Ontologiamuokkaimen käyttö laskentaklusterin tehokkuusanalyysissä (valmiin työn esittely) Santtu Klemettilä

Samankaltaiset tiedostot
Ontologiamuokkaimen käyttö laskentaklusterin tehokkuusanalyysissä

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Monte Carlo -menetelmä optioiden hinnoittelussa (valmiin työn esittely)

Mikä on semanttinen web?

Lineaaristen monitavoiteoptimointitehtävien

Kasvuyrityksen tuotekehitysportfolion optimointi (valmiin työn esittely)

Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Portfoliolähestymistapa CO2 - kiilapelin analysoinnissa (valmiin työn esittely) Tuomas Lahtinen

Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely)

Luento 12: XML ja metatieto

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

Metatiedot organisaatioiden sisällönhallinnassa

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Lineaaristen monitavoiteoptimointitehtävien ratkaiseminen Bensonin algoritmilla

Lentotiedustelutietoon perustuva tykistön tulenkäytön optimointi (valmiin työn esittely)

The OWL-S are not what they seem

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Tuotantoprosessin optimaalinen aikataulutus (valmiin työn esittely)

Seurantalaskimen simulointi- ja suorituskykymallien vertailu (valmiin työn esittely) Joona Karjalainen

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

Vedonlyöntistrategioiden simulointi ja evaluointi

How to Support Decision Analysis with Software Case Förbifart Stockholm

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Lisäinformaation arvo monikriteerisessä projektiportfoliovalinnassa (valmiin työn esittely)

Suojarakenteiden vaikutus maalin selviytymiseen epäsuoran tulen tai täsmäaseen iskussa

Stokastinen optimointi taktisessa toimitusketjujen riskienhallinnassa (valmiin työn esittely)

Kaksintaistelun approksimatiivinen mallintaminen (valmiin työn esittely)

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Scheduling of Genetic Analysis Workflows on Grid Environments (valmiin työn esittely) Arttu Voutilainen

Skedulerisimulaattorin implementointi fysiikkatöille ja sen matemaattinen validointi

Minimilatenssiongelman ratkaisualgoritmeja (valmiin työn esittely)

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Kahden virtualisointiohjelmiston suorituskyvyn testaus (valmiin työn esittely)

Optimaaliset riskinalentamisportfoliot vikapuuanalyysissä (valmiin työn esittely)

Lineaaristen monitavoiteoptimointitehtävien ratkaiseminen Bensonin algoritmilla

Valuation of Asian Quanto- Basket Options

Kielitieteellisten aineistojen käsittely

Vesivoimaketjun optimointi mehiläisalgoritmilla (Valmiin työn esittely)

Sisällönhallinnan menetelmiä

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Tapahtumankäsittely Semanttisen Webin Menetelmillä

Konetekniikan koulutusohjelman opintojaksomuutokset

TIETOJEN TUONTI TIETOKANNASTA + PIVOT-TAULUKON JA OLAP-KUUTION TEKO

punainen lanka - Kehitysjohtaja Mcompetence Oy markokesti.com Työhyvinvoinnin kohtaamispaikka Sykettätyöhön.

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

Sähköisen liiketoiminnan tason mittaaminen pk-yrityksissä (aihe-esittely)

Ajankohtaisia SOA tutkimusteemoja

Polkuriippuvuus trade-off-painotuksessa (valmiin työn esittely)

Bachelor level exams by date in Otaniemi

Paikkatiedot ja Web-standardit

Luodin massajakauman optimointi

Bachelor level exams by subject in Otaniemi

Kustannustehokkaat riskienhallintatoimenpiteet kuljetusverkostossa (Valmiin työn esittely)

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

WP3 Decision Support Technologies

Aihioiden priorisointi ja portfolioanalyysi ennakoinnissa (valmiin työn esittely)

Optimal Harvesting of Forest Stands

Jalkapallovedonlyöntistrategioiden. evaluointi. Aleksi Avela Ohjaaja: Juho Roponen Valvoja: Ahti Salo

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

Ohjelmistoprosessit ja ohjelmistojen laatu Kevät Ohjelmistoprosessit ja ohjelmistojen laatu. Projektinhallinnan laadunvarmistus

Tutkijan informaatiolukutaito

Internet jolla on merkitystä

Menetelmä Markowitzin mallin parametrien estimointiin (valmiin työn esittely)

Collaborative & Co-Creative Design in the Semogen -projects

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Turvallisuudelle tärkeiden laitteiden koestusten merkitys vikojen havaitsemisessa (Valmis työ)

Epälineaarinen hinnoittelu: Diskreetin ja jatkuvan mallin vertailu

Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Tilanne sekä MS-A0003/4* Matriisilaskenta 5 op

Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely)

Finnish Solar Revolution

Ylikerroinstrategiat ja Poissonmallit vedonlyönnissä (aihe-esittely) Jussi Kolehmainen

FinnONTO-infrastruktuurin esittely

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Semanttinen Web ja Webteknologiat

Hand-out kooste

Semanttinen web: ontologioiden esittäminen ja oppiminen

Portfoliopäätöksenteon vinoumat (valmiin työn esittely)

Orientaatiopäivät

Työhyvinvointi ja tuottavuus

Puhelintukiasema-antennin säteilykuvion mittaus multikopterilla (Valmiin työn esittely)

Vaikuttavuuden arvioinnin haasteet laadullisten tulosten näkökulma

Visma Nova. Visma Nova ASP käyttö ja ohjeet

W3C ja Web-teknologiat

Optimization of Duties in Railway Traffic (valmiin työn esittely)

TIK.kand Kandidaatintyö ja seminaari (10 op) WWW-teknologiat, Aiheiden esittely,

Semanttinen Finlex Visio ja sen toteutus

Luottamuksen ja maineen rooli palveluperustaisten yhteisöjen muodostamisessa

Päätösanalyysi Teknologföreningenin kiinteistöuudistuksen tukena (valmiin työn esittely)

Agentit ja semanttinen web. Pekka Halonen

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com

Mammutti vai elefantti?

Osakkeiden tuottojakaumia koskevien markkinaja asiantuntijanäkemysten yhdistely copulafunktioilla

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Transkriptio:

Ontologiamuokkaimen käyttö laskentaklusterin tehokkuusanalyysissä (valmiin työn esittely) Santtu Klemettilä 25.03.2013 Ohjaaja: FT Markopekka Niinimäki Valvoja: Prof. Ahti Salo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeudet pidätetään.

Tausta: Ontologia Data on yleensä hajanaista ja heterogeenistä Tietokoneella ei ole älyä ymmärtää sille määrittelemätöntä dataa Yleisenä tavoitteena semanttinen web, jossa tarjolla on myös tiedon merkityksen kertova tieto Ontologia on kokonaisuus, jossa määrittyy sovellettavan aiheen käsitteet ja niiden väliset suhteet Ei universaaleja ontologioita, vaan sovelluskohteille on määriteltävä tarkoituksenmukainen ontologia

Tausta: Laskentaklusteri Analyysin kohteena CERNin tutkimustyössä käytettävä laskentaklusteri Accounting-data koostuu laskentatöihin liitettävistä tietueista (ajankohta, muistinkäyttö, dataliikenne ym.) Energiankulutusdata on osaklusterikohtaista kahden tunnin aikajaksoihin jaettua dataa Kahdentyyppisiä laskentatöitä Monte Carlo simulaatiot, muistinkäyttö suurta Analyysityöt, dataliikenne suurta

Tavoitteet Ontologiamuokkaimen arviointi dataintegraatiovälineenä Vaiheina laskentaklusteriontologian määritteleminen ja sen avulla datan tuonti analysoitavaksi Laskentaklusterin tehokkuusanalyysi Tutkitaan laskentatöiden jakautumista ja laskentatöiden vaikutusta klusterin energiankulutukseen

Ontologian määrittely

Ontologiatieto (1/2) Data on tallennettu tiedostoihin merkein (tässä : ) ja rivinvaihdoin eroteltuna qname:hostname:group:owner:job_name:job_number:account:priority:submission_time:start_time:end_time: failed:exit_status:ru_wallclock arc:c26.local:ndgfops:ndgfops:arc_testjob_rls:349:sge:0:1268406240: 1268406246:1268406288:0:0:42 Ontologiatieto tallentuu standardoituun RDF/XMLmuotoon <owl:class rdf:about="#measure"/> <olapcore2:measure rdf:about="#wallclock"> <olapcore2:hasmeasureunit rdf:resource="sec"/> <olapcore2:hasmeasuresummarizabilitytype rdf:resource="float"/> <olapcore2:hasdependencyondimension rdf:resource="start_time"/> </olapcore2:measure>

Ontologiatieto (2/2) Ontologian ulottuvuuksien ja mittojen yhteydet datalähteen nimikkeisiin tallentuu projektin omaan data_sources muotoon name="wallclock (sec)" source="http://hiptek.web.cern.ch/hiptek/ protected/accounting_feb2011_muok.txt" authentication="username:password" delimiter=":" variablename1="wallclock" variableget1="ru_wallclock Lopuksi muokkaimella voi tulostaa R-ohjelmistossa suoritettavan komentosarjan, jolla kartoitettu tieto saadaan helposti analysoitavaksi measures=new.env(hash = TRUE, emptyenv()) require("rcurl") data0<read.table(textconnection(geturl("http://username:password@hiptek.web.cern.ch/hiptek/protected/accoun ting_feb2011_muok.txt")), sep=":", header=true) measures$wallclock <- data0[,c("ru_wallclock")]

Data-analyysi (1/2) Selittävät muuttujat R 2 Korjattu p( lkm ) p( mem ) p( io ) R 2 lkm, mem, io 0,46 0,45 0,063 2,6*10-7 8,3*10-4 mem, io 0,45 0,45-7,9*10-15 6,69*10-4

Data-analyysi (2/2) Suurin osa energiankulutuksesta riippumatonta laskentakoneiden rasituksesta (vakiotermin perusteella 95 % energiasta kuluu koneiden päälläoloon) Jos laskentatyöt olisivat täydellisesti ositettavissa ja tasaisesti jakautuneita ajan suhteen, laskentakonevaatimus olisi 22 % nykyisestä määrästä eli potentiaalinen energiansäästö olisi noin 74 %. Tutkimalla laskentaklusterin käyttöastetta ja tarpeita, voidaan arvioida energiankulutuksen (ja muiden kustannusten) pienentämisen mahdollisuutta

Laskentatöiden jakauma (1/2) Klusterin kapasiteetti saavutetaan vain silloin tällöin Käytön epätasaisuus mahdollisesti esimerkiksi työajoista johtuvaa Laskentakoneiden käyttö epätasaista

Laskentatöiden jakauma (2/2) Jakaumat kellonajan ja viikonpäivien suhteen suhteellisen tasaiset Varianssianalyysikään ei viittaa eroavaisuuksiin kellonaikojen tai viikonpäivien suhteen Kyseessä siis pidemmän aikavälin ongelma

Johtopäätökset Ontologiamuokkain onnistuu tavoitteessaan olla dataintegraatiota helpottava työkalu Datan tuominen analysoitavaksi yksinkertaistuu Erityyppisten datojen yhdistämisessä onnistutaan Laskentaklusterin tehokkuusanalyysistä selviää energiansäästömahdollisuus Toteuttamisen järkevyys riippuu halutusta palvelutasosta Käyttöasteen vaihtelevuudelle ei löydy säännöllistä tekijää

Viitteet Becket, Dave (toim.): RDF/XML Syntax Speci cation. http://www.w3. org/tr/rec-rdf-syntax/, 2004. Disease Ontology. http://disease-ontology.org, viitattu 31.7.2012. Guarino, Nicola: Formal Ontology, Conceptual Analysis and Knowled- ge Representation. International Journal of Human- Computer Studies, 43(5-6):625 640, 1995. Halevy, Alon, Anand Ra jaraman ja Joann Ordille: Data Integration: The Teenage Years. Teoksessa IN VLDB, sivut 9 16, 2006. Hendler, James, Tim Berners-Lee ja Eric Miller: Integrating Applications on the Semantic Web. Journal of the Institute of Electrical Engineers of Japan, 122:676 680, 2002. Resource Details for jade-cms.hip.. http://www.nordugrid.org/ monitor/clusdes.php?host=jade-cms.hip.fi&port=2135. Storage Element Performance Optimization for CMS Analysis Jobs. http://indico.cern.ch/getfile.py/access?contribid= 243&sessionId=8&resId=0&materialId=poster&confId=149557. Miller, Eric: An Introduction to the Resource Description Framework. Bulletin of the American Society for Information Science and Technolo- gy, 25:15 19, 1998. Niemi, Tapio, Santtu Toivonen, Marko Niinimäki ja Jyrki Nummenmaa: Ontologies with Semantic Web/Grid in Data Integration for OLAP. In- ternational Journal on Semantic & Web Information Systems, 3:25 49, 2007. Niinimäki, Marko ja Tapio Niemi: An ETL Process for OLAP Using RDF/OWL Ontologies. Journal of Data Semantics, JoDS XIII: Special Issue Semantic Data Warehouses, sivut 97 119, 2009. Niinimäki, Marko, Tapio Niemi, Stephen Martin, Jyrki Nummenmaa ja Peter Thanisch: Timely Report Production from WWW Data Sources. Teoksessa BIR 2011 Work-shops, LNBIP 106, sivut 184 195. Springer Berlin Heidelberg, 2012. Shoshani, Arie: Summarizability. Teoksessa Encyclopedia of Database Systems, sivut 2880 2884. Springer US, 2009. Ubuntu Manpage: Accounting - Grid Engine Accounting File For- mat. http://manpages.ubuntu.com/manpages/intrepid/man5/sge_ accounting.5.html, viitattu 1.8.2012.