Semanttinen web Prof. Eero Hyvönen Aalto-yliopisto, mediatekniikan laitos Helsingin yliopisto, tietojenkäsittelytieteen laitos Semantic Computing Research Group http://seco.tkk.fi/ 13.4.2012
Sisältö Semanttinen webin idea Semanttisen webin ytimessä Metadata, ontologiat, päättely Katsaus keskeisimpiin uusiin ratkaisuihin ja standardeihin Sovellusalueita
Semanttisen webin idea
Kehityksen este Webissä WWW-palvelu kone auttaa ihmistä» Edellyttää sisältöjen koneellista "ymmärtämistä" WWW:n sisällöt ovat ihmislukijaa varten» HTML, PDF, JPEG, Kone ei ymmärrä WWW:n sisältöjä» Hakukoneet, ostoagentit, verkkomönkijät jne.» Periaatteessa kaikki WWW-sovellukset => Perustavaa laatua oleva ristiriita
Miten Webistä tulee älykkäämpi? 1. Älykkäämmät sovellukset Sisältö pysyy samana Koneesta tehdään ihmismäisempi 2. Älykkäämmin esitetty sisältö Sisältö helpommin ymmärrettäväksi Kone pysyy tyhmempänä Käytännössä molempia tapoja tarvitaan Yhä älykkäämmät järjestelmät käsittelevät yhä älykkäämmin esitettyjä tietoja
Ratkaisumalli 1: Älykkäämmät sovellukset Kielen automaattisen tulkinnan vaikeus Dokumenttien vapaamuotoisuus Sisällön semantiikka Ei-tekstuaaliset sisällöt Kuva, ääni, musiikki, video, ohjelmisto, Miten tulkita algoritmisesti? Tulkintaan ei riitä itse dokumentti Tarvitaan konteksti, common sense Tekoälyn perusvaikeuksia, ihmiselle helppoa! Suuria tieteellisteknisiä haasteita
Ratkaisumalli 2: Älykkäämmin esitetty sisältö Semantic Webin lähtökohta Talletetaan tieto niin, että tyhmempikin sen ymmärtää! Ihminen tulee konetta vastaan Kone voi auttaa ihmistä itsensä auttamisessa Kehitystyö käynnistyi 2000-luvun alussa W3C:n Semantic Web Activity 2001 W3C:n Web Services Activity 2002
Webin sukupolvia 1G WWW:» WWW-sivut ihmisen tulkittavaksi» HTML-kieli 2G WWW:» Rakenteet ihmisen/koneen tulkittavaksi» XML-kieli 3G WWW: Semantic Web» Merkitykset ihmisen/koneen käytettäväksi» RDF(S)-kieli => Uusi perusta älykkäille WWW-palveluille» Kansainvälinen yhteistyö (W3C, ISO, FIPA, ym. )
Limitations of Non-semantic Web Case MuseumFinland <artifact> <id> NBA:H26069:467 </id> <target> cup and plate </target> <material> porcelain </material> <creationlocation> Germany </creationlocation> <creator> Meissen </creator> </artifact> This metadata cannot answer the following questions: Find all vessels? Find all ceramic products? Find artifacts manufactured in Europe? Does the city of Meissen manufacture ceramics?
Semantic Web Solution: Ontologies NBA-H26069-467 :object cup and plate ; :object_concept object:cup ; :object_concept object:plate ; :material porcelain ; :material_concept object:porcelain ; :creationplace Germany ; :creationplace_concept place:germany ; :creator Meissen :creator_concept actor:meissen. Find all vessels? Find all ceramic products? Find artifacts manufactured in Europe? Does the city of Meissen manufacture ceramics? NBA-H26069-467 place:germany creationlocation_concept object_concept object_concept material_concept... material:porcelain place ontology loc:partof object:cup place:europe place:meissen rdfs:subclassof object:plate... object ontology... object:vessel rdfs:subclassof actor ontology material ontology actor:meissen
Case Rijksmuseum Amsterdam: CHIP Demonstrator Example in N3Turtle notation VRA metadata schema (extension of Dublin Core) (Aroyo et al., 2007) A resource in the TGN ontology / vocabulary
Amsterdam in TGN
An Ontology Concept Hierarchy: Standard Upper Merged Ontology SUMO
Semanttisen webin teknologiapohja
Semanttisen webin teknologiakakku-malli Sanasto/ ontologia Metadata Päättely/ logiikka (Tim Berners-Lee)
Metadata level
Miksi XML ei riitä semanttisen webin perustaksi? Jokaisen XML-kielen tulkinta joudutaan määrittelemään tapauskohtaisesti Kahden eri XML-kielen merkintöjen yhdistäminen on hyvin hankalaa Tarvitaan tiedon merkkauskieli, jonka tulkinta on yhteisesti sovittu sovellusalueiden rajat ylittävä koneen ymmärtämä XML:n semantiikka on vain nahkakansissa, ei peltikuoressa <OSOITE> <NIMI>Onni Ohjelmoija</NIMI> <PUHELIN> 123 456 </PUHELIN> </OSOITE> <OSOITE> <NIMI > >Onni Ohjelmoija </NIMI> <PUHELIN> 123 456 </PUHELIN> <//OSOITE>
Semanttisen webin ratkaisumalli: RDF Resource Description Framework Yleinen verkkoresurssien metadatan kuvaamiskieli Relaatiotietomalli, ei syntaksi kuten XML» RDF-kuvaus = suunnattu verkko Semantiikka määritelty logiikan avulla Syntaksi/serialisointi» XML:n avulla (erityisesti koneille)» Yksinkertaisina kolmikoina (N3, Turtle, N-triples) ihmisille Standardoitu ja yleisessä käytössä» W3C draft 1999» W3C recommendation 10.2.2004
RDF Vocabulary Description Language: RDF Schema RDF-kuvausten sanaston määrittely Olioajattelu WWW-kuvauksiin» Luokat, yksilöt, ominaisuudet» Käsitehierarkiat, periytyminen (Class/subClass/type)» Rajoitteet ominaisuuksille (domain, range) RDF(S):n tulkinta määritellään logiikan avulla» Mahdollistaa päättelyn W3C draft 2000, recommendation 10.2.2004
RDF(S) Example (Maedche, 2002)
Metadataskeemat Standardoituja muotoja metadata ilmaisemiseen Metadata on kokonaisuus, jolla» joukko elementteja/ominaisuuksia ja» näillä määrämuotoisia arvoja Eri sisältötyypeille tarvitaan yleensä erilaisia ominaisuuksia Esimerkiksi: kirja vs. musiikkikappale vs. museoesine Ongelmia Miten ilmaistaan elementtien arvot?» Tarja Halonen vs. Halonen T.» 11.9.2001 vs. Sept 11, 2001 vs. 2001/09/11 Mitä arvot tarkoittavat?» lasi, nokia, Pyhäjärvi Miten erimuotoiset skeemarakenteet voidaan yhdistää?» kirjoittaja vs. valmistaja
Esimerkki: Dublin Core Geneerinen 15 ominaisuuden joukko eri sisällöille DCMI Element Set (ISO Standard 15836)» Title» Creator» Subject» Description» Publisher» Contributor» Data» Type» Format» Identifier» Relation» Source» Language» Coverage» Rights
Kentille määritelty lisäksi kymmeniä tarkennettuja (qualifier/refinement) muotoja, jotka rajoittavat yhden elementin semantiikkaa Esim. accessrights < Rights Dumb-down periaate Tarkennettu muoto voidaan aina korvata yleisemmällä elementillä» Ts. tarkenne voi vain rajoittaa elementin merkitystä Kenttien arvoille vakioituja koodausmuotoja Vocabulary encoding scheme» Sanaston termit Syntax encoding scheme» Esim. päiväys 2001-09-11
Sovellusprofiilit (Application Profile) Käytettävä DC elementtien ja tarkenteiden joukko + arvojen ilmaisutavat Mahdolliset omat laajennukset Esim. Visual Resources Association Core 4.0» Uusia elementtejä kuten measurements http://www.vraweb.org/projects/vracore4/index.html
Metadata Schema in HealthFinland
Maijan lasit pdf-dokumentti webissä
Maijan lasit: metatieto RDF-muodossa
Ontology level
Ontologian käsite Ontologia on formaali, eksplisiittinen määrittely yhteisestä käsitteistöstä (Gruber, 1993)» Formaali: jämpti» Eksplisiittinen: konekin ymmärtää» Yhteinen: kommunikaatio mahdollista Kuvaa sovellusmaailmassa olevat käsitteet/oliot Ensimmäinen edellytys sille, että ihmiset ja koneet voivat ymmärtää toisiaan
ONTOLOGY TYPES Machine understandable Human understandable Numbers Thesaurus - relations - NT, BT, RT etc. Glossary - word list - little structure Taxonomy - relations - inheritance - constrains Axiomatized theory - formal system - logic-based Philosophical text Ontological complexity/depth
IEEE Standard Upper Merged Ontology (SUMO) Goals Automated reasoning support in knowledge-based applications Interoperability» Define new data elements using SUMO and obtain mutual interoperability» Interoperability between applications using domain specific ontologies (that use SUMO)» Neutral interchange format for different systems Application areas E-commerce E-learning Natural language understanding tasks
Standard Upper Merged Ontology
SUMO Principal Distinctions
SUMO Object:
Cyc ontology
OpenCyc Nx100,000 concepts Nx1,000,000 assertions Connected with Linked Data Available for download
AAT Art & Architecture Thesaurus - Paul Getty -säätiön thesaurus - 7 pääluokkaa, 125 000 käsitettä MAO abstraktit käsitteet toimijat tapahtumat materiaalit ja aineet esineet arkisto- ja kirjastoaineisto organismit ympäristöt
Universal List of Artist Names ULAN on ONKI People Server 120,000 instances 293,000 names
Geonames http://www.geonames.org Classes: 9 feature classes, 645 feature codes Instances: 8 million geographical names, 6.5 million unique features, 2.2 million populated places, 1.8 million alternate names Registries and Wiki used for populating the ontology
TGN Thesaurus of Geographical Names 912,000 records 1.1 million names, place types, coordinates, and descriptive notes Places important for the study of art and architecture
Finnish Ontologies: ONKI http://www.onki.fi/
class-def animal class-def plant subclass-of NOT animal class-def tree subclass-of plant class-def branch slot-constraint is-part-of has-value tree class-def leaf EXAMPLE OF AN slot-constraint is-part-of has-value branch OIL ONTOLOGY class-def defined carnivore subclass-of animal slot-constraint eats value-type animal class-def defined herbivore subclass-of animal slot-constraint eats value-type plant OR (slot-constraint is-part-of has-value plant) class-def herbivore subclass-of NOT carnivore class-def giraffe subclass-of animal slot-constraint eats value-type leaf class-def lion subclass-of animal slot-constraint eats value-type herbivore class-def tasty-plant subclass-of plant slot-constraint eaten-by has-value herbivore, carnivore
OWL Web Ontology Language W3C Recommendation 2004 Next level above RDF(S) Based on formal (description) logic Inference, consistency Subsumption: find objects satisfying a description Subset of predicate logic» Optimized for subsumbtion relation & decidability Human-friendly tools being developed RDF(S) is produced by the machine Based on USA: DAML EU: OIL
Why OWL? Terminology logics for defining ontologies Usage Design phase» Check consistency» Derive subsumption hierarchy Data integration» Detect inconsistenties and unintendent relations Deployment» Term expansion and inference, e.g. in information retrieval» Using descriptions in applications Generic tools for cross-domain applications E.g. Protégé OWL Plugin Open standard W3C Recommendation
OWL example: Lion rdf:resource= #carnivore />
WHAT IS NEW? PROGRAMMING Object-oriented modeling ARTIFICIAL INTELLIGENCE Description logic semantics XML-syntax, e.g., RDF(S) WWW-TECHNOLOGIES
Metadata + Ontologiat = Linked Data (Web of Data)
Biografiakeskus ja kirjastot keräävät henkilöhistoriaa henkilö nimi ammatti syntymapaikka... H1 Akseli Gallen-Kallela taiteilija Lemu H2 Gustaf Mannerheim marsalkka Askainen... nimi Akseli Gallen-Kallela ihminen tyyppi H1 ammatti s-paikka Lemu taiteiija tyyppi nimi Gustaf Mannerheim H2 ammatti marsalkka s-paikka Askainen
Museo luetteloi maalauksia teos nimi tekijä aika aihe... T1 Mannerheimin muotokuva Akseli Gallen-Kallela 1929 Gustaf Mannerheim T2 Aino-triptyykki Akseli Gallen-Kallela 1891 Aino, Kalevala... nimi Akseli Gallen-Kallela tekijä T1 tyyppi maalaus... aika 1929 aihe nimi Gustaf Mannerheim
Maanmittauslaitos ylläpitää paikkarekistereitä kunta Askainen Helsinki Lemu Turku... lääni Varsinais-Suomen lääni Uudenmaan lääni Varsinais-Suomen lääni Varsinais-Suomen lääni kunta Lemu tyyppi tyyppi lääni part-of tyyppi part-of... part-of Varsinais-Suomen lääni Suomi Askainen Turku part-of
FinnONTO kehittää ontologioita KOKO-ontologia pysyvä yläluokka yläluokka käsite muuttuva yläluokka abstrakti fyysinen objekti yläluokka yläluokka ajanjakso ammatti paikka yläluokka kunta ihminen taiteiija lääni maalaus marsalkka
Semanttinen RDF-verkko yhdistää kaiken: Web of Data käsitteet pysyvä yläluokka muuttuva yläluokka abstrakti yläluokka fyysinen objekti yläluokka paikka yläluokka yläluokka ajanjakso ammatti kunta nimi Akseli Gallen-Kallela tyyppi ihminen tyyppi tyyppi H1 ammatti taiteiija s-paikka Lemu tekijä tyyppi maalaus T1 tyyppi lääni yläluokka tyyppi... aihe aika 1929 part-of Varsinais-Suomen lääni part-of Suomi H2 nimi Gustaf Mannerheim ammatti marsalkka part-of part-of s-paikka Askainen Turku
Linked Data Web of Data Hajautetun työn hyödyntäminen Laajojen ja monialaisten sisältöjen koostaminen Linked Open Data ajattelu Semanttiset portaalit http://linkeddata.org
Rule level
Sääntöjen idea RDF/OWL-semantiikka perustuu logiikkaan Logiikan idea: uutta tietoa voidaan johtaa vanhasta päättelemällä
SUMO Knowledge Representation Developed in KIF (Knowledge Interchange Format) A version of first order predicate logic Other versions exist (e.g. OWL) Size 1006 terms 4142 axioms 814 rules
Rule Markup Language RuleML Standardized XML notation for rules
Sovellusesimerkki: MuseoSuomi.fi suosittelee Päättelysäännöt kertovat koneelle maailmasta Esim. että ylioppilaslakit liittyvät juhliin Esim. että asia liittyvät toisiinsa jos niiden yläkäsitteet liittyvät toisiinsa jne. Kone voi metadata+ontologia-verkon avulla päätellä kiinnostavia uusia yhteyksiä museokokoelmien esineiden välille ja tarjota ne loppukäyttäjälle suosittelulinkkeinä
Application Example
Semanttisen webin sovellusalueita Yhteentoimivuus (interoperability) Informaation haku (information retrieval) Suosittelujärjestelmät (recommender systems) Tietämyksen hallinta (knowledge management) Sähköinen liiketoiminta ja web services Personointi Esim. Aallossa kehitettyjä sovellusdemoja http://www.museosuomi.fi http://www.kulttuurisampo.fi
Vireä kehityssuunta juuri nyt: Yhdistetty avoin tieto -- Linked Open Data
Avoin tieto Open Data Tieto vapaaksi! Kansalaisilla on oikeus avoimeen tietoon Avoimelle tiedolle syntyy itsestään hyötysovelluksia Tiedon arvo kasvaa sitä jakamalla Yhden organisaation ja kokonaisuuden edut puntarissa Tuotannon tehokkuus kasvaa Miksi tuottaa uudelleen jo tuotettua tietoa? Avoimuus parantaa yhteistyötä ja työnjakoa Esim. Wikipedia Avoimuus edistää yhteentoimivuutta Keskinen kustannustekijä tietotekniikassa Avoimuus asettaa haasteita mm. lainsäädännölle Henkilösuoja, vapaa kilpailu, tekijänoikeudet, tietoturva,...
Tiedon vapauttaminen ei yksin riitä! Open Data ei ota kantaa julkaisutapaan Tietotekninen näkökulma puuttuu Open Data ei ota kantaa yhteistyöhön Web 2.0 -näkökulma puuttuu Open Data avaa tiedon vain ihmiskäyttäjälle Semanttisen webin näkökulma puuttuu» Koneiden pitää ymmärtää avointa tietoa! Linked Data on moderni ratkaisumalli Kehitysyhteisö http://linkeddata.org Tukijoina mm. W3C
Linked Data: Idea Nykyinen web on verkko joka linkittää sivuja: Web of Pages Voidaan hakea/selailla perinteisellä selaimelle Linked Data on semanttinen käsiteverkko: Web of Data Voidaan hakea/selailla myös semanttisella sovelluksella Uusi (semanttinen) web koostuu molemmista verkoista Web of Pages (ihmiselle)» WWW World Wide Web Web of Data (koneelle)» GGG Giant Global Graph Web of Pages WWW Web of Data GGG
Linked Data + Open Data = Linked Open Data
Kansainvälinen ja kotimainen tahtotila tiedon avaamiseen
Perinteinen malli: tiedon erilliset siilot + hankalaa ja kallista
Solution: Linked (Open) Data Ecosystem Public Sector Companies Linked Open Data Humans Ontologies Metadata Schemas Data Models Machines Scientific Research Social Media
1 +1 > 2 M.O.T.
Britanniassa: http://data.gov.uk
Runsaasti sovelluksia verkossa
Linked Open Data esimerkkisovellus: BBC
USA:ssa http://www.data.gov
Opengov.XX portaalit eri maissa: opengov.fi, opengov.se,...
Linked Open Data Story so Far Starting 2005 (Tim Berners-Lee)
New Datasets Linked with Others (Tim Berners-Lee)
(Tim Berners-Lee)
Linked Open Data 2009 (linkeddata.org, 2009)
Linked Open Data Cloud 2010: http://linkeddata.org
Linked Open Data Cloud 2010: http://linkeddata.org
LOD Cloud Statistics (Heath, Bizer, 2011)
Suomessa on kansallinen tahtotila tiedon avaamiseen Valtiovarainministeriö ValtIT:n Valtiotason tietoarkkitehtuurit -loppuraportti Tietohallintolaki ( FinnONTO-laki ) on juuri hyväksytty eduskunnassa Liikenne- ja viestintäministeriö Hallituksen periaatepäätös tiedon avaamisesta Avoin data mukana uudessa hallitusohjelmassa Opetus- ja kulttuuriministeriö Tutkimuksen tietoaineistot selvitys Kansallinen digitaalinen kirjasto hanke ICT-teolllisuus ICT-klusteri Tivitin Data to Intelligence -ohjelma (2012-)? HS Open, Apps4Finland, Avoimen datan foorumi, Tutkimus (tietotekniikka) Kansallinen FinnONTO-hanke (2003-2012) Linked Data Finland (2012-2014)
Kansallinen FinnONTO-visio ja -infrastruktuuri
FinnONTO Vision 2003-2012 Semantic Web needs a content infrastructure Like traffic needs roads Like energy service needs powerlines Like mobile phones need GSM or 3G-networks Especially useful in Cross-domain applications Collaborative Web 2.0 applications Let s create it together on a national level Based on W3C s generic standards
FinnONTO Industrial & Public Organization Consortium FinnONTO 2003-2004» 14 funding organizations 2004-2005» 16 funding organizations 2005-2006» 30 funding organizations 2006-2007» 37 funding organizations FinnONTO 2.0 2008-2010» 38 funding organizations 2010-2012» 35 funding org. 1.52 MEUR 2010-2012 Semantic UBICOM-services 17 funding org 0,55MEUR Linked Data Finland 2012-2014» 21 funding organizations
40+ partners in FinnONTO (2003-2012) Research mainly by Aalto and University of Helsinki Antikvaria-ryhmä
FinnONTO Results Linked open ontology infrastructure KOKO ontology cloud Data registries (e.g. persons, places, history events) International vocabularies National ontology library service ONKI http://onki.fi Case applications (based on reusable tools) eculture: MuseumFinland, CultureSampo, BookSampo, TravelSampo ehealth: HealthFinland, ActiveFinland ebusiness: CorporateFinland, case Wärtsilä, case Rautaruukki, egoverment: Semantic Suomi.fi, DataFinland, case Finnish Defense Forces, Everything open source
Linked Open Ontologies: KOKO Ontology Cloud Aligning ONKI ontologies Leikkaavat ontologiat Yhteisten ekvivalenttien käsitteiden määrä YSO + TAO 1990 YSO + MAO 2330 YSO + VALO 950 MAO + TAO 1190 YSO Your ontology?... AFO VALO MAO TAO... KOKO [Hyvönen et al., ESWC 2009]
KOKO sovelluskäyttäjän näkökulmasta
KOKOs Component Ontologies 2/2011 Thesaurus-based Ontologies in the KOKO Ontology System Name Ontology domain Underlying thesaurus Size Organization 1 YSO General domain General Finnish Thesaurus YSA, Allärs 23700 National Library, Åbo Academy 2 MUSO Music Musiikin asiasanasto MUSA, CILLA 1000 National Library 3 MAO Museum domain Museoalan asiasanasto MASA 6800 National Board of Antiquities 4 AFO Agriculture, foresty Agriforest-asiasanasto 5500 Viikki Science Library TAO Applied arts Käsi- ja taideteollisuuden asiasanasto 2600 University of Eastern Finland, 5 Library of TAIK VALO Photography Valokuvakirjallisuuden asiasanasto, 1900 Finnish Museum of Photography et 6 Valokuvaustekniikan asiasanasto al. MERO Seafaring, shipping Merenkulkun asiasanasto 1400 Liikennevirasto et al. 7 8 KAUNO Literature subjects Kaunokki, Bella 4900 Public Libraries, Kirjastot.fi 9 JUHO Public goverment Valtioneuvoston asiasanasto VNAS 6400 Ministry of Finance 10 TERO Health promotion YSA, HPMulti, MeSH, Stameta 22000 National Inst. of Health and Welfare 11 KITO Literature research Kirjallisuuden tutkimuksen asiasasanasto 900 SKS 12 KULO Culture research Kulttuurien tutkimuksen asiasanasto 1600 SKS 13 KTO Linguistics Kielitieteen asiasanasto 1000 Kotus 14 PUHO Defense Puolustushallinnon asiasanasto Puolustusvoimat 15 POIO Points of interest TGN, Geonames, LDG, SUO Aalto Univerisity TOTAL 79700
Biological Namelists of Finnish Museum of Natural History in ONKI (10/2011) vuosi alue ryhmä taksoneita joista lajeja Catalogus Lepidopterorum. Fenniae et regionum adiacentium. 1. Macrolepidoptera. 1962 Suomi Perhoset 313 161 Suomen perhosten luettelo 1977 Suomi Perhoset 256 120 The Lepidoptera of Europe. A Distributional Checklist 1996 Skandinavia Perhoset 12256 9804 Checklist of Finnish Lepidoptera 2002 Suomi Perhoset 265 126 Suomen perhosten luettelo - päivitetty versio 2008 Suomi Perhoset 4573 2987 Norwegian Lepidoptera 2008 Norja Perhoset 3244 2210 Luoteis- Catalogue of the Lepidoptera of Russia (only NW parts) 2008 Venäjä Perhoset 3251 2171 Estonian Lepidoptera. Catalogue 2008 Viro Perhoset 3477 2389 The Fly Fauna of Finland (Draft) 2008 Suomi Kärpäset 6351 4800 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 1. heimo Ichneumonidae, alaheimot Pimplinae, Poemeniinae, Rhyssinae ja Diacritinae - A check list of Finnish Hymenoptera, Parasitica. Part 1 1995 Suomi Loispistiäiset 282 210 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 2. alaheimot Tryphoninae, Eucerotinae, Adelognathinae, Xoridinae ja Agriotypinae - A check list of Finnish Hymenoptera, Parasitica. Part 2 1999 Suomi Loispistiäiset 398 311 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 3. alaheimo Cryptinae - A check list of Finnish Hymenoptera, Parasitica. Part 3 1999 Suomi Loispistiäiset 919 727 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 4. heimo Ichneumonidae, alaheimot Lycorinae, Neorhacodinae, Stilbopinae, Banchinae ja Ctenopelmatinae - A Check list of Finnish Hymenoptera, Parasitica. Part 4 2000 Suomi Loispistiäiset 786 646 Suomen loispistiäisluettelo (Hymenoptera, Parasitica). Osa 5. heimo Ichneumonidae, alaheimot Tersilochinae, Ophioninae, Anomalinae, Paxylommatinae, Cremastinae ja Campopleginae - A check list of Finnish Hymenoptera, Parasitica. Part 5 2003 Suomi Loispistiäiset 733 587 Suomen ripsiäisten luettelo - Checklist of Finnish Thysanoptera 2008 Suomi Ripsiäiset 219 140 Suomen nivelkärsäisten luettelo - Check-list of Finnish Hemiptera 2008 Suomi Nivelkärsäiset 2690 1697 Verkkosiipiset ja Suomen verkkosiipiset ja kärsäkorennot - The Neuroptera s.l. and Mecoptera of Finland 2008 Suomi kärsäkorennot 113 72 Maailman lintujen suomenkieliset nimet (Finnish Names of the Birds of the World) 2010 Maailma Linnut 12125 9740 Nisäkkäiden nimilista (beta) 2008 Maailma Nisäkkäät 6062 4629 Suomen myrkkypistiäisten luettelo 2010 Suomi Myrkkypistiäiset 1048 664
International Ontologies in ONKI http://onki.fi/ Art and Architecture Thesaurus (AAT) (culture) Library of Congress Subject Headings (LCSH) (library) UNSPSC (products and services) IPSV (egov) MeSH (medical) Iconclass (culture)
Muita ontologioita Paikkaontologiat Maanmittauslaitoksen paikannimirekisteri Suomen ajallinen paikkaontologia ONKI Geo Henkilöt ONKI People Historialliset tapahtumat Aineistona historiantutkijoiden yhteisön Agricola-aikajana
Kansallinen ontologiakirjastopalvelu ONKI http://onki.fi/
ONKI-palvelukonseptin idea ONKI tarjoaa kansalliset keskitetyt sanasto/ontologiapalvelut valmiina toiminnallisuuksina, jotka voidaan integroida kustannustehokkaasti osaksi sovelluksia Käsitteiden haku, selailu, valinta, laajennus, kääntäminen Hieman vastaavaan tapaan kuin esimerkiksi Google Maps tarjoaa karttapalvelut sovellusten käyttöön Käyttötapaukset Tiedon indeksointi sisältöä tuotettaessa» Museot, virastot, kirjastot, mediayritykset, kansalaiset... Tiedon haku» Esim. synonyymit, kyselyn laajentaminen, monikielisyys Sanastojen kehittämisen ja julkaisemisen tuki
ONKI:n käyttöönottotilanne 9 / 2011 Prototyyppi Living Laboratory ympäristössä 2009-2011 Ihmiset: 15 000+ uniikkia käyttäjää / kk (domain) Koneet: 310 rekiströitynyttä käyttäjää (domain) ONKI konsortio valmisteilla ONKI:n ylläpito FinnONTO:n jälkeen (2012-) Kansalliskirjasto ryhtymässä vetäjäksi (suunnitelma) Hakemus arvioitavana OKM:ssä ja VM:ssä
What is the Semantic Web? Content perspective: A new metadata layer on the web describing its contents in terms of shared vocabularies, i.e. ontologies» Web as a global database system» Web of Pages vs. Web of Data Application perspective: Machine understandable web» The meaning (semantics) of contents accessible to machines» Enables human usage Intelligent web services Semantic interoperability Techological perspective: Next layers above XML» W3C standards: RDF, OWL etc. Metadata Ontology Rules