Semanttinen web miksi "normi-web" ei riitä? Petri Tonteri, 28.9.2011, etunimi.sukunimi@tampere.fi
Mikä on semanttinen web? semanttinen web tiedon verkko (Web of Data) dokumenttien jakamisesta datan jakamiseen vähennetään monimerkityksisyyttä informaatio koneiden ymmärrettävässä muodossa standardointia Tim Berners-Lee ja World Wide Web Consortium (W3C) > WWW:n standardeja alias suosituksia W3C Library Linked Data Incubator Group standardoitavia teknologioita esim. Resource Description Framework (RDF)
Millä keinoin?
Resource Description Framework (RDF) tietomalli, jossa tietämys esitetään lausekkeina lausekkeet muodostavat RDF-verkon RDF on kuvailumalli, jossa entiteettien välisiä suhteita ns. tripla-väittein. Triplat koostuvat 1. subjektista 2. predikaatista 3. objektista.
Linkitetty (avoin) data vähän niinkuin linkitykset HTML-dokumenttien välillä
Linkitetty (avoin) data, 2 linkitetty data linkitetty avoin data periaatteet: 1. identifioidaan asioita URIen avulla (Uniform Resource Identifier), käytännössä esim. Uniform Resource Locator (URL) -osoittein, esim. http://www.kirjasampo.fi/ 2. käytetään HTTP-muotoista URIa helpomman käytettävyyden vuoksi 3. tarjotaan käyttökelpoista standardimuotoista informaatiota (esim. RDF jne) 4. linkitetään dataa muualle webiin.
Esimerkki
?
{identifikaattori: Veikko Huovinen} {identifikaattori: on teoksen tekijä} {identifikaattori: Hamsterit}
? {identifikaattori: on teoksen tekijä} {identifikaattori: Hamsterit} <http://id.loc.gov/authorities/names/n82099572> <http: //rdvocab.info/roles/author> <http://www.worldcat. org/oclc/15026414>
jwyg, 2009, http://www.flickr.com/photos/jwyg/3792267659/
Rakenteinen linkitetty data mahdollistaa että 1. tietokoneet voivat "ymmärtää" sisältöjä ja 2. tietokoneet voivat "tehdä päätelmiä" sisällöistä.
Ontologiat termit ovat koneluettavassa muodossa YSO: ontologisoitu, ei hierarkialtaan täydellinen, mutta korjattavissa ja täydennettävissä sisältöjen kuvailuun hakutuloksiin esiin eri näkökulmat, esim. Nokia: paikkakunta >< yritys jne sokeritauti diabetes
YSA : jalkineet
YSO : jalkineet
eli kritiikkiosasto Internetin laajuus: automatisoitujen päättelyjärjestelmien on hanskattava valtavaa määrää sisältöjä epätäsmälliset käsitteet, kuten nuori ja kookas täsmälliset käsitteet, joilla on epävarmat arvot, esimerkiksi potilaan oireet voivat sopia moniin erilaisiin diagnooseihin ristiriitaisuudet, joita väistämättä syntyy ontologioita kehitettäessä ja kun eri lähteistä tulevia ontologioita yhdistellään inhimillinen käyttäytyminen ja henkilökohtaiset mieltymykset syllogismisyytös: onko maailma puristettavissa deduktiivisiksi päättelyketjuiksi?
Mitä sitten eli mitä iloa? itseasiassa nyky-webin tuunausta informaation helpompi 1. löydettävyys 2. jaettavuus 3. yhdisteltävyys muuhun informaatioon W3C Library Linked Data Incubator Groupin työversio linkitetystä datasta
Hyödyt tutkijoille, opiskelijoille, loppukäyttäjille parempaa löydettävyyttä ja datan käytettävyyttä helpommin linkityksiä kirjastopalvelujen ja eikirjastopalvelujen välille
Hyödyt organisaatioille linkitettyä dataa tuotetaan hajautetusti teknologisilta ratkaisuiltaan perustuu yleisiin standardeihin > yhteentoimivuus > helpottaa kilpailuttamista ja osaajien rekrytointia jne. läsnäolo webissä lisääntyy
Hyödyt informaatioammattilaisille kuten kirjastolaisille ja arkistolaisille linkitettyyn avoimeen dataan siirtyessään kirjastot luovat avoimen, globaalin jaetun datavarannon sisällönkuvailussa web-lähtöiset teknologiat tekevät resurssien kuvailuista moderneja ja helposti hyödynnettäviä yleisesti käytössä olevien identifikaattorien käyttö säilyttää merkityksensä helpommin formaattimuutosten yli
Hyödyt kehittäjille ja järjestelmäntoimittajille linkitetyn datan menetelmät tukevat datan hakemista ja uudelleen hyödyntämistä. Linkitetty data käyttää tunnettuja ja standardeja web-protokollia kuten Hypertext Transport Protocol (HTTP) irti kirjastospesifeistä dataformaatteihin linkitettyä dataa tukevat järjestelmäntoimittajat voivat tarjota tuotteitaan myös kirjastomaailman ulkopuolelle
Käytännön esimerkkejä
Miten kirjastot tähän istuu? 1. Nykytilanne 2. Semanttisen webin projekteista kirjastoissa 3. Mitä seuraavaksi?
Mikä tökkii? 1. kirjastodataa ei ole perusteellisesti avattu muulle webille 2. kirjastostandardit on tarkoitettu vain kirjastoyhteisölle (esim. MARC, Z39.50) 3. kirjastoyhteisöllä ja semanttisen webin yhteisöllä on eri terminologia 4. kirjastoteknologiset muutokset riippuvat järjestelmäntoimittajista.
Ongelmia alias esteitä alias hidasteita alias haasteita... käsitteellisesti hankala asia paljolti asiantuntijoiden, tutkijoiden pelikenttää tarpeita metadataperustan muutokselle käytännön esimerkkejä vähän kirjastojärjestelmillä ei ole tukea semanttiselle webille, esim. RDF ontologioiden ongelmat.
Esimerkkejä kirjastoista
British Library Gate Shadow, C. G. P. Grey, 2005
maxf
Mitä seuraavaksi? potentiaalisten datajoukkojen identifiointia (high priority, low effort) linkitetty avoin data agendoihin mukaan semanttisen webin standardointityöhön kirjastostandardien yhteensopivuus semanttisen webin standardien kanssa
Summa summarumia linkitetyn avoimen datan web on dynaaminen lupauksia mm. moniselitteisyyden väheneminen, tarkemmat hakutulokset yksi vastaus tiedonhakuvaivoihin standardointia lisää ja ulos kirjastoympyröistä: mahdollisuus kirjastoille ja järjestelmävalmistajille osaamishaaste yhteisluetteloteema järjestelmäriippumattomuutta, yhteentoimivuutta
Lähteitä Alang, Navneet (2011). Quora: Has Social Trumped the Semantic Web? http://www.techi.com/2011/01/quora-has-socialtrumped-the-semantic-web/ [Viitattu 20.9.2011] Anderson, Janna; Rainie, Lee (2010). The Fate of the Semantic Web. Pew Internet. http://www.pewinternet. org/reports/2010/semantic-web/overview.aspx [Viitattu 23.8.2011] Aristoteelinen logiikka. Wikipedia. http://fi.wikipedia.org/w/index.php?title=aristoteelinen_logiikka&oldid=8945072 [Viitattu 13.9.2011] Autio-Tuuli, Marjatta (2009). RDA - uusi luettelointistandardi : käyttäjän tarpeet kuvailutietojen lähtökohdaksi. Aikakausjulkaisussa: Tietolinja, nro 1. http://urn.fi/urn:nbn:fi-fe200905201529 [Viitattu 17.9.2011] Autio-Tuuli, Marjatta; Seppälä, Marja-Liisa (2010). Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria. Aikakausjulkaisussa: Tietolinja, nro 3. http://urn.fi/urn:nbn:fi-fe201012143106 [Viitattu 17.9.2011] Belam, Martin (2010). Let a million data structures bloom... http://www.currybet.net/cbet_blog/2010/09/dconstruct-tomcoates-semantic-web-must-die.php [Viitattu 21.9.2011] Berners-Lee, Tim (2006). Linked Data. http://www.w3.org/designissues/linkeddata.html [Viitattu 18.9.2011] British Library (2010). 2020 Vision. http://www.bl.uk/2020vision [Viitattu 18.9.2011] Byrne, Gillian; Goddard, Lisa (2010). The Strongest Link: Libraries and Linked Data. Aikakausjulkaisussa: D-Lib Magazine, vol. 16, nro 11/12. http://dlib.org/dlib/november10/byrne/11byrne.html [Viitattu 21.8.2011] Digitorstai 22.9.2011. Kirjastokaista. Establishing the Connection: Creating a Linked Data Version of the BNB (2011). http://www.slideshare. net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnb [Viitattu 18.9.2011] Crualaoich, Daithi Ó (2010). Linked Data at the Guardian. http://www.guardian.co.uk/open-platform/blog/linked-dataopen-platform?cmp=twt_gu [Viitattu 20.9.2011] Digitorstai 22.9.2011. http://bambuser.com/channel/kirjastokaista1/broadcast/1989738 [Viitattu 26.9.2011] Europeana Connect. http://www.europeanaconnect.eu/index.php [Viitattu 19.9.2011] Final post. COMET (Cambridge Open METadata) project blog. http://cul-comet.blogspot.com/2011/07/final-post.html [Viitattu 19.9.2011] Ford, Paul (2003). A Response to Clay Shirky's The Semantic Web, Syllogism, and Worldview. http://www.ftrain. com/contrashirky.html [Viitattu 15.9.2011]
FRAD = Functional Requirements for Authority Data. Freebase. http://www.freebase.com/ [Viitattu 18.9.2011] Freebase-wiki. http://wiki.freebase.com/wiki/main_page [Viitattu 18.9.2011] Freebase. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=freebase&oldid=440874330 [Viitattu 18.9.2011] FRSAD = Functional Requirements for Subject Authority Data. Functional Requirements for Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php? title=functional_requirements_for_authority_data&oldid=451095480 [Viitattu 18.9.2011] Functional Requirements for Subject Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php? title=frsad&oldid=451095511 [Viitattu 18.9.2011] Gruber, Tom (1992). What is an Ontology? http://www-ksl.stanford.edu/kst/what-is-an-ontology.html [Viitattu 20.9.2011] Heath, Tom; Bizer, Christian (2011). Linked Data : Evolving the Web into a Global Data Space. http://linkeddatabook. com/editions/1.0/ [Viitattu 19.9.2011] Heinemann, Laila (2010). Kirjastodataa raakana? : näkökulmia bibliografisen datan avaamiseen. Aikakausjulkaisussa: Tietolinja, nro 2. http://urn.fi/urn:nbn:fi-fe201012143105 [Viitattu 26.9.2011] Helmet-aineistoluettelo. http://data.kirjastot.fi/data.html [Viitattu 27.9.2011] Kirjasampo. http://www.kirjasampo.fi/ [Viitattu 27.9.2011] Lassila, Matti. Kaukomieli-blog. http://www.kaukomieli.net/ [Viitattu 27.9.2011] Linked Data. http://www.w3.org/standards/semanticweb/data [Viitattu 23.9.2011] Linked Data : Connect Distributed Data across the Web. Frequently Asked Questions. http://linkeddata.org/faq [Viitattu 19.9.2011] Linked data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=linked_data&oldid=449014322 [Viitattu 18.9.2011] LLD = Library Linked Data Incubator Group. LLD XG Final Report (Draft of the general part). Library Linked Data Incubator Group, W3C. http://www.w3. org/2005/incubator/lld/wiki/draftreportwithtransclusion [Viitattu 17.9.2011] Malmsten, Martin (2008). Making a Library Catalogue Part of the Semantic Web. International Conference on Dublin Core and Metadata Applications. Proceedings. http://dcpapers.dublincore.org/ojs/pubs/article/viewarticle/927 [Viitattu 21.8.2011] McComb, Dave. Shirky, Syllogism and the Semantic Web. http://semanticarts.com/articles/shirky-syllogism-and-the-
Miller, Eric (1998). An Introduction to the Resource Description Framework. Aikakausjulkaisussa: D-Lib Magazine, may 1998. http://www.dlib.org/dlib/may98/miller/05miller.html [Viitattu 21.8.2011] Ontologia (tietojenkäsittelytiede). Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php?title=ontologia_(tietojenk%c3% A4sittelytiede)&oldid=10697296 [Viitattu 20.9.2011] Ontology. http://semanticweb.org/wiki/ontology [Viitattu 20.9.2011] Quertle. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=quertle&oldid=441616035 [Viitattu 18.9.2011] RDA = Resource Description and Access. RDF = Resource Description Framework. Resource Description and Access. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php? title=resource_description_and_access&oldid=450956049 [Viitattu 17.9.2011] Resource Description Framework. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=rdf&oldid=9599449 [Viitattu 21.8.2011] SeCo = Semantic Computing Research Group. Semantic Computing Research Group (Semanttisen laskennan tutkimusryhmä). http://www.seco.tkk.fi/ [Viitattu 23.9.2011] Semantic Web. W3C. http://www.w3.org/standards/semanticweb/ [Viitattu 18.9.2011] Semantic Web. Wikipedia. http://en.wikipedia.org/w/index.php?title=semantic_web&oldid=449643399 [Viitattu 11.9.2011] Shirky, Clay (2003). The Semantic Web, Syllogism, and Worldview. http://www.shirky.com/writings/semantic_syllogism. html [Viitattu 13.9.2011] Sig.ma. http://sig.ma/ [Viitattu 18.9.2011] Stoll, Clifford (1995). The Internet? Bah! : Hype alert: Why cyberspace isn't, and will never be, nirvana. http://www. thedailybeast.com/newsweek/1995/02/26/the-internet-bah.html [Viitattu 13.9.2011] Styles, Rob; Ayers, Danny; Shabir, Nadeem (2008). Semantic MARC, MARC21 and the Semantic Web. http://events. linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdf [Viitattu 26.9.2011] ThisWeKnow. http://www.thisweknow.org/ [Viitattu 20.9.2011] Tonteri semanttisesta webistä. http://sorvipenkki.wordpress.com/tag/semanttinen-web/ [Viitattu 23.9.2011] Tuominen, Jouni (2010). Helppokytkentäiset ontologiapalvelut semanttisessa webissä. http://www.seco.tkk. fi/publications/2010/tuominen-gradu-2010.pdf [Viitattu 26.9.2011]
Understanding the Semantic Web: Bibliographic Data and Metadata (2010). Aikakausjulkaisussa: Library Technology Reports, vol. 46, nro 1. http://alatechsource.metapress.com/content/g212v1783607/? p=e4abf7498a9c4188a195f66474b1e80f&pi=12 [Viitattu 26.8.2011] URI. Wikipedia-artikkeli. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=uri&oldid=9936126 [Viitattu 19.9.2011] URI = Uniform Resource Identifier. W3C = World Wide Web Consortium. W3C Library Linked Data Incubator Group. http://www.w3.org/2005/incubator/lld/ [Viitattu 17.9.2011] World Wide Web Consortium. Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php? title=world_wide_web_consortium&oldid=10525438 [Viitattu 26.9.2011]