Semanttinen web. miksi "normi-web" ei riitä? Petri Tonteri, ,

Samankaltaiset tiedostot
Kirjastoverkkopäivät Marja-Liisa Seppälä Kansalliskirjasto

Avoin data Avoin kirjasto Kuvailupäivät

Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

W3C-teknologiat ja yhteensopivuus

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Mikä on semanttinen web?

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

RDA (Resource Description and Access) & FRBR-käsitemalli

Semanttinen Finlex Arttu Oksanen ( )

Open > Link > GO Avointa linkitettyä dataa kirjastomaailmassa

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Miten ja miksi asiasanastoista kehitetään ontologioita

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

TP1: Metatietovaranto-konsepti muuttuvassa ympäristössä

Yleinen suomalainen ontologia YSO

W3C ja Web-teknologiat

Käsitemallit RDA-sääntöjen taustalla. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

ONKI Living Lab. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

The OWL-S are not what they seem

W3C ja Web-teknologiat

Luento 12: XML ja metatieto

YSAsta YSOon kirjastoissa: miksi ja miten

Internet jolla on merkitystä

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Paikkatiedot ja Web-standardit

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Metatiedot organisaatioiden sisällönhallinnassa

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Ontologiakirjasto ONKI-Paikka

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Miten avoin yhdistetty tieto saadaan verkkoon: kansallinen Linked Data Finland -hanke-ehdotus

W3C: teknologia ja (tieto)yhteiskunta

YSAsta YSOon. Mikko Lappalainen Sisällönkuvailun asiantuntijaryhmän kokous,

FinnONTO-infrastruktuurin esittely

Sisällönhallinnan menetelmiä

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Kim Viljanen

Kuvailun muutoksen visualisointi Marja-Liisa Seppälä / Kansalliskirjasto

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Semanttinen Finlex Visio ja sen toteutus

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Käsitemallit muistiorganisaatioiden kuvailun yhdenmukaistamisen välineenä

W3C ja alueellinen standardointi

3 Verkkosaavutettavuuden tekniset perusteet

Pysyvät tunnukset ja niiden hyödyntäminen

Finto-palvelu ja ontologioiden käyttöönotto sisällönkuvailussa

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

Kansalliskirjasto ja Finto-palvelu kuvailun infrastruktuurin rakentajana

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

labs.kirjastot.fi Antti Pakarinen Timo Tuominen

ONKI: sanastojen ja avoimen linkitetyn datan tekninen infrastruktuuri Juha Hakala Kansalliskirjasto

Kansallinen yhteisluettelo kirjastojen luettelointiyhteistyön tukena. Pori Nina Hyvönen

Kuvailun kansallisten asiantuntijaryhmien suhteet ja roolit

Yleisen suomalaisen ontologian kehitystyö

ONKI-PROJEKTIN ESITTELY. Matias Frosterus ja Osma Suominen JHKA sanastotyöpaja

10 Nykyaikainen WWW-arkkitehtuuri

W3C ja Web-teknologiat

Asiasanastosta ontologiaksi

Juha Hakala Kansalliskirjasto

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

RDA, BIBFRAME, Melinda kuinka kuvailutyö uudistuu

Kohti suomalaista semanttista webiä

Paikannimirekisteri linkitettynä tietona

Avoin data, avoimet rajapinnat ja tietojen linkitys. Osma Suominen Suomi.fi

Lauri Roine. BIBLIOGRAFISEN VALVONNAN UUSIA TUULIA: RDA-luettelointisäännöstön ja Bibframe-luettelointiformaatin nykytilanne ja tulevaisuudennäkymiä

Digitalisaatio oppimisen maailmassa. Tommi Lehmusto Digital Advisor Microsoft Services

Uusi käsitemalli IFLA LRM

Yleisten kirjastojen kuvailutyön kansallinen viitekehys. Yleisten kirjastojen neuvosto Anu Jäppinen

Avoimet standardit ja arkistointi

RDA mitä, miten, milloin. Asiantuntijaseminaari Marja-Liisa Seppälä

Kansalliset kehittämishankkeet: Etenemissuunnitelmat

Asiasanastoista ontologioita: Yleinen suomalainen ontologia YSO ja sen laajennukset

FinnONTO-hanke loi ontologisen perustan kansalliselle webin tietoinfrastruktuurille

Automaattinen semanttinen annotointi

Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

Johtamisen haaste kokonaisarkkitehtuuri menestyksen mahdollistajako?

Suomalainen kulttuuri ja semanttinen web

IoT (Internet-of-Things) - teknologian hyödyntäminen rakennuksien paloturvallisuuden kehityksessä ja integroidussa älykkäässä ympäristössä

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

XML johdanto, uusimmat standardit ja kehitys

Finto-palvelu ja ontologioiden kehitystyön tuki Suomessa

Metatietojen merkitys tiedonhallinnassa

Finto palveluiden toteuttamisen alustana

Aihe-entiteettien ominaisuuksien ja suhteiden merkitseminen. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.

Tieto matkaa maailmalle

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

SPARQL-workshop. Sini Pessala Kirjastoverkkopäivät KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Metatiedon yhteentoimivuutta edistävät palvelut ja projektit. Missä mennään -webinaari

Muutosten vuosikymmen

Median digitalisoituminen ja yhdistetty tieto - Svenska.yle.fi

Kirjastojen uuden taustajärjestelmän hankinta Mitä Voyagerin jälkeen? Päivikki Karhula Eduskunnan kirjasto

Metatietojen merkitys tiedonhallinnassa

Taustamuistio 1 (6) Yhteinen tiedon hallinta -hanke. Taustatietoa Sanaston metatietomallin määrittely -työpajan keskusteluun

Transkriptio:

Semanttinen web miksi "normi-web" ei riitä? Petri Tonteri, 28.9.2011, etunimi.sukunimi@tampere.fi

Mikä on semanttinen web? semanttinen web tiedon verkko (Web of Data) dokumenttien jakamisesta datan jakamiseen vähennetään monimerkityksisyyttä informaatio koneiden ymmärrettävässä muodossa standardointia Tim Berners-Lee ja World Wide Web Consortium (W3C) > WWW:n standardeja alias suosituksia W3C Library Linked Data Incubator Group standardoitavia teknologioita esim. Resource Description Framework (RDF)

Millä keinoin?

Resource Description Framework (RDF) tietomalli, jossa tietämys esitetään lausekkeina lausekkeet muodostavat RDF-verkon RDF on kuvailumalli, jossa entiteettien välisiä suhteita ns. tripla-väittein. Triplat koostuvat 1. subjektista 2. predikaatista 3. objektista.

Linkitetty (avoin) data vähän niinkuin linkitykset HTML-dokumenttien välillä

Linkitetty (avoin) data, 2 linkitetty data linkitetty avoin data periaatteet: 1. identifioidaan asioita URIen avulla (Uniform Resource Identifier), käytännössä esim. Uniform Resource Locator (URL) -osoittein, esim. http://www.kirjasampo.fi/ 2. käytetään HTTP-muotoista URIa helpomman käytettävyyden vuoksi 3. tarjotaan käyttökelpoista standardimuotoista informaatiota (esim. RDF jne) 4. linkitetään dataa muualle webiin.

Esimerkki

?

{identifikaattori: Veikko Huovinen} {identifikaattori: on teoksen tekijä} {identifikaattori: Hamsterit}

? {identifikaattori: on teoksen tekijä} {identifikaattori: Hamsterit} <http://id.loc.gov/authorities/names/n82099572> <http: //rdvocab.info/roles/author> <http://www.worldcat. org/oclc/15026414>

jwyg, 2009, http://www.flickr.com/photos/jwyg/3792267659/

Rakenteinen linkitetty data mahdollistaa että 1. tietokoneet voivat "ymmärtää" sisältöjä ja 2. tietokoneet voivat "tehdä päätelmiä" sisällöistä.

Ontologiat termit ovat koneluettavassa muodossa YSO: ontologisoitu, ei hierarkialtaan täydellinen, mutta korjattavissa ja täydennettävissä sisältöjen kuvailuun hakutuloksiin esiin eri näkökulmat, esim. Nokia: paikkakunta >< yritys jne sokeritauti diabetes

YSA : jalkineet

YSO : jalkineet

eli kritiikkiosasto Internetin laajuus: automatisoitujen päättelyjärjestelmien on hanskattava valtavaa määrää sisältöjä epätäsmälliset käsitteet, kuten nuori ja kookas täsmälliset käsitteet, joilla on epävarmat arvot, esimerkiksi potilaan oireet voivat sopia moniin erilaisiin diagnooseihin ristiriitaisuudet, joita väistämättä syntyy ontologioita kehitettäessä ja kun eri lähteistä tulevia ontologioita yhdistellään inhimillinen käyttäytyminen ja henkilökohtaiset mieltymykset syllogismisyytös: onko maailma puristettavissa deduktiivisiksi päättelyketjuiksi?

Mitä sitten eli mitä iloa? itseasiassa nyky-webin tuunausta informaation helpompi 1. löydettävyys 2. jaettavuus 3. yhdisteltävyys muuhun informaatioon W3C Library Linked Data Incubator Groupin työversio linkitetystä datasta

Hyödyt tutkijoille, opiskelijoille, loppukäyttäjille parempaa löydettävyyttä ja datan käytettävyyttä helpommin linkityksiä kirjastopalvelujen ja eikirjastopalvelujen välille

Hyödyt organisaatioille linkitettyä dataa tuotetaan hajautetusti teknologisilta ratkaisuiltaan perustuu yleisiin standardeihin > yhteentoimivuus > helpottaa kilpailuttamista ja osaajien rekrytointia jne. läsnäolo webissä lisääntyy

Hyödyt informaatioammattilaisille kuten kirjastolaisille ja arkistolaisille linkitettyyn avoimeen dataan siirtyessään kirjastot luovat avoimen, globaalin jaetun datavarannon sisällönkuvailussa web-lähtöiset teknologiat tekevät resurssien kuvailuista moderneja ja helposti hyödynnettäviä yleisesti käytössä olevien identifikaattorien käyttö säilyttää merkityksensä helpommin formaattimuutosten yli

Hyödyt kehittäjille ja järjestelmäntoimittajille linkitetyn datan menetelmät tukevat datan hakemista ja uudelleen hyödyntämistä. Linkitetty data käyttää tunnettuja ja standardeja web-protokollia kuten Hypertext Transport Protocol (HTTP) irti kirjastospesifeistä dataformaatteihin linkitettyä dataa tukevat järjestelmäntoimittajat voivat tarjota tuotteitaan myös kirjastomaailman ulkopuolelle

Käytännön esimerkkejä

Miten kirjastot tähän istuu? 1. Nykytilanne 2. Semanttisen webin projekteista kirjastoissa 3. Mitä seuraavaksi?

Mikä tökkii? 1. kirjastodataa ei ole perusteellisesti avattu muulle webille 2. kirjastostandardit on tarkoitettu vain kirjastoyhteisölle (esim. MARC, Z39.50) 3. kirjastoyhteisöllä ja semanttisen webin yhteisöllä on eri terminologia 4. kirjastoteknologiset muutokset riippuvat järjestelmäntoimittajista.

Ongelmia alias esteitä alias hidasteita alias haasteita... käsitteellisesti hankala asia paljolti asiantuntijoiden, tutkijoiden pelikenttää tarpeita metadataperustan muutokselle käytännön esimerkkejä vähän kirjastojärjestelmillä ei ole tukea semanttiselle webille, esim. RDF ontologioiden ongelmat.

Esimerkkejä kirjastoista

British Library Gate Shadow, C. G. P. Grey, 2005

maxf

Mitä seuraavaksi? potentiaalisten datajoukkojen identifiointia (high priority, low effort) linkitetty avoin data agendoihin mukaan semanttisen webin standardointityöhön kirjastostandardien yhteensopivuus semanttisen webin standardien kanssa

Summa summarumia linkitetyn avoimen datan web on dynaaminen lupauksia mm. moniselitteisyyden väheneminen, tarkemmat hakutulokset yksi vastaus tiedonhakuvaivoihin standardointia lisää ja ulos kirjastoympyröistä: mahdollisuus kirjastoille ja järjestelmävalmistajille osaamishaaste yhteisluetteloteema järjestelmäriippumattomuutta, yhteentoimivuutta

Lähteitä Alang, Navneet (2011). Quora: Has Social Trumped the Semantic Web? http://www.techi.com/2011/01/quora-has-socialtrumped-the-semantic-web/ [Viitattu 20.9.2011] Anderson, Janna; Rainie, Lee (2010). The Fate of the Semantic Web. Pew Internet. http://www.pewinternet. org/reports/2010/semantic-web/overview.aspx [Viitattu 23.8.2011] Aristoteelinen logiikka. Wikipedia. http://fi.wikipedia.org/w/index.php?title=aristoteelinen_logiikka&oldid=8945072 [Viitattu 13.9.2011] Autio-Tuuli, Marjatta (2009). RDA - uusi luettelointistandardi : käyttäjän tarpeet kuvailutietojen lähtökohdaksi. Aikakausjulkaisussa: Tietolinja, nro 1. http://urn.fi/urn:nbn:fi-fe200905201529 [Viitattu 17.9.2011] Autio-Tuuli, Marjatta; Seppälä, Marja-Liisa (2010). Kirjaston vastaus informaatioympäristön muutokseen : Semanttinen web, ontologiat ja standardit osana kirjastojen tiedonhallinnan infrastruktuuria. Aikakausjulkaisussa: Tietolinja, nro 3. http://urn.fi/urn:nbn:fi-fe201012143106 [Viitattu 17.9.2011] Belam, Martin (2010). Let a million data structures bloom... http://www.currybet.net/cbet_blog/2010/09/dconstruct-tomcoates-semantic-web-must-die.php [Viitattu 21.9.2011] Berners-Lee, Tim (2006). Linked Data. http://www.w3.org/designissues/linkeddata.html [Viitattu 18.9.2011] British Library (2010). 2020 Vision. http://www.bl.uk/2020vision [Viitattu 18.9.2011] Byrne, Gillian; Goddard, Lisa (2010). The Strongest Link: Libraries and Linked Data. Aikakausjulkaisussa: D-Lib Magazine, vol. 16, nro 11/12. http://dlib.org/dlib/november10/byrne/11byrne.html [Viitattu 21.8.2011] Digitorstai 22.9.2011. Kirjastokaista. Establishing the Connection: Creating a Linked Data Version of the BNB (2011). http://www.slideshare. net/nw13/establishing-the-connection-creating-a-linked-data-version-of-the-bnb [Viitattu 18.9.2011] Crualaoich, Daithi Ó (2010). Linked Data at the Guardian. http://www.guardian.co.uk/open-platform/blog/linked-dataopen-platform?cmp=twt_gu [Viitattu 20.9.2011] Digitorstai 22.9.2011. http://bambuser.com/channel/kirjastokaista1/broadcast/1989738 [Viitattu 26.9.2011] Europeana Connect. http://www.europeanaconnect.eu/index.php [Viitattu 19.9.2011] Final post. COMET (Cambridge Open METadata) project blog. http://cul-comet.blogspot.com/2011/07/final-post.html [Viitattu 19.9.2011] Ford, Paul (2003). A Response to Clay Shirky's The Semantic Web, Syllogism, and Worldview. http://www.ftrain. com/contrashirky.html [Viitattu 15.9.2011]

FRAD = Functional Requirements for Authority Data. Freebase. http://www.freebase.com/ [Viitattu 18.9.2011] Freebase-wiki. http://wiki.freebase.com/wiki/main_page [Viitattu 18.9.2011] Freebase. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=freebase&oldid=440874330 [Viitattu 18.9.2011] FRSAD = Functional Requirements for Subject Authority Data. Functional Requirements for Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php? title=functional_requirements_for_authority_data&oldid=451095480 [Viitattu 18.9.2011] Functional Requirements for Subject Authority Data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php? title=frsad&oldid=451095511 [Viitattu 18.9.2011] Gruber, Tom (1992). What is an Ontology? http://www-ksl.stanford.edu/kst/what-is-an-ontology.html [Viitattu 20.9.2011] Heath, Tom; Bizer, Christian (2011). Linked Data : Evolving the Web into a Global Data Space. http://linkeddatabook. com/editions/1.0/ [Viitattu 19.9.2011] Heinemann, Laila (2010). Kirjastodataa raakana? : näkökulmia bibliografisen datan avaamiseen. Aikakausjulkaisussa: Tietolinja, nro 2. http://urn.fi/urn:nbn:fi-fe201012143105 [Viitattu 26.9.2011] Helmet-aineistoluettelo. http://data.kirjastot.fi/data.html [Viitattu 27.9.2011] Kirjasampo. http://www.kirjasampo.fi/ [Viitattu 27.9.2011] Lassila, Matti. Kaukomieli-blog. http://www.kaukomieli.net/ [Viitattu 27.9.2011] Linked Data. http://www.w3.org/standards/semanticweb/data [Viitattu 23.9.2011] Linked Data : Connect Distributed Data across the Web. Frequently Asked Questions. http://linkeddata.org/faq [Viitattu 19.9.2011] Linked data. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=linked_data&oldid=449014322 [Viitattu 18.9.2011] LLD = Library Linked Data Incubator Group. LLD XG Final Report (Draft of the general part). Library Linked Data Incubator Group, W3C. http://www.w3. org/2005/incubator/lld/wiki/draftreportwithtransclusion [Viitattu 17.9.2011] Malmsten, Martin (2008). Making a Library Catalogue Part of the Semantic Web. International Conference on Dublin Core and Metadata Applications. Proceedings. http://dcpapers.dublincore.org/ojs/pubs/article/viewarticle/927 [Viitattu 21.8.2011] McComb, Dave. Shirky, Syllogism and the Semantic Web. http://semanticarts.com/articles/shirky-syllogism-and-the-

Miller, Eric (1998). An Introduction to the Resource Description Framework. Aikakausjulkaisussa: D-Lib Magazine, may 1998. http://www.dlib.org/dlib/may98/miller/05miller.html [Viitattu 21.8.2011] Ontologia (tietojenkäsittelytiede). Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php?title=ontologia_(tietojenk%c3% A4sittelytiede)&oldid=10697296 [Viitattu 20.9.2011] Ontology. http://semanticweb.org/wiki/ontology [Viitattu 20.9.2011] Quertle. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php?title=quertle&oldid=441616035 [Viitattu 18.9.2011] RDA = Resource Description and Access. RDF = Resource Description Framework. Resource Description and Access. Wikipedia-artikkeli. http://en.wikipedia.org/w/index.php? title=resource_description_and_access&oldid=450956049 [Viitattu 17.9.2011] Resource Description Framework. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=rdf&oldid=9599449 [Viitattu 21.8.2011] SeCo = Semantic Computing Research Group. Semantic Computing Research Group (Semanttisen laskennan tutkimusryhmä). http://www.seco.tkk.fi/ [Viitattu 23.9.2011] Semantic Web. W3C. http://www.w3.org/standards/semanticweb/ [Viitattu 18.9.2011] Semantic Web. Wikipedia. http://en.wikipedia.org/w/index.php?title=semantic_web&oldid=449643399 [Viitattu 11.9.2011] Shirky, Clay (2003). The Semantic Web, Syllogism, and Worldview. http://www.shirky.com/writings/semantic_syllogism. html [Viitattu 13.9.2011] Sig.ma. http://sig.ma/ [Viitattu 18.9.2011] Stoll, Clifford (1995). The Internet? Bah! : Hype alert: Why cyberspace isn't, and will never be, nirvana. http://www. thedailybeast.com/newsweek/1995/02/26/the-internet-bah.html [Viitattu 13.9.2011] Styles, Rob; Ayers, Danny; Shabir, Nadeem (2008). Semantic MARC, MARC21 and the Semantic Web. http://events. linkeddata.org/ldow2008/papers/02-styles-ayers-semantic-marc.pdf [Viitattu 26.9.2011] ThisWeKnow. http://www.thisweknow.org/ [Viitattu 20.9.2011] Tonteri semanttisesta webistä. http://sorvipenkki.wordpress.com/tag/semanttinen-web/ [Viitattu 23.9.2011] Tuominen, Jouni (2010). Helppokytkentäiset ontologiapalvelut semanttisessa webissä. http://www.seco.tkk. fi/publications/2010/tuominen-gradu-2010.pdf [Viitattu 26.9.2011]

Understanding the Semantic Web: Bibliographic Data and Metadata (2010). Aikakausjulkaisussa: Library Technology Reports, vol. 46, nro 1. http://alatechsource.metapress.com/content/g212v1783607/? p=e4abf7498a9c4188a195f66474b1e80f&pi=12 [Viitattu 26.8.2011] URI. Wikipedia-artikkeli. https://secure.wikimedia.org/wikipedia/fi/w/index.php?title=uri&oldid=9936126 [Viitattu 19.9.2011] URI = Uniform Resource Identifier. W3C = World Wide Web Consortium. W3C Library Linked Data Incubator Group. http://www.w3.org/2005/incubator/lld/ [Viitattu 17.9.2011] World Wide Web Consortium. Wikipedia-artikkeli. http://fi.wikipedia.org/w/index.php? title=world_wide_web_consortium&oldid=10525438 [Viitattu 26.9.2011]