Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä



Samankaltaiset tiedostot
Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

Sisältö. Miten hyötypalveluja Webiin saadaan? Mitä hyötyä on Webistä? Kehityksen este Webissä? Miten Webistä tulee älykkäämpi?

Sisältö. Semanttinen Web. WWW:n perusta. WWW tänään. WWW tänään: palvelut ja tiedonhaku. Toiminnalliset palvelut: ongelmia

Sisältö. Semanttinen Web ja Web palvelut Sisältötuotannon ja palveluiden tulevaisuus Internetissä. WWW:n perusta. WWW tänään

Sisältö. Semanttinen Web - tulevaisuuden Internet? WWW:n perusta. WWW tänään. WWW tänään: palvelut ja tiedonhaku. Toiminnalliset palvelut: ongelmia

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

Internetin tulevaisuudennäkymiä Semanttinen web ja älykkäät palvelut

Mikä on semanttinen web?

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Luento 12: XML ja metatieto

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Sisällys. Valtion tietotekniikan rajapintasuosituksia. XML:n rooleja sähköisen asioinnin tavoitearkkitehtuurissa. dbroker - asiointialusta

XML johdanto, uusimmat standardit ja kehitys

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

W3C-teknologiat ja yhteensopivuus

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Sisällönhallinnan menetelmiä

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

TESAURUKSET JA ONTOLOGIAT

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

Paikkatiedot ja Web-standardit

W3C ja alueellinen standardointi

Ajankohtaisia SOA tutkimusteemoja

W3C, Web-teknologiat ja XML

The OWL-S are not what they seem

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Semanttinen web ja sukututkimus

Semantic Web - kohti uutta merkitysten Internetiä

W3C ja Web-teknologiat

Metatietojen merkitys tiedonhallinnassa

Semanttisen Webin mahdollisuudet yrityksille

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

W3C ja Web-teknologiat

Semanttisen webin idea

Avoimet standardit ja arkistointi

XML-evoluutio ja kestävä kehitys

3 Verkkosaavutettavuuden tekniset perusteet

Metatietojen merkitys tiedonhallinnassa

Taustamuistio 1 (6) Yhteinen tiedon hallinta -hanke. Taustatietoa Sanaston metatietomallin määrittely -työpajan keskusteluun

Semanttinen Finlex Visio ja sen toteutus

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Miten tästä eteenpäin? FinnONTO 2.0:n jatkonäkymiä Semanttiset jokapaikan palvelut

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Metatiedot organisaatioiden sisällönhallinnassa

W3C ja Web-teknologiat

Semanttinen web - lyhyt johdatus

Semantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy

XML ja Web Services update

Kohti suomalaisen semanttista webiä -- ontologioita, palveluita ja sovelluksia

FinnONTO-infrastruktuurin esittely

Esityksen sisältö. Kokoelmatietojen siirto MuseoSuomi-järjestelmään. 1. Sisällöntuotannon ongelma: lähtökohdat ja tavoitteet

Internet jolla on merkitystä

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

Johdatus rakenteisiin dokumentteihin

Rakenteisten dokumenttien jatkokurssi, syksy 2006

Keltaisten sivujen palveluiden kuvaaminen ontologioiden avulla

Molempien kehityssuuntien edellytys. Ontologiat: semanttisen webin ydinteknologia. Webin kehityssuuntia. WWW:n tulevaisuus? Ontology: perspectives

Ontologiat: standardeja, työkaluja

10 Nykyaikainen WWW-arkkitehtuuri

W3C: teknologia ja (tieto)yhteiskunta

Tietokantajärjestelmien tulevaisuuden haasteet. Jan Lindström

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Mitä mahdollisuuksia tuloksemme tarjoavat museoille?

CIRI Ontologiaperustainen tiedonhakuliittymä

Johdatus XML teknologioihin

Terveys- ja yrityspalvelutyöpajan tutkimus Eero Hyvönen, Mikko Salonoja, Reetta Sinkkilä, Osma Suominen, Antti Tani

in condition monitoring

HSMT J2EE & EJB & SOAP &...

Neoxen Systems on suomalainen ohjelmistotalo. Olemme erikoistuneet tiedon- ja oppimisen hallinnan ratkaisuihin.

Valtioneuvoston tietosisältöjen semanttinen yhteentoimivuus

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Web ja semanttinen web organisaatioissa

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Semanttinen web: visio uudesta webistä

Paikannimirekisteri linkitettynä tietona

Ontologiakirjasto ONKI-Paikka

Viestintätekniikka AS-tutkinto-ohjelmassa. Eero Hyvönen

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

W3C, Web-teknologiat ja Semanttinen Web

Semanttinen Web Mitä se on käytännössä?

Johdanto: Semanttinen Kalevala projekti

Verkkopalveluiden saavutettavuus

Semanttisen webin hyödyntäminen terveystiedon löydettävyydessä

Tiedonsiirto- ja rajapintastandardit

ONKI kansallinen ontologiapalvelu: kohti yhtenäistä sisällönkuvailua

MALog-projekti kehittää oppimateriaalia matemaattiseen logiikkaan. Insinöörikoulutuksen foorumi

Mikä on internet, miten se toimii? Mauri Heinonen

Semanttinen Web ja Webteknologiat

Transkriptio:

Semantic Web - kohti uutta merkitysten Internetiä Prof. Eero Hyvönen Helsingin yliopisto Helsinki Institute for Information Technology 1-marras-01 1 Visio tulevaisuuden Webistä Mitä hyötyä on Webistä? Keskeistä WWW:n tarjoamat palvelut Vrt. 3G, Sonera, Elisa, dot.com-kupla Miten hyötypalveluja Webiin saadaan? Sisältö tärkeää (materiaalin digitointi) Palvelun äly tärkeää (sisällön hyödyntäminen) Käyttömukavuus tärkeää ihmiselle Keskeinen edellytys? Sisältöjen koneellinen "ymmärtäminen" 1-marras-01 2 Vision este Webissä WWW:n sisällöt ovat ihmislukijaa varten HTML, PDF, JPEG WWW:tä käyttävät kuitenkin myös koneet Hakukoneet, ostoagentit, verkkomönkijät jne. Periaatteessa kaikki WWW-sovellukset Yhä enenevässä määrin => Perustavaa laatua oleva ristiriita Ratkaisumalli 1: Älykkäämmät sovellukset Tiedon haku (information retrieval) Tiedon etsintä "surffailemalla" Assosiatiivisuus "Lost in hyperspace" -ongelma Hakurobotit Avainsanojen indeksointi Verkon viittausten hyödyntäminen (Google) 1-marras-01 3 1-marras-01 4 Tiedon ekstrahointi (information extraction) Merkityshahmojen tunnistaminen vapaamuotoisesta aineistosta Esim. kiiinnostavien uutisten tunnistus Tiedon louhinta (data mining) Klusterointi, sääntöjen oppiminen... Verkon louhinta (web mining) Sisällöt: Content mining Käyttö: Usage mining 1-marras-01 5 1-marras-01 6 1

Ratkaisumalli 1:n ongelmat Ratkaisumalli 2: Semantic Web Kielen automaattisen tulkinnan vaikeus vapaamuotoisuus, sisällön semantiikka Ei-tekstuaaliset sisällöt kuva, ääni, musiikki, video, ohjelmisto Miten tulkita algoritmisesti? Tulkintaan ei riitä itse dokumentti Tarvitaan konteksti, common sense 1-marras-01 7 Talletetaan tieto niin, että tyhmempikin sen ymmärtää! Ihminen tulee konetta vastaan Kone voi auttaa ihmistä itsensä auttamisessa 1-marras-01 8 Semantic Web: Technology push Taso 1: Internet Luottamus (trust, proof) Päättely DAML+OIL, RuleML, KIF... Ontologiat WordNet, RosettaNet,... Metakuvaukset RDF, RDF(S), Topic Maps,... Rakenteen kuvaus XML, XML Scema, XSL,... Internet URI, Unicode... Palvelut, prosessit XML/edi, ebxml, UDDI, WSDL,... Kommunikointi SOAP, KQML, 1-marras-01 9 Ytimenä URI (Universal Resource Identifier) Esim. http://www.cs.helsinki.fi/ WWW = URI:en verkko Unicode-merkistö Kaikki maailman kielet Protokollat HTTP, FTP, TCP/IP 1-marras-01 10 Taso 2: Sisältöjen rakenne extensible Markup Language (XML) Meta-kieli sovelluskohtaisille kielille <OSOITE> Rakenteen ja ilmasun erottaminen Muunnokset ja ilmiasu: XSL 1-marras-01 11 XML ja "Semantic" Web? Semantiikka: "tutkii miten symbolit viittaavat toisiin olioihin" Intensio: käsitteen merkitys Extensio: käsitteen viittamat oliot XML on syntaktinen, ei semanttinen 1-marras-01 12 2

Miksi XML ei ole "semanttinen"? Taso 3: Semanttiset metakuvaukset <OSOITE> <OSOITE> Semantiikka on vain nahkakansissa, ei peltikuoressa 1-marras-01 13 Idea: rakenteelle on annettava merkitys (semantiikka) toisella tasolla Tärkeimmät Semantic Web -standardit W3C: RDF (S) ISO: Topic Maps, XTM 1-marras-01 14 RDF(S) RDF Resource Description Framework (1999) Yleinen verkkoresurssien kuvaamiskieli RDF Schema (2000) RDF- terminologian määrittely Käsitehierarkiat (Class/subClass/type) Topic Maps Ideoitu jo ennen WWW:tä 90-luvun alussa! Kirjan hakemisto lähtökohtana TAO: Topic - Association - Occurrence Semanttinen surffailu Webissä 1-marras-01 15 1-marras-01 16 RDF(S) ja XTM: semantiikan idea Kieliä WWW-resurssien kuvaamiseen Kielen muodot viittaavat alla oleviin resursseihin ja jopa itseensä (reifikaatio) Tietomalli ei ole sidottu XMLesitysmuotoon Sarjallistamistapa (serialization) periaatteessa yhdentekevä Kielet voidaan esittää muunkinlaisella syntaksilla Taso 4: Ontologiat Ontologia on formaali, eksplisiittinen määrittely yhteisestä käsitteistöstä (Gruber, 1993) Kuvaa sovellusmaailmassa olevat oliot Ensimmäinen edellytys sille, että ihmiset ja koneet voivat ymmärtää toisiaan 1-marras-01 17 1-marras-01 18 3

Ontologiat käytännössä Ontologin välineitä Yleisiä hierarkkisia sanastoja (esim. YSA, WordNet) Yleisiä maailmanmalleja (esim. CYC) Spesifejä ammattitermistöjä (esim. RosettaNet) Luokittelujärjestelmiä (esim. UDK) Loogisia terminologisia malleja Esityskielet Esimerkiksi DAML+OIL Ontologiaeditorit Esimerkiki Protégé, OilEd 1-marras-01 19 1-marras-01 20 Ontologin haasteita Terminologinen konsensus Eri tarpeiden ja mieltymisten sovittaminen Ontologioiden koko-ongelmat Riittävätkö resurssit, skaalautuvatko välineet? Ontologioiden muuttuminen Esim. Tsekkoslovakia valtio-ontologiassa Ontologioiden yhdistäminen Tasot 5-6: Logiikka ja luottamus Logiikkataso Päättely ja toiminta ontologian kuvaamiin oliohin liittyen Todistukset/perustelut (proof) Esim. RuleML -saantömerkkauskieli Luottamus Resurssien kuvailu/arvostelu (annotointi) Digitaaliset allekirjoitukset (digital signatures) 1-marras-01 21 1-marras-01 22 Webin sukupolvia Sovellusalueita 1G WWW: HTML-sivut ihmisen tulkittavaksi 2G WWW: XML-sivut ihmisen/koneen tulkittavaksi 3G WWW: Merkitykset ihmisen/koneen käytettäväksi => Uusi perusta älykkäille WWW-palveluille Kansainvälinen yhteistyö (W3C, XML, ) 1-marras-01 23 Informaation haku Seuraavan polven hakurobotit Älykkäät hakemistot Matchmaker-sovellukset Semanttiset portaalit 1-marras-01 24 4

Tietämyksen hallinta (knowledge management) Ongelmia Dokumenttien monimuotoisuus Maapalloistuminen -> sisältöjen hajautus Tietämyskannan komplisoituminen SW-tekniikat antavat uusia työkaluja Verkkokauppa (B2C) Uusi markkinointi- ja jakelukanava Uudet sähköiset liiketoimintamallit Sähköinen liiketoiminta (B2B) Transaktiot: EDI-XML Toimintakehykset: UDDI, ebxml, WSDL, RosettaNet Profilointi Ihmiset, palvelut, laitteet (CC/PP) 1-marras-01 25 1-marras-01 26 Semantic Web ja Suomi Semantic Web Kick-Off in Finland Kansainvälinen juna lähti jo XML-standardointihankkeet, 90-luvun loppu W3C Semantic Web Activity, 2001/kevät EU:n OntoWeb 2001/kesä Tärkeä ala, kick-off tarpeen Suomessa Teollinen intressi Tekninen mahdollisuus Tieteellinen haaste Kansallinen intressi 1-marras-01 27 Johdanto, visio (E. Hyvönen) W3C:n aktiviteetit (M.-R. Koivunen) Suomalainen yrityscase (J. Saarela) Teknologiakatsaus (Helsingin yliopisto) Suomalaiset hankkeet 1-marras-01 28 Tervetuloa verkottumaan semanttisesti! 1-marras-01 29 5