Semanttinen web: visio uudesta webistä

Samankaltaiset tiedostot
Web ja semanttinen web organisaatioissa

Semanttinen web - lyhyt johdatus

Mikä on semanttinen web?

Metatietojen merkitys tiedonhallinnassa

Metatietojen merkitys tiedonhallinnassa

Sisällönhallinnan menetelmiä

Sähköisten dokumenttien hallinta: peruskäsitteet ja kuvausmenetelmät

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Metatiedot organisaatioiden sisällönhallinnassa

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

Sisältöjen hallinta verkottuneessa tietoympäristössä

Internet - hyvän ja pahan tiedon tie

W3C-teknologiat ja yhteensopivuus

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Rakenteiset dokumentit Mitä hyötyä niistä on?

Semantic Web Sisältötuotannon ja palveluiden tulevaisuus

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Luento 12: XML ja metatieto

The OWL-S are not what they seem

Mikä on internet, miten se toimii? Mauri Heinonen

3 Verkkosaavutettavuuden tekniset perusteet

Internet jolla on merkitystä

Paikkatiedot ja Web-standardit

XML johdanto, uusimmat standardit ja kehitys

Avoimet standardit ja asiakirjamuodot Suomen julkisessa hallinnossa: teoriasta käytäntöön

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

10 Ohjelmoinnista Semanttisessa Webissä

Avoin tieto ja World Wide Web tietoyhteiskunnan palveluksessa. Open Data and the World Wide Web in Service for the Informaton Society

W3C ja Web-teknologiat

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

W3C ja Web-teknologiat

Sisällys. Valtion tietotekniikan rajapintasuosituksia. XML:n rooleja sähköisen asioinnin tavoitearkkitehtuurissa. dbroker - asiointialusta

Laajuus 5 op Luennot: 12 x 2t Harjoitukset: 7 viikkoharjoitusta harjoitusten tekemiseen saatavissa apua 2 ryhmää / harjoitus

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Verkkosisällön saavutettavuusohjeet 2.0: hyviä ohjeita monimuotoisen sisällön suunnitteluun ja arviointiin

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

ONKI-projekti tuo ontologiat käyttöön sisällönkuvailussa

W3C: teknologia ja (tieto)yhteiskunta

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Verkkopalveluiden saavutettavuus

Vaasan yliopiston toimintaa tukevat informaatiopalvelut ovat käytettävissä WWW:n kautta.

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Sisältö. Semanttinen Web. WWW:n perusta. WWW tänään. WWW tänään: palvelut ja tiedonhaku. Toiminnalliset palvelut: ongelmia

XML ja Web Services update

Avoimet standardit ja arkistointi

Sisältö. Semanttinen Web ja Web palvelut Sisältötuotannon ja palveluiden tulevaisuus Internetissä. WWW:n perusta. WWW tänään

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Ontologiat ja semanttinen web sisällön tuotannon näkökulmasta Luetteloinnin tiedotuspäivä Juha Hakala Kansalliskirjasto.

Johdatus XML teknologioihin

1. Lähtökohta ja taustat

TESAURUKSET JA ONTOLOGIAT

Semanttinen web ja sukututkimus

W3C ja Web-teknologiat

XML-tutkimus Jyväskylän yliopistossa

Valtioneuvoston tietosisältöjen semanttinen yhteentoimivuus

Kansallinen semanttisen webin sisältöinfrastruktuuri FinnONTO - visio ja sen toteutus

Paikannimirekisteri linkitettynä tietona

Rakenteisten dokumenttien jatkokurssi, syksy 2006

StanForD-XML. Juha-Antti Sorsa, Tapio Räsänen, Vesa Imponen

Sisältö. Miten hyötypalveluja Webiin saadaan? Mitä hyötyä on Webistä? Kehityksen este Webissä? Miten Webistä tulee älykkäämpi?

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

W3C, Web-teknologiat ja Semanttinen Web

W3C ja alueellinen standardointi

Ensi askeleet semanttiseen webiin: tuotantoprojektin kokemuksia

XML-evoluutio ja kestävä kehitys

XML-saatavuuskysely. XML-tiedoston kuvaus. versio

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

10 Nykyaikainen WWW-arkkitehtuuri

W3C, Web-teknologiat ja XML

Digitaalisen median tekniikat xhtml - jatkuu Harri Laine 1

FinnONTO-infrastruktuurin esittely

Kim Viljanen

- Jarjestelmaasiantuntija Markku Jaatinen

Neoxen Systems on suomalainen ohjelmistotalo. Olemme erikoistuneet tiedon- ja oppimisen hallinnan ratkaisuihin.

URI:n muodostamisen prosessi (suositusluonnoksen liite 1)

Sisältö. XML, XHTML ja CSS XML XML. XML:n ja HTML:n ero. XML kieliä XML XHTML CSS XSL. T Hypermediadokumentin laatiminen 2002

W3C & verkkojulkaisun standardit

Johdatus rakenteisiin dokumentteihin

Digitaalisen median tekniikat xhtml - jatkuu

Internetin tulevaisuudennäkymiä Semanttinen web ja älykkäät palvelut

MALog-projekti kehittää oppimateriaalia matemaattiseen logiikkaan. Insinöörikoulutuksen foorumi

Heikki Helin Metatiedot ja tiedostomuodot

XML-standardointi julkishallinnossa: mahdollisuuksia ja haasteita

Paikkatietorajapinnat IT arkkitehtuurin näkökulmasta

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

XML kielioppi. Elementtien ja attribuuttien määrittely. Ctl230: Luentokalvot Miro Lehtonen

SUOMALAISEN LAINSÄÄDÄNTÖTYÖN TIEDONHALLINTA Suuntana semanttinen web

JHS XML suositus. XML Finland tapahtuma Mikael af Hällström ylitarkastaja, Verohallinto JHS XML työryhmän vetäjä

Ontologiamuokkaimen käyttö laskentaklusterin tehokkuusanalyysissä (valmiin työn esittely) Santtu Klemettilä

RDF-TIETOMALLI TOIMINTAPROSESSIN TIEDONHALLINNAN TUKENA

Ajankohtaisia SOA tutkimusteemoja

Metatiedot organisaatioiden sisällönhallinnassa

ATK yrittäjän työvälineenä

Semantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy

ONKI-palvelin ja sen hyötykäyttö: selain, valitsin ja verkkopalvelut

Automaattinen semanttinen annotointi

Yhteentoimiva.suomi.fi - palvelukokonaisuuden ja työkalujen esittely

Agentit ja semanttinen web. Pekka Halonen

Transkriptio:

Semanttinen web: visio uudesta webistä Airi Salminen Jyväskylän yliopisto http://www.cs.jyu.fi/~airi/ 29.1.2003 Tietopalveluseuran seminaari Tiedonhaun uudet tuulet Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003

Sisältö 1. Webin synty 2. Webin käyttö organisaatioissa 3. Webin ongelmia 4. Osaratkaisuja: XML ja RDF 5. Tavoitteita tulevaisuuden webille 6. Semanttinen web: mikä se on? 7. Webin tieto ja metatieto 8. Semanttisen webin tekniikoita 9. Mahdollisuuksia ja haasteita 10. Yhteenveto Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 2

1. Webin synty 1960-luku: Verkottumisen alku 1970-luku: Internetin synty 1980-luku: Internet käytäntöön 1990-luku: World Wide Web 2000-luku: Kohti semanttista webiä Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 3

1. Webin synty 1957 Neuvostoliitto laukaisee avaruuteen Sputnikin 1958 ARPA (myöhemmin DARPA = Defense Advanced Research Projects Agency) perustetaan 1960-luku: Verkottumisen alku 1962 Licklider (MIT) esittää vision globaalisti toisiinsa kytketyistä tietokoneista 1969 ARPANET-verkko saa alkunsa, 4 konetta vuoden lopussa verkossa; käyttö tiedostojen siirtoa ja ohjelmien etäkäyttöä; RFC-käytäntö (Request for Comments) Internetin spesifikaatioiden kehittämiseksi saa alkunsa. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 4

1. Webin synty 1970-luku: Internetin synty 1970 ALOHAnet ja muitakin verkkoja alkaa kehittyä 1971 Uusi verkkosovellus: sähköposti 1972 "Internetworking architecture" -ajatus verkkojen verkosta esitetään DARPA:n piirissä 1973 TCP/IP (Transmission Control Protocol/Internet Protocol) -yhteyskäytäntö syntyy 1979 noin 200 tietokoneella oma IP-osoite Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 5

1. Webin synty 1980-luku: Internet käytäntöön 1983 ARPANET siirtyy TCP/IP-yhteyskäytäntöön 1984 Nykyinen nimeämiskäytäntö (esim. www.cs.jyu.fi) otetaan käyttöön 1985 Amerikkalainen yliopistojen tutkimusverkko NSFNET perustetaan 1989 NSFNET:ssä mukana AU, CA, DE, DK, FI, FR, IL, IS, IT, JP, MX, NL, NO, NZ, PR, SE, UK Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 6

1. Webin synty 1990-luku: World Wide Web 1991 World Wide Web (WWW) esitellään Cernissä; Internet Society perustetaan 1992 Internetiin kytkettyjen koneiden määrä > miljoona 1993 Media, yritykset ja julkishallinto alkavat herätä 1994 W3C (World Wide Web Consortium) perustetaan 1998 XML-spesifikaatio hyväksytään W3C:ssä, Dublin Core -metatietosuositus esitellään RFC:nä 1999 RDF-spesifikaatio hyväksytään W3C:ssä Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 7

1. Webin synty 2000-luku: Kohti semanttista webiä 2000 Internetiin kytkettyjen koneiden määrä ylittää sata miljoonaa 2001 Semantic Web Activity käynnistyy W3C:ssä 2006 Miljardi vuorovaikutteista laitetta kytkettynä Internetiin? Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 8

1. Webin synty World Wide Web syntyi Cernin hajallaan toimivien tutkijoiden ja tutkimusprojektien yhteistyön ja tietämyksen hallinnan tukemiseen. WWW:n keskeiset tekniikat Resurssien osoittaminen: URI (Universal Resource identifier) Rakenteisten hypertekstidokumenttien esittäminen: HTML (Hypertext Markup Language) Hypertekstidokumenttien siirtäminen: HTTP (Hypertext Transfer Protocol) Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 9

1. Webin synty HTML Internetissä jaettavaksi tarkoitettujen dokumenttien esittämiseen standardoidussa muodossa kielessä mekanismi hypertekstilinkkien esittämiseen kieli on vapaasti kaikkien käytettävissä ymmärrettävissä sekä ihmisille että tietokoneelle HTML-selaajaohjelmat (web-selaajia, esim. Netscape, MS Internet Explorer, Opera) helposti saatavissa käyttöön; myös julkisohjelmia Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 10

1. Webin synty HTML-esimerkki <html> <head> <title>esimerkkisivu</title> </head> <body> Tämän minä haluan kertoa maailmalle. </body> </html> Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 11

1. Webin synty Hypertekstilinkki HTML-dokumentissa <html> <head> <title>esimerkkisivu</title> </head> <body> Tämän minä haluan kertoa maailmalle. <a href="http://www.cs.jyu.fi/~airi/"> Lisätietoa minusta </a> </body> </html> Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 12

2. Webin käyttö organisaatioissa Web-teknologiaa on hyödynnetty organisaatioissa kolmella tasolla: Internet Extranet Intranet Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 13

2. Webin käyttö organisaatioissa Internet Hajautettu dokumenttivarasto (HTML-dokumentit, teksti, kuvat, musiikki, video) julkisohjelmavarasto (HTML-selaajat,... ) palvelukanava (uutispalvelut, kauppapaikat,...) jakelukanava (tiedottamiseen, markkinointiin, palvelujen tarjoamiseen, myymiseen) kommunikointikanava (sähköposti, uutisryhmät) Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 14

2. Webin käyttö organisaatioissa Extranet organisaatioverkoston keskinäiseen tiedon, tietämyksen, dokumenttien, työprosessien hallintaan web-teknologia käytössä yhteys Internetiin käyttörajoitukset organisaatioverkoston sisällä Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 15

2. Webin käyttö organisaatioissa Intranet organisaation sisäiseen tiedon, tietämyksen, dokumenttien, työprosessien hallintaan web-teknologia käytössä yhteys Internetiin käyttörajoitukset organisaation resursseihin Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 16

3. Webin ongelmia WWW:n perusratkaisu oli niin onnistunut, että webin sisältöjen määrä kasvanut vaikeasti hallittavaksi. Sisältö mitä kirjavinta. Sisällön ja palvelujen luotettavuus epävarmaa. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 17

3. Webin ongelmia HTML-kieli kertoo dokumenttirakenteista (otsikko, kappale, lista, taulukko,... ) ja kirjasintyypeistä (kursivoitu,...), ei dokumentin sisällön merkityksestä. WWW:n sisällöstä valtaosa on maailman eri kielillä kirjoitettua luonnollista kieltä; sisällön merkitys ei yleensä ohjelmistojen ymmärrettävissä. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 18

3. Webin ongelmia Internetin käyttäjien ja tietovarastojen huima kasvu on aktivoinut myös mitä erilaisimpien agenttiohjelmien ja vertaispalvelujen (peer-to-peer) kehittämisen; niiden kontrolloiminen ja niihin liittyvän tietoturvan varmistaminen on ongelmallista. Kaikki ei ole sopivaa kaikille eikä kaikki ole tarpeen kaikille. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 19

4. Osaratkaisuja: XML ja RDF XML = Extensible Markup Language T. Bray, J. Paoli, C. M. Sperberg-McQueen, and E. Maler (Eds.), Extensible Markup Language (XML) 1.0 (Second Edition), W3C Recommendation 6 October 2000, http://www.w3.org/tr/rec-xml RDF = Resource Description Framework O. Lassila, & R. R. Swick (Eds.), Resource Description Framework (RDF) Model and Syntax Specification, W3C Recommendation, Feb. 1999. http://www.w3.org/tr/rec-rdf-syntax/ Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 20

4. Osaratkaisuja: XML ja RDF XML Säännöt sovellusaluekohtaisten dokumenttityyppien määrittelyyn ja esittämiseen. Voidaan määritellä dokumenttien merkkauksessa käytettävässä nimistö ja dokumenttirakenteet. Nimistöön voidaan sisällyttää semantiikkaa. Maailman kaikilla kielillä kirjoitetuille sisällöille. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 21

4. Osaratkaisuja: XML ja RDF XML XML hyväksyttiin W3C:n suositukseksi kuten HTML:kin. Vapaasti käytettävissä, sekä ohjelmistokehittäjien että sisällöntuottajien. Pohjautuu jo vuonna 1986 standardoituun SGML-merkkauskieleen. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 22

4. Osaratkaisuja: XML ja RDF Dokumenttityyppimäärittely (DTD) runoille. <!DOCTYPE runo [ <!ELEMENT runo (info_linkki? otsikko?, sae+)> <!ATTLIST runo tekija CDATA #REQUIRED tekija_syntynyt CDATA #IMPLIED> <!ELEMENT otsikko (#PCDATA) > <!ELEMENT info_linkki (#PCDATA) > <!ATTLIST info_linkki xmlns:xlink CDATA #FIXED "http://www.w3.org/1999/xlink" xlink:type CDATA #FIXED "simple" xlink:href CDATA #REQUIRED > <!ELEMENT sae (rivi+) > <!ELEMENT rivi (#PCDATA) >] Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 23

4. Osaratkaisuja: XML ja RDF <?xml version = "1.0"?> <runo tekija = Murasaki Shikibu tekija_syntynyt = 974 > <info_linkki xmlns:xlink= http://www.w3.org/1999/xlink xlink:type="simple xlink:href= http://digital.library.upenn.edu/women/omori/court/murasaki.html > Lisätietoa runoilijasta </info_linkki> <sae> <rivi>this life of ours would not cause you sorrow</rivi> <rivi>if you thought of it as like </rivi> <rivi>the mountain cherry blossoms</rivi> <rivi>which bloom and fade in a day. </rivi> </sae> </runo> Huom: Elementtien rivi sisältö on otettu sivustosta http://www.bopsecrets.org/rexroth/translations/japanese.htm, missä on Kenneth Rexrothin japanilaisten runojen käännöksiä englanniksi. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 24

4. Osaratkaisuja: XML ja RDF This life of ours would not cause you sorrow if you thought of it as like Lisätietoa the mountain cherry blossoms runoilijasta which bloom and fade in a day. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 25

4. Osaratkaisuja: XML ja RDF RDF Malli metatietojen liittämiseksi Internetin resursseihin. Resurssi on mitä tahansa, mitä voidaan osoittaa internetissä; osoittaminen tapahtuu URI:llä Esimerkkejä resursseista: tiedosto, palvelu, sivusto, tiedoston osa,kirja, henkilö, yritys. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 26

4. Osaratkaisuja: XML ja RDF RDF-kuvaus koostuu ominaisuuskuvauksista: (ominaisuus, resurssi, ominaisuuden arvo) (language, http://www.cs.jyu.fi/~airi/opetus/semanttinenweb.html, "fi") Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 27

4. Osaratkaisuja: XML ja RDF RDF-kuvauksille on määritelty XML-syntaksi RDF-kuvaus kolmikkoina: (Creator, http://www.cs.jyu.fi/~airi/opetus/semanttinenweb.html, "Airi Salminen") (Language, http://www.cs.jyu.fi/~airi/opetus/semanttinenweb.html, "fi") XML-syntaksi: <rdf:rdf xmlns:rdf = "http://www.w3.org/1999/02/22-rdf-syntax-ns#"> <rdf:description about = "http://www.cs.jyu.fi/~airi/opetus/semanttinenweb.html"> <Creator>Airi Salminen<Creator> <Language>fi</Language> </rdf:description> </rdf:rdf> Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 28

4. Osaratkaisuja: XML ja RDF Eri yhteisöt määrittelevät toisistaan poikkeavia XML-kieliä samallekin sovellusalueelle. Eri yhteisöt määrittelevät toisistaan poikkeavia RDF-malleja samallekin sovellusalueelle. Luonnollista kieltä olevien sisältöjen merkityksen ymmärtäminen ohjelmien avulla ongelmallista. Resurssien yhdistäminen ongelmallista. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 29

5. Tavoitteita tulevaisuuden webille Kontrolloimattoman kasvun mahdollisuus Webin kasvua ei edelleenkään haluta rajoittaa. Ei keskitettyä kontrollia. Epätäydellisyys hyväksytään. Ristiriitaisuudet mahdollisia. Kaikkiin kysymyksiin ei saada vastauksia. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 30

5. Tavoitteita tulevaisuuden webille Monipuolista metatietoa Nykyistä huomattavasti enemmän webin tietovarantojen merkitykseen, käyttöön, käyttötapoihin ja luotettavuuteen liittyvää metatietoa. Metatietojen kieli homogeenisempaa ja kontrolloidumpaa kuin dokumenttisisältöjen. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 31

5. Tavoitteita tulevaisuuden webille Metatiedot koneiden ymmärrettävään muotoon Metatiedot formaalissa standardoidussa muodossa niin, että sekä ihmiset että erilaiset ohjelmistot pystyvät niitä hyödyntämään. Automaattisia päättelysääntöjä. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 32

5. Tavoitteita tulevaisuuden webille Entistä joustavampi laajennettavuus ja yhdisteltävyys Hajallaan olevien yhteisöjen täytyy voida työskennellä toisistaan riippumattomasti webin yhteisen tietämyksen lisäämiseksi ja jatkuvaksi kehittämiseksi. Uutta tietoa täytyy voida lisätä niin, ettei vanhaa tarvitse muuttaa. Erilaisia sanastoja ja erilaisia rakenteita täytyy voida yhdistellä. Paikallisen ja globaalin tiedon joustava yhdistäminen. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 33

5. Tavoitteita tulevaisuuden webille Luottamuksen lisääminen Tietojen tuottajan voitava määritellä käyttöoikeudet erilaisille kuluttajille, niin ihmisille kuin myös ohjelmistoille. Tietojen kuluttajan voitava varmistaa tiedon alkuperä ja ja sisällön tai palvelun luotettavuus. Palvelun käyttäjän voitava varmistaa, mihin hänen tietojaan käytetään. Juridiset, kaupalliset ja yhteiskunnalliset näkökohdat voitava huomioida. Tekniikat hajautettuun luottamuksen hallintaan. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 34

6. Semanttinen web: mikä se on? The abstract representation of data on the World Wide Web, based on the RDF standards and other standards to be defined. It is being developed by the W3C, in collaboration with a large number of researchers and industrial partners. W3C Semantic Web Activity, http://www.w3.org/2001/sw/ Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 35

6. Semanttinen web: mikä se on? An extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation. Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001. http://www.scientificamerican.com/2001/0501issue/0501berners-lee.html Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 36

6. Semanttinen web: mikä se on? Keskeisiä ominaisuuksia: Lukuisien yhteisöjen web, merkitykset määritellään ihmisten yhteisöissä. Koostuu primääriresursseista ja metatietoresursseista. Erityisesti resurssien merkitykseen, käyttöön ja luotettavuuteen liittyviä metatietoja. Metatiedot standardoidussa muodossa, sekä ihmisten että ohjelmien luettavissa. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 37

6. Semanttinen web: mikä se on? Keskeisiä ominaisuuksia: Kehitystä koordinoi W3C. XML sekä primääri- että metatietoresurssien esitysmuoto. RDF metatietojen esitysmuoto. Pääosa primääriresurssien sisällöstä on kirjoitettu luonnollisilla kielillä. Resurssien monipuolinen yhdistely mahdollista. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 38

6. Semanttinen web: mikä se on? Keskeisiä ominaisuuksia: Automaattista päättelyä merkityksestä ja luotettavuudesta. Monipuolinen ohjelmistojen yhteistyö ja kommunikointi mahdollista. Mahdollistaa ihmisten monipuolisen yhteistyön yhteisöissä, missä on yhdenmukainen käsitys sisältöjen merkityksestä ja yhteiset arvot. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 39

6. Semanttinen web: mikä se on? Keskeisiä ominaisuuksia: Vaatii ihmisten monipuolista yhteistyötä. Vaatii halua ja kykyä sopia yhteisön käsitteistöstä ja luotettavista webtoimintatavoista. Vaatii eri alueiden asiantuntijoiden (kohdealue, tietohallinto, tietopalvelut, tekniikka) halua ja kykyä yhteistyöhön. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 40

7. Webin tieto ja metatieto metatieto tietoa joka auttaa käyttämään, ymmärtämään, prosessoimaan ja yhdistämään webin tietoresursseja Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 41

7. Webin tieto ja metatieto Metatieto voi kuvata esimerkiksi dokumentista sisällön rakennetta sisällön merkitystä sisällön kieltä tuottamisympäristöä (tekijä, organisaatio, prosessi, ohjelma) versiota tallennusmuotoa tallennusmediaa säilytysaikaa käyttöoikeuksia Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 42

7. Webin tieto ja metatieto kuvaa webin resurssia upotettu Vaihtoehtoja metatiedoille kuvaa webin ulkopuolista asiaa ulkoinen keskitetty hajautettu ihmisen tuottama automaattisesti tuotettu Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 43

7. Webin tieto ja metatieto Esimerkki metatiedosta HTML-dokumentissa <head> <title>airi Salminen</title> <link rel="schema.dc" href="http://purl.org/dc/elements/1.1/"> <meta name="dc.title" content="airi Salminen"> <meta name="dc.creator" content="airi Salminen"> <meta name="dc.description" content="home page of Professor Airi Salminen, her representative publications, research interest, projects, courses, and contact information"> <meta name="dc.date.updated" content="2002-12-10"> <meta name="dc.format" content="html"> <meta name="dc.identifier" content="http://www.cs.jyu.fi/~airi/index.html"> <meta name="dc.language" content="en"> </head> Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 44

7. Webin tieto ja metatieto XML-kieli metatiedon esittämisessä Merkkaus (markup) sisältää metatietoa dokumentin rakenteesta ja elementtien merkityksestä. Dokumenttityyppimääritys (DTD) sisältää tietoa dokumentin rakenteesta. XML-dokumentin sisältö voi koostua johonkin asiaan liittyvistä metatiedoista, esimerkiksi julkaisujen bibliografisista tiedoista. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 45

7. Webin tieto ja metatieto Ontologia Yhteisön tietovarantojen merkitykseen liittyvää metatietoa. Yhteisesti sovittu käsitteistö (käsitteet, niiden väliset suhteet). Tietokoneen tulkittavaksi tarkoitettu. Mahdollisesti päättelysääntöjä. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 46

7. Webin tieto ja metatieto Esimerkkejä ontologioista: YSA - Yleinen Suomalainen Asiasanasto http://vesa.lib.helsinki.fi/ UNSPSC - Universal Standard Products and Services Classification http://eccma.org/unspsc/ WordNet - Lexical database for the English language http://www.cogsci.princeton.edu/~wn/ SHOE-ontologioita http://www.cs.umd.edu/projects/plus/shoe/onts/index.html Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 47

7. Webin tieto ja metatieto Ontologiakieliä: määrittelykieli ontologioiden määrittelyyn annotointikieli tietyn ontologian käsitteistön liittämiseen esimerkiksi html-sivuun kyselykieli annotoitujen dokumenttien hakemiseen Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 48

8. Semanttisen webin tekniikoita Semanttisen webin pelkistetty rakenne sovellusohjelmat primääritietovarannot semanttisen webin tekniikoihin perustuvat metatietovarannot semanttisen webin tekniikat Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 49

8. Semanttisen webin tekniikoita Tekniikoita sisältöjen identifioimiseen, esittämiseen ja määrittelyyn Merkkikoodit ja tietoresurssien osoittaminen: Unicode, URI Rakenteisten dokumenttien esittäminen: XML, XML Namespaces Rakenne- ja sisältörajoitteiden määritteleminen: DTD, XML Schema Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 50

8. Semanttisen webin tekniikoita Tekniikoita metatiedon esittämiseen ja määrittelyyn metatiedon esittäminen: RDF metatietoesitystapojen määrittely: RDF Schema aihekartat: Topic Maps (XTM) ontologian määrittely: Web Ontology Language (OWL) Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 51

8. Semanttisen webin tekniikoita Tekniikoita luottamuksen hallintaan digitaalinen allekirjoitus: XML-Signature tietosuojamenettelytavat: P3P, APPEL salakirjoittaminen: XML Encryption annotointien jakaminen: Annotea Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 52

8. Semanttisen webin tekniikoita sovellusohjelmat primääritietovarannot DTD:t, XML Schema - määrittelyt, RDF Schema -määrittelyt, RDF-määrittelyt, ontologiat, aihekartat, annotoinnit,... URI, Unicode, XML, XML Namespaces, XML Schema, RDF, RDF Schema, XTM, XML-Signature, OWL, Annotea,... Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 53

9. Mahdollisuuksia ja haasteita Sovellusalueita: web-portaalit organisaation tai yhteisön tietämyksen hallinta elektroninen kaupankäynti agenttiohjelmat Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 54

9. Mahdollisuuksia ja haasteita Web-portaalit tehokkaan portaalin rakentamiseksi tarvitaan käsitteistön yhdenmukaistamista yhdenmukaistaminen voidaan tehdä palveluihin liitetyillä metatiedoilla Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 55

9. Mahdollisuuksia ja haasteita Tietämyksen hallinta Evidence-based Medical Information Service: lääketieteellistä tietoa saksankielisille lääkäreille http://www.evimed.ch/ organisaatiomuisti ontologiakielellä julkishallinnon tietämyksen hallinta e-gif (electronic Government Interoperability Framework) http://www.govtalk.gov.uk/ Suomalainen julkishallinnon metatietojen standardointi http://www.lib.helsinki.fi/dublin_core/metatyor.html Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 56

9. Mahdollisuuksia ja haasteita Elektroninen kaupankäynti Palvelujen yhteensovittaminen, sisällönkuvailuun tarvitaan ontologioita UDDI - Universal Description, Discovery and Integration of Business for the Web http://www.uddi.org/ RosettaNet: organisaatio, joka standardoi IT-alan kaupankäyntiprosesseja http://www.rosettanet.org Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 57

9. Mahdollisuuksia ja haasteita Agenttiohjelmat työn organisointia auttavat agentit ostoagentit tiedonetsijäagentit, esimerkiksi WebWatcher Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 58

9. Mahdollisuuksia ja haasteita Haasteita Metatiedon standardoiminen yhteisössä ongelmallista; vaatii paljon työtä. Luottamukseen ja tietoturvaan liittyvät ongelmat erittäin vaikeita. Yhteistyön käynnistäminen ja ylläpitäminen eri alueiden asiantuntijoiden kesken vaikeaa. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 59

10. Yhteenveto Globaalissa tietoverkossa käytetään dokumenteissa mitä moninaisimpia kieliä, samallakin sovellusalueella. Kielien rikkautta dokumenttisisällöissä ei haluta rajoittaa. Tarvitaan metataso, jolla kieli on huomattavasti kontorolloidumpaa kuin dokumenttisisällöissä. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 60

10. Yhteenveto Metatason määrittelyiden täytyy olla niin formaaleja, että ohjelmat pystyvät käyttämään määrittelyjä. Jotta sisältökielien rikkautta voitaisiin hyödyntää, metatasojakin täytyy määritellä eri kielille ja eri yhteisöille. Webin käytön tehostaminen edellyttää luottamuksen entistä parempaa hallintaa. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 61

10. Yhteenveto Vaikutuksia organisaation tietopalveluun Automaatio lisääntyy (hakuagentit, kysymyksiin vastaavat järjestelmät, päättelyt). Luottamuksen hallinnan merkitys kasvaa. Työ suuntautuu entistä enemmän tiedon hakemisesta suunnitteluun ja yhteistyöhön eri alueiden asiantuntijoiden kesken. Tietopalvelujen asiantuntemus tärkeää semanttisen webin kehittämisessä. Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 62

Lähteitä Berners-Lee, T., Cailliau, R., Luotonen, A., Nielsen, H.F., Secret, A., The World-Wide Web. Communications of the ACM 37, 8, August 1994, 76-82. Berners-Lee, T., Hendler, J., & Lassila, O., The Semantic Web. Scientific American, May 2001. http://www.scientificamerican.com/2001/0501issue/0501bernerslee.html Communications of the ACM, Vol. 45, No. 2, 2002, Special Section on the Ontologies. Hyvönen, E., Semantic Web - kohti uutta merkitysten Internetiä, esitelmä Semantic Web Kick-Off in Finland -tilaisuudessa 2.11.2001. http://www.cs.helsinki.fi/u/eahyvone/stes/semanticweb/semanticweb Visio.PDF Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 63

Lähteitä Kobayashi, M. & Takeda, K., Information retrieval on the Web. ACM Computing Surveys 32, 2 (June 2000), 144-173. Salminen, A., XML Family of Languages. Overview and Classification of W3C Specifications. http://www.cs.jyu.fi/~airi/xmlfamily.html. Lisää lähteitä: Salminen, A., Kevään 2002 semanttinen web -kurssin kotisivu, Jyväskylän yliopisto. http://www.cs.jyu.fi/~airi/opetus/semanttinenweb.html Airi Salminen, Semanttinen wew: visio uudesta webistä, 29.1.2003 64