12 Case: "hajautettu kauppapaikka"

Samankaltaiset tiedostot
12 Case: "hajautettu kauppapaikka"

12 Pari sanaa sovelluskehityksestä

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Paikkatiedot ja Web-standardit

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

Rakenteisten dokumenttien jatkokurssi, syksy 2006

Luento 12: XML ja metatieto

RDF ja RDFS. 8 RDF ja RDFS

XML johdanto, uusimmat standardit ja kehitys

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

6 Semanttinen Web 101

W3C-teknologiat ja yhteensopivuus

Seitsemän syytä semanttiseen webiin. Eero Hyvönen Aalto-yliopisto ja HY Semanttisen laskennan tutkimusryhmä (SeCo)

6 Semanttinen Web 101

6 Semanttinen Web 101

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Automaattinen semanttinen annotointi

The OWL-S are not what they seem

Media- ja kulttuuripalvelut. Eetu Mäkelä

SiSuQ8 Tutorial / Mekaaninen simulaatio

Sisällönhallinnan menetelmiä

Tekninen alusta. Tavoitteet ja näkökulmia maankäyttöpäätöksiin Jani Kylmäaho, osahankepäällikkö Maanmittauslaitos

W3C ja alueellinen standardointi

Paikannimirekisteri linkitettynä tietona

Suunnitteluvaihe prosessissa

Katsaus tietoarkkitehtuurityöhön

Johdatus rakenteisiin dokumentteihin

Mistä on kyse ja mitä hyötyä ne tuovat?

PerustA - Perustietovarantojen viitearkkitehtuuri. Liite 3: Tietojärjestelmäarkkitehtuurin. integraatioarkkitehtuuri

Semanttisen webin käyttöliittymäratkaisut. Tiedonhallinta semanttisessa webissä Osma Suominen

Mikä on semanttinen web?

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

3 Verkkosaavutettavuuden tekniset perusteet

Metatiedot organisaatioiden sisällönhallinnassa

Tietosisällön eheys. Kimmo Janhunen Riskienhallintapäällikkö

Yhteentoimiva.suomi.fi - palvelukokonaisuuden ja työkalujen esittely

SKOS. Osma Suominen ONKI-hankkeen laajennettu projektiryhmä

Internet jolla on merkitystä

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Kohti kansallista semanttisen webin sisältöinfrastruktuuria

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

HELIA 1 (8) Outi Virkki Tietokantasuunnittelu

IT-OSAAJA, TIETOJENKÄSITTELYN ERIKOISTUMISOPINNOT

W3C ja Web-teknologiat

Yritysturvallisuuden perusteet

Kirjastoinfo TY KTMT Porin tiedekirjasto

Opinto-oppaiden rakenteistaminen JY:ssä

è è è RDF-perusteet 7 RDF-perusteet

Miksi asiasanastot eivät riitä vaan tarvitaan ontologioita?

10 Tieto ja metatieto

Potilastiedon arkiston käyttöönotto ja arkistonhoitaja

Rakennustietomallien hallinta linkitettynä tietona

SPARQL-workshop. Sini Pessala Kirjastoverkkopäivät KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Esimerkki uudelleenohjauksen teknisestä toteutuksesta

P e d a c o d e ohjelmointikoulutus verkossa

Suomi.fi-palveluväylä

Kuvailusäännöt, formaatti ja kirjastojärjestelmä

REKISTERI- JA TIETOKANTA-AINEISTOJEN SIIRTÄMINEN VAPA-PALVELUUN

Uusia tuulia Soneran verkkoratkaisuissa

9.16 XSLT ja nimiavaruudet (1/3): literaali oletusnimiavaruus

Miten Linked Data aineistoja tuotetaan ja. Semanttisen laskennan tutkimusryhmä SeCo Aalto-yliopisto

Älykkäät keltaiset sivut ( Intelligent Web Services ( IWebS ) )

Tietojärjestelmän osat

Helsinki Region Infoshare Pääkaupunkiseudun tiedon avaaminen

TIE Ohjelmistojen suunnittelu. Luento 2: protot sun muut

Valikoima, laatu ja mainonta

W3C ja Web-teknologiat

Esittely: Helsinki Region Infoshare Seudun tietovarannot avoimiksi. Ville Meloni ja Pekka Vuori

CQRS, -ES, PACS, DICOM, WTF?

ONKI SKOS Sanastojen ja ontologioiden julkaiseminen ja käyttö Asiasanaston muuntaminen SKOS muotoon: case YSA

Semanttisen Webin mahdollisuudet yrityksille

UMTK- SUUNNITTELUPROJEKTIN ESITTELY (UMTK = MML:N UUSI MAASTOTIETOJEN TUOTANTOJÄRJESTELMÄ)

W3C ja Web-teknologiat

Tervetuloa Iggloilemaan

Taltioni teknisen alustan arviointi

Järjestelmäarkkitehtuuri (TK081702) Lähtökohta. Integroinnin tavoitteet

Yritys nimeltä Redicom

Web sovelluksen kehittäminen sähkönjakeluverkon suojareleisiin

TIE Ohjelmistojen suunnittelu. Luento 2: protot sun muut

Koodistoeditorin tavoitteet ja tilannekatsaus

opiskelun suunnittelujärjestelmä, kurki ja ilmo käyttävät kaikki samaa tietokantaa, ja uusi järjestelmä tulee osaksi tätä.

Uutisjärjestelmä. Vaatimusmäärittely. Web-palvelujen kehittäminen. Versio 1.3

Visio tulevaisuuden Webistä. Semantic Web - kohti uutta merkitysten Internetiä. Ratkaisumalli 1: Älykkäämmät sovellukset. Vision este Webissä

Potilastiedon arkiston käyttöönotto ja arkistonhoitaja. Kela, Kanta-palvelut,

XML Finland seminaari : Office 2007 XML dokumenttituotannossa

T Tietojenkäsittelyopin ohjelmatyö Hirviöryhmä loppukatselmointi. Hirviö. Projektikatselmointi

Sähköpostin arkistointi

Maailma visuaalivalmistajan näkökulmasta

Keltaisten sivujen palveluiden kuvaaminen ontologioiden avulla

Tietotekniikan kandidaattiseminaari

Yhteentoimivuutta edistävien työkalujen kehittäminen

Semanttinen Finlex Arttu Oksanen ( )

Lehmanin ja Dijkstran lait

Vaihe A: Blogin luominen

Onnistuneeseen omistajanvaihdokseen Mika Haavisto. Hyrrät-Metropolia

W3C: teknologia ja (tieto)yhteiskunta

URI:n muodostamisen prosessi (suositusluonnoksen liite 1)

Yritysturvallisuuden perusteet

Transkriptio:

12 Case: "hajautettu kauppapaikka" Kurssin lopuksi tarkastelemme yksinkertaista sovellusesimerkkiä joka pyrkii valottamaan eri tekniikoiden suhdetta ja hajautettuihin sovelluksiin tyypillisesti liittyvien toimijoiden rooleja (nyt löyhä Semantic Web Services - yleisjäsennys). Esityksen tarkoituksena on yksinkertaisesti miettiä suunnittelun ja käytäntöjen välistä vuoropuhelua sekä yrittää nähdä metsä puilta. 252

12.1 Välisoitto Monimutkaiset palvelukokonaisuudet toimivat kilpailun, verkostoitumisen ja erikoistumisen periaatteiden mukaan Kaikki eivät ehdi/ halua/ osaa/ voi tehdä kaikkea sama pätee tekniikkaan ja tietoteknisiin palveluihin (vrt. liiketoimintaympäristöt) 253

12.2 Esimerkki #1: TTY:n periodi 2 (v2006) Näkökulmia lukukauden tapahtumatiedon hyödyntämiseen: I: Henkilökohtainen käyttö: esim. "Ossin periodi 2" - Henkilökohtaisen aikajanan kokoaminen (päällekkäisyydet, ennakointi, suunnittelu) G: Ryhmätason käyttö: esim. "RDJ-kurssin näkökulma periodiin 2 " - Kurssitason aikajanan kokoaminen (suhde muihin opintojaksoihin, koordinointi) O: Organisaatiotason käyttö: esim. "Seuranta ja tukitoimet" - TTY:n tason aikajanan kokoaminen (tilankäytön ja resurssien optimointi, työkuorman seuranta) Tarpeet ja motivaatio tiedon tuottamiseen ja hyödyntämiseen saattavat suurestikin vaihdella eri toiminnan tasoilla (!) 254

12.3 Esimerkki #2: kauppapaikka (v200[57]) Yksinkertaisen kauppapaikan käyttötapauksia: K1: "Myynti-ilmoituksia hyvin monentyyppisistä myyntiartikkeleista" - artikkeleiden perustiedot (rdf:type, rdfs:label, dc:description, rdj:thumblink, rdj:imagelink) - luokitteluun YSA-asiasanasto taksonomiana - luokitellaan kaikki myytävät artikkelit (dc:subject) K2: "Artikkelin ja ilmoituksen hinta- ja voimassaolotiedot" - rdj:priceineuros, rdj:expires K3: "Yhteydenotot ja varaukset" - myyjän tiedot, myyntistatus (dc:creator, rdj:onsale) Kaikki ei suju kuin tanssi... 255

12.4 RDF/SPARQL/XSLT-esimerkki Kokeillaan... 256

12.5 Palvelun perusjäsennys Myyjä ja Ostaja Välittäjä, tehtäviä - löydettävyys, hakemistot, taksonomiat,..., lisäarvopalvelut - tietojen eheyden ja luotettavuuden tarkistukset, tietoturva Provider Broker Requestor (Meta) Provider (Auxiliary / Added Value Services) - tietojen elinkaaren hallinta (päivitykset, poistot, tarkistuspyynnöt,...) - liiketoiminnan prosesseihin liittyvät palvelut ja tarkistukset (esim. LKVpalvelut, saako esim. myyjä P 1 sanoa jotain myyjän P 2 tuotteista?, jne.) - laskutus (huomaa että osa yo. tehtävistä siirrettävissä lisäarvopalveluihin) Oheis- tai lisäarvopalvelun tarjoaja, tehtäviä - lisätietoja (esim. hintavertailuja), arviointeja ja testejä, markkinointi,... - "periaatteessa kuten myyjä, mutta erilainen prosessi ja liikeidea" 257

12.6 Taksonomiaan perustuva luokittelu, huomioita Sovitaan nimet taksonomian käsitteille... (mekaaniset muunnokset) Taksonomia voidaan kuvata RDF-mallissa esim. seuraavasti... ysa:autot rdf:type rdfs:class. ysa:henkilöautot rdf:type rdfs:class. ysa:henkilöautot rdfs:subclassof ysa:autot.... Nyt esim. kategorioita hyödyntävä haku onnistuu siis transitiivisen päättelijän (Transitive Reasoner) varassa (vrt. Jena2) - vaihtoehtoisesti, voimme kuvata transitiivisuuden myös OWL:lla Jos luokittelussa on sallittua käyttää myös taksonomian sisäsolmuja voi käytännössä olla suotavaa koodata luokittelu kahteen kertaan (miksi?): - joko luokitellaan kaikki myytävät artikkelit ei-transitiivisesti (dc:subject) ja kopioidaan transitiiviseksi määrittelyksi (esim. rdf:type tai rdj:category) - tai transitiivisuusominaisuus pitää voida kytkeä hauissa pois päältä 258

12.7 Luokittelu? (vrt. etuovi.com, autotalli.fi) Asiasanaston käyttöön liittyy pulmia jotka hankaloittavat sen käyttöä taksonomiana! Esimerkkejä: - tarjotaan myytäväksi omakotitaloa luokitellaanko kategorian asunnot vai rakennukset mukaan? - tarjotaan myytäväksi luhtitaloasuntoa tätä luokittelua ei löydy YSA:sta (...lisätään? mutta onko luhtitalo asunnot-tyyppisen artikkelin lisäominaisuus, asuntojen aliluokka vai jotain muuta?) - tarjotaan myytäväksi kokonaista rivitaloa (eikä yksittäistä rivitaloasuntoa)... Eräänä ratkaisuna voidaan tarjoa useita rinnakkaisia luokituksia (oletus?) Luokituksen sisään/rinnalle voidaan esim. sopia kategoriakohtaisia lisätietoja (jotka siis myös luokituksia huomaa rekursio määritelmässä!) - esim. moottoriajoneuvot-kategoriaan moottorin tiedot - esim. asunnot-kategoriaan osoite- ja tontin tiedot, huoneistopinta-ala yms. 259

12.8 Tiedot sisällöllisesti ok? Ovatko artikkeleiden myynti-ilmoitukset kunnossa? - kieli? alue? linkki sähköiseen tuotteeseen? luokittelu oikein? hintatieto oikein? tiedot ajan tasalla? saatavilla? - todellisia ilmoituksia (rdj:serious)? hyvän maun mukaisia? Miten oikeellisuus varmistetaan käytännössä? ts....tarvitaanko käytännössä kuitenkin (ihmis)päätoimittajaa? Eräs ratkaisumalli: ilmoitusten hyväksyminen - roskan mekaaninen suodatus (vrt. Spam Filters), - uusien/muuttuneiden tietojen hyväksyminen (käsin), vanhentuneiden tietojen automaattisuodatus, - "luotettavien yhteistyökumppanien" tunnistaminen automatisointi, jne. Tietojen kopiointi repository-tyyppiseen "väli"varastoon? (saatavuus ja muutokset) 260

12.9 Tiedot teknisesti ok? Ilmeisesti suora SPARQL-kysely ei yksin sellaisenaan ole riittävä ratkaisu Tyypillisiä murheita: - yksittäiset (tilapäisesti) RDF/XML-tiedostot rikki - tietoa ei (tilapäisesti) ole saatavilla,... Mallinnus kunnossa? - luokat vs. ominaisuudet, resurssit vs. literaalit,... - onko esim. dc:subject-predikaatin arvo mallinnettu resurssina? Huomaa että tyypillinen lisäarvopalvelu kytkeytyisi todennäköisesti juuri esim. luokitukseen (...siispä arvon on oltava resurssi) - "luento-tyyppisistä tapahtumista halutaan sanoa jotain yleistä" - "asuntoa ostaville tarjotaan myös lainatarjouksia ja käytettyjä autoja ostaville autotohtorien palveluita" 261

12.10 Välittäjä, lisäarvopalvelut ja liiketoiminta? Tyypillisiä oheis- ja lisäarvopalveluita - markkinointi - tietopalvelut (esim. hintatilastot, vrt. Tuulilasin käytettyjen autojen hinnat) - asiantuntijapalvelut (esim. autotohtori) Pulmia: - myyjät ja asiakkaat arvostavat erilaisia lisäarvopalveluja! - suostuisivatko esim. vähittäiskaupat, puhelinoperaattorit, vakuutusyhtiöt, rakennusliikkeet,..., julkaisemaan tietonsa vertailtavassa muodossa? - poliisina toimiminen! Tarvitaanko keskitettyä kauppapaikkaa? - löydettävyys, luotettavuus, lisäarvopalvelut,... (?) 262

12.11 Ohje tiedon tuottamiselle ja käyttöliittymä, kiitos Tietenkin ohjeistettava tarkemmin! (Mieti yo. näkökohtia & rämettymistä) - esittely, käyttötapaukset - esimerkki(!), predikaattien kuvaukset ja skeema (tai ontologia tms.) - validointipalvelu(!) - sovellusesimerkki Käyttöliittymät! - harva loppukäyttäjä hakisi tietoa suoraan SPARQL-kielellä - RDF-tietomalli piiloutuu todennäköisesti vaiheistetun lomakkeen alle - kysymyksiä: nimet? validointi? semanttinen verkko?... Ts. RDF/XML/SPARQL/XSLT/... -tekniikan rooli sovelluksessa kutistuu prosessien ja käytäntöjen haasteiden edessä ("Enabling Technologies") 263

12.12 Tietointensiivisten (SW-)sovellusten haasteita 1. Ei tiedetä, minkälainen tieto olisi käyttökelpoista käsillä olevan tehtävän ratkaisemiseksi 2. Ei tiedetä mitä tietoa olisi periaatteessa saatavilla tai mistä se löytyisi 3. Halutut tiedot eivät ole saatavilla 4. Viitatuista dokumenteista löytyy kielioppivirheitä XML-syntaksin tasolla, RDF-tietomallin tasolla, OWLontologian tasolla jne. 5. Saatavilla olevaa tietoa ei osata tulkita (esim. dokumentoinnin puutteen tai esitietovaatimusten takia) 6. Tietolähde ei ole luotettava tai tiedot eivät ole ajan tasalla (tai tätä ei tiedetä) 7. Saatavilla olevan tiedon olemassa oleva mallinnus ei sovi tehtävän ratkaisuun sellaisenaan 8. Tietoa on luokiteltu väärin tai mallinnus ei ole systemaattista (olettaen että asia ymmärretään!) 9. Tieto on epätäydellistä tai se on näkökulmaltaan ei-toivotusti värittynyttä (vrt. uutiset) 10. Tietoa on potentiaalisesti saatavilla liikaa tietokannan fyysisen koon näkökulmasta 11. Tietoa on potentiaalisesti saatavilla liikaa tietokannan loogisen koon näkökulmasta 12. Tiedon käyttöä on rajoitettu esim. tekijänoikeuksien/lisensoinnin näkökulmasta 13. Tietoa on syötetty harhauttamistarkoituksessa väärin 14. Yksilöobjekteja käsittelevä lausumatieto muuttuu, terminologinen tieto muuttuu (odottamatta) 264

12.13 Sovelluskehittäjän johtopäätöksiä RDF/OWL soveltuvat melko hyvin tiedon julkaisuun (vrt. HTML), mutta tietointensiivisen ("Semanttisen Webin") sovelluksen toteutus tarvitsee muutakin, erityisesti: 1. RDF/XML-"raakadata" vaatii yleensä teknistä esikäsittelyä (käyttöoikeuksien hallinta, kielioppivirheiden perkaaminen yms.) 2. Tietolähteen järkevyyden arviointi saattaa edellyttää myös semanttista arviointia ja harkintaa tiedon "hyväksymisessä" (vrt. sabotaasi!) 3. SPARQL-kyselijä tms. soveltuu käsiteltävän RDF-osajoukon rajaamiseen, mutta ei oletuksena sovellu monimutkaisten sovellusten "varsinaiseksi kyselykieleksi". Tarvitaan myös erillistä sovelluslogiikkaa. 4. Päättelyä, sääntöjä tms. sisältävien sovellusten suurin (käytännön) haaste piilee monimutkaisen (hyödyllisen) tietämyskannan tuotannon ja ylläpidon vaikeudessa, niinpä "hyvät" mekaanista päättelyä suorittavat sovellukset ovat melko yksinkertaisia (tai rajatun käyttäjäkunnan "erikoissovelluksia") 265

12.14 Lopuksi RDF-tietomalli soveltuu kuvailu- ja metatiedon esittämiseen ja yhdistämiseen, sekä OWL-laajennuksen myötä myös käsitemallien esittelyyn XML-tietojenkäsittelyn suoraviivaisuus puolustaa paikkaansa myös tietointensiivisissä sovelluksissa (työnjako) Realististen sovellusten taustalta tulee poikkeuksetta löytyä tietojenkäsittelyprosessin tarkoituksenmukainen kuvaus (sisältäen organisaation tavoitteisiin, ihmisiin & työkulttuuriin liittyviä asioita) Mutta: Mitä tarkemmin prosesseja yritetään mekanisoida, sitä tarkempia määrittelyjä tarvitaan (tarkemmat määrittelyt taas tuovat lisätyötä) Motto: turha (tai epämiellyttävä) käsityö on katoavaa kansanperinnettä onneksi! 266

12.15 Kiitos! 267