Rakenteisten dokumenttien jatkokurssi, syksy 2005

Samankaltaiset tiedostot
Rakenteisten dokumenttien jatkokurssi, syksy 2006

Paikkatiedot ja Web-standardit

W3C-teknologiat ja yhteensopivuus

Semanttinen Web. Ossi Nykänen Tampereen teknillinen yliopisto (TTY), DMI / Hypermedialaboratorio W3C Suomen toimisto

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto

XML johdanto, uusimmat standardit ja kehitys

W3C, Web-teknologiat ja XML

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Luento 12: XML ja metatieto

3 Verkkosaavutettavuuden tekniset perusteet

Avoimet standardit ja arkistointi

12 Pari sanaa sovelluskehityksestä

Metatiedot organisaatioiden sisällönhallinnassa

Saavutettavuus, syksy 2004

XML-tietojenkäsittely

W3C, Web-teknologiat ja Semanttinen Web

6 Semanttinen Web 101

12 Case: "hajautettu kauppapaikka"

XML - mahdollisuudet ja kehitys

W3C ja alueellinen standardointi

XML-evoluutio ja kestävä kehitys

6 Semanttinen Web 101

Mikä on semanttinen web?

Sisällys. Valtion tietotekniikan rajapintasuosituksia. XML:n rooleja sähköisen asioinnin tavoitearkkitehtuurissa. dbroker - asiointialusta

Tieto- ja viestintätekniikka. Internetistä toimiva työväline, 1 ov (YV10TV2) (HUOM! Ei datanomeille)

10 Ohjelmoinnista Semanttisessa Webissä

W3C ja Web-teknologiat

WWW-ohjelmoinnin kokonaisuus. WWW-OHJELMOINTI 1 Merkkauskielet. Merkkauskielten idea. Merkkauskielet (markup languages) Merkkauskielten merkitys

TieVie-hanke Saksan kieli. Ritva Huurtomaa

Opettajalle ohje opintojakson toteutuksen tekemiselle mallipohjana ja mallipohjan tuominen opintojakson toteutukseen.

XML ja Web Services update

Sisällönhallinnan menetelmiä

The OWL-S are not what they seem

Hallintotieteiden opinto-opas lkv , Yleisopinnot ok Yleisopinnot

Internet jolla on merkitystä

12 Case: "hajautettu kauppapaikka"

XML prosessori. XML prosessointi. XML:n kirjoittaminen. Validoiva jäsennin. Tapahtumaohjattu käsittely. Tapahtumaohjattu käsittely.

Johdatus rakenteisiin dokumentteihin

standardit (W3C, ISO) Semanttisen laskennan tutkimusryhmä Teknillinen korkeakoulu

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Ontologiat merkitysten mallintamisessa: OWL. Eeva Ahonen

Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), W3C Suomen toimisto

Käsitemallit muistiorganisaatioiden kuvailun yhdenmukaistamisen välineenä

6 Semanttinen Web 101

Ohjelmistotekniikan menetelmät, kevät 2008

Verkkokurssien ulkopuolinen arviointi. Tie Vie - asiantuntijakoulutus Turku, Aino-Maija Hiltunen HY, HILMA-verkosto

RDF ja RDFS. 8 RDF ja RDFS

W3C ja Web-teknologiat

Profium. Smart Information Router (SIR) Janne Saarela Profium Oy. Profium perustettu Pioneeri sisällönhallinnan ratkaisujen kehityksessä

Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja

SÄHKÖISEN LIIKETOIMINNAN AMMATILLISET ERIKOISTUMIS- OPINNOT (30 op)

TIE Ohjelmistojen suunnittelu

IIZT4020 Projektitoiminta

Mat Systeemien identifiointi

10 Tieto ja metatieto

Tilanne sekä MS-A0003/4* Matriisilaskenta 5 op

Sähköinen säilyttäminen

Integrointi. Ohjelmistotekniikka kevät 2003

Ohjelmistotekniikan menetelmät, kesä 2008

Tieto- ja viestintätekniikan opinnot Jyväskylän yliopistossa. Humanistinen tiedekunta Syksy 2014 Tanja Välisalo

Hohde Consulting 2004

OULUN SEUDUN AMMATTIKORKEAKOULU TEKNIIKAN YKSIKKÖ TIETOTEKNIIKAN OSASTO OHJELMISTOKEHITYKSEN SUUNTAUTUMISVAIHTOEHTO

Laajuus 5 op Luennot: 12 x 2t Harjoitukset: 7 viikkoharjoitusta harjoitusten tekemiseen saatavissa apua 2 ryhmää / harjoitus

3.vsk Länsimaisen musiikin historia (1 b Barokki-Romantiikka)/Matti Huttunen Koodi A Keväällä 2013

W3C ja Web-teknologiat

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Opintoihin orientointi

Tutkitaan sitten HTML-dokumenttien anatomiaa, jotta päästään käsiksi rakenteisten dokumenttien käsitteistöön esimerkkien kautta.

Koulutustarjonta Osaamisen isen ja siv ja isty siv kse isty n parhaaksi a

Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto

Kansallinen digitaalinen kirjasto Pitkäaikaissäilytys. KDK-seminaari korkeakoulukirjastoille Esa-Pekka Keskitalo

Väli- ja loppuraportointi

Uutisjärjestelmä. Vaatimusmäärittely. Web-palvelujen kehittäminen. Versio 1.3

W3C, XML ja tietojenkäsittely: Ihmisen ja tietokoneen yhteinen ymmärrys suoritettavasta tehtävästä ja XML-standardien merkitys tietosysteemeissä (MH)

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Yhteiset konseptit ja periaatteet julkishallinnon palvelukehittämisen edistäjinä Kuntien avoin data hyötykäyttöön seminaari 27.1.

XML-tutkimus Jyväskylän yliopistossa

IIZP2010 Järjestelmäprojekti 5 op

LUKUJÄRJESTYSPOHJA Tekniikan ja luonnontieteiden TkK-tutkinto-ohjelma, Ympäristö- ja energiatekniikan opintosuunta

SEURAA OPETUSAIKATAULUA - MUUTOKSET NÄKYVÄT PUNAISELLA! SYKSY lv. Seuraa opetusaikataulua päivitysten havaitsemiseksi

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Induktio kaavan pituuden suhteen

Sosiaalihuollon avoin asiakastietomalli ja sen kehittämisessä ja soveltamisessa käytetyt standardit

Fysiikan opinnot Avoimen yliopiston opiskelijoille

XML-pohjaiset rakennemäärittelyt

Ohjelmointi II. Erkki Pesonen Luennot ja harjoitukset. Itä-Suomen yliopisto Tietojenkäsittelytieteen laitos 2015

Semanttinen Web ja Webteknologiat

W3C: teknologia ja (tieto)yhteiskunta

MAISTERIN TUTKINNON PEDAGOGISET OPINNOT (35 OP)

Automaattinen semanttinen annotointi

Kurssiesite. Rakentamisen tekniikat RAK-C3004

Uudistuva RISKINARVIO-ohje

Analyyttinen mekaniikka I periodi 2012

Luotettavuuden mittaamisesta. Ilkka Norros ja Urho Pulkkinen

Menetelmätieteiden opintokokonaisuudessa on kaikissa tapauksissa oltava vähintään 10 op matematiikkaa ja vähintään 10 op tilastotiedettä.

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Aalto-yliopiston perustieteiden korkeakoulu VERSIO 3 Teknillisen fysiikan ja matematiikan koulutusohjelma tbh

Harri Eskelinen, puh , Konetekniikan koulutusohjelman johtaja Tekniikan tohtori vuonna 1999 Dosentti

Ohjelmistojen mallintaminen, kesä 2009

YLIOPISTOARVOSANOJEN LINJA. Opetussuunnitelma

Transkriptio:

Rakenteisten dokumenttien jatkokurssi, syksy 2005 MATHM-57200 Rakenteisten dokumenttien jatkokurssi, 5 op opetetaan syksyn 1-2 periodeilla Kotisivu: http://matriisi.ee.tut.fi/hmopetus/rdj/index.html Luennot: TI 10-12 ja KE 12-14, salissa S3 (Huom! muutoksia luvassa) Harjoitukset: TO 8-10, PE 8-10, salissa Sb204 (1. harj viikolla 37!) Suoritustapa: Luennot, harjoitukset ja tentti. Pieni harjoitustyö. Porkkanapisteitä jaossa. (ilmoittaudu kurssille oinfossa!) Opettaja: Ossi Nykänen, TD303, vastaanotto to 13-14 ossi.nykanen@tut.fi MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 1

1 Johdanto Rakenteinen dokumentaatio tarjoaa puitteet tiedon käyttökelpoiselle esitystavalle (vrt. ). Tiedon määrällinen kasvu edellyttää lisäpanostusta tiedon tarkoituksenmukaiseen mallintamiseen ja kuvailuun. Näillä pyritään tyypillisesti tukemaan tiedonhakua, eri tietolähteiden lähteistä peräisin olevan tiedon pätevää semanttista yhdistämistä ja siten esim. tietämyksen (knowledge) tasolla operoivien sovellusten toimintaa (läh. päättely yms. tietomallissa välttämättä päteviin ominaisuuksiin vedoten). Pyrkimys tiedonhallinnan automatisointiin johtaa järjestelmien tarkasteluun näitä kuvaavien tieto- ja käsitemallien tasolla (vrt. viestiformaatti vs. käsitemalli). Tietomallien voidaan tulkita joko "vain" ohjaavan suunnittelijan työtä, tai vaihtoehtoisesti ne pyritään myös osin (loogisesti) formalisoimaan sopivan kuvailujärjestelmän suhteen. Teknisten menetelmien kirjo toisinaan hämärtää tietorakenteiden ja tiedon mallinnukseen tähtäävien menetelmien eroja sovelluksissa. Käytännössä erot näkyvät yleensä sovellusten rajauksessa ja mallintamisen primitiiveissä sekä teknisen toteutuksen laadussa. Sovelluskenttää voidaan lähestyä useista näkökulmista, eri menetelmiin nojautuen. Nyt tarkastelemme lähinnä yleisesti tunnettuja menetelmiä ja välineitä joilla on konkreettista merkitystä tietoteknisten sovellusten näkökulmasta (-perhe, Semanttinen Web). MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 2

1.1 Opintojakson suoritustapa Arvosanan määrää lopputentti (4 * 6 pts = 24 pts). Hyvää kurssiarvosanaa voi varmistella keräämällä porkkanapisteitä kurssin aikana. arvosana 0 1 2 3 4 5 pistemäärä 0-10 11-13 14-16 17-19 20-21 22-24 Mikäli tenttipistemäärä on riittävän suuri ja porkkanapisteitä on kertynyt edullisesti, huonoimman tenttitehtävän pistesaalis korvataan maksimissaan kuudella porkkanapisteellä. Porkkanapisteitä saa tekemällä erikseen merkittyjä harjoitustehtäviä yms. Porkkanapisteiden jakoperuste on opiskelijan oma aktiivisuus ja asioiden opiskelu silloin kun niitä opetetaan. Kurssiin liittyvä pieni harjoitustyö arvostellaan asteikolla hylätty/hyväksytty. (Toteutus periodilla 2.) Huom. Porkkanapisteiden lähtökohta on läsnäolo: suorituksia ei saa delegoida toisen merkittäväksi, eikä lähettää sähköpostitse tms. MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 3

1.2 Välisoitto Tekniikka = välineitä ja mahdollisuuksia Tavoite on tehostaa ja rajata ihmisten käsityötä...mutta kaikkiin pulmiin ei löydy "teknistä ratkaisua" (käytännöt & ns. vaikeat ongelmat) MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 4

1.3 Opintojakson sisältö Tällä opintojaksolla "Rakenteisten dokumenttien jatkokurssi" puhutaan mm. seuraavista asioista: - Tiedon mallinnus sen käsittelyn näkökulmasta - Schema - -kyselykielet (XQuery) - Tieto ja metatieto - Semanttinen Web (SW) ja kuvailutiedon idea - RDF-tekniikoista ja -sovelluksista - RDF-kyselykielistä (RDQL yms.) - Käsitemalleista/ontologioista ja säännöistä (OWL) - Sovelluksia ja esimerkkejä, erityiskysymyksiä (tieto ja tietämys, päättely) MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 5

1.4 Lyhenteitä ensi hätään... lisää luvassa ASCII (American Standard Code for Information Interchange) DTD (Document Type Definition) OWL (Web Ontology Language) RDF (Resource Description Framework) RDQL (RDF Query Language) SW (Semantic Web) (Extensible Markup Language) XQuery ( Query Language) MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 6

1.5 Miksi rakenteisesta dokumentaatiosta puhutaan (taas)? Tieto-/käsitemalli (?) Tiedon ulkoistaminen Tietorakenteen kuvailutieto MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 7

1.6 Everywhere? (Lue: mihin tämä tarjoaa ratkaisun?)...pelkkä yhteensopiva tietorakenne (ASCII, Unicode,,...) ei siis oikeasti riitä sovellusten semantiikka ja taustaprosessit pitää myös saada järkevästi sovitettua yhteen (yhteensopivien pelisääntöjen ja kuvailun keinoin) MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 8

1.7 Tekniikkaa sovellusintegraation näkökulmasta: 2 tasoa & database systems legacy systems scientific data & measurements project and working group management systems adapter adapter adapter adapter RDF storage queries description rules... modelling, interpreting, and processing data MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 9

1.8 Kertaus, rakenteiset dokumentit & 101 -dokumentti, merkkauskielioppi ja dokumentin jäsennyspuu <?xml version="1.0" encoding="iso-8859-1"?> <purchaseorder orderdate="1999-10-20"> <shipto country="us" VAT="yes"> <name>alice Smith</name> <address>123 Maple Street, Mill Valley, CA 90952</address> </shipto> <item>kenwood Eon Tt 900</item> </purchaseorder> Dokumentin tyyppi, tyypin määritys ja DTD-kieli Nimiavaruudet -perhe & -sovellusohjelmointi MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 10

1.9 Kertaus, tiedon saavutettavuus 101 Lippmann's Switch Tietojenkäsittelyn vaikeita ongelmia - puheentunnistus - hakutehtävien/algoritmien kompleksisuus (kombinatorinen räjähdys) - tekoäly, arkipäättely -... Content Description Kun pyritään harjoittamaan tietojenkäsittelyä tiedon tasolla, törmätään nopeasti tietojenkäsittelyn vaikeisiin ongelmiin - erityisesti: mallinnuksen ja epätäydellisen tiedon esittämisen ja yhdistelyn haasteet vs. pätevän päättelyn haasteet Time MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 11

1.10 Tiedonsiirto, dokumentin tyyppi ja tietomalli (1/2) Dokumentin tyyppi toimii rajoitteena...joka rajaa tarkasteltavan tietorakenteen joksikin tietyksi ja tarjoaa osin myös selityksen dokumentin eri osille -...näin on erityisesti mahdollista ohjelmoida käsittelijä tai muuten tulkita tietoa Vain yhteinen sopimus tyyppimäärittelykielestä ja sen käsitteistä (esim. DTD) mahdollistaa käsittelijöiden rakentamisen ko. rajapintaan vedoten typedef Provider instance Requestor MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 12

1.11 Tiedonsiirto, dokumentin tyyppi ja tietomalli (2/2) Tyyppimäärittelyn taustalta löytyy käytännössä myös sovelluksen toiminnallisuutta, rakennetta ja käyttöä koskevia suunnittelua ja tietoa -...joka ohjaa tyyppimäärittelyn toteutusta ja käyttöä -...mutta ei kokonaisuudessaan käy ilmi tyyppimäärittelystä itsestään (joka ilmenee "vain" rajapintana) Esimerkki, dokumenttienhallinnan (DH) "lisätietoja": - paikallistaminen, sisällönkuvailu, käyttöedellytykset, konteksti, elinkaari Tietomallia, käsittelyprosessia yms. voidaan toki myös kuvata dokumentteina; tällöin tarvitaan sopimus mallinnuskielestä ja sen käsitteistä (esim. RDF) - huomaa kuitenkin että sekä "tyyppimäärittelykieli" että "mallinnuskieli" tuottavat lopulta vain dataa tietokoneiden käsiteltäväksi MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 13

1.12 Esimerkki, "tieto ja metatieto" Kohdesovelluksen tietyn osan käsitemalli (esim. dokumenttienhallinnan metatiedot löydettävyyteen ja tilaan liittyen): "(Reaali)sovellus":... Tietyntyyppisen yksittäisen dokumentin käsittelyä ohjaava tietorakenne: typedef Provider instance Requestor MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 14

1.13 Huomioita: rajoitteet vs. kuvailu Huomaa tiedon mallintamisen kaksi toisiaan täydentävää näkökulmaa: Tiedon mallinnus ("proseduraalisten") rajoitteiden keinoin - "elementin luokitus arvo voi vain olla jokin seuraavista: lasku, muistio, lähete" - tavoite: validointi ("arvoa saate ei hyväksytä") Tiedon mallinnus ("loogisen") kuvailun keinoin - "lasku on kirjanpidon asiakirja" - tavoite: luokittelu ja päättely ("Kirjanpidon asiakirjat pitää arkistoida yrityksessä. Lasku on kirjanpidon asiakirja joten myös se pitää arkistoida") Käytännössä yo. näkökulmat saattavat mennä hyvin helposti sekaisin jo hyvin yksinkertaisten metatietojen tapauksessa -...koska kaikki syötetty tieto pitää toki aina "validoida", jotta sitä voisi järkevästi soveltaa (ja esim. harjoittaa päättelyä ko. tiedon varassa) MATHM-57200 RAKENTEISTEN DOKUMENTTIEN JATKOKURSSI (syksy 2005) - ON 15