Metatietojen merkitys tiedonhallinnassa Airi Salminen Jyväskylän yliopisto http://www.cs.jyu.fi/~airi/ Suuntana lainsäädäntötyön semanttinen web Kohti lainsäädäntötyön tiedonhallinnan tehostamista Seminaari Eduskunnassa 26.5.2004 Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004
Sisältö 1. Tietoa tiedosta 2. Mihin metatietoa tarvitaan? 3. Sisällönhallinta tiedonhallintana 4. Metatiedot sisällönhallinnassa 5. Metatiedot semanttisessa webissä 6. Yhteenveto Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 2
1. Tietoa tiedosta metatieto = tietoa tiedosta esimerkiksi dokumentista dokumenttikokoelmasta dokumentin osasta HTML-sivusta tietokannasta ohjelmasta museoesineestä henkilöstä Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 3
1. Tietoa tiedosta Metatieto voi kuvata esimerkiksi dokumentista sisällön rakennetta sisällön merkitystä sisällön kieltä tuottamisympäristöä (tekijä, organisaatio, prosessi, ohjelma) versiota tallennusmuotoa tallennusmediaa säilytysaikaa käyttöoikeuksia Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 4
1. Tietoa tiedosta Dublin Core -metatiedot webin tietoresursseille: title creator subject description publisher contributor date type format identifier source language relation coverage rights Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 5
1. Tietoa tiedosta Esimerkki DC-metatiedosta HTML-dokumentissa <head> <title>airi Salminen</title> <link rel="schema.dc" href="http://purl.org/dc/elements/1.1/"> <meta name="dc.title" content="airi Salminen"> <meta name="dc.creator" content="airi Salminen"> <meta name="dc.subject" content="airi Salminen"> <meta name="dc.description" content= Home page of Airi Salminen, showing her representative publications, research interests, projects, courses, and contact information"> <meta name="dc.date.modified" content="2004-04-10"> <meta name="dc.type" content="text.home page"> <meta name="dc.format" content="html"> <meta name="dc.identifier" content="http://www.cs.jyu.fi/~airi/index.html"> <meta name="dc.language" content="en"> <meta name="dc.relation" content="http://www.cs.jyu.fi/~airi/docman.html"> <meta name="dc.relation" content="http://www.cs.jyu.fi/~airi/publications.html"> <meta name="dc.rights" content="copyright 2002 Airi Salminen"> </head> Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 6
1. Tietoa tiedosta JHS 143 Asiakirjojen kuvailuformaatti: nimeke tekijä aihe kuvaus julkaisija muu tekijä aikamääre laji formaatti identifiointitunnus lähde kieli suhde kattavuus oikeudet asiakirjan laji julkisuus versio ympäristö saatavuus vastaanottaja toimeksiantaja kohdeyleisö Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 7
2. Mihin metatietoa tarvitaan? Kirjaston kokoelmien organisoimiseen, julkaisujen hakuun, saatavuuden varmistamiseen tieto metatieto Kirjaston julkaisukokoelmat kirjastokortit (tekijä, julkaisuvuosi, kustantaja, avainsanat, hyllysijainti,...) luokitukset sanastot, hakemistot lainaajatiedot lainaussäännöt Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 8
2. Mihin metatietoa tarvitaan? Internetin tietojen ja palvelujen etsimiseen ja tarjoamiseen tieto metatieto Internetin tietovarannot hakukoneiden indeksit linkkisivut Dublin Core -kuvaukset joko upotettuina dokumenteissa tai ulkoisina kuvauksina Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 9
2. Mihin metatietoa tarvitaan? Varmistamaan organisaation asiakirjojen löydettävyys, ylläpidettävyys, todistusvoimaisuus, autenttisuus ja ymmärrettävyys tieto metatieto kortistot, hakemistot Organisaation asiakirjat ohjelmistokohtaiset metatiedot (diaari-, dokumenttienhallinta-, päätöksenteko-, arkistointijärjestelmät) Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 10
3. Sisällönhallinta tiedonhallintana RASKE-metodologia kokonaisvaltaiseen dokumenttien- ja sisällönhallinnan kehittämiseen RASKE1 (1994-1998): menetelmiä dokumenttien rakenteistamiseen; sovellusalueena valtiopäiväasiakirjojen rakenteistaminen RASKE2 (2003-2006): menetelmiä sisällönhallinnan kehittämiseen, metatietojen standardoimiseen ja tietoresurssien integroimiseen; sovellusalueena lainsäädäntöprosessin sisällönhallinta http://www.it.jyu.fi/raske/ Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 11
3. Sisällönhallinta tiedonhallintana Sisällönhallinnan osa-alueet tieto sisältöyksiköt toiminnot toimijat asiakirjat muistiot sähköpostisanomat valokuvat,... järjestelmät organisaatiot ihmiset agenttiohjelmat laitteistot ohjelmistot standardit (TCP/IP, pdf, XML, RDF,...),... Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 12
3. Sisällönhallinta tiedonhallintana sisältöyksiköt lainsäädäntöprosessi toimijat järjestelmät Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 13
3. Sisällönhallinta tiedonhallintana sisältöyksiköt lainsäädäntöprosessi toimijat asiakirjat rakenteisten asiakirjojen osat sähköpostisanomat web-sivustot tyylitiedostot DTD:t... järjestelmät PTJ VEPS ym. järjestelmät Valtioneuvosto Eduskunta ym. organisaatiotoimijat valmistelijat ministerit valiokuntasihteerit kansanedustajat kansalaiset ym. henkilötoimijat agenttiohjelmat Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 14
3. Sisällönhallinta tiedonhallintana Ongelmia organisaatioiden sisällönhallinnassa sisältöjen määrä kasvanut vaikeasti hallittavaksi sisältöyksiköiden hämärtyminen (asiakirja, dokumentti, html-sivu, tiedosto, sähköpostisanoma, tyylitiedosto) sisältöjen epäyhtenäisyys vastuut metatietojen tuottamisesta ja ylläpitämisestä hämäriä Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 15
3. Sisällönhallinta tiedonhallintana Ongelmia organisaatioiden sisällönhallinnassa järjestelmien kirjavuus järjestelmät eivät kommunikoi keskenään tuki työprosesseille puuttuu Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 16
4. Metatiedot sisällönhallinnassa sisältöyksiköt toiminnot toimijat järjestelmät Metatiedot kuvaavat sisältöyksiköitä, toimintoja, toimijoita, järjestelmiä Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 17
4. Metatiedot sisällönhallinnassa Tavoitteita metatiedoille formaali, standardoitu muoto niin, että sekä ihmiset että erilaiset ohjelmistot pystyvät niitä hyödyntämään sovellusriippumaton esitysmuoto mahdollisimman paljon automaattista tuottamista täsmällisesti määritellyt tuottamis- ja ylläpitovastuut Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 18
4. Metatiedot sisällönhallinnassa sisältöyksiköt toiminnot toimijat primäärisisältö metatietosisältö järjestelmät Metatietosisältöä voivat olla esim. rakennekuvaukset, tyylitiedostot, JHS 143 -kuvaukset, prosessikuvaukset, toimijakuvaukset, järjestelmäkuvaukset, standardien kuvaukset Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 19
4. Metatiedot sisällönhallinnassa liittyy yhteen sisältöyksikköön Vaihtoehtoja metatiedoille liittyy sisältöyksikköjen joukkoon upotettu keskitetty ihmisen tuottama ihmisen käyttöön ulkoinen hajautettu automaattisesti tuotettu tietokoneen käyttöön Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 20
5. Metatiedot semanttisessa webissä Semanttisessa webissä metatiedoilla pyritään varmistamaan yhteisön tietoresurssien käytettävyys niin ihmisille kuin ohjelmillekin (löydettävyys, ymmärrettävyys, luotettavuus, yhdisteltävyys) tieto metatieto Semanttisen webin tietovarannot käsitteistöt ja käsitteiden väliset suhteet, päättelysääntöjä (ontologiat) käyttöoikeuksiin ja käyttötarkoituksiin liittyvät kuvaukset tietoturvaan liittyvät tiedot (digitaaliset vesileimat, allekirjoitukset,...) tiedot metatietostandardeista Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 21
5. Metatiedot semanttisessa webissä Monipuolista metatietoa Nykyistä huomattavasti enemmän webin tietovarantojen merkitykseen, käyttöön, käyttötapoihin ja luotettavuuteen liittyvää metatietoa. Metatietojen kieli huomattavasti homogeenisempaa ja kontrolloidumpaa kuin dokumenttisisältöjen. Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 22
5. Metatiedot semanttisessa webissä Metatiedot koneiden ymmärtämässä muotoon Metatiedot formaalissa standardoidussa muodossa niin, että sekä ihmiset että erilaiset ohjelmistot pystyvät niitä hyödyntämään. Automaattisia päättelysääntöjä. Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 23
5. Metatiedot semanttisessa webissä Semanttisen webin pelkistetty rakenne sovellusohjelmat primääritietovarannot semanttisen webin tekniikoihin perustuvat metatietovarannot semanttisen webin tekniikat Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 24
5. Metatiedot semanttisessa webissä sovellusohjelmat primääritietovarannot DTD:t, XML Schema - määrittelyt, RDF Schema -määrittelyt, RDF-määrittelyt, ontologiat, aihekartat, annotoinnit,... URI, Unicode, XML, XML Namespaces, XML Schema, RDF, RDF Schema, XTM, XML-Signature, OWL, Annotea,... Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 25
6. Yhteenveto Metatiedot organisaatioissa pitkälle järjestelmiin sidottuja. Ratkaisut hajanaisia, ei tukea työprosesseille Sisältöjen rakenteisuutta ei pystytä vielä hyödyntämään kovin tehokkaasti. Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 26
6. Yhteenveto Järjestelmäriippumaton standardointi tärkeää. Metatason määrittelyiden täytyy olla niin formaaleja, että ohjelmat pystyvät käyttämään metatietoja. Semanttisen webin metatietostandardien käyttö tarjoaa mahdollisuuden yhdistellä ratkaisuja, joita tehdään eri yhteisöissä. Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 27
6. Yhteenveto RASKE2-projektissa kehitetään menetelmiä metatietojen standardointiin ja sisällönhallinnan kokonaisvaltaiseen kehittämiseen. Lisätietoja RASKE2-projektista ja sitä edeltävästä aihepiiriin liittyvästä tutkimustyöstä: http://www.it.jyu.fi/raske/ Airi Salminen, Metatietojen merkitys tiedonhallinnassa, 26.5.2004 28