Käsitemallit muistiorganisaatioiden kuvailun yhdenmukaistamisen välineenä Pekka Henttonen KDK:n arkistosektorin seminaari 6.2.2012 Kansallisarkisto
Esityksen sisältö Semanttisen webin visio Käsitemallien merkitys Tämän hetken ongelmat Sillä välin Kirjastoissa: Museoissa: FRBR CIDOC CRM Kirjastoissa (jatk.): FRBRoo Mitä meidän on tehtävä? Tekniset toteutukset ovat toinen asia
Semanttisen webin visio NYT Linkkejä resurssien välillä http://www.uta.fi/kirjasto/ ilmoitus.html?id=69856 SEMANTTINEN WEB Merkityksiin perustuvia linkkejä http://granum.uta.fi/granum/ kirjantiedot.php?tuote_id=220 92 Käsitemalli: ei-tekninen kuvaus yhteen liittyvistä entiteeteistä ja niiden välisistä suhteista
Kuvailu Tietokannat Metatietomallit Käsitemallit Ontologiat (esim. RDF:nä) Tiedon organisointi Alkoholi LT nautintoaineet, päihteet RT alkoholijuomat
Tämän hetkisiä puutteita Ei asiakirjahallinnan eksplisiittisiä käsitemalleja (ja ontologioita) Ei semanttisen webin infrastruktuuria Vain rajatusti yhteiskäyttöisyyttä Eri arkistojen kesken Arkistojen ja asiakirjahallinnon järjestelmien kesken Museoiden, arkistojen ja kirjastojen kesken Kuvailu- ja luettelointi ei vastaa tarpeita Metatietojen ja kuvailujen, sähköisten ja perinteisten aineistojen yhdistäminen Uudenlaiset aineistot (esim. tietokannat) Digitoitujen asiakirjojen yms. yksittäisten objektien kuvailu Käyttäjien tekemät kuvailut ja folksonomiat miten yhdistetään?
Sotapäiväkirja (Vakka) Muu aineisto (Aarre) Suomen sodissa menehtyneiden tiedosto 1939-45 (tietokanta) Sotilaskantakortti (oma hakemisto)
Sotapäiväkirja (Vakka) Muu aineisto (Aarre) PERSON ORGANIZATION Suomen sodissa menehtyneiden tiedosto 1939-45 (tietokanta) COLLECTION Sotilaskantakortti (oma hakemisto) DOCUMENT
Sotapäiväkirja (Vakka) Muu aineisto (Aarre) Sotapäiväkirja isa: Document T-3144 isa: Collection Suomen sodissa menehtyneiden tiedosto 1939-45 (tietokanta) 1./JR 7 isa: Organization Sotilaskantakortti (oma hakemisto) Kalle Määttä isa: Person Kantakortti isa: document
Kirjastojen kuvailu Perinteinen kirjastojen kuvailu- ja luettelointi koettiin epätyydyttäväksi Vastaus 1) Functional Requirements for Bibliographic Records (FRBR) v. 1997 Määrittelee bibliografisen kuvailun keskeiset entiteetit ja niiden väliset suhteet 2) Resource Description and Access FRBR:ään perustuvat kuvailusäännöt Ondaatje, Michael, 1943- The English patient. [original book] Sound recording - English The English patient / by Michael Ondaatje. London : Macmillan Audio Books, p1997. 2 sound cassettes (ca. 4 hrs.) : analog. ISBN: 0333675568 Miten kuvaillaan ID: 2806897438 Mitä kuvaillaan
CIDOC CRM (Conceptual Reference Model) Alun perin museomaailmassa luotu käsitemalli ISO-standardi (ISO 21227) vuodesta 2006 Määrittelee n. 90 luokkaa ja 140 suhdetta luokkien välille (esim. E53 Place - P87 is identified by (identifies) - E44 Place Appellation) Tarkoitettu myös laajemmin muistiorganisaatioiden tiedon integrointiin (yhteys löytyy ylemmältä abstraktiotasolta) Tapahtumakeskeinen Erityisalojen kuvailut ja metatiedot kelpaavat sellaisenaan (ei ole preskriptivinen) Time spans Time-Spans Types refine Actors participate in Temporal Entities within Conceptual Objects Physical Entities affect located at occur at Places
Fyysinen objekti: Sopimus Osallistujat: Churchill, Roosevelt, Stalin Tapahtuma: Sopimuksen laatiminen Tapahtuma: Valokuvan ottaminen Paikka: Jalta Aika: vuosi 1945 Fyysinen objekti: Valokuva
Esimerkki CIDOC CRM:stä CIDOC CRM ei määrää mitä entiteeteistä kerrotaan Alakohtaiset käsitemallit voivat täsmentää ja täydentää CRM:ää: esim. arkistonmuodostajalla voisi olla Paikan lisäksi yhteys Tehtävään?
CIDOC CRM E1 CRM Entity E39 Actor E77 Persistent Item E70 Thing FRBRoo (2008) - CIDOC CRM:n kanssa sovitettu käsitemalli E74 Group E40 Legal Body Kirjaston käsitemalli E21 Person E72 Legal Object E18 Physical Thing E19 Physical Object E20 Biological Object Arkiston käsitemalli Kirjailija Kirjeen vastaanottaja
Esimerkki FRBRoo:sta FRBRoo:n käsite CIDOC CRM:n käsite Kuvaus sisällöstä bibliografisen kuvailun näkökulmasta Esimerkkejä
Lopuksi: mitä siis on tehtävä? Käsitemallien kehittäminen tukemaan 1) uudenlaista kuvailua (johon tarvitaan käsitemalli, vrt. FRBR) 2) ontologioiden kehittämistä (johon tarvitaan tarkka käsitemalli) 3) integrointia kirjasto- ja museojärjestelmiin (johon tarvitaan CIDOC CRM yhteensopiva tarkka käsitemalli, vrt. FRBRoo) Työ osin käynnissä ICAssa? Tietoja huonosti saatavilla Toteutuu osin AHAA-projektissa
Kiitos! pekka.henttonen@uta.fi