Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto juha.hakala@helsinki.fi



Samankaltaiset tiedostot
Metadatasuositus julkaisuarkistojen tekstiaineistoille

KOPIOLUETTELOINTI KANSALLISKIRJASTON TIETOKANNOISTA

Metadata ja hyvät käytännöt

Yleisten kirjastojen kuvailutyön kansallinen viitekehys. Yleisten kirjastojen neuvosto Anu Jäppinen

Talonmiehen tuokio klo KANSALLISKIRJASTO

Monihaku ja sähköiset aineistot tutuksi. Jyväskylän kaupunginkirjaston tiedonhaun koulutus

FINMARC -> Marc 21 järjestelmätoimittajan puheenvuoro. Helsinki Seppo Lindström varatoimitusjohtaja

Kuvailusäännöt, formaatti ja kirjastojärjestelmä

E-aineisto Melindassa

Kirjastojen kansallinen metatietovaranto -hanke Yleisten kirjastojen projekti

Kuvailun muutoksen visualisointi Marja-Liisa Seppälä / Kansalliskirjasto

Uudet kuvailusäännöt ja tietokantojen 0-alueen konversio. Ulla Ikäheimo Arto-päivä, Helsinki

Yhteenvetoa RDA-koulutuspäivistä. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

Juha Hakala Kansalliskirjasto

Käyttöoikeuksien metatieto

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

MichaelPlus. Hankkeen esittely Mikael Vakkari Suunnittelija MichaelPlus hanke

Aineistoentiteettien ensisijaiset suhteet. RDA-koulutus Marja-Liisa Seppälä marja-liisa.seppala[ät]helsinki.fi

ARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN

RDA, BIBFRAME, Melinda kuinka kuvailutyö uudistuu

Bibframe, ISO TC 46/SC 4 & julkishallinnon metatietopalvelu. Metatietoverkoston infotilaisuus Juha Hakala KIRJASTOVERKKOPALVELUT

Kokoelmakartan lyhyt historia

JYX-julkaisuarkisto työtä ja kehitystyötä

NELLI & DOMS paikallisesti

Kansalliskirjaston palvelupaletti erikoiskirjastoille

Kansallinen digitaalinen kirjasto: tilannekatsaus

TTA, PAS ja julkishallinnon standardisointi

Metatietosuositus julkaisuarkistojen tekstiaineistolle

NELLI Kansallinen tiedonhakujärjestelmä

Kansalliset digitaaliset kulttuuriaineistot Eduskunnan kirjastossa Annamari Törnwall

TIETEELLISTEN KIRJASTOJEN YHTEISTILASTOSSA LASKETTAVAT TUNNUSLUVUT

ISNI-järjestelmä. Sähköisten sisältöjen aamupäivä Maarit Huttunen. KANSALLISKIRJASTO - Tutkimuskirjasto

Luetteloinnin ja tiedonhaun tulevaisuuden näkymiä. Juha Hakala Helsingin yliopiston kirjasto

BIBFRAME-hankkeen tilannekatsaus

Asiakirjojen sailytysvaatimukset, toimitusjohtaja Antero Ensio, Ensitieto Oy

Kirjastoverkkopäivät Marja-Liisa Seppälä Kansalliskirjasto

Luetteloinnin tiedotuspäivä

Nelli kaukopalvelutyössä

OPAC vai WWW Miten elektroniset kausijulkaisut löytyvät?

Metodiopetuksen tuki verkossa: menetelmäopetuksen tietovaranto

KULTTUURIAINEISTOJEN TALLETTAMINEN JA SÄILYTTÄMINEN

Tieto matkaa maailmalle

Erikoiskirjastojen vastaajat palvelukyselyssä Päivi Jokitalo Kansalliskirjasto. Kirjastoverkkopalvelut

Kysely kirjastoille kirjastojärjestelmähankinnasta

RDA-kuvailun keventäminen. Melinda-päivä Marja-Liisa Seppälä Kuvailusääntöpalvelu

Kuvailutiedot tiedonhakijan näkökulmasta

Vastausten määrä: 597 Tulostettu :11:33

Kirjastoinfo TY KTMT Porin tiedekirjasto

ISBD(ER) UUDISTUS Tärkeimmät muutokset Teemapäivä elektronisen aineiston luetteloinnista , Lassi Lager & Eeva Murtomaa, HYK

Metatiedon yhteentoimivuutta edistävät palvelut ja projektit. Missä mennään -webinaari

Opetusteknologian standardoinnin tilanne. Antti Auer

Julkaisujen, aktiviteettien ja uutisten tietojen tallennus LaCRISjärjestelmään

Kirjastoinfo TuKKK Pori Porin tiedekirjasto

Kokoelmien kuvailujen tallennusohje Dspace tallennusalustalle Kokoelmakartan formaatin mukaisesti

Painetun aineiston saatavuus Suomessa. Viikki Pentti Vattulainen

KULTUURIAINEISTOLAKI JA MUSIIKKIAINEISTOT. Uudistunut kulttuuriaineistolaki -seminaari Tapani Moisio

Porin tiedekirjasto ja TTY:n verkkoaineistot

Porin tiedekirjasto ja TTY:n verkkoaineistot

MARC 21 YHTEISEKSI FORMAATIKSI -- SUOSITUS ERIKOISKIRJASTOILLE?

Automaattinen semanttinen annotointi

Uudet kuvailusäännöt (RDA) tulevat. Erikoiskirjastojen neuvoston kokous Marja-Liisa Seppälä

Tampereen kaupunginkirjasto ja Melinda

Melindan hankauskohtia

Metatiedot organisaatioiden sisällönhallinnassa

TIEDONHANKINNAN PERUSTEET (1 op) harjoitus 1 (TaY Pori syksy 2014)

UKJ nyt. FUCIO:n kevätkokous Ari Ahlqvist

CC0-lisenssi: case Finna

RINNAKKAISTALLENNUSOHJE

Katsaus kansainväliseen ja kansalliseen tunnistetilanteeseen (ISBN, ISSN, ISNI)

Äänikirjojen kuvailuohje

Virva Nousiainen- Hiiri

Muutosten vuosikymmen

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Helsingin yliopiston kirjasto, Yliopistonkatu 1, 2. kerroksen kokoushuone

Yhtenäisen juonen lohtu : Kirjasampo, lukeminen ja muisti

Tieteellisten kirjastojen yhteistilasto. Kirjastotilastotietokanta - KITT Biblioteksstatistikdatabasen - BIS Library Statistics Database - LISDA

RDA Toolkit. RDA-koulutuspäivä Martin Engberg KANSALLISKIRJASTO

Kuvailutyöryhmät, koulutus ja viestintä. Maria Kovero Kuvailun tiedotuspäivät

Teknologinen muutos ja yliopistojen tulevaisuus. Tievie-seminaari Helsinki Antti Auer

Patron Driven Acquisition (PDA) e-kirjojen hankintamenetelmänä: Case Ebrary Itä-Suomen yliopiston kirjastossa

TP1: Metatietovaranto-konsepti muuttuvassa ympäristössä

KIRJASTO- JA TIETOPALVELUALAN AMMATILLISET ERIKOISTUMIS- OPINNOT (60 op)

THL:N NÄKÖKULMIA TUTKIMUSAINEISTOJEN SÄILYTTÄMISEEN

Perussuunnitelma yleisille kirjastoille MARC 21 -formaattiin siirtymiseksi

NELLI PORTAALIN KÄYTTÖOPAS

Uudessa Excel-2007 on muutettuja / uusia ominaisuuksia jotka tulee huomioida kun Excel-2003 tehtyjä sovelluksia otetaan käyttöön Excel-2007:ssä.

Näin toimii Digitalkoot. Digi.kansalliskirjasto.fi:n toiminnot Kansalliskirjasto / Digitointi- ja Konservointikeskus URN:NBN:fi-fe

E-kirjat Helsingin yliopiston kirjastossa

Kirjastojen kuvailutiedot Finnassa

E-lehtien siirtäminen SFX:stä Voyager-tietokantaan

Kansallinen digitaalinen kirjasto missä mennään? Kristiina Hormia-Poutanen

RDA, osio 8: Teosten, ekspressioiden, manifestaatioiden ja kappaleiden suhteiden kuvailu (luvut ja liite J)

Digitaalisen median tekniikat xhtml - jatkuu Harri Laine 1

Miten Finna muuttaa sisällönkuvailua vai muuttaako?

Mitä, miksi ja miten?

PAS-tilanne ja julkaistujen opinnäytteiden pitkäaikaissäilytykseen liittyvä prosessi ja edellytykset

Ohjausryhmän kokous 1/2008. Kansalliskirjasto Yliopistonkatu 1, Fabianian kokoushuone

Transkriptio:

Metatieto mihin ja miten? Juha Hakala Helsingin yliopiston kirjasto juha.hakala@helsinki.fi

Sisältö Metatiedon määrittely Metatiedon käytöstä Metatietoformaatit MARC, Dublin Core, IEEE LOM Elektronisten julkaisujen kuvailu ja säilytys Tallennus- ja hakuvälineistä

Metatieto Dokumentin rakenteinen kuvaus Voidaan tuottaa koneellisesti Google, Alta Vista, etc..tai käsityönä kirjaston näyttöluettelo, kansallisarkiston arkistotietokanta, Osa kuvailtavaa dokumenttia tai erillään Koskee julkaisua tai sen käyttöehtoja/ympäristöä

Metatiedon käytöstä Tiedonhaku, aineiston hankinta + evaluointi suurimmissa kirjastojen tietokannoissa lähes 50 miljoonan teoksen tiedot; haku yhä tehokasta LINDA = 3.7 miljoonaa tietuetta Paikallistaminen (URL/paikanmerkki) Tekijänoikeuden metatiedot Pitkäaikaissäilytys (el. aineiston)

Metatiedon käytöstä (2) Tiedonhakuun tarvittavat elementit kuten tekijä, nimeke, aihe jne.) tunnetaan, mutta tekijänoikeuksien metadata on alkutekijöissään pitkäaikaissäilytyksen kuvailutiedosta on monia ehdotuksia, mutta ei selkeää ratkaisua

Metatietoformaatit metatiedon rakenne perustuu formaattiin yksinkertaiset (Google), rakenteiset (Dublin Core) ja monimutkaiset (MARC) formaatit vähäiset vs. kovat ammattitaitovaatimukset halvalla ei saa hyvää kuvailua, vaikka automaattinen indeksointi on kehittynyt 1 MARC-tietue = 500 mk

Metatietoformaatit (2) formaatit yleensä domain-kohtaisia kirjastojen MARC-formaattiin rakennettu sisään kirjastomainen tapa käsitellä julkaisuja Dublin Core pyrkii olemaan yleinen ratkaisu domaineilla omat kuvailusäännöt monimutkaiset säännöt, monimutkainen formaatti (kehikko johon tiedot koodataan konelukuiseen muotoon)

MARC Machine Readable Cataloguing, kehitettiin Kongressin kirjastossa 70-luvun alussa levinnyt kaikkialle maailmaan; kansallisia versioita (kuten FINMARC) jokainen kirjastojärjestelmä MARC-pohjainen yliopistokirjastot siirtyvät FINMARCista kansainväliseen MARC21-formaattiin tietojen kopiointi ulkomaisista kirjastoista

Dublin Core ANSI/NISO Z39.85-2001 amerikkalainen kansallinen standardi SFS-versio valmistuu syksyllä 2001 Suomessa jo versio asiakirjoille vastuutaho Dublin Core Metadata Initiative http://www.dublincore.org/ 14 työryhmää, joista yksi DC-Education http://www.dublincore.org/groups/education/

Dublin Core (2) DC koostuu 15 kentästä ja joukosta (noin 70) niiden tarkenteita http://www.dublincore.org/documents/dces/ http://www.dublincore.org/documents/dcmesqualifiers/ käyttöopas hyväksytty, suomennos 2001 opas hyvin yleinen, hankkeiden kehitettävä omat luettelointisäännöt yhteismitallisuus kärsii tästä

Dublin Core (3) DC-tietojen tallennustapa määritelty HTML:, XML/RDF: ja XHTML:lle HYK ylläpitää tallennusalustaa http://www.lib.helsinki.fi/cgi-bin/dc.pl haaste: tallennusvälineen ja tekstinkäsittelyohjelman yhdistäminen erillistä tallennusalustaa vaikea käyttää

IEEE Learning Object Metadata Standardiluonnos, kehityksestä vastaa IEEE Learning Object Metadata Working Group http://ltsc.ieee.org/wg12/ taustalla IEEE Learning Technology Standards Committee (LTSC) monipuoliset tavoitteet http://ltsc.ieee.org/wg12/s_p.html valmistumisajankohta avoinna

IEEE LOM & Dublin Core ovat varsin yhteensopivia, katso http://www.ischool.washington.edu/sasutton/ie EE1484.html ja standardiluonnoksen Annex B mutta IEEE LOM on paljon DC:tä laajempi tavoitteena yhteismitallisuuden parantaminen http://dublincore.org/news/pr-20001206.shtml

Formaattikonversiot Periaatteessa mikä tahansa rakenteinen data voidaan muuntaa formaatista toiseen Käytännössä homma ei ole helppo metatiedoissa olevat virheet, vaihtelevat nimien tallennustavat (etunimi sukunimi vai sukunimi, etunimi), kenttien yhteismitattomuus, merkkivalikoimien erot vaikeuttavat työtä

Elektronisen aineiston kuvailusta Painettuun aineistoon verrattuna: aineistoa on hyvin paljon dokumenttien määrittely ja rajaus vaikeaa elektroninen lehti sulaa verkkoon elektroninen kirja voi koostua kymmenistä palasista eri aineistot yhtenevät digimassaksi radiolähetyksessä kuvaa ja tekstiä julkaisu voi paitsi lakata ilmestymästä, myös kadota täydellisesti

Elektronisen aineiston kuvailusta ID-tunnukset Perinteiset ID-tunnusjärjestelmät kriisissä ISSN ja verkkolehden määritelmä ISBN:n kapasiteetin loppuminen mikä tunnus oppimateriaaleille? kansallisbibliografian ID-numero? Uudet tunnusjärjestelmät teoksille ISAN: International Standard Audiovisual Number ISWC: International Standard (Musical) Work Code ISTC: International Standard Textual Work Code

Elektronisen aineiston kuvailusta metatieto ja verkkokauppa E-bisnes ajaa kehitystä: jokainen kaupan oleva tuote pitää löytyä verkkokirjakaupasta metatieto todistaa että henkilö x on teoksen a tekijä keskeinen merkitys tekijänoikeusasioiden selvittämisessä metatietojen tuottajan oltava luotettava

Elektronisen aineiston kuvailu kirjastoissa Vain murto-osa aineistosta käsiteltävissä perinteisellä tyylillä (luettelointi) verkkolehdet, opinnäytteet, e-kirjat laaja kirjastojen välinen yhteistyö tarpeen Aihehakemistot (virtuaalikirjastot) nopeaan kuvailuun Kokoteksti-indeksointi verkkoarkisto, 1800-luvun sanomalehdet

Elektronisen aineiston säilytys Useita ongelmia tallennusväline muuttuu lukukelvottomaksi aineisto kopioitava suojaan dokumentin käyttöön tarvittava ohjelma lakkaa toimimasta uusissa koneissa TEKO (DOS-teksturi) ja Windows

Elektronisen aineiston säilytys Kolme ratkaisumallia (2) säilytä vanhat koneet (ei onnistu) konvertoi vanhat dokumentit kaikkea aineistoa ei voi konvertoida - esim. ohjelmistoista ei ole lähdekoodia konvertointi voi muuttaa julkaisua alkuperäisen käyttöympäristön jäljittely DOS-emulaattori Windows NT:ssä alkuperäisten ohjelmien säilytys ja käytön opettelu emulaattoreiden kasautuminen

Elektronisen aineiston säilytys (3) Käytännön projekteja vähän Kansalliskirjastojen NEDLIB-hanke CD ROM -levyjen käyttösovellus verkkoaineiston haravaohjelmisto emulation test bed pitkäaikaissäilytyksen edellyttämät metatiedot elibin CEDARS-projekti HYK kehittänyt suomalaisen version säilytyksen metatiedoista

Tallennusvälineistä Tallennusvälineet suunnattu usein ammattilaisille (välittäjille) kirjastojärjestelmät (MARC, Dublin Core) Kuvailuvastuu osin siirtymässä dokumenttien tekijöille asiakirjojen hallintajärjestelmät, computer aided radio järjestelmät Hyvät apuvälineet tarpeen Vesa-verkkosanasto (http://vesa.lib.helsinki.fi)

Hakuvälineistä Verkon indeksointisovellukset kehittyneet nopeasti (Google, Alltheweb) skaalautuminen verkon mukana Tulosjoukot liian suuria Metatietoa verkossa paljon, laatu ongelma hakukoneiden rakentajat eivät ole panostaneet tehokkaaseen metadatahakuun panostettava hyvän metatiedon tallennukseen

Virtuaaliyliopiston kirjasto? Tarvitaan sekä periaatepäätöksiä sekä käytännön työvälineiden kehittämistä minkä aineiston kansalliskirjasto luetteloi ja tallentaa osana vapaakappalevastuutaan? mistä materiaalista vastaavat yliopistot, ja miten esimerkiksi metatiedon luonti tehdään? itsepalvelu ainoa toimiva ratkaisu jos dokumentteja on todella paljon