Elektronisen julkaisemisen uusia tuulia - sanomalehtiä ja aikakausjulkaisuja taannehtivasti verkossa AGRICOLA

Samankaltaiset tiedostot
Tieteelliset lehdet ja takautuva digitointi. Digitointirahaa onko sitä? -seminaari Jyrki Ilva

Digitalia-projektin tekstinlouhinnan tuloksia. Kimmo Kettunen

Open access Suomessa 2013? Avoin tiede -keskustelutilaisuus, Jyrki Ilva

Arvoisa juhlayleisö, Mitä tämä voi olla käytännössä?

Suomalaiset lehdet ja avoimen julkaisemisen rahoitus

Open Journal Systems digitoitujen aineistojen tallennusalustana ANTTI-JUSSI NYGÅRD SUUNNITTELIJA, TIETEELLISTEN SEURAIN VALTUUSKUNTA

Lähteisiin viittaaminen ja lähdekritiikki

Tieteellisten seurojen julkaisutoiminta Eeva-Liisa Aalto

Open Journal Systems digitoitujen aineistojen tallennusalustana ANTTI-JUSSI NYGÅRD SUUNNITTELIJA, TIETEELLISTEN SEURAIN VALTUUSKUNTA

SELVITYS PRO GRADUJEN KÄYTÖSTÄ TAIDEKIRJASTOSSA

Käsitteitä ja määritelmiä

Kansalliset digitaaliset kulttuuriaineistot Eduskunnan kirjastossa Annamari Törnwall

Kuinka tutkijat hakevat tietoa Aaltoyliopiston

Tiedelehtien avoimuus osana kustantajaneuvotteluja

NELLI Kansallinen tiedonhakujärjestelmä

Kansalliskirjaston digitoitu historiallinen lehtiaineisto : sanatason laatu, kokoelmien käyttö ja laadun parantaminen

TIEDONHANKINNAN PERUSTEET (1 op) harjoitus 1 (TaY Pori syksy 2014)

Tieto matkaa maailmalle

Julkaisuvaihto ja verkkojulkaiseminen

Opinnäytteitä verkossa - katsaus yliopistojen tutkielmapankkeihin AGRICOLA

Kansalliskirjaston julkaisuarkistopalvelut. Jyrki Ilva Erikoiskirjastojen neuvosto,

KUVATAIDEAKATEMIAN KIRJASTON KOKOELMAPOLITIIKKA

Kotilava Hemvett Rahoituspilotti käyntiin Ajankohtaista julkaisemisesta Tieteiden talo (Kirkkokatu 6, Helsinki)

Näin toimii Digitalkoot. Digi.kansalliskirjasto.fi:n toiminnot Kansalliskirjasto / Digitointi- ja Konservointikeskus URN:NBN:fi-fe

Sanomalehtien Liiton keskustelutilaisuus Digiarkistoista liiketoimintaa. Taustaa. Mitä Kansalliskirjasto voi tarjota sanomalehdille?

Avoin julkaiseminen // Tiedekulma

Porin tiedekirjasto ja TTY:n verkkoaineistot

Vanhat sanomalehdet ja tekijänoikeus Satu Kangas

TAMPEREEN YLIOPISTON KIRJASTO JULKAISUKESKUS

Avoin tiede ja tutkimus TURUN YLIOPISTON JULKAISUPOLITIIKKA

Digiarkistosta palveluja kuluttajille Kari Kaikkonen Mediatalo ESA Oy

Arto, Linda ja Fennica kansallisen julkaisurekisterin tietojen lähteinä. Asiantuntijakokous, Jyrki Ilva

Tieteellisten lehtien avoimuuspolitiikat

Historialliset kartat verkossa. Jari Järvinen JY, Multimediaopintokokonaisuus

Kotimainen tieteellinen julkaiseminen ja avoimuus. Johanna Lilja Kirjastoverkkopäivät

Tekijänoikeudet digitointihankkeissa

Tiedonhaku opiskelun osana CHEM Virpi Palmgren Tietoasiantuntija DI Oppimiskeskus beta

TIETEELLISTEN KIRJASTOJEN YHTEISTILASTOSSA LASKETTAVAT TUNNUSLUVUT

Rinnakkaisjulkaiseminen Tampereen yliopistossa

Espoon Kaupunginarkisto EKYL

Julkaisutiedonkeruun avoin saatavuus -tieto

Jälkidigitaalinen tiede tieteellisen tiedon saatavuuden muutos

Porin tiedekirjasto ja TTY:n verkkoaineistot

Oikeuskirjallisuus Eduskunnan kirjastossa

Kirjastoinfo TY KTMT Porin tiedekirjasto

Talonmiehen tuokio klo KANSALLISKIRJASTO

Jarmo Saarti Kirjastojuridiikan ajankohtaispäivä Kirjastot ja datamining, tutkijan ja kirjaston näkökulmat

Kirjastoinfo TuKKK Pori Porin tiedekirjasto

Web of Science, Scopus ja Tutka. Matti Rajahonka

Laki kulttuuriaineistojen tallettamisesta ja säilyttämisestä /1433 Verkkoaineisto

Historiallisten digitoitujen sanoma- ja aikakauslehtien avaaminen avoimena datana tutkijoille

OPEN ACCESS JYVÄSKYLÄN YLIOPISTO AVOIN TIETEENTEKIJÄ

Tehdään laadukas painotuote

ASIAKASNÄKÖKULMA JULKAISUTOIMINNAN MURROKSEEN

MicroTieto. Oivallus palvelusta

E-kirjat Helsingin yliopiston kirjastossa

Aineistojen hyöty-kustannus-suhde : Kokoelmapolitiikan priorisoinnit

Open access FinELibin neuvotteluissa: Tutkijan näkökulma

KOPIOINTILUPA YLIOPISTOILLE JA AMMATTIKORKEAKOULUILLE

Digi.kansalliskirjasto.fi:n käyttöohje

Tietohallintopäällikkö Ari Apilo

Rinnakkaistallentaminen tekee hyvää kaikille! Pekka Olsbo Jyväskylän yliopiston kirjasto

Keski-Suomen maakuntakokoelman aineistovalinnan periaatteet

Ostetaan avoimeksi? Avoimen aineiston hankinnan kriteerit. Irene Ylönen Informaatikko Avoimen tiedon keskus Jyväskylän yliopisto

Lukijatutkimus Tutkimusraportti Focus Master Oy

Aviisi-projektin avaamat mahdollisuudet

Julkaisuarkistojen käyttötilastot: Mitä tilastoidaan ja miksi?

Ajankohtaista TSV:n vertaisarviointitunnuksesta

Yliopistojen julkaisujen avoimuus vuonna 2016

JURE ja julkaisufoorumi. Julkaisuarkistotapaaminen, Jyrki Ilva

Kirjastojen verkkoaineistoja opetukseen

Kansallisen elektronisen kirjaston käyttäjäkysely ammattikorkeakouluille 2007

Theseus ja rajatun käytön aineistot

Digitoinnin työpaja 3a/4 Äänitteiden digitoinnin perusteita

Ei ainoastaan kielitieteelle! Fenno-Ugrica kokoelma historiantutkimuksen tukena

Nelli Tiedonhakuportaali Kemi-Tornion ammattikorkeakoulun elektronisiin aineistoihin. Onnistuneita hetkiä Nellin parissa!

KORKEAKOULUJEN KOPIOINTILUPA. Yliopistot ja ammattikorkeakoulut

Kansallisten viitetietokantojen hyödyntäminen JUREssa

E-kirjat sähköiset kirjat

Millaista tietoa tiedottaja tarvitsee? Ja mistä tieto löytyy?

KORKEA- KOULUJEN KOPIOINTILUPA

Rahoittajat ja tiedon julkisuus. Pirjo Hiidenmaa Suomen Akatemia

Ohje: Miten haen artikkeleita Aleksista

Kansallinen digitaalinen kirjasto -tilannekatsaus

Hintzellit Suomen lehdistöss. ssä sata vuotta sitten. Hintzellin sukukokous Holman kurssikeskus Klaukkala

Museaalisen kuvamateriaalin digitoinnin ulkoistaminen

Julkaisuportaali ja yliopistojen julkaisutiedot

Nautitaan e-aineistoista

Kopioi cd-levyt kiintolevylle, niin fyysiset levyt joutavat eläkkeelle.

HELSINGIN YLIOPISTON KIRJASTO

Juha Henriksson. Digitointiprojektin hallinta ja ulkoistaminen Dr. Juha Henriksson Finnish Jazz & Pop Archive

Uudet sivut palvelevat sinua entistä. paremmin ja tehokkaammin. Tässä muutamia vinkkejä sivujen tarjonnasta.

Nykytilanne *

Kysy kirjastonhoitajalta. Linkkikirjasto. Tiedonhaun portti. Frank-monihaku. kirjastot.fi>

Julkaisufoorumi, julkaisurekisterit ja Arto. Arto-päivä, Jyrki Ilva

Osallistujia (PP) 146 (AC) Tervetuloa! Melinda-päivä KANSALLISKIRJASTO

Kirjastojen verkkoaineistoja opetukseen

OJS-palvelun kehittäminen. Artiva-seminaari Johanna Lilja

Kirjastoinfo TaY Pori Porin tiedekirjasto

- kaksi vuotta amkien yhteisen julkaisuarkiston koordinointia

Transkriptio:

1 / 5 1.2.2018 klo 22:33 Elektronisen julkaisemisen uusia tuulia - sanomalehtiä ja aikakausjulkaisuja taannehtivasti verkossa AGRICOLA Vaikka verkkobisneksen ja uusmedia-alan kovasti mainostetulla "sisällöntuotannolla" ei nykymuodossaan näytä olevan paljonkaan yhteistä humanismin kanssa, kaiken kaupallisen turhuuden varjossa on edelleen työn alla sellaisiakin hankkeita, jotka hyödyttävät myös aivan perinteistä humanistista tutkimusta. Useissa ajankohtaisissa koti- ja ulkomaisissa julkaisuprojekteissa ollaan tuomassa verkon kautta saataville sekä sanomalehtien että tieteellisten aikakausjulkaisujen vanhoja vuosikertoja taannehtivasti aina viime vuosisadalta lähtien. JSTOR - elektroninen lehtivarasto Tieteellisiin aikakauslehtiin erikoistunut amerikkalainen JSTOR on yksi historioitsijan kannalta kiinnostavimmista julkaisuhankkeista. Nimi JSTOR on lyhennys sanoista journal storage, mikä viittaa hankkeen taustaan: aikakausjulkaisujen säilyttäminen vaatii kirjastoilta runsaasti hyllytilaa, ja yksi JSTOR:in perustamisen taustalla olleista motiiveista oli nimenomaan pyrkimys pienentää yksittäisten kirjastojen varastointikustannuksia tarjoamalla vanhat numerot keskitetysti saataville verkon kautta. Lisäksi tavoitteena oli luoda keskeisistä julkaisuista koottu peruskokoelma, joka olisi tasaveroisesti kaikkien (amerikkalais)yliopistojen käytettävissä. Hanke pääsi vauhtiin vuonna 1995, ja nyt se on edennyt jo seuraavaan vaiheeseen, jossa nykyistä kokoelmaa laajennetaan luonnontieteiden suuntaan. Tällä hetkellä JSTOR sisältää yhteensä 117 amerikkalaisen, etupäässä humanistisen ja yhteiskuntatieteellisen aikakausjulkaisun täydelliset vuosikerrat elektronisessa muodossa. Useissa tapauksissa

2 / 5 1.2.2018 klo 22:33 lehtien varhaisimmat numerot ovat peräisin 1800-luvun puolelta. Joukkoon mahtuu useita historioitsijan kannalta keskeisiä julkaisuja, mm. American Historical Review, Journal of Modern History, Journal of Economic History ja Journal of the History of Ideas, joista on saatavilla kaikki yli viisi vuotta vanhat numerot. Lehtien uusimpia vuosikertoja palvelusta on turha etsiä, sillä kyseessä on nimenomaan varasto, johon uudet lehdet siirretään vasta myöhemmin. Tämä on luonnollisesti myös lehtien kustantajien etujen mukaista. JSTOR:in tekninen toteutus on mielenkiintoinen. Yhdistämällä samaan tietokantaan sekä kuvatiedoston että tekstintunnistusohjelmalla luodun tekstitiedoston JSTOR ratkaisee näppärästi kokotekstijulkaisuihin tähän asti liittyneet ongelmat. Nykyiset OCR-ohjelmat tekevät näet väistämättä ainakin jonkin verran virheitä, joiden korjaaminen ihmisvoimin olisi erittäin hankalaa ja kallista. JSTOR-projektissa tekstintunnistuksen tarkkuudeksi on saatu 99.95%, eli OCR-ohjelman läpi ajetussa aineistossa on keskimäärin yksi virhe 2000 merkkiä kohden. Tämä tarkkuus riittää kyllä hyvin hakuohjelmien tarpeisiin, mutta prosessin tuloksena syntynyt tekstitiedosto ei kuitenkaan sinällään kelpaa alkuperäisen paperille painetun julkaisun korvikkeeksi. Tekstitiedostosta poiketen elektroninen faksimile taas säilyttää muuttumattomana sekä alkuperäisen informaation että julkaisun ulkoasun, mutta toisaalta pelkistä kuvatiedostoista ei voi tehdä minkäänlaisia tekstihakuja. JSTOR yhdistää nämä kaksi formaattia siten, että hakuohjelmalla on käytössään OCR-ohjelman läpi ajettu tekstitiedosto, kun taas lukijalle annetaan samat sivut kuvatiedostoina. Näin voidaan kätevästi hyödyntää kummankin formaatin hyvät puolet. JSTOR:iin tallennetut artikkelit voi halutessaan myös tulostaa, eli niitä ei ole pakko lukea pelkästään näyttöruudulta. Aineistoa voi käyttää joko selailemalla lehtien vuosikertoja alkuperäisessä järjestyksessä numero kerrallaan tai sitten tekemällä aineistosta hakuja, joiden avulla on mahdollista löytää yksittäisiä artikkeleita tai jopa jonkin erisnimen tai sanan esiintymiä jossakin aineistoon sisältyvässä lehdessä jonakin tiettynä aikana. Niinpä palvelusta on jo nyt ollut hyötyä esim. kielentutkijoille. JSTOR:in sisältämästä aineistosta on voitu tutkia esim. tiettyjen sanojen ja sanontojen esiintymistä eri ikäisissä teksteissä, ja joissakin tapauksissa

3 / 5 1.2.2018 klo 22:33 aikaisimmat löytyneet esiintymät ovat olleet vuosikymmeniä aiemmin tunnettuja esiintymiä varhaisempia. Muutenkin jotain tiettyä aihetta käsittelevät artikkelit löytyvät tietokannasta vaivattomasti, siinä missä saman materiaalin etsiminen bibliografioiden tai indeksien avulla olisi aiemmin saattanut viedä päiväkausia. JSTOR:in toiminnan rahoitus perustuu sitä käyttäviltä kirjastoilta ja muilta yhteisöiltä kerättäviin vuosittaisiin maksuihin, eli se ei ole vapaata verkkoaineistoa. Suomessa se on kuitenkin Kansallisen elektronisen kirjaston FinELibin kautta käytettävissä useimmissa suomalaisissa yliopistoissa, ja kuten edellä on toivottavasti käynyt ilmi, kyseessä on historioitsijankin kannalta erittäin hyödyllinen ja suositeltava palvelu. Entä meillä Suomessa? Suomessa ei ole käytettävissä miljoonien dollarien budjetteja, mutta mikään ei kuitenkaan estä samanlaisen tekniikan soveltamista hieman pienemmissä ympyröissä. Itse asiassa Helsingin yliopiston kirjaston Mikkelin mikrokuvaus- ja konservointilaitoksen Aurora-projektissa on jo parin vuoden ajan kokeiltu kotimaisen autonomian ajan sanomalehdistön muuntamista elektroniseen muotoon. Tämä projekti on osa laajempaa pohjoismaista hanketta, jossa pyritään saattamaan verkon kautta saataville kaikki pohjoismainen ennen vuotta 1850 julkaistu sanomalehtiaineisto. Suomessa digitoinnin on tämänhetkisten suunnitelmien mukaan tarkoitus edetä aina vuoteen 1860 saakka. Tulevaisuudessa projektia on luonnollisesti mahdollista jatkaa pitemmällekin, joskin intoa vähentää toistaiseksi se, että 1800- luvun lopun aineiston kohdalla alkaa jo tulla vastaan potentiaalisia tekijänoikeusongelmia Mikkelin projektissa alkuperäiset lehdet kuvataan ensin uudestaan mikrofilmille, josta ne sitten skannataan digitaaliseen muotoon. Aineiston ajaminen tekstintunnistusohjelman läpi vaatii runsaasti ihmistyötä, sillä ohjelma täytyy opettaa jokaisen lehden kohdalla erikseen tunnistamaan kaikki siinä käytettyjen kirjaimien eri variaatiot. Vanhojen lehtien epätasainen painojälki ja monissa lehdissä kirjasinlajina käytetty fraktuura vaikeuttavat prosessia, ja käytännössä samankin lehden kirjaimisto täytyy opettaa ohjelmalle tietyin väliajoin uudestaan sen takia, että lehden painamisessa käytetyt kirjasimet ovat vähitellen kuluneet.

4 / 5 1.2.2018 klo 22:33 JSTOR:ista poiketen tämä projekti on yhä kesken, ja sen tuloksia voitaneen odottaa yleisesti saataville aikaisintaan parin vuoden päästä. Digitoitu aineisto on tarkoitus koota tietokantaan, joka sitten asetetaan käytettäväksi Internetin kautta. Tietokannan hakuominaisuuksia pyritään parantamaan myös hyödyntämällä 1800- luvulla koottua sanomalehtien artikkelihakemistoa, joka sekin skannataan ja ajetaan tekstintunnistusohjelman läpi. Näin siis myös viime vuosisadan kirjastotätien ja -setien tekemä työ koituisi digitaalisen aikakauden tutkijoiden hyödyksi. Aurora-projektissa keskitytään vanhaan autonomian ajan materiaaliin, mutta Mikkelissä aloitellaan myös toista digitointiprojektia (Peri+), jossa kokeillaan tieteellisten aikakausjulkaisujen takautuvaa julkaisemista elektronisessa muodossa. Hanke sai Auroran tavoin täksi vuodeksi rahoitusta opetusministeriön tietoyhteiskuntamäärärahoista. Alustavien suunnitelmien mukaan koemateriaalina on tarkoitus käyttää vuodesta 1903 lähtien ilmestynyttä Historiallista aikakauskirjaa, jonka vanhoista numeroista ryhdytään siis työstämään elektronista versiota. Samalla täytyy selvittää myös tieteellisissä aikakauslehdissä julkaistun aineiston taannehtivaan digitointiin liittyviä tekijänoikeuskysymyksiä. Uudempia tieteellisiä aikakauslehtiä on julkaistu jo aiemmin Elektratietokannassa, joka on keväästä 2000 lähtien tullut FinELibin kautta aiempaa laajemmin saataville kaikissa suomalaisissa yliopistoissa. Elektra on myös siirtymässä uudelle palvelimelle, jolloin se toivottavasti toimii tähänastista juohevammin. Lehtien lisäksi Elektrassa on julkaistu myös Bibliotheca Historica -sarjassa ilmestyneet väitöskirjat, joita on muutamassa vuodessa kertynyt jo kolmisenkymmentä kappaletta. Elektran julkaisut ovat PDFmuodossa, joten palvelun hakuominaisuudet eivät ole samaa luokkaa kuin esim. JSTOR:issa, mutta artikkelit soveltuvat joka tapauksessa hyvin sekä ruudulta luettaviksi että tulostettaviksi. Jyrki Ilva FM, Helsingin yliopisto Sisällysluettelo 2/00 Agricolan Tietosanomien pääsivulle

5 / 5 1.2.2018 klo 22:33 Historian äärelle Tutkimus, opetus, seurat Arkistot, kirjastot, museot Ajankohtaista Agricolan kartta Haku Agricolasta Hakemisto Uutta! Tekijät Palaute Etusivulle