Fennica ja muut kirjastolue1elot avoimen 3eteen lähteina Kirjastoverkkopäivät, 2015 Mikko Tolonen, Helsingin yliopisto
Esityksen runko Tutkimusidea kirjastolue1eloille Kuvailu3edot, avoin 3ede ja big datan ongelmat Historia ja brigläinen lue1eloin3 1470-1800 Mitä voidaan sanoa yleisistä suomalaisista julkaisutrendeistä 1640-1917 Fennican pohjalta?
TUTKIMUSIDEA
Kirjastolue5elot: perinteinen 9etokanta, uusi käy5ö!? Ymmärretään 3edontuotantoa & kul1uurien vuorovaikutusta! Kvan3ta3ivinen lähestyminen laadullisiin kysymyksiin AVOIN TIEDE DATA (estc, fennica, kungliga) Läpinäkyvät metodit (R, Python,..)
h1ps://github.com/ropengov/estc/ Mahdollisuudet: kokonaiskuva koko varhaismodernin ajan kirjatuotannosta + historian resonoin3 3edontuotannossa
KUVAILUTIEDOT, AVOIN TIEDE JA BIG DATAN ONGELMAT
Kuvailu3etojen monikäy1öisyys Kvan3ta3ivinen kehys laadulliselle tutkimukselle Tiedontuotannon ymmärtäminen Julkaisijat ja niiden verkostot (visualisoin3) Julkaisupaikat, cultural transfer Historian, filosofian, uskonnon analysoin3 (ei genreinä per se, mu1a alakategorioina) Yksi1äiset kirjoi1ajat ja näiden vertailu
Avoimen 3eteen periaa1eet Ei ainoastaan avoin julkaisu koko tutkimusprosessi on keskeinen ja sen tulisi olla mahdollisimman avoin. Metodit, tutkimus, data ja tulokset kaikki avoimiksi. Läpinäkyvyys, toiste1avuus, informaali yhteistyö, uudet aloi1eet Pääsy raakadataan on ins3tu3onaalinen kysymys
Läpinäkyvyys (data, metodit, raportoin3) Tutkija ryhmä A Toiste1avuus Kirjasto, aineistot Tutkimusprosessi Alustat Avoin jakelu ja uusiokäy1ö Tutkija ryhmä B Yhteistyö Ajatus avoimen 3eteen ekosysteemistä humanis3sessa tutkimuksessa
Big data lähestyminen ja sen ongelmat
Vies3 Big data ja muilla uusilla Digital Humani3es lähestymistavoilla voidaan tuo1aa lisäarvoa, mu1a pääpaino oltava laadussa ja avoimuudessa ketjun kaikissa osissa: Lue1eloin3työ (kirjastolue1eloiden tapauksessa) Datan avaaminen Datan siivoaminen tutkimuksessa Tutkimusdatan avoimuus Tutkimuksen uusiokäy1ö / sen mahdollistaminen
Kuvailu3etojen nyky3lasta Kysymys mitä ei enää haluta lue5eloida - Dimensiot (esim. sivunumerot), Fennican puu5eet MIKSI? Yleinen valitus Marcin sotkuisuudesta - Meille tutkijoille ei ongelma Versionhallinnan mahdollisuudet - Github yms. versionhallinta harvoin käytössä, mahdollisuus kaksisuuntaiseen vuorovaikutukseen Kokonaisten kokoelmien kuvailun globaalit periaa5eet - Kansallisbibliografiat, miksi ei yhtenäisiä standardeja mitä näihin kuuluu ja mitä ei?
Datan laadun todellisuus (Fennica) "","publisher","n" "1","G. W. Londicer",1829 "2",NA,1463 "3","J. C. Frenckell",1316 "4","Frenckellianis",1185 "5","C. A. Londicer",484 "6","Johan Winter",375 "7","Johan Larsson Wall",276 "8","Peter Hansson",262 "9","Joh. Christoph. Frenckell",248
PILOTTITUTKIMUS: HISTORIA TILASTOLLISESTI BRITTILÄISEN ENGLISH SHORT- TITLE CATALOGUE, ESTC KATALOGIN PERUSTEELLA
Kuka kirjoig historiaa Britanniassa? Yleisimmät auktorit (otsikoiden perusteella)
Kuka kirjoig historiaa? Julkaisujen määrät aikajanalla: William Prynne, Daniel Defoe, David Hume (1558 1629) sekä David Hume (1711-1776)
Kuka kirjoig historiaa? Julkaisujen määrän ja paperin kulutuksen vertaus (yleisimmät auktorit)
Kuka kirjoig historiaa? Missä historiaa julkais9in? Miten julkai semin en muu1 ui?
Missä historiaa julkais3in? Julkaisumäärien ja paperinkulutuksen vertailua
Missä historiaa julkais3in? Paperinkulutus ja julkaisumäärät Irlannissa, Skotlannissa ja USAssa Paperinkulutus Julkaisumäärät
Kuka kirjoig historiaa? Miten julkaiseminen muu5ui? Ketkä julkaisivat historiaa?
Miten julkaiseminen muu5ui? Keskimääräinen paperinkulutus per dokumenc
Miten julkaiseminen muu5ui? Pamfle9t verra5una kirjoihin
Esimerkki 2 TIEDONTUOTANTO SUOMESSA 1640-1917 FENNICAN PERUSTEELLA
Mitä voidaan sanoa suomalaisesta 3edontuotannosta Fennican esikäsi1elyn perusteella? Ilman parempaa 3etoa, näy1äisi olevan silmiinpistävää romahdus 1809 jälkeen. Helsingin rooli 1800- luvulla sivistyksessä ehkä erilainen kuin kuva jonka saa lukemalla esim. Klingeä. Mu1a, keskeisin seli1ävä tekijä puu1eet lue1eloinnissa: Kansalliskirjastossa 3edetään e1ä ruotsinkielisen materiaalin osalta puu1eet suuria. Sil3, 1820- luvun loppupuolella tai edes 1850- luvulla luulisi julkaisutoiminnan nousevan. Mitään vii1eitä siitä ei ole. Joka tapauksessa, Fennicaan ei voi näiltä osin luo1aa ennen kuin aineistoa täydennetään = ei voi vetää näitä johtopäätöksiä.
Avoimen 3eteen kiertokulku Fennican tapauksessa Peruslue1eloin3 kuntoon Kansalliskirjasto! Kuvaus3etojen siivoaminen, rikastu1aminen, yhdistely ja analysoin3 Fennica tutkimusryhmä + muut Tutkimusdatan avaaminen Tutkimusdatan uusiokäy1ö muut tutkijat, sekä aineistonhal3jat Kansalliskirjasto!
LOPUKSI
Digitaaliset aineistot Suomessa Aineistoja on jo hyvin esim. aatehistorian tutkimuksen kannalta Fennica (1483-1917) Erityinen painopiste: digitoidut (kaikki) suomalaiset sanomalehdet 1770-1910 Calonius- Naumannin kokoelma Turun väitöskirjat ym.
Laajojen historiallisten aineistojen tutkijakäy1ö Innova3ivinen tutkimus on usein ruohonjuuritasolta nousevaa. Kehitystä ei tapahdu jos meillä on erikseen työkalujen tuo1ajat ja tutkijat. Aito yhteistyö aineistojen hal3joiden (kirjastojen) ja tutkijoiden kanssa väl1ämätöntä Avoimuus sekä raaka- e1ä tutkimusdatan kanssa on 3e eteenpäin.
YLIMÄÄRÄISIÄ DIOJA
Entä si1en kun aineistoon itseensä ei voi täysin luo1aa? Koskaan ei voi 3etää voiko aineistoon luo1aa tai sillä tehdä tulkintoja laajoista trendeistä ennen kuin aletaan sen soveltaminen (siksi julkaise ajoissa ja usein käy1äen versionhallintaa). Tämä on erilainen tapa ajatella suhteessa perinteiseen näkemykseen historiallisesta lähdekri3ikistä. #AVOINTIEDE Aineistoja tulee täydentää, tarvitaan rii1ävä massa aineistoa e1ä voidaan tehdä big data tutkimusta Pitää muistaa, e1ä aineiston ei täydy oltava täydellistä e1ä se olisi käy1ökelpoista. Tästä huolima1a aineiston putsaus ennen analyysia vie n. 70% ajasta.