TUTKIMUSAINEISTOJEN HALLINNOINNIN TYÖRYHMÄ MUISTIO [KOKOUSNUMERO 01/2011] Aika: 03.11.2011 klo 12.15-14.00 Paikka: Ag C133 Läsnä: vararehtori Matti Manninen (puheenjohtaja) (12:38-) kehittämispalveluiden päällikkö Antti Auer (tietohallintokeskus) (varapuheenjohtaja) professori Mikko Aro (kasvatustieteellinen tiedekunta) laatupäällikkö Pirjo Halonen lakimies Visa Hiltunen professori Tarja Kettunen (liikunta- ja terveystieteiden tiedekunta) tutkija Marja-Liisa Kinnunen (yhteiskuntatieteellinen tiedekunta) professori Antero Malin (koulutuksen tutkimuslaitos) professori Jari Ojala (humanistinen tiedekunta) julkaisukoordinaattori Pekka Olsbo (kirjasto) tutkimusjohtaja Tuija Tammelin (LIKES) viestintäpäällikkö Riku Valleala (KIHU) intendentti Pirjo Vuorinen (museo) järjestelmäsuunnittelija Miika Nurminen (tietohallintokeskus) (sihteeri) Asiantuntijavieraat: tutkimuspäällikkö Sirkka-Liisa Korppi-Tommola (12:35-) Poissa: tutkija Sami Määttä (Niilo Mäki Instituutti) 1 / 5
1. Kokouksen avaus Varapuheenjohtaja avasi kokouksen klo 12.15. 2. Avoin data seminaarin yhteenvetoa Olsbo kertoi Avoin data -seminaarissa 1 1.11. käsiteltyjä asioita, jotka liittyvät työryhmän tavoitteisiin. Valtioneuvosto on 3.3.2011 tehnyt periaatepäätöksen julkishallinnon tietoaineiston saatavuudesta. Laajemmin tämä liittyy tieteen julkisuusperiaatteeseen: tutkimusaineistojen, menetelmien ja tutkimuksen tuloksena syntyneiden johtopäätösten tulisi olla julkisia. Seminaarissa käytiin läpi myös caseja eri tieteenaloilta - esityksistä sai kuvan, että avoimuusongelmia ei tutkimusdatassa ole, vaan tietoa jaetaan tarpeen mukaan - tosin vaihtelevin käytännöin. Jatkossa opetus- ja kulttuuriministeriö pyrkii ottamaan tutkimusaineistojen hallintaa haltuun. Hyvä tietopaketti tietoaineistojen hyödyntämisestä on OKM:n raportti Tieto käyttöön. Tiekartta tutkimuksen sähköisten tietoaineistojen hyödyntämiseksi 2. 3. Katsaus aiempien työryhmien työhön ja työryhmän kontekstiin Auer esitteli aiempaa työtä tutkimusaineistojen hallintaan liittyen. JY:ssä on toiminut aiemmin ainakin kaksi laajaa työryhmää tutkimusaineistojen hallintaan liittyen: Rinnakkaisjulkaiseminen ja tutkimusaineistojen hallinnointi -työryhmä 3 (22.10.2009-31.3.2010) ja epävirallinen Tutkimusaineistojen hallinto -työryhmä 4 (21.2.-16.9.2011). Työryhmä jatkaa siitä, mihin aiemmat työryhmät ovat jääneet - suuri osa jäsenistä on samoja kuin alkuvuonna toimineessa epävirallisessa työryhmässä. Hyödyllisiä pohjadokumentteja ovat mm. käyttäjätarpeiden pohjalta (käynnistäjänä Niilo Mäki instituutti) laadittu Tutkimusaineistot -osaraportti 5 (sis. mm. aineistotyyppiluokittelun) ja tutkimusaineistoprosessia mallintavat prosessikuvaukset 6 ja sopimuspohja 7. Löyhemmin tutkimusaineistojen hallintaan liittyy Laatukäsikirjan sanastotyöryhmä 8 (1.2.-22.6.2010), joka on kuitenkin määritellyt esim. hanketoiminnan sanastoa. Kirjaston, museon ja kirjaamon tehtäviin kuuluu lähtökohtaisesti aineistojen pitkäaikaissäilytystä. Ojala muistutti etnologian laitoksella järjestettävästä arkistonhallinnan maisteriohjelmasta, jossa käsitellään mm. käytäntöjä arkistojen käyttöön - arkistot voivat olla itsessään myös tutkimusaineistoja. Myös muilla laitoksilla on ollut hankkeita tutkimusaineistojen hallinnan tueksi. Nurminen mainitsi YouData 9 - ja YouSource 10 -järjestelmien 1 http://www.finnoa.fi/?cat=12 2 http://www.minedu.fi/opm/julkaisut/2011/tiekartta_tutkimuksen_sahkoisten_tietoaineistojen_hyodyntamiseksi.html 3 https://www.jyu.fi/hallinto/tyoryhmat/rinnakkaisjulkaiseminen 4 https://webapps.jyu.fi/wiki/pages/viewpage.action?pageid=13272822 5 https://www.jyu.fi/hallinto/tyoryhmat/rinnakkaisjulkaiseminen/intra/tutkimusaineistojenhallinnointia-kaesittelevaeosaraportti 6 https://webapps.jyu.fi/wiki/display/adi/prosessikuvaukset 7 https://webapps.jyu.fi/wiki/pages/viewpage.action?pageid=13274457 8 https://www.jyu.fi/hallinto/tyoryhmat/sanastotyoryhma 9 http://sovellusprojektit.it.jyu.fi/judo/ 10 http://yousource.it.jyu.fi/ 2 / 5
kehityksen tietotekniikan laitoksella. Eri tutkimusryhmillä voi olla hyvinkin pitkälle kehittyneitä ja eri tieteenalojen kesken vaihtelevia käytäntöjä tutkimusaineistojen hallintaan. Olsbo mainitsi, että Helsingin yliopistossa on myös meneillään kartoitus tutkimusaineistojen hallinnointiin soveltuvista järjestelmistä. Yhteistyöstä on sovittu, ja raportti valmistuu lähiaikoina. Auer totesi, että marraskuun alussa järjestetyillä IT-päivillä ilmeni, että muissakin yliopistoissa tutkimusaineistojen hallinta on vielä hajanaista. 4. Tavoitteiden asettelu ja rajaus Taustoituksen yhteydessä keskusteltiin Mannisen johdolla työryhmän aihealueen rajauksesta ja todettiin tutkimusaineiston hallinnan koskevan sekä fyysisiä että digitaalisia aineistoja. Työryhmän tulee ottaa kantaa niin tutkimusprosessiin, aineistojen hallintaan käytettäviin järjestelmiin kuin käyttöoikeuksien edellyttämiin sopimuksiin. Ajallisesti tutkimusaineistojen hallinta tulisi ulottaa sekä aineiston säilytykseen, käyttöön ja jalostamiseen tutkimuksen aktiivivaiheessa että pitkäaikaissäilytykseen arkistointia varten. Korppi-Tommolan mukaan projektien yleiseen hallintaan liittyvät dokumentit voidaan kuitenkin rajata pois tutkimusaineistojen käsittelystä, vaikka ne tutkimusprosessiin liittyvätkin. Tavoitteita asetellessa keskusteltiin konkreettisista haasteista, joita tutkimusaineistojen hallintaan liittyy. Nämä voidaan jakaa karkeasti kolmeen osaan: Kinnunen kuvasi, kuinka uuden tutkijan liittyessä tutkimusryhmään hänen pitää olla selvillä tutkimusprosessista ja aineistojen hallinnan käytännöistä ryhmän sisällä. Samaten organisaatiossa käytetyissä roolinimikkeissä voi olla epäselvyyttä. Tarvitaan mm. sanastomäärittelyjä (esim. mitä tarkoittaa tutkimushanke, vastuullinen johtaja ym). Aineistojen käytössä tutkimuksen aikana ja toisaalta pitkäaikaissäilytyksessä on runsaasti hajontaa eri tieteenaloilla. Esim. yhteiskuntatieteissä keskeinen valtakunnallinen palvelu aineiston pitkäaikaissäilytykseen on FSD - yhteiskuntatieteellinen tietoarkisto 11 - tämä sisältää vain raakadataa, ei välttämättä sellaisenaan tutkijoiden käyttämää. Raakadatankin arkistointi on työlästä, koska ensisijainen tutkimusaineisto voi olla paperilomakkeilla, joita siirretään digitaaliseen muotoon. Toisaalta esim. fysiikassa CERN:istä tuleva aineisto voidaan pysyväissäilyttää välittömästi. Auer totesi, että tiedon keruuseen käytetään paljon aikaa ja vaivaa, tallennusvälineiden on oltava kunnossa. Yliopiston tulisi tarjota keskitetty ja kilpailukykyinen ratkaisu aineistojen hallintaan (esim. edullisesti tarjottavaa levytilaa tutkijoille). Erityishuomiota tarvitsevat metatiedot -myös analogisten aineistojen kohdalla. Esim. Kanavuoren arkiston prosessi ja 11 http://www.fsd.uta.fi/ 3 / 5
dokumentointi on vielä puutteellista. Metadatamääritysten on oltava kunnossa jo ennen pitkäaikaissäilytystä, koska tämä helpottaa myös tutkimuksen tekoa, ja olemassa olevat metatiedot voidaan käyttää syötteenä arkistoinnissa. Avoin kysymys on, kuka päättää, mitä lopulta arkistoidaan - Vuorinen totesi, että JY:ssä ei ole yhteistä ohjeistusta, miten pysyvästi tallennettavia tietoja hallinnoidaan pitkällä aikavälillä. Ojala huomautti, että arkistoihin jää tyypillisesti vain 10% saapuneesta materiaalista. Ilman selkeitä ohjeistuksia säilytyksestä riskinä on, että arvokasta tutkimusaineistoa häviää esim. tutkimusyksikön muuttaessa ja arkistointi on kiinni yksittäisten tutkijoiden aktiivisuudesta. Myös sopimukset aineistojen käytöstä ja tulosten omistajuudesta voivat aiheuttaa ongelmia - pitkään jatkuneissa projekteissa sopimuksia ei välttämättä edes löydy helposti. Esim. yritysten kanssa toimittaessa voidaan usein käyttää valmiita sopimuspohjia, mutta tietyillä materiaaleilla (esim. lähdekoodit) liian tiukasti asetettujen sopimusten riskinä voi olla, että edes tutkimusryhmän jäsenet eivät saa käyttää toistensa tuotoksia, ellei tästä nimenomaisesti sovita erikseen. 5. Jatkotoimenpiteistä sopiminen Manninen jakoi työryhmän kolmeen alaryhmään, joista kukin keskittyy tunnistettuihin ongelmakohtiin. Ryhmien tulokset esitellään seuraavassa kokouksessa. Prosessiryhmä tarkentaa aiempaa tutkimusprosessin kuvausta ja tutkimusaineistoihin liittyvää sanastoa. Ryhmän vetäjä Pirjo Halonen, muut jäsenet Antti Auer, Tarja Kettunen, Marja-Liisa Kinnunen ja Antero Malin. Arkistoryhmä selvittää, miten tutkimusprosessin aikaista tiedonkeruuta ja analyysia voidaan tukea nykyistä paremmin niin, että tutkimusprosessin aikana kertyvää metatietoa saadaan hyödynnettyä. Lisäksi ryhmä kartoittaa tutkimusaineistojen hallinnan tukena olevaa tekniikkaa, ja laatii ohjeistuksen tutkimusaineistojen arkistointiin. Ryhmän vetäjä Antti Auer, muut jäsenet Miika Nurminen, Jari Ojala ja Pirjo Vuorinen. Sopimusryhmä määrittelee, mitä sopimuksia ja sääntöjä tarvitaan aineistojen käsittelyyn, omistajuuden määrittelyyn ja aineistojen avoimeen julkaisemiseen eri aineistotyypit huomioiden. Ryhmän vetäjä Visa Hiltunen, muut jäsenet Mikko Aro, Sami Määttä, Pekka Olsbo, Tuija Tammelin ja Riku Valleala. 6. Tekniset asiat Nurminen ehdotti, että ryhmä käyttäisi sisäisessä työskentelyssä Google Docs -palvelua, mikä mahdollistaa useamman henkilön samanaikaisen editoinnin tietylle dokumentille ja nopean luonnosten jaon (ei vaadi kirjautumista). Myös www:ssä näkyviä verkkolevyjä (esim. prosessit.it.jyu.fi) on mahdollista käyttää aineistojen siirtoon jos tälle ilmenee tarvetta. Myös 4 / 5
epävirallisen tutkimusaineistoryhmän Confluence-wikitilaa voidaan käyttää, jos halutaan jakaa kirjautumista vaativia materiaaleja. Wiki sisältää myös linkkilistan. Halonen totesi, että pysyvä tila ja ensisijainen julkaisupaikka muistioille ja raporteille on kuitenkin työryhmän virallinen Plone-sivu. 7. Seuraavan kokouksen ajankohta Aika: 10.1.2012 8:15-10:00 Paikka: Ag C132 8. Kokouksen päättäminen Puheenjohtaja päätti kokouksen klo 14.30. 5 / 5