Tutkijan identifiointi esiselvitys toteuttamisvaihtoehdoista Suomessa



Samankaltaiset tiedostot
Tutkijan identifiointi - kansallisen tason toteuttamisvaihtoehdot

Tutkijan identifiointi esiselvitys toteuttamisvaihtoehdoista Suomessa

Kansainväliset tutkijatunnisteet

Tutkijan identifiointi - kansallisen tason toteuttamisvaihtoehdot

ORCID ja tutkijoiden tunnistaminen. RAKETTI-tulosseminaari, Jyrki Ilva

Tutkijan identifiointi kyselyn tuloksia. Hanna-Mari Puuska, CSC Tieteen tietotekniikan keskus Oy

Tutkijan identifiointi

Tutkijat, julkaisut ja tunnisteet Tutkijan tunnistamisesta kansainvälisellä ja kansallisella tasolla

Tutkijat, julkaisut ja tunnisteet Tutkijan tunnistamisesta kansainvälisellä ja kansallisella tasolla

Tutkimustietojen näkyvyys ja hyödynnettävyys

Juuli - julkaisutietoportaali. Asiantuntijaseminaari, Helsinki Jyrki Ilva (jyrki.ilva@helsinki.fi)

ORCID. Tampereen yliopistollisen sairaalan tutkijoiden identifioinnissa. Pirjo Heikkilä Tays Tutkimus- ja innovaatiopalvelut, tiedekeskus

Arto, Linda ja Fennica kansallisen julkaisurekisterin tietojen lähteinä. Asiantuntijakokous, Jyrki Ilva

Juuli-julkaisutietoportaali: tilannekatsaus

Nimiauktoriteetit Nimien tunnisteet. Kuvailun tiedotuspäivä Maarit Huttunen

Julkaisutiedot läpinäkyviksi: julkaisuportaali. Tampereen teknillinen yliopisto, Jyrki Ilva

Vuoden 2012 julkaisudata Juulissa

Yliopistojen julkaisujen avoimuus vuonna 2016

Kansallinen ORCiD yhdistämispalvelu

Kansallinen julkaisurekisteri ja kotimaiset viitetiedot. Linnea2-konsortion yleiskokous, Jyrki Ilva

Juuli-julkaisutietoportaali

KORKEAKOULUJEN JULKAISUTOIMINNAN TIEDONKERUUT KOTA SEMINAARI Ylitarkastaja Jukka Haapamäki

Justus-julkaisutietojen tallennuspalvelua koskeva rekisteri

JURE ja julkaisufoorumi. Julkaisuarkistotapaaminen, Jyrki Ilva

VIRTA-julkaisutietopalvelu. CSC Finnish research, education and public administration ICT knowledge centre

Julkaisuportaali ja yliopistojen julkaisutiedot

RAKETTI-VIRTA-projekti rakentaa korkeakoulujen valtakunnallista tietovarantoa ja viranomaistietovirtoja

ORCID-tunnisteen käyttöönotto Suomessa

Bibliometriikkahankkeet 2014

Juulin kehittäminen: tilannekatsaus

Julkaisut ja tutkimuksen arviointi - katsaus OKM:n vireillä oleviin hankkeisiin

ORCID-tunnisteen käyttöönotto Suomessa

Korkeakoululaitoksen tietohallinnon kehittäminen & julkisen hallinnon kokonaisarkkitehtuuri

Avoin tiede ja tutkimus TURUN YLIOPISTON JULKAISUPOLITIIKKA

Kansallisten viitetietokantojen hyödyntäminen JUREssa

Suomalaiset lehdet ja avoimen julkaisemisen rahoitus

Tutkimustietovaranto julkaisujen näkökulmasta

Open Researcher & Contributor id. Jukka Englund 2016

Varda varhaiskasvatuksen tietovaranto

JUSTUS - Theseus integraatio

Korkeakoulujen kansallinen julkaisuportaali. OKM:n bibliometriikkaseminaari, Jyrki Ilva

Tutkijan identifiointi -ohjausryhmän kokous

RAkenteellisen KEhittämisen Tukena TIetohallinto

Tutkijan identiteetti osana julkaisutoimintaa. Informaatikko Marja Kokko Tieteen julkisuus seminaari Jyväskylän yliopistossa 12.4.

Tutkimus ja kehittämistoiminnan tilastointi Tilastokeskuksessa. KOTA-AMKOTA-seminaari Marianne Kaplas Tilastokeskus

Juha Tretjakov. Oppijanumero ja käyttäjien tunnistaminen

Korkeakoulujen julkaisutiedonkeruut

OKM:n ja korkeakoulujen tietohallintoyhteistyön tilanne. Ylitarkastaja Ilmari Hyvönen

CSC:ltä ostetut palvelukokonaisuudet vuonna 2014

Haaga-Helia ammattikorkeakoulu Oy:n tietosuojaseloste koskien Justusjulkaisutietojen

Joonas Mäkinen. Käyttäjähallinnan esittely

ISNI-järjestelmä. Sähköisten sisältöjen aamupäivä Maarit Huttunen. KANSALLISKIRJASTO - Tutkimuskirjasto

YLIOPISTOJEN TIEDONKERUUT Ylitarkastaja Jukka Haapamäki

Tutkimus- ja kehittämistoiminta Suomessa 1 SUOMEN AKATEMIA 2019 TUTKIMUS- JA KEHITTÄMISTOIMINTA

Korkeakoulujen valtakunnallinen tietovaranto: Tietosuojaseloste, looginen rekisteri

Auktoriteettitietokanta

- Korkeakoulutuksen ja tutkimuksen (linkitetty) tietomalli

Korkeakoulujen tietohallinnon kehittäminen: tiedon yhteismitallisuus ja järjestelmien yhteentoimivuus. Johtaja Hannu Sirén

Kansalliskirjaston ATThankkeet

Kansallinen julkaisurekisterihanke

Tietosuojailmoitus: yhdistetty rekisteröidyn informointiasiakirja (Tietosuoja-asetuksen (2016/679) artikla 13 ja 14).

Kertomusluonnoksesta annetut lausunnot 6/2018 Kuntatalouden ohjaus 121/51/2017

VIRTA-PROJEKTI Tilanneraportti

EU:n yleinen tietosuoja-asetus (2016/679), artiklat 13 ja 14 Laatimispäivämäärä: Päivitetty:

Korkeakoululaitoksen tietohallinnon kehittäminen Ilmari Hyvönen Korkeakoulu- ja tiedepolitiikan osasto Tietohallinnon vastuualue

Tieteen tila 2014: Humanistiset tieteet

Korkeakoulujen tietohallinto mitä RAKETTI-hankkeen jälkeen

Tietohallintolain vaikutus opetuksen ja tieteennäkökulmasta

Juha Tretjakov Oppijanumero ja käyttäjien yksilöinti

Julkaisufoorumi, julkaisurekisterit ja Arto. Arto-päivä, Jyrki Ilva

Julkaisutiedonkeruun avoin saatavuus -tieto

Web of Science, Scopus ja Tutka. Matti Rajahonka

Datan avaamisen reunaehdot. Katri Korpela Projektipäällikkö 6Aika - Avoin data ja rajapinnat

YTI Tunnuskäytänteet julkisessa hallinnossa. Mikael Vakkari

AVOIN DATA AVAIN UUTEEN Seminaarin avaus Kansleri Ilkka Niiniluoto Helsingin yliopisto

JULKAISUFOORUMI TIEDEPOLITIIKAN VÄLINEENÄ. Suomen tiedekustantajien liiton seminaari Ilkka Niiniluoto TSV, JuFo-ohjausryhmän pj

Pyyntö OKM nimeämispyyntö jäseniksi tutkimushallinnon tietovirtojen ja tutkimustietovarannon johto- ja ohjausryhmät

Fairdata PAS-palvelu

Avoinyliopisto.fi -verkkopalvelu CSC:n palvelut

OKM nimeämispyyntö jäseniksi Oppijan tietovirtojen ja Virtaopintotietopalvelun

Puhuja? Avoinyliopisto.fi -verkkopalvelu CSC:n palvelut CSC JA PALVELUT. Avointen yliopistojen neuvottelupäivät Soile Pylsy, CSC

OppiJana 2030-esiselvitys Kootuki

RAKETTI ohjausryhmä. RAkenteellisen KEhittämisen Tukena TIetohallinto

Jatkuvan oppimisen tunnistuspalvelu pähkinänkuoressa. Opetus- ja kulttuuriministeriö

Tutkimuksen tietoaineistot

ARTOn / ARTIVAn hyödyntäminen julkaisutiedonkeruussa

Julkaisuarkisto avoimen julkaisemisen infrastruktuuri

Mihin tarkoitukseen henkilötietojani kerätään ja käsitellään?

Henkilön yksilöinnin uudistus , Sami Kivivasara Henkilön yksilöinnin tulevaisuus (HETU) -seminaari ja työpajat

Kv-liikkuvuutta koskevat tiedonkeruut VIRTA-opintotietopalvelusta

Kansalliskirjaston julkaisuarkistopalvelut. Jyrki Ilva Erikoiskirjastojen neuvosto,

Esittely: Helsinki Region Infoshare Seudun tietovarannot avoimiksi. Ville Meloni ja Pekka Vuori

OKM:N JA TILASTOKESKUKSEN TIEDONKERUUT VIRTA- OPINTOTIETOPALVELUSTA 2016

Hankkeet ja yhteentoimivuus. OKM:n kirjastopäivät Minna Karvonen

HELSINGIN KAUPUNKI MUISTIO Numero 1 TALOUS- JA SUUNNITTELUKESKUS Tietotekniikkaosasto

Informointiasiakirja varhaiskasvatuksen tietovaranto Vardaan tallennettavista varhaiskasvatus asiakkaiden tiedoista

Opetus- ja koulutusyhteistyöhön liittyvä korkeakoulujen tietojärjestelmien yhteentoimivuuden kehittäminen ja arkkitehtuurityö

SOTKAMON KUNTA TIETOSUOJASELOSTE 1(5) Henkilötietolaki (523 / 1999) 10 ja 24

TIETOSUOJAILMOITUS. EU:n yleinen tietosuoja-asetus (2016/679), artiklat 13 ja 14. Laatimispäivämäärä:

PALVELUITA DATANHALLINTAAN

Transkriptio:

TutkijanidentifiointiesiselvitystoteuttamisvaihtoehdoistaSuomessa Versiohistoria versio pvm kuvaus ylläpidosta tekijä hyväksyjä 0.1 4.4.2013 Runko ja alustava hahmotelma Hanna-Mari sisällöstä Puuska 0.1b 12.4.2013 Täydennyksiä (TTA) Panu Kalliokoski 0.1c 23.4.2013 Täydennyksiä (terminologia & Mikael Linden ja Haka) 0.2 17.5.2013 Täydennetty sisältöä Hanna-Mari Puuska 0.3 1.11.2013 Täydennetty sisältöä ja lisätty toimenpide-ehdotukset Hanna-Mari Puuska 0.3b 8.11.2013 Täydennetty sisältöä Jyrki Ilva, Mikael Linden, Antti Mäki, Hanna-Mari Puuska 0.3c 8.11.2013 Vähäisiä korjauksia Hanna-Mari Puuska Sisällysluettelo 1 Johdanto... 3 1.1 Taustaa... 3 1.2 Esiselvityksen toimeksianto ja eteneminen... 3 1.3 Käsitteitä... 4 2 Nykytilanne ja tulevaisuuden tarpeet... 5 2.1 Opetus- ja kulttuuriministeriön tiedonkeruut... 5 2.1.1 OKM:n tiedonkeruiden nykytilanne... 5 2.1.2 Käyttötarpeita tutkijan identifioinnille OKM:ssä... 6 2.2 Tilastokeskus... 7 2.3 Korkeakoulut... 8 2.3.1 Tutkijan identifiointi osana korkeakoulujen järjestelmäkokonaisuutta... 8 1

2.3.2 Korkeakouluille suunnatun tutkijan identifiointi -kyselyn tulokset... 8 2.4 Muut tutkimusorganisaatiot... 10 2.5 Tutkimuksen tietoaineistojen toimijoiden identifiointi... 10 2.6 auktoriteettien hallinta kirjastoissa... 10 3 Tutkijatunnisteet... 11 3.1 Henkilötunnus... 12 3.2 Korkeakoulukohtainen henkilönumero... 12 3.3 Haka-tunnistautuminen... 12 3.4... 13 3.5 ResearcherID ja Scopus Author ID... 14 3.6 ISNI... 15 3.7 OID... 16 3.8 Tutkijatietojen ja -tunnisteiden tietovirrat eri toimijoiden ja järjestelmien välillä... 17 4 Tietosuojaan liittyvät kysymykset... 18 5 Tutkijan identifiointi muissa maissa... 19 6 Tutkijan identifioinnin toteuttaminen kansallisella tasolla... 20 6.1 Tutkijan identifiointi osana OKM:n kansallisen tason tiedonkeruuta ja ohjausta... 20 6.1.1 Julkaisu- ja henkilöstötiedonkeruun yhdistäminen... 20 6.1.2 Ei-palvelussuhteessa olevat korkeakouluihin affilioituneet tutkijat... 21 6.2 Kansainvälisten tutkijatunnisteiden koordinointi ja hyödyntäminen kansallisella tasolla... 22 6.2.1 Kansallinen suositus kansainvälisten tutkijatunnisteiden käytöstä... 23 6.2.2 Kansallinen -koordinaatio ja -tuki... 23 6.3 Tutkijan identifiointi osana korkeakoulujen tietohallinnon kokonaisuutta... 24 6.3.1 Oppija-tunnisteen käytön laajentaminen tutkijoiden identifiointiin... 24 6.3.2 Henkilötunnuksen käytön laajentamisesta ja henkilötunnuksen myöntöoikeuden saamisesta korkeakouluille... 25 7 Yhteenveto toimenpide-ehdotuksista... 26 7.1 Tutkijan identifiointi osana OKM:n kansallisen tason tiedonkeruuta ja ohjausta... 26 7.2 Kansainväliset tutkijatunnisteiden koordinointi ja hyödyntäminen kansallisella tasolla... 28 7.3 Tutkijan identifiointi osana korkeakoulujen tietohallinnon kokonaisuutta... 30 Liite 1. Korkeakouluille suunnatun tutkijan identifiointi kyselyn tulokset... 31 2

1 Johdanto 1.1 Taustaa Tieteellisten tuotosten yhdistäminen oikeisiin henkilöihin ja organisaatioihin on tärkeää sekä tutkijoille että näiden tutkimustoimintaa arvioiville tahoille. Julkaisujen ja julkaisutietojen siirtyminen verkkoon sekä sähköisten järjestelmien kehittyminen ovat luoneet uusia mahdollisuuksia tietojen yhdistelyyn. Tällä hetkellä tutkijan identifioinnin käytännöt ovat hajanaisia ja tekijöiden erottaminen toisistaan luotettavasti pelkästään henkilöiden nimien perusteella on mahdotonta. Nimet saatetaan eri yhteyksissä ilmoittaa eri muodossa, ja samannimisiä henkilöitä on paljon. Siksi luotettava tutkijoiden identifiointi edellyttää jonkinlaista tunnistejärjestelmää. Opetus- ja kulttuuriministeriössä esille on noussut tarve tutkijan identifioinnille valtakunnallisella tasolla siten, että julkaisujen tekijät voidaan yhdistää identifioituihin henkilöihin. Tämän on katsottu muun muassa parantavan tutkimustoiminnan tilastointimahdollisuuksia sekä parantavan yliopistojen ja ammattikorkeakoulujen rahoitusmalleissa käytettävien tietojen luotettavuutta. Laki julkisen hallinnon tietohallinnon ohjauksesta velvoittaa opetus- ja kulttuuriministeriön kehittämään toimialallaan kokonaisarkkitehtuuria siten, että tietojen yhteentoimivuus paranee. Yhteentoimivuuden edellytyksiä on kyky tunnistaa, mitkä tiedot liittyvät yhteen ja keskeisimpiä yhdistäviä tekijöitä julkisen hallinnon tietoarkkitehtuurissa on identifioitu, yksilöity henkilö. Tarve tutkijan identifioinnille on myös kansainvälinen. Tieteellisen tutkimuksen tulokset suunnataan useimmiten kansainväliselle tiedeyhteisölle, tulokset julkaistaan kansainvälisillä julkaisukanavilla, tutkimusryhmät ovat kansainvälisiä ja tutkijat liikkuvat maasta toiseen. Paitsi että tutkijoille on kehitetty kansainvälisiä tunnistejärjestelmiä, tarpeita kansallisen tason identifiointiin pohditaan useissa maissa. Tässä selvityksessä kartoitetaan kansainvälisellä tasolla tehtyjä ratkaisuja tutkijan identifiointiin sekä tehdään lyhyt katsaus myös muissa maissa tehtyihin suosituksiin ja käynnissä oleviin hankkeisiin. 1.2 Esiselvityksentoimeksiantojaeteneminen OKM on antanut CSC:lle tehtäväksi selvittää erilaisten ratkaisujen teknisiä toteuttamismahdollisuuksia, eri vaihtoehtojen hyötyjä ja rajoituksia sekä arvioita kustannuksista ja mahdollisesta toteuttamisaikataulusta. CSC:ssä esiselvitystä on toteuttanut työryhmä, johon ovat kuuluneet Hanna-Mari Puuska, Mikael Lindén, Antti Mäki; Kirsi Pispa, Tuija Raaska ja Panu Kalliokoski CSC:ltä sekä Jyrki Ilva Kansalliskirjastosta. Lisäksi työryhmän kokouksiin on osallistunut myös yliopistojen edustajia. Esiselvitys toteutettiin vuoden 2013 aikana. Keväällä 2013 kartoitettiin erilaisia toteuttamisratkaisuja sekä olemassa olevia tutkijatunnisteita. Sen jälkeen todettiin tarpeelliseksi kartoittaa laajemmin korkeakoulujen valmiuksia ja käytäntöjä tutkijan identifioinnissa, jotta ne voidaan huomioida, kun pohditaan kansallisen tason ratkaisujen toteuttamisedellytyksiä. Korkeakouluille suunnattu kysely toteutettiin kesä-elokuussa 2013. Hankkeen edetessä on noussut esille liityntöjä useisiin muihin käynnissä ja suunnitteilla oleviin hankkeisiin ja toimintaprosesseihin. Esiselvityksessä on pyritty huomioimaan tutkijan identifiointiin liittyviä muita prosesseja, joita ovat mm. henkilöiden yksilöinti korkeakouluissa ja tekijöiden identifiointi kirjastojär- 3

jestelmissä ja tutkimuksen tietoaineistoissa. Haasteita kansallisen tason ratkaisuille tuo lisäksi se, että tutkijan identifiointiin kohdistuu moninaisia tarpeita käyttökohteesta riippuen. OKM:n ohjaustarpeen lisäksi esiselvityksessä on pohdittu tutkijan identifiointiin liittyviä kysymyksiä kansainvälisen tiedeyhteisön, tutkijan, korkeakoulujen sekä muiden tutkijoiden tietoja hyödyntävien tahojen näkökulmasta. Esiselvityksessä tunnistettiin kolme tasoa, joilla tämän raportin lopussa tehdään kansallisen tason tutkijaidentifiointiin liittyviä toimenpide-ehdotuksia: 1) OKM:n ohjaustarpeet, 2) korkeakoulujen ja tutkijoiden tarpeet tutkijoiden ja näiden tuotosten tunnistamiseen kansainvälisesti, 3) tutkijan identifiointi osana korkeakoululaitoksen piiriin kuuluvien henkilöiden yksilöintiä. 1.3 Käsitteitä Tutkijan identifioinnilla ei tässä yhteydessä tarkoiteta sitä, että määriteltäisiin, ketkä henkilöt ovat tutkijoita. Tutkijan identifioiminen (engl. identification) tarkoittaa tutkijan erottamista vertaisistaan siihen tarkoitetun (yksilöivän) tunnisteen (unique identifier) avulla. Tunniste voidaan liittää yksikäsitteisesti yhteen tosielämän henkilöön (elävään tai edesmenneeseen). Käyttäjätunnus, henkilötunnus, tunniste ja ISNI-tunniste ovat esimerkkejä tunnisteista. Samalla henkilöllä saattaa olla käytössään useita rinnakkaisia tunnisteita. Tutkijan tunnistaminen (engl. authentication, verification of identity) eli tutkijan henkilöllisyyden todentaminen tarkoittaa, että tunnistava taho, esimerkiksi tietojärjestelmä, varmistaa henkilön olevan joku entuudestaan tunnettu henkilö. Tietojärjestelmissä tämä tapahtuu sisäänkirjautumisen yhteydessä, kun tutkija syöttää järjestelmään käyttäjätunnuksensa ja salasanansa. Tällöin tunnistava taho saavuttaa tiettyyn rajaan asti varmuuden siitä, kuka järjestelmään kirjautunut henkilö on (ts. mikä on hänen käyttäjätunnuksensa). Varmuutta voidaan kasvattaa siirtymällä vahvaan tunnistukseen. Tarkkuus on tarpeen käytettäessä termejä tunnistaminen ja identifioiminen. Tunnistaminen viittaa tietojärjestelmiin kirjautumiseen, ja siihen liittyy mm. käsitteet vahvasta tunnistamisesta. Identifioiminen taas tarkoittaa tutkijan erottamista toisista tutkijoista, mutta identifioinnin ei välttämättä tarvitse liittyä nimenomaan tietojärjestelmään sisäänkirjautumiseen. Identifioinnista on kysymys esimerkiksi silloin, kun halutaan selvittää, onko kaksi tutkimusartikkelia kirjoittanut itse asiassa yksi ja sama tosielämän henkilö. Yksilöinti tarkoittaa tässä eri rooleissa identifioidun, tunnistetun henkilön erottamista samaksi luonnolliseksi henkilöksi. Tämä tarkoittaa esimerkiksi identifioidun tutkijan ja identifioidun opiskelijan tai identifioidun opettajan tunnistamista samaksi henkilöksi, vaikka henkilöllä on käytössää useita rinnakkaisia tunnisteita. Yksilöinti ulottuu siis tutkijan roolin puitteissa tehdytä identifiointia pidemmälle, usein myös eri aikoina käytössä olleisiin identifiointeihin. Tässä tarkoituksessa käytetään henkilötunnusta tai keskitetyn identiteettien hallinnan tietojärjestelmän tuottamaa muuta viiteavainta (surrogaattia). 4

2 Nykytilannejatulevaisuudentarpeet 2.1 Opetus-jakulttuuriministeriöntiedonkeruut 2.1.1 OKM:ntiedonkeruidennykytilanne OKM kerää vuosittain korkeakouluilta tietoja niiden toiminnasta, muun muassa henkilöstöstä sekä julkaisuista. Vuodesta 2011 alkaen yliopistot ja vuodesta 2012 alkaen ammattikorkeakoulut ovat raportoineet vuosittain kaikista julkaisuistaan bibliografiset tiedot, mm. julkaisun nimi julkaisutyyppi tieteenala & koulutusala julkaisun tekijöiden nimet korkeakoulu ja sen alayksikkö lehti/sarja/kustantaja lehden numero, volyymi & sivut Julkaisutiedonkeruussa ilmoitetaan sekä julkaisun kaikki tekijät että organisaation omat tekijät erillisinä tietokenttinä. Osa yliopistoista ilmoittaa myös julkaisuun liittyvät laitokset tai yksiköt. Korkeakoulujen henkilöstötiedonkeruu perustuu henkilöstön palvelusuhdejaksoihin. Tiedot kerätään kaikilta päätoimen palvelussuhteessa olevilta ja osa-aikaisilta tuntiopettajilta, jotka ovat olleet palvelussuhteessa korkeakouluun tilastovuonna. Henkilöistä kerätään mm. seuraavia tietoja: henkilötunnus korkeakoulukohtainen henkilönumero tiedekunta ja laitos nimike, tehtävä & tutkijanuravaihe tutkinto sukupuoli kansalaisuus tieteenala & koulutusala Vuosittaisilla tiedonkeruilla saadaan kattava rekisteri korkeakouluissa toimivasta henkilöstöstä sekä näiden julkaisuista, mutta tällä hetkellä julkaisuja ei kytketä tietojen raportointivaiheessa identifioituihin henkilöihin, joten luotettavat tekijäkohtaiset analyysit eivät ole toistaiseksi mahdollisia. Esimerkiksi samannimisiä henkilöitä ei voida erottaa toisistaan luotettavasti eikä eri aikoina tuotettuja julkaisuja voida yhdistää samaan henkilöön, mikäli henkilön nimi muuttuu. Julkaisujen tekijöitä ei näin ollen voida yhdistää henkilötiedonkeruussa kerättäviin tietoihin. Myöskään laitostasoiset analyysit eivät ole luotettavia. Sekä julkaisu- että henkilöstötiedonkeruusta muodostettavat tilastotiedot julkaistaan Vipunen - opetushallinnon tilastopalvelussa (http://vipunen.csc.fi). Lisäksi julkaisujen viitetiedot ovat julkisesti saatavilla JUULI-julkaisutietoportaalissa (http://www.juuli.fi). Kansalliskirjaston toteuttama JUULI täydentää CSC:n toteuttamaa Vipunen-tilastopalvelua, joka on suunniteltu julkaisutietojen pohjalta tehtävien tilastollis- 5

ten analyysien tekemiseen. JUULIssa on verkon kautta käytettävä, haku- ja selailukäyttöön soveltuva yliopistojen julkaisujen viitetiedot sisältävä käyttöliittymä. JUULI mahdollistaa tällä hetkellä julkaisujen selailun sekä haut tekijän nimellä. Toistaiseksi kuitenkin tekijöitä ei käytännössä voida identifioida, vaan tekijähaulla voi saada esimerkiksi usean samannimisen henkilön julkaisuja tai saman henkilön nimellä voi olla useita erilaisia kirjoitusasuja. JUULIn ensisijainen tarkoitus ei ole yksittäisen tutkijan tietojen selailu, mutta käytännössä on varsin tavallista, että yksittäiset tutkijat haluavat tarkastaa, miten omien julkaisujen tiedot on raportoitu kansalliselle tasolle. Esillä on ollut myös tutkija- ja julkaisutietojen kerääminen korkeakoulujen valtakunnalliseen tietovarantoon samaan tapaan kuin sinne on sovittu siirrettävän kaikkien korkeakoulujen opiskelijatiedot eli tiedot henkilöistä ja heidän opiskeluoikeuksistaan sekä lisäksi tutkintoja, opintosuorituksia ja niiden arvosanoja koskevia tietoja. Tietovaranto on valtakunnallinen palvelu, jossa korkeakoulu säilyttää kopiota opiskelijarekisterinsä tiedoista. Tietovarannossa tieto on looginen osa korkeakoulun opiskelijatietoja sisältävää rekisteriä. Tietovarantoon tietojen siirtäminen ei siis ole tietojen luovuttamista. (ks. https://confluence.csc.fi/display/virta/raketti-virta ). Julkaisun tekijöiden identifiointi ja julkaisutietojen keräystapa eivät kuitenkaan ole riippuvaisia toisistaan, vaan kansallisen tason tutkijan identifiointi on mahdollista toteuttaa myös nykyisellä tiedonkeruumuodolla. 2.1.2 KäyttötarpeitatutkijanidentifioinnilleOKM:ssä Julkaisuista kerättäviä tietoja käytetään korkeakoulujen tutkimustoiminnan seurannassa sekä rahoitusmallin yhtenä kriteerinä. OKM:ssä on esiintynyt tarpeita laajentaa tiedepolitiikassa käytettävää tietoa Suomessa harjoitettavasta tutkimuksesta. Tällä hetkellä esimerkiksi julkaisuista kerättävien tietojen avulla saadaan kuva harjoitettavan tutkimuksen määrästä, jakautumisesta korkeakouluihin, tieteen- ja koulutusaloille sekä tutkimuksen laadusta ja näiden kehittymisestä. Jatkossa tavoitteena on arvioida esimerkiksi eri yliopistojen tutkimuspotentiaalia ja sen kehittymistä ajan myötä sekä pidemmällä aikavälillä seurata mm. tutkijaliikkuvuuden kehittymistä eri korkeakouluissa ja tieteenaloilla. Julkaisutiedoissa ilmoitettujen tekijöiden yhdistäminen korkeakoulujen henkilötietoihin mahdollistaisi julkaisutoiminnan tarkastelun mm. tekijöiden iän, sukupuolen, koulutusalan ja asteen, tutkijavaiheen sekä mahdollisesti muiden tutkimussuoritusten suhteen. Julkaisun tekijöiden identifiointi helpottaisi valtakunnallisessa tiedonkeruussa julkaisutietojen tarkistamista ja duplikaattien tunnistamista henkilön tunnettujen taustatekiöiden (esim. organisaatio, organisaation alayksikkö). Lisäksi yliopistojen tuottamia julkaisutietoja on mahdollista yhdistää kansainvälisten viitetietokantojen Thomson Reutersin Web of Science (WoS) ja Elsevierin Scopus sisältämiin julkaisuihin tunnistusalgoritmin avulla. Jos yliopistojen julkaisujen tekijät kytketään tulevaisuudessa henkilöihin, ne voidaan tarvittaessa liittää myös niihin WoS- tai Scopus-julkaisuihin, jotka esiintyvät yliopistojen keräämissä tiedoissa. Näin ollen myös julkaisujen määrää ja vaikuttavuutta voidaan selvittää myös suhteessa tutkijanuravaiheeseen, tutkijan ikään ja sukupuoleen jne. Toisaalta kansainvälisten tutkijatunnisteiden vakiintuessa jatkossa olisi mahdollista haravoida tietoja suoraan viitetietokannoista tutkijan tunnisteen avulla. Käytännössä julkaisujen tekijät tulisi liittää henkilöihin jonkin yksilöivän tunnisteen avulla. Käytettäviä tunnisteita voi olla yksi tai useampia. OKM:n henkilöstötiedonkeruussa kerätään kattavasti tiedot kor- 6

keakouluihin palvelussuhteessa olevista henkilöistä. Henkilön linkittäminen julkaisun tekijään voitaisiin toteuttaa esimerkiksi siten, että henkilöstötiedonkeruussa käytettävä henkilötunnus tai muu yksilöivä tunniste kytkettäisiin korkeakouluissa julkaisun tallennusvaiheessa julkaisun tekijään. Menettely edellyttää kuitenkin yliopistoilta lisätyötä ja muutoksia tiedonkeruuseen. Nykyisen henkilöstötiedonkeruun ulkopuolelle jäävät ne henkilöt, jotka eivät ole varsinaisessa palvelussuhteessa yliopistoon, mutta ovat siihen muuten affilioituneet, kuten esimerkiksi apurahatutkijat ja emeritusprofessorit. Osa korkeakouluista kerää tietoja myös ei-palvelussuhteessa olevista (esim. apurahatutkijat, emeritukset), jos näillä on julkaisuja, mutta tiedot eivät ole henkilöstötietojärjestelmässä. Tietoa ei myöskään yleensä kerätä niistä ei-palvelussuhteessa olevista henkilöistä, joilla ei ole julkaisuja. Ulkomaalaisilla tutkijoilla ei välttämättä ole henkilötunnusta, joten näiden henkilöiden kohdalla täytyisi käyttää muuta tunnistetta. Henkilöstötiedonkeruussa kerätään myös henkilöiden korkeakoulukohtainen henkilönumero, mutta sen avulla ei voi identifioida samaa henkilöä eri korkeakouluissa. 2.2 Tilastokeskus Tilastokeskuksen tutkimus- ja kehittämistoiminnan tilastoinnissa määritelmällisesti tutkimushenkilöstöön kuuluu henkilö, jonka työajasta vähintään 10 prosenttia kuluu t&k-toimintaan. Yliopistojen tutkimus- ja kehittämistoiminnan tilastoa varten kerätään poikkileikkaustieto (lokakuun lopun tilanne) yliopiston henkilöstöstä. Yliopistoittain kerättävät tiedot ovat henkilötunnus ja vastuualue. Henkilötunnuksen avulla henkilöön yhdistetään tieto korkeimmasta tutkinnosta ja ammattinimikkeestä. Ammattinimikkeen perusteella henkilöt jaetaan ammattiryhmiin ja sitä kautta tutkijoihin ja muuhun tutkimushenkilöstöön. Vastuualueen tieteenalatieto yhdistetään henkilöön OKM:n henkilöstötiedonkeruun tiedoista. Vastuualueen tieteenalatieto on kooste vastuualueella työskentelevien henkilöiden tieteenalajakaumasta. Jakauma perustuu kunkin tieteenalan htv-osuuksiin. Yliopistojen työajankirjausaineiston perusteella t&k-henkilöstön nimikkeet on onnistuttu poimimaan hyvin. Menetelmä on kuitenkin sellainen, että yksittäisen henkilön osalta ei voida varmuudella tietää, että tämä kuuluisi t&k-henkilöstöön. Apurahatyövuosien laskenta perustuu maksettuihin tutkimusapurahoihin, jotka kysytään yliopistoilta suoraan. Yhden tutkimustyövuoden oletetaan vastaavan vuosittaisen verottoman apurahan määrää (19 445 euroa vuonna 2012). Lisäksi Tilastokeskuksen työssäkäyntitilasto hyödyntää yliopistojen henkilöstön osalta erityisesti henkilötunnuksen ja toimipaikan linkkitietoa. Yritysrekisteri muodostaa yliopistojen toimipaikkakeruun pohjalta sen toimipaikkarakenteen, johon henkilöstö linkitetään. Varsinaisesti työsuhdetiedot saadaan käyttöön työeläkevakuutuksen perusteella (ja ne voidaan edelleen linkittää tähän pakettiin henkilötunnuksen kautta). Yritysrekisteri määrittelee toimipaikoille henkilötyövuosien määrän yliopistojen toimipaikkatiedonkeruun pohjalta. Työssäkäyntitilasto ei tällä tavalla laske henkilötyövuosien määrää, vaan tarkastelee henkilöitä vuoden lopussa. Tiettyjä tietoja katsotaan myös kertymänä vuoden ajalta (esimerkiksi työkuukaudet), mutta niitä ei raportoida henkilötyövuosien näkökulmasta. Henkilöstökeruusta saatua aineistoa hyödynnetään työssäkäyntitilastossa myös ammatin määrityksessä. Tilastokeskuksen ammattirekisterin ylläpidossa voisi olla hyötyä siitä, jos tutkijan identifioinnin kautta ammattinimikkeen ja tarkenteen työstä (esim. tutkimusalasta) voisi linkittää henkilötunnisteeseen. Tie- 7

doista voisi olla hyötyä myös muun muassa EU:n She Figures -julkaisussa, jossa kuvataan sukupuolten tasa-arvoa TKI toiminnassa. 2.3 Korkeakoulut Eri korkeakouluilla on käytössä erilaisia tutkimustietojärjestelmiä ja erilaisia käytäntöjä julkaisujen tekijöiden identifioimiseen. Korkeakoulut ovat myös eri vaiheissa tutkimustietojärjestelmän käyttöönotossa. Yliopistojen ja ammattikorkeakoulujen käytäntöjä tutkijan identifioinnissa selvitettiin niille suunnatulla kyselyllä, joka toteutettiin kesä-elokuussa 2013. Kyselyllä kartoitettiin sekä nykytilannetta että tulevaisuuden suunnitelmia. Tässä luvussa esitellään yhteenveto kyselyn tuloksista sekä käsitellään ensin tutkijan identifiointia osana korkeakoulujen järjestelmäkokonaisuutta. Kyselyn tarkempi kuvaus sekä vastaukset löytyvät liitteestä 1. 2.3.1 Tutkijanidentifiointiosanakorkeakoulujenjärjestelmäkokonaisuutta Vaikka tutkijatunnisteen loppukäyttö voi olla tutkimustietojärjestelmässä tai julkaisuarkistossa, yliopistossa toimivan henkilön rooleja ja identiteettiä hallinnoidaan esimerkiksi henkilöstöjärjestelmässä ja käyttöluparekisterissä ja korkeakouluihin kuuluvien tutkijoiden identifiointi kytkeytyy myös yleisemmin korkeakoulujen järjestelmäkokonaisuuteen ja henkilöiden yksilöintiin. Korkeakouluissa kerättävien tietojen yhteentoimivuuden näkökulmasta henkilö on keskeisin eri tietojoukkoja yhdistävä tekijä niin mahdollisissa toimintaa tukevissa palveluissa kuin tiedolla johtamisessakin (henkilön kautta esimerkiksi julkaisuja voidaan laskea suhteessa taustaorganisaation tietoihin, uratasoihin tms). Kaikkia eri rooleja, joihin identifioidaan käyttäjiä, tuleekin ajatella koko kokonaisuuden näkökulmasta, johon liittyy henkilöiden, identiteettien ja roolien hallinta. Esimerkiksi saman henkilön osalta eri rooleihin kytkeytyvät tiedot tulisi olla kytketty toisiinsa. Ensimmäinen taso yksilöinnissä on yksittäisen korkeakoulun tietojen käsittelyn kokonaisuus, seuraava taso on tiedonhallinta valtakunnallisella tasolla. Eri verkostot mahdollistavat lisäksi niiden sisällä identiteettien hallinnan tietyissä rooleissa aina kansainväliselle tasolle asti. Samankaltaisia kysymyksiä on käsitelty muun muassa opiskelun ja opetuksen tukipalveluiden ja hallinnan alueella, jossa on pohdittu muun muassa Opetushallituksen tuottaman Object Identifier OID - standardiin perustuvan kansallisen oppijanumeron ( OID ) käyttämistä valtakunnallisena yksilöintiavaimena. Oppijan palvelukokonaisuuden esiselvityksessä ja määrittelyssä on otettu huomioon valtakunnallisen Oppija-numeron (OID) käyttäminen kaikkien korkeakoululaitoksen piirissä olevien henkilöiden yksilöimiseen, mikä tarkoittaa, että OID voisi olla laajennettavissa myös korkeakouluissa toimivien tutkijoiden yksilöintiin. 2.3.2 Korkeakouluillesuunnatuntutkijanidentifiointi-kyselyntulokset Yliopistot Esiselvityksessä toteutettuun kyselyyn tutkijan identifioinnista vastasi 13 yliopistoa. Tällä hetkellä kahdeksassa yliopistossa henkilöstötietojärjestelmästä siirtyy palvelussuhteessa olevien henkilöiden tietoja tutkimustietojärjestelmään. Siirtyviä tietoja ovat muun muassa nimi, henkilökuntanumero, yksikkö ja palvelussuhdetiedot. Henkilötunnisteena käytetään mm. korkeakoulukohtaista hen- 8

kilönumeroa, henkilön käyttäjätunnusta tai järjestelmän sisäistä tunnusta. Kuudessa yliopistossa on suunnitteilla lisäksi jonkin muun tunnisteen käyttöönotto tutkimustietojärjestelmässä (ResearcherID, Scopus Author ID, ). Toistaiseksi yhdessä yliopistossa ResearcherID-tunnisteita käytetään käsin kerätyn julkaisutiedon tarkistamiseen ja täydentämiseen ja tutkijoita kannustetaan luomaan tunnisteita joko itse tai kirjaston tukemana. Tutkijan tunnisteita käytetään yliopistojen sisällä mm. tutkimustietojen tarkistamiseen, siirtämiseen ja yhdistämiseen järjestelmien välillä (kv. viitetietokannat, patenttitietokannat, kustantajat, rahoittajat, projektitietokannat), henkilön julkaisutietojen esittämiseen korkeakoulun omilla verkkosivuilla sekä raportoinnin, tutkimuksen johtamisen tai henkilökunnan tulospalkkauksen tietopohjana. Tällä hetkellä usealla yliopistoista on kuitenkin käytössä melko vanhanaikainen tutkimustietojärjestelmä tai ei varsinaista järjestelmää ollenkaan. Näin ollen julkaisujen tekijöiden identifiointi ei vielä kaikissa yliopistoissa ole mahdollista muun kuin nimen perusteella. Seitsemän yliopistoa on kuitenkin hankkimassa tai suunnittelee uuden tutkimustietojärjestelmän hankintaa. Kyselyn perusteella on odotettavissa, että vuonna 2016 kaikkien yliopistojen julkaisutiedot kerätään nykyaikaiseen tutkimustietojärjestelmään, joissa henkilöiden tietoja luetaan yliopiston henkilöstö- tai käyttäjähallinnan järjestelmästä ja julkaisun tekijät näin ollen identifioidaan. Lisäksi kaksi yliopistoa on parhaillaan uusimassa henkilöstötietojärjestelmäänsä. Useimmiten yksi julkaisun tekijöistä tallentaa julkaisun järjestelmään. Muut tekijät identifioidaan muutamissa yliopistoissa siten, että myös muiden yhteisjulkaisun tekijöiden pitää hyväksyä julkaisu. Useimmissa yliopistoissa julkaisutietoja kerätään myös henkilöiltä, jotka eivät ole palvelussuhteessa, mutta ovat muuten affilioituneita yliopistoon. Tällaisia henkilöitä ovat mm. apurahatutkijat, emeritukset, jatkoopiskelijat, vierailevat tutkijat, tuntiopettajat, dosentit (joilla ei työsuhdetta muualla) sekä muut tutkijat, joilla on sopimus laitoksen tai yksikön kanssa. Tällaisten henkilöiden osuus julkaisuja tuottavista henkilöistä vaihtelee kyselyn perusteella yliopistosta toiseen 3-22 prosentin välillä. Ei-palvelussuhteessa olevien tutkijoiden julkaisut tallentaa usein laitoksen yhteyshenkilö, mutta muutamissa yliopistoissa näille henkilöille annetaan pyynnöstä tunnukset julkaisu- tai tutkimustietojärjestelmään. Ei-palvelussuhteessa olevien henkilöiden henkilötietoja tallennetaan vain kahdessa yliopistossa henkilöstötietojärjestelmään. Viidessä yliopistossa tietoja tallennetaan tutkimustietojärjestelmään ja kolmessa käyttäjähallinnan järjestelmään. Lopuissa yliopistoissa tällaisten henkilöiden tietoja ei tallenneta minnekään. Vastausten mukaan kuudessa yliopistossa ei-palvelussuhteessa olevien henkilötietojen tallentaminen perustuu ainakin joidenkin henkilöstöryhmien osalta henkilön kanssa tehtävään sopimukseen. Kyselyssä pyydettiin lisäksi vastaajia kommentoimaan yleisesti tutkijan identifiointia kansallisella tasolla. Annettujen kommenttien perusteella yliopistot kannattavat yhteistä kansallista suositusta kansainvälisten tutkijatunnisteiden käyttöön. Yliopistojen on kuitenkin vielä vaikea nähdä yksittäiselle korkeakoululle koituvia hyötyjä kansallisen tason identifioinnista ja sen epäillään lisäävän byrokratiaa. Prosessiin liittyvinä haasteina mainitaan mm. työsuhteiden alkaminen/päättyminen, päällekkäiset affiliaatiot ja työstävapautukset. Lisäksi kommenteissa todetaan, että tietosuojan ja -turvan järjestämiseen tarvitaan menettelyt ja selkeä vastuutaho. Lisäksi toivottiin valtakunnallisena tason ratkaisua henkilötunnuksen saamisen helpottamiseksi ulkomaalaisille tutkijoille ja opiskelijoille. 9

Ammattikorkeakoulut Yhteensä 22 ammattikorkeakoulua vastasi korkeakouluille suunnattuun kyselyyn tutkijan identifioinnista. Julkaisujen tekijöiden identifiointia ei ole useimmissa ammattikorkeakouluissa vielä pohdittu, eikä niissä ole käytössä sellaisia nykyaikaisia tutkimustietojärjestelmiä kuin useimmissa yliopistoissa. Vain kolmen ammattikorkeakoulun julkaisutietojärjestelmään siirtyy tällä hetkellä tietoja henkilöstötietojärjestelmästä ja kahdessa se on suunnitteilla. Kaksi ammattikorkeakoulua suunnittelee uuden tutkimustietojärjestelmän hankintaa. Ammattikorkeakouluissa ei juuri ole sellaisia henkilöitä, jotka julkaisisivat korkeakoulun nimissä, mutta eivät ole siihen palvelussuhteessa. Tämä koskee etupäässä henkilöitä, jotka ovat aikaisemmin olleet työsuhteessa, mutta eivät ole enää julkaisun ilmestyessä. Yleisissä kommenteissa todettiin muun muassa, että ammattikorkeakoulujen yhteisen julkaisutietojärjestelmän kehittäminen olisi tarpeellista. Lisäksi ammattikorkeakoulujen vastauksissa toivotaan TKItoiminnan erityispiirteiden huomioimista tiedonkeruissa. 2.4 Muuttutkimusorganisaatiot Merkittävä osa suomalaisista tutkijoista työskentelee valtion tutkimuslaitoksissa sekä yliopistosairaaloissa. Nämä organisaatiot tuottavat myös merkittävän osan suomalaisista tieteellisistä julkaisuista. Tutkijan identifioinnin käytäntöjä kyseisissä organisaatioissa ei kuitenkaan selvitetty tässä esiselvityksessä, vaan todettiin, että niiden osalta tutkijan identifiointia tulee selvittää samassa yhteydessä, kun selvitetään mahdollisuuksia OKM:n tiedonkeruiden laajentamisesta tutkimuslaitoksiin ja yliopistosairaaloihin. 2.5 Tutkimuksentietoaineistojentoimijoidenidentifiointi Tutkimuksen tietoaineistot -hanke (TTA) on opetus- ja kulttuuriministeriön hanke, jonka tarkoitus on parantaa tutkimusaineistojen uudelleenkäyttöä ja yhteentoimivuutta. TTA-hankkeen minimimetatietomalli määrittää ne metatiedot, joita hankkeessa kerätään kaikille tutkimusaineistoille tieteenalasta riippumatta. Minimimetatietomallissa suositetaan, että kaikki tutkimusaineistoon liittyvät toimijat määritetään tunnisteella; nimeä saa käyttää vain, jos tunnistetta ei ole käytettävissä. Erilaisia toimijoita ovat tutkimusaineiston tekijän lisäksi aineiston omistaja, rahoittaja, jakelija, tuottajaprojekti sekä näiden kaikkien taustaorganisaatiot. Tyypillinen henkilötoimija on tutkija, joka on ollut jollain tavoin mukana aineiston syntyprosessissa. Kun tällainen tutkija voidaan tunnistaa yksiselitteisesti, voidaan etsiä saman tutkijan tuottamia aineistoja ja julkaisuja, tilastoida esim. rahoituksen tuottavuutta tai tutkimusaineistojen uudelleenkäyttöastetta taustatietojen mukaan, sekä selventää, kenellä on oikeus korjata virheellisiä aineistojen tietoja sekä oikeus päättää aineiston uudelleenkäytöstä (esimerkiksi aineiston lisenssiehdoista ja käyttöluvista). 2.6 auktoriteettienhallintakirjastoissa Tieteellisten kirjastojen näkökulmasta henkilöiden tunnistamiseen liittyy lähinnä kahdenlaisia intressejä: toisaalta henkilöitä koskevia tietoja tarvitaan asiakasrekisterien ylläpidon ja käyttöoikeuksien hallinnan tarpeisiin, toisaalta julkaisuihin ja muiden kirjastojen kokoelmiin sisältyviin aineistoihin liittyvien toimijoiden identifiointiin. Vaikka tutkijoilla saattaa olla esim. opiskelijoista poikkeavia käyttöoikeuksia myös 10

kirjastojen asiakkaina, tutkijoiden tunnistaminen on kirjastojen näkökulmasta relevanttia pääasiassa tekijätietoihin liittyen. Kirjastojen tietojärjestelmissä on jo pitkään ollut välineitä ns. auktoriteettitietojen ja -tietueiden hallintaan. Näiden avulla järjestelmissä pyritään yhdistämään toisiinsa sekä saman tekijän eri nimimuodot että erottamaan samannimiset tekijät toisistaan. Esim. Suomen kansallisbibliografiassa Fennicatietokannassa samannimisten tekijöiden erottamiseen on käytännössä käytetty ensisijaisesti näiden syntymävuotta, sikäli kuin tämä on tiedossa. Käytännössä kirjastoissa tehty auktoriteettityö on keskittynyt tekijöiden osalta etenkin monografioihin (ml. kaunokirjallisuus) ja musiikkiaineistoihin liittyvien toimijoiden tunnistamiseen. Tekijöiden lisäksi nimiauktoriteetteja on käytetty myös mm. teosten kohdehenkilöiden ja teoksiin liittyvien yhteisöjen identifiointiin. Tekijöiden lisäksi auktoriteettitietueita on mahdollista käyttää myös esim. saman teoksen eri versioiden (mm. eri painokset ja erikieliset käännökset) yhdistämiseen. Tätä toimintamallia on kehitelty eteenpäin myös periaatteellisella tasolla (ns. funktionaalinen luettelointi ja FRBR-malli). Kirjastot ovat lähitulevaisuudessa siirtymässä RDF-pohjaiseen RDA-kuvailuformaattiin, joka tukee avoimen linkitetyn datan periaatteita: kukin tieto sijaitsee vain yhdessä paikassa. Kansalliskirjasto on rakentanut kirjastotietokantojen käyttämien auktoriteettitietojen hallinnointia varten Asteri-nimisen tietokannan, ja lähes kaikki korkeakoulukirjastot ovat ryhtyneet luetteloimaan aineistojaan ensisijaisesti kansalliseen Melindametatietovarantoon, jonka sisältö pyritään avaamaan avoimena datana laajempaan käyttöön. Käytännössä avoimen linkitetyn datan täysimittainen hyödyntäminen edellyttää kirjastotietokantojen teknisten ratkaisujen uudistamista, mitä suunnitellaan parhaillaan käynnissä olevassa UKJ-hankkeessa, todennäköisesti keskitetysti ylläpidettyjen avoimen lähdekoodin ratkaisujen pohjalta. Lisäksi Kansalliskirjasto kehittää kansallista ONKI-ontologiapalvelua, joka tarjoaa välineet erilaisten eri tarpeisiin tuotettujen ontologioiden ylläpitoon ja joka on yksi avoimeen linkitettyyn dataan perustuvan kansallisen infrastruktuurin peruspalveluista. Kirjastot ovat olleet pitkään mukana myös tekijöiden tunnistamiseen liittyvässä kansainvälisessä yhteistyössä. Asterin sisältämät auktoriteettitiedot pyritään lähitulevaisuudessa liittämään osaksi VIAF:ia (The Virtual International Identity File), ja Kansalliskirjasto valmistelee myös ISNI-tunnisteiden käyttöönottoa kansallisella tasolla. Kirjastojen ylläpitämien auktoriteettitietojen hyödyntämiseen laajemmin julkishallinnossa ja myös tekijänoikeuksien hallinnassa on kohdistunut kasvavaa kiinnostusta. 3 Tutkijatunnisteet Tässä luvussa esitellään erityyppisiä henkilötunnisteita sekä pohditaan niiden käyttömahdollisuuksia tutkijan yksilöivänä tunnisteena kansallisella tasolla. Kansallisia tunnisteita ovat muun muassa henkilötunnus, korkeakoulukohtainen henkilönumero, Haka-tunniste sekä valtakunnallinen oppijanumero (OID). Kansainvälisiä tunnisteita erityisesti tutkijoille ovat muun muassa, ResearcherID ja Scopus Author ID. Lisäksi ISNI-tunnistetta käytetään laajemmin kuin vain tutkijoille julkaisujen ja tuotosten tekijöiden tunnisteena kirjastojärjestelmissä. 11

3.1 Henkilötunnus Tällä hetkellä OKM kerää kansallisella tasolla henkilötunnuksen kaikilta korkeakouluihin palvelussuhteessa olevilta henkilöiltä. Mukaan liitetään myös ulkomaalaisille henkilöille annetut väliaikaiset henkilötunnukset. Henkilötunnus puuttuu kuitenkin useilta ulkomaalaisilta tutkijoilta, ja toisaalta väliaikaiset henkilötunnukset eivät ole uniikkeja kansallisella tasolla. Henkilötunnuksen käytön etu tutkijatunnisteena on, että sen avulla voidaan tunnistaa samaksi henkilö, joka työskentelee eri korkeakouluissa. Henkilötunnus on liitetty julkaisun tekijöihin muutamien korkeakoulujen julkaisu- tai tutkimustietojärjestelmässä, mutta kaikissa korkeakouluissa järjestelmä ei ainakaan toistaiseksi hae tietoja henkilöstötietojärjestelmästä, joten yksilöivää tunnistetta ei ole saatavilla. Tietosuojaan liittyvien erilaisten tulkintojen vuoksi, henkilötunnuksen käyttö ja sen siirtäminen järjestelmien välillä on melko rajoitettua. 3.2 Korkeakoulukohtainenhenkilönumero Korkeakoulukohtainen henkilönumero viittaa tässä henkilön korkeakoulukohtaiseen muuttumattomaan henkilönumeroon, joka raportoidaan OKM:n henkilöstötiedonkeruussa ja joka perustuu korkeakoulun omaan koodistoon. Kun henkilö kirjataan korkeakoulun henkilöstötietojärjestelmään, tälle annetaan henkilökuntanumero. Se raportoidaan OKM:n tiedonkeruussa kattavasti kaikilta korkeakouluihin palvelussuhteessa olevilta henkilöiltä. Henkilönumero annetaan myös joissakin korkeakouluissa eipalvelussuhteessa oleville. Korkeakoulukohtainen henkilönumero voi olla myös henkilöillä, joilla ei ole henkilötunnusta. Korkeakoulukohtaisen henkilönumeron avulla ei kuitenkaan voida yhdistää henkilöä samaksi, jos tämä työskentelee useassa eri korkeakoulussa. 3.3 Haka-tunnistautuminen Haka on Suomen korkeakoulujen ja tutkimuslaitosten yhteinen käyttäjätunnistusjärjestelmä, jota tieteen tietotekniikan keskus CSC operoi. Haka-luottamusverkoston jäseneksi voivat liittyä yliopistot, ammattikorkeakoulut, yliopistosairaalat, tutkimuslaitokset ja näiden toimintaa tukevat organisaatiot. Hakaverkostoon kuuluvien organisaatioiden henkilöstö ja opiskelijat voivat käyttää kotiorganisaationsa käyttäjätunnuksia kirjautuessaan Hakan piirissä oleviin www-palveluihin. Käyttäjien henkilötietoja voidaan siirtää palveluihin kirjautumisen yhteydessä. Haka kattaa yliopistojen ja ammattikorkeakoulujen tutkimus- ja opetushenkilöstön. Lisäksi Hakan kautta voidaan tunnistaa myös sellaisia henkilöitä, jotka eivät ole palvelussuhteessa organisaatioon, mutta joille organisaatio on katsonut tarpeelliseksi antaa käyttäjätunnuksen. Tällaisia henkilöitä voivat olla esimerkiksi jatko-opiskelijat, apurahatutkijat, dosentit ja emeritusprofessorit. Haka-tunniste on nimeltään edupersonprincipalname. Tunniste muodostetaan yleensä käyttäjän käyttäjätunnuksesta, ja se on esimerkiksi muotoa puuska@csc.fi. Hakasta puuttuu toiminnallisuus, jonka avulla eri organisaatioissa työskennellyt tai opiskellut henkilö voitaisiin yhdistää samaksi tosielämän henkilöksi. Lisäksi tunniste saattaa vaihtua, vaikka henkilö ei vaihda korkeakouluaan, jos esimerkiksi käyttäjätunnus vaihtuu tai useat korkeakoulut yhdistyvät. 12

Henkilötunnusta voidaan käyttää jossain rajoissa identiteettien yhdistämiseen yli organisaatiorajojen, mutta kaikilla tutkijoilla ei ole suomalaista henkilötunnusta tai se ei ole saatavilla Haka-kirjautumisen yhteydessä. Jos tutkijan identifiointi -hankkeessa kuitenkin otetaan käyttöön tutkijan yksilöivä tunniste, voitaisiin ajatella että tämä voisi olla yksi tutkijasta Haka-kirjautumisen yhteydessä saatavilla oleva henkilötieto. Tällöin tosin tulee rakentaa riittävän luotettava prosessi, jolla korkeakoulujen tietohallinnot ylläpitäisivät tutkijoille kuuluvia tunnisteita osana hänen käyttäjätunnustietojaan. 3.4 Aiemmin tutkijoiden identifiointiin tarkoitettuja tunnistejärjestelmiä on yritetty rakentaa kansallisella tasolla tai yksittäisten kustantajien voimin, mutta kattavan ja tutkijoiden kannalta houkuttelevan järjestelmän luominen edellyttää kuitenkin laajaa kansainvälistä yhteistyötä. (http://orcid.org ) pyrkii luomaan tieteellisen julkaisemisen ja tutkimushallinnon tarpeisiin kansainvälistä järjestelmää. on avoin, voittoa tavoittelematon yhteisö, jonka päämääränä on luoda ja ylläpitää rekisteriä tutkijoiden identifioimiseksi ja heidän tieteellisen tuotantonsa yhdistämiseksi heihin. on tieteenalariippumaton, ylikansallinen järjestelmä, joka on rekisteröity Delawaren osavaltioon, USAan. Alun perin on syntynyt suurten tieteellisten kustantajien aloitteesta, mutta mukana myös järjestelmätoimittajia sekä tutkimushallinnon organisaatioita. Jäsenorganisaatioita oli mukana jo ennen in julkistamista yli 300. -tunnisteet toimivat yhteen useimpien muiden tutkijatunnisteiden kanssa (esim. ResearcherID, Scopus Author ID ja ISNI). -palvelu otettiin käyttöön lokakuussa 2012. toimii yhteistyössä tutkimusyhteisön kanssa ja pyrkii integroitumaan työnkulkuihin, kuten tutkimusprofiilin ylläpitoon, käsikirjoitusten lähettämiseen sekä tutkimusrahoituksen ja patenttien hakemiseen. Alkuvaiheessa tutkijat voivat oma-aloitteisesti perustaa ja ylläpitää tietojaan ja tunnisteitaan -palvelussa. -tunnuksen luominen on tutkijalle ilmaista, ja kustannukset katetaan jäsenorganisaatioilta saatavilla tuloilla (mm. kustantajat ja tutkimusorganisaatiot). illa on useita erilaisia prosesseja tunnisteiden luomiseen ja tietojen täydentämiseen. Kuka tahansa voi rekisteröityä :in verkkopalveluun, hankkia itselleen tunnuksen ja muokata ja hallinnoida omia tietojaan. Tällä hetkellä tutkija voi lisätä tietoihinsa vapaamuotoisen kuvauksen lisäksi omia julkaisujaan, joita voi joko syöttää käsin tai ladata muista lähteistä (esim. Scopus, CrossRef). Jatkossa mahdollista on lisätä tietoja muun muassa affiliaatioista, patenteista ja apurahoista. Tutkijan -tunniste on muotoa http://orcid.org/0000-0001-5532-9274. Tunniste ja tutkijan nimi ovat julkisia, mutta muiden tietojen julkisuutta tutkija voi rajoittaa. Tutkijan tiedot ovat löydettävissä keskitetystä tietokannasta ja niitä voidaan käyttää tutkijan määrittelemien oikeuksien mukaisesti sekä kustantajien, tutkimusorganisaatioiden että tutkimusrahoittajien tarpeisiin. issa on mahdollista ylläpitää tutkijan julkaisutiedot koko uralta yhdessä keskitetyssä rekisterissä, vaikka henkilö vaihtaisi organisaatiota. Paitsi tutkijat itse, myös sellaiset tutkijoiden kotiorganisaatiot, jotka maksavat ille jäsenmaksua, voivat perustaa ja ylläpitää tutkijoidensa tunnisteita ja tietoja. Muutamat tutkimusorganisaatiot ovatkin jo ottaneet tällaisen toimintatavan käyttönsä (mm. Chalmers tekniska högskola Ruotsissa). Tunniste luodaan siten, että organisaatio toimittaa teknisen rajapinnan kautta :ille henkilökuntansa tietoja ja järjestelmä etsii jo olemassa olevista tunnisteista mahdollisia duplikaatteja, jotka se toimittaa takaisin 13

organisaation selvitettäviksi. Duplikaattien hallinta perustuu esimerkiksi tutkijoiden sähköpostiosoitteisiin. Jos organisaatio luo tutkijalle tunnisteen, tutkija voi joko itse hallita tai antaa kotiorganisaationsa hallinnoida tietojaan. Jos voidaan tallentaa paikalliseen henkilöstöjärjestelmään, kansainvälisistä viitetietokannoista organisaation omaan julkaisutietojärjestelmään haravoitu julkaisutieto on mahdollista yhdistää automaattisesti oikeaan henkilöön. tarjoaa myös kansallista jäsenyyttä ( National Agreement ), jossa yksi organisaatio on ns. pääjäsen, ja organisoi muiden organisaatioiden osallistumisen sekä teknisen tuen. Muutamissa maissa suunnitellaan in käyttöönottoa kansallisena tutkijatunnisteena (mm. Ruotsi, Tanska, Iso-Britannia ja Hollanti), mutta sitä ei ole vielä käytännössä implementoitu yhdessäkään maassa (ks. luku 4). tukee myös kustantajalähtöistä toimintatapaa tunnisteiden luomisessa. Tutkijat pyritään saamaan kirjautumaan iin jo siinä vaiheessa, kun he toimittavat kustantajalle julkaistavaksi tarkoitetun käsikirjoituksen, minkä jälkeen kulkee julkaisun mukana. Kustantajien käsikirjoitusten käsittelyyn käyttämät tietojärjestelmät pyritään yhdistämään teknisen rajapinnan kautta in järjestelmään, ja käsikirjoituksen tallennuksen yhteydessä tutkija luo itselleen oman -tunnuksen, jos tällaista ei ole ennestään olemassa. Useat kansainväliset tieteelliset kustantajat ovat jo ottaneet tai ovat ottamassa -tunnisteet käyttöön käsikirjoituksen lähettämisvaiheessa. Joillakin tieteellisillä kustantajilla on jo palveluita, joilla voi hakea henkilön julkaisuja näiden tietokannoista -tunnisteella. Tällä hetkellä suomalaisia organisaatioita ei ole liittynyt iin, mutta kyselyn mukaan sellaista on suunniteltu muutamissa yliopistoissa. Tutkijan henkilötietoja siirrettäessä ja -tunnisteita luotaessa on kuitenkin otettava huomioon Suomen henkilötietolain määräykset. Luovuttaessaan tietoja ille, suomalainen korkeakoulu luovuttaisi tutkijan henkilötietoja EU/ETA:n ulkopuoliselle rekisterinpitäjälle. Lain näkökulmasta on henkilörekisteri, jonka rekisterinpitäjä on yhdysvaltalainen -niminen voittoa tavoittelematon yhteisö. Koska on otettu käyttöön vasta vuosi sitten, sen kehitys on vasta alkuvaiheessa. Näin ollen käytännöt eivät ole vielä vakiintuneita, ja kokemuksia on melko vähän. Useat toiminnallisuudet ovat vasta suunnitteluvaiheessa. Ks. lisää: Jyrki Ilva: Tutkijoita tunnistamassa: http://blogs.helsinki.fi/digikirjasto/2012/07/19/tutkijoitatunnistamassa-orcid/ Jyrki Ilva: ja tutkijoiden tunnistaminen, esitys RAKETTI-tulosseminaarissa, 30.8.2013 http://www.doria.fi/bitstream/handle/10024/92356/orcid-ja-tutkijat-2013-08-30.pdf?sequence=2 3.5 ResearcherIDjaScopusAuthorID Thomson Reutersin Web of Science ja Elsevierin Scopus ovat tunnettuja ja laajalti käytettyjä tietokantoja, jotka sisältävät tietoja kansainvälisissä tieteellisissä lehdissä julkaistuista artikkeleista ja näiden saamista viittauksista. Tietoja käytetään ensisijaisesti tiedonhakuun, mutta lisäksi yhä enenevässä määrin ainiestoina bibliometrisille analyyseille, joita hyödynnetään muun muassa tutkimuksen arvioinnin tukena 14

sekä kansainvälisesti että kansallisella tasolla. Kummassakin tietokannassa on oma järjestelmänsä julkaisujen tekijöiden identifiointiin. Toimintatavat ovat kuitenkin erilaiset näiden kahden järjestelmän välillä. Thomson Reuters ylläpitää ResearcherID-systeemiä (http://www.researcherid.com ), jonka avulla tutkijat voivat itse identifioida itselleen Thomson Reutersin Web of Science -tietokannoissa esiintyviä julkaisuja. Tutkijan ResearcherID-tunniste on esimerkiksi muotoa G-2078-2012. Elsevierin Scopus-viitetietokannassa puolestaan pyritään identifioimaan algoritmin avulla julkaisujen tekijöitä ja antamaan näille Scopus Author ID -tunnisteita. Tutkija voi kuitenkin myös itse luoda itselleen Scopus Author ID -tunnisteen. Tutkijan Scopus Author ID -tunniste on esimerkiksi muotoa 26641357600. Tunnisteiden käyttöä rajoittaa se, että niihin voi kytkeä vain kyseisten tietokantojen sisältämiä julkaisuja, kun taas -tunnisteeseen tutkija voi itse liittää minkä tahansa julkaisujen tietoja. Sekä Thomson Reuters että Elsevier kuuluvat kuitenkin myös -järjestelmän kehittäjäorganisaatioihin ja tutkija voi kytkeä omaan -tunnisteeseensa sekä ResearcherID- että Scopus Author ID -tunnisteensa. 3.6 ISNI ISNI (International Standard Name Identifier) on ISOn (the International Organization for Standardization) kehittämä henkilöiden ja yhteisöjen nimien eli julkisten identiteettien kansainvälinen standarditunniste (public identities of parties). Julkinen identiteetti" on identiteetti, jota luonnollinen henkilö tai organisaatio käyttää julkaisutoiminnassa. Käytännössä järjestelmä rajataan henkilöihin ja yhteisöihin, jotka ovat tavalla tai toisella tekemisissä henkisen luomistyön kanssa. Kansainvälinen ISNI-tietokanta (http://isni.oclc.nl/) avattiin käyttäjille ja tunnusten jakelu alkoi tammikuussa 2012. Taustavoimia ovat olleet etenkin tekijänoikeusjärjestöt ja kirjastot. Kansainvälinen ISNIkeskus ISNI International Agency antaa tunnisteita ja paikalliset ISNI-keskukset anovat ja tarkistavat tietoja. Paikallinen ISNI-keskus Suomessa on Kansalliskirjasto. Tekijätietojen ja julkaisujen yhdistäminen tehdään pääsääntöisesti keskitetysti erilaisten tietovarantojen sisältämien tietojen pohjalta. Tekijöitä ei informoida, eivätkä he useinkaan tiedä, että heille on annettu ISNI-tunniste. ISNI-tunniste soveltuu etenkin kirjastojen bibliografisiin käyttötarkoituksiin, ja sitä voidaan hyödyntää esim. auktoriteettitietojen tallennuksessa ja jakelussa, yhteisluetteloiden ylläpidossa sekä linkitetyn datan luonnissa. ISNIä ei ole suunniteltu erityisesti tutkijoiden identifiointiin, vaan se on laaja-alainen ja yleinen tunnistejärjestelmä. ISNIn ja in lähtökohdat ja toimintaperiaatteet ovat varsin erilaisia, mutta ne tekevät yhteistyötä ja järjestelmien taustajoukoissa on osin samoja toimijoita. julkaisee keväällä 2014 toiminnon, jonka avulla tutkija voi yhdistää oman - ja ISNI-tunnisteensa. ISNI-tunnukset ovat rakenteeltaan samanlaisia kuin -tunnisteet, ja kansainvälinen ISNI-keskus on varannut osan ISNItunnisteavaruudesta -tunnuksille. Järjestelmien toisiaan täydentävästä luonteesta kertoo sekin, että on ilmoittanut käyttävänsä ISNI:ä tekijöiden affiliaatioissa esiintyvien organisaatioiden identifiointiin. Ks. lisää: Juha Hakala: ISNI (International Standard Name Identifier): johdatus julkisten toimijoiden tunnistamiseen http://urn.fi/urn:nbn:fi-fe201005211890 15

3.7 OID Korkeakouluissa on toivottu valtakunnallista ratkaisua henkilötunnuksettomien identifioinnin toteuttamiseen. Opetushallitus on toteuttanut kansallisen oppijanumero -palvelun osana SADE-ohjelman Oppijan palvelukokonaisuutta. Oppijanumero perustuu kansainväliseen object identifier (OID) -standardiin ja on siksi saanut kutsunimen OID. OID:n tarkoitus on toimia yksilöintiavaimena eri tavoin tunnistautuville henkilöille siten, että valtakunnallisesti eri käyttäjätunnuksia tai tunnistuspalveluita käyttävällä henkilöllä on vain yksi identiteetti, johon eri roolit (oppija, henkilökunta ) ja tunnistustavat (VETUMA, Haka, VIRTU, Facebook, Google ) liittyvät. Henkilön valtakunnallisena tunnisteena OID on keskeisessä roolissa Korkeakoulujen tietomallissa (http://tietomalli.csc.fi) ja erityisesti opiskelun ja opetuksen tukipalveluiden ja hallinnan alueella. Sitä hyödynnetään henkilötunnuksettomien opiskelijoiden henkilötunnisteena ja henkilötunnuksellisten opiskelijoiden vaihtoehtoisena tunnisteena Korkeakoulujen valtakunnallisessa tietovarannossa Opetushallitus tarjoaa palvelua kaikkeen julkisesti rahoitettuun koulutustoimintaan Suomessa Oppijan keskitettyjen palveluiden kautta, mikä korkeakoululaitoksen piirissä tarkoittaa opiskelijaksi ottamista Opetushallituksen palveluiden kautta. Korkeakoulut käyttävät Opetushallituksen palveluita lakisääteisesti ottaessaan opiskelijoita perustutkintoon johtavaan koulutukseen. Oppijan palvelukokonaisuuden tavoitteiden mukaisesti korkeakoulut voivat käyttää Opetushallituksen palveluita ottaessaan opiskelijoita kaikkeen koulutustarjontaansa myös tutkintoon johtamattoman koulutuksen osalta. OID on jatkossa kaikilla uusilla perustutkintoon johtavan korkeakoulutuksen opiskelijoilla ja se voi olla kaikilla uusilla opiskelijoilla. Julkisen hallinnon kokonaisarkkitehtuurin koulutuksen ja tutkimuksen osa-alueen yleisenä yksilöintipalveluna OID palvelisi korkeakoulujen sisäisiä tarpeita kokonaisvaltaisesti ja mahdollistaisi eri tavoin identifioituneiden tutkijoiden yksilöimisen ja tietojen yhdistämisen silloin, kun siihen on perusteet. Oppijan palvelukokonaisuuden esiselvityksessä ja määrittelyssä on otettu huomioon OID:n käyttäminen kaikkien korkeakoululaitoksen piirissä olevien henkilöiden yksilöimiseen. 16

3.8 Tutkijatietojenja-tunnisteidentietovirrateritoimijoidenjajärjestelmienvälillä Viranomaistiedonkeruut JUULI Tilastokeskus OKM julkaisutied onkeruu HETU Kk-hlönro OID OKM henkilöstöti edonkeruu HETU Kk-hlönro OID HETU Kk-hlönro OID HETU Kk-hlönro OID Julkaisutiet ojärjestelm ä Henkilöstöti etojärjestel mä Korkeakoulut HETU Kk-hlönro OID HETU Kk-hlönro OID Käyttäjähall innan järjetelmä Värien selitykset: Siirtyy jo nyt Siirtyy toisinaan Mahdollinen, ei toistaiseksi siirry Kv. toimijat Scopus ScopusID ScopusID ResearcherID ISNI ResearcherID WoS ISNI ISNI Muut kansalliset toimijat Kirjastojärje stelmät ISNI Muut? Tutkimusa ineistokat alogit? tieto palvelu Väestörek isterikesk us Lehti-ja kirjakustant ajat Lehti-ja kirjakustant ajat Kuva 1. Tutkijatietojen ja -tunnisteiden tietovirrat eri toimijoiden ja järjestelmien välillä. 17

4 Tietosuojaanliittyvätkysymykset Tutkijoiden nimet, tunnisteet ja muut tiedot ovat hänen henkilötietojaan, joiden käsittelyä Suomessa säätelee henkilötietolaki. OKM:n tiedonsaantioikeus esimerkiksi korkeakoulujen henkilöstöstä perustuu erityislainsäädäntönä Ammattikorkeakoululain 40 :ään ja Yliopistolain 51 :ään sekä yleislakina Lakiin julkisen hallinnon tietohallinnon ohjauksesta. Henkilötietolaki on yleislakina toissarvoinen erityislainsäädäntöön nähden ja tietosuojavaltuutetun toimiston ohjeen mukaan erityislainsäädännöstä vastaava ministeriö antaa ohjeet tulkintatavasta eli esimerkiksi henkilötietojen käsittelystä. Sen sijaan tietohallintolain nojalla esimerkiksi korkeakoulujen henkilöitä (korkeakoululaitoksessa olevia rooleja) koskevan tietovarannon kehittäminen vaatii erikseen selvittämistä eikä voi perustua pelkästään ministeriön tiedonsaantioikeuteen. Kun tutkijan henkilötietoja käsitellään (esimerkiksi kerätään, yhdistellään tai luovutetaan toiselle rekisterinpitäjälle EU/ETA-alueelle tai sen ulkopuolelle), pitää selvittää mm. henkilötietolaista tulevia vaatimuksia, esim. Kuka on rekisterinpitäjä? Mikä on henkilötietojen käsittelytarkoitus? Mikä on henkilötietojen käsittelyn peruste (henkilötietolaki 8 )? Miten rekisteröityä informoidaan henkilötietojen käsittelystä? Miten toteutuu rekisteröidyn tarkistusoikeus ja kuinka hän voi oikaista virheellisen henkilötiedon (jos esim. hänen julkaisujaan on yhdistetty väärään henkilöön)? Minkälaisia järjestelyjä edellyttää tietosuojan riittävän tason takaaminen, kun henkilötietoja luovutetaan EU/ETA-maiden ulkopuolella olevalle rekisterinpitäjälle (esim. )? 18

5 Tutkijanidentifiointimuissamaissa Ruotsissa on selvitetty tutkijan identifioinnin hyödyntämistä erilaisissa julkaisutietokannoissa sekä sen mahdollisuuksia ja haasteita kansallisella tasolla. Tammikuussa 2013 valmistuneessa Författaridentifikatorer och publiceringsdatabaser scenarier och utvecklingsmöjligheter -projektin loppuraportissa annetaan suosituksia identifiointijärjestelmän valintaan sekä siitä, kuinka se sopii yhteen Ruotsin julkaisujärjestelmien kanssa. Raportissa suositellaan, että tutkijan identifiointi SwePubissa ja julkaisurekistereissa perustuisi iin. Iso-Britanniassa tehtiin vastaava selvitys vuonna 2012, ja todettiin, että mahdollisuudet ja kustannukset koko tutkimussektorin kytkemisestä iin pitäisi selvittää. Norjassa tutkijan identifiointi on kytketty kansalliseen keskitettyyn tutkimustietojärjestelmään Cristiniin, jonne kaikki tutkimusorganisaatiot syöttävät julkaisunsa ja tutkijoidensa tiedot. Tunnisteena käytetään henkilötunnuksia, jonka saavat myös ulkomaalaiset tutkijavierailijat. Mahdollisuus käyttää henkilötunnusta Cristinissä on Norjassa säädetty yliopisto- ja korkeakoululakiin. Norjassa ei toistaiseksi ole suunnitelmia esimerkiksi - tai muiden tunnisteiden kytkemisestä Cristiniin. Hollannissa on vuodesta 2005 alkaen ollut käytössä kansallinen tutkijatunniste DAI (Digital Author Identifier), jota käytetään tutkijoiden identifiointiin korkeakoulujen tutkimustietojärjestelmissä. Tutkijoiden tiedot haravoidaan paikallisista järjestelmistä myös kansalliseen julkaisujen hakupalveluun NARCISiin. DAI kattaa arviolta 80 prosenttia hollantilaisista tutkijoista. Tutkijat eivät kuitenkaan itse perusta tai ylläpidä DAI-tunnisteitaan. Hollannissa selvitetään mahdollisuuksia kytkeä DAI-tunnisteita sekä Iin että ISNIin. Tanskassa on käytössä tutkijatietokanta, johon yliopistot voivat raportoida tietoja. Tietojen laatu on kuitenkin heikko, eikä se sisällä yksilöiviä tunnisteita tutkijoille, joten tietokantaa ei käytetä laajalti. Tanskassa on parhaillaan käynnissä selvitys siitä, kuinka korkeakouluissa ja kansallisen tason julkaisutiedonkeruussa voitaisiin hyödyntää -tunnisteita henkilön yksilöivänä tunnisteena. Lähteet: KB, Ruotsi http://www.kb.se/dokument/om/projekt/open_access/2013/forfattaridentifikatorer_slutrapport_2013-02-11.pdf 19

6 Tutkijanidentifioinnintoteuttaminenkansallisellatasolla Tässä luvussa esitetään kansallisen tason tutkijaidentifiointiin liittyviä toteuttamis- ja toimenpideehdotuksia sekä pohditaan niihin liittyviä etuja, rajoituksia ja avoimia kysymyksiä. Toimenpideehdotukset liittyvät esiselvityksessä tunnistettuihin kolmeen näkökulmaan: 1) Tutkijan identifiointi osana OKM:n kansallisen tason tiedonkeruuta ja ohjausta 2) Kansainvälisten tutkijatunnisteiden koordinointi ja hyödyntäminen kansallisella tasolla 3) Tutkijan identifiointi osana korkeakoulujen tietohallinnon kokonaisuutta. 6.1 Tutkijan identifiointi osana OKM:n kansallisen tason tiedonkeruuta ja ohjausta Käytännössä tiedot suomalaisissa tutkimusorganisaatioissa toimivista tutkijoista saadaan kerättyä parhaiten tutkimusorganisaatioiden omasta henkilöstöstään keräämien tietojen pohjalta. Jos tietojenkeruu perustuisi tutkijoiden omaan raportointiin, siitä ei saataisi kattavaa. Tällä hetkellä OKM:llä on käytössään henkilöstötiedonkeruun kautta kattava tutkijarekisteri korkeakoulujen henkilöstöstä, jonka tiedot esillä olleiden suunnitelmien toteutuessa mahdollisesti tulevaisuudessa viedään korkeakoulujen valtakunnalliseen viranomaistietovarantoon (VIRTA). Erillisen tutkijarekisterin perustaminen ei näin ollen ole mielekästä. Tuleekin korostaa, että tämän esiselvityksen lähtökohtana ei ole, että saataisiin kerättyä tietoa siitä, ketkä kaikki Suomessa tekevät tutkimusta. Sen määritteleminen ja tiedon kerääminen olisi käytännössä mahdotonta. Sen sijaan tarkoituksena on pohtia keinoja, joilla korkeakoululaitoksessa toimiva ja julkaisuja tuottava henkilö voidaan identifioida ja näin erottaa toisista henkilöistä jonkin yksilöivän tunnisteen avulla. OKM:ssä on ollut esillä tiedonkeruun laajentaminen korkeakoulujen lisäksi myös muihin tutkimusorganisaatioihin, kuten valtion tutkimuslaitoksiin ja yliopistollisiin sairaaloihin. Niihin ei oteta kantaa tässä esiselvityksessä, vaan mahdollista henkilöstötiedonkeruuta tulee selvittää samassa yhteydessä, kun selvitetään mahdollisuuksia OKM:n julkaisutiedonkeruiden laajentamisesta tutkimuslaitoksiin ja yliopistosairaaloihin. 6.1.1 Julkaisu-jahenkilöstötiedonkeruunyhdistäminen OKM:n ensisijaiset tarpeet tutkijan identifioinnissa liittyvät julkaisujen tekijöiden identifioimiseen. Käytännössä tämän toteuttaminen tarkoittaa sitä, että julkaisutiedonkeruussa tekijöille tulisi jatkossa ilmoittaa jokin yksilöivä tunniste, jolla henkilö voitaisiin yhdistää henkilöstötiedonkeruun tietoihin. Tällä hetkellä henkilöstötiedonkeruussa kerättäviä tutkijan identifioivia tunnisteita ovat henkilötunnus sekä korkeakoulukohtainen henkilönumero. Muita tunnisteiden kehittäminen on vasta alkuvaiheessa ja vasta muutamissa yliopistoissa niitä ollaan ottamassa käyttöön. Näin ollen jos julkaisujen tekijöiden tunnistaminen halutaan tehdä nopealla aikataululla, tunnisteena tulisi käyttää nyt kerättävää henkilötunnusta tai korkeakoulukohtaista henkilönumeroa. Henkilötunnuksen ongelma on, että se puuttuu osalta ulkomaalaisesta henkilöstöstä ja se saattaa muuttua. Toisaalta sen hyödyntäminen on tietosuojan vuoksi rajallista, ja sen käyttö tutkijoiden identifioimiseksi Kansalliskirjaston ylläpitämässä JUULIjulkaisutietoportaalissa olisi ongelmallista. 20