Avointen aineistojen julkaisualusta. Tanja Kantola, AVAA-projekti, CSC,

Samankaltaiset tiedostot
PALVELUT KATA/AVAA/IDA. Tuija Raaska, CSC,

TTA-hankkeen esittely. Pirjo-Leena Forsström TTA-hankkeen pääsihteeri

Avointen aineistojen julkaisualusta AVAA

TTA palvelukokonaisuuden esittely Korkeakoulujen IT-päivät

Datanhallinnan oppaan esittely mitä ovat IDA, AVAA, KATA, PAS, REMS? Johanna Blomqvist, CSC - Tieteen tietotekniikan keskus

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus

Tutkimusdatan hallinnan kansalliset välineet IDA, Etsin, AVAA. Stina Westman, ATT-hanke, CSC

PALVELUITA DATANHALLINTAAN

Tutkimuksen pitkäaikaissaatavuuden palvelukokonaisuus

Kansalliskirjaston ATThankkeet

AVOIN DATA AVAIN UUTEEN Seminaarin avaus Kansleri Ilkka Niiniluoto Helsingin yliopisto

Open access julkaiseminen Helsingin yliopistossa

Aineistonhallinta pähkinänkuoressa METODIFESTARIT TAMPEREEN YLIOPISTO ARJA KUULA-LUUMI

Tervetuloa AVOIN*-hankkeen seminaariin

Avoimen datan löytäminen, käyttöönotto ja jakaminen. Havainnolliset analyysit avoimella paikkatiedolla ProGIS ry ja Poligon, 11.4.

JHS XXX Avointen tietoaineistojen käyttölupa. Anne Kauhanen-Simanainen

Tutkimusrahoittajien ja tiedejulkaisujen vaatimukset aineistonhallinnalle

DATAN AVAAJAN PIKAOPAS

Avoin julkaiseminen (Open Access) tarkoittaa tieteellisen tiedon avointa saatavuutta internetissä.

Data käyttöön! Ministeriön datapolitiikka osana työ- ja elinkeinopolitiikkaa

JHS Avoimen tietoaineiston käyttölupa

Avoin tiede ja tutkimus TURUN YLIOPISTON JULKAISUPOLITIIKKA

DATAN AVAAJAN PIKAOPAS

Avoin tiede ja tutkimus ATT Hankkeiden esittely

PALVELUITA AINEISTOJEN HALLINTAAN

Data Management Plan Hyvä datanhallinta alkaa suunnittelusta. Minna Ahokas CSC

Avoimen tieteen palvelut

YLEISESITTELY: MITÄ ON AVOIN TIEDE? Ilkka Niiniluoto Helsingin yliopisto OKM:n seminaari

ATT-areena Avoimen tieteen palvelut

Tutkimuksen tietoaineistot

Tutkimusdatan pitkäaikaissäilytys ATT-hankkeessa.

Avoimen tieteen palvelujen kehittäminen Tampereen yliopiston kirjastossa. Tampereen kirjastopäivät

OJS-palvelun kehittäminen. Artiva-seminaari Johanna Lilja

Avoin tiede ja tutkimus (ATT-hanke)

Julkaisuarkistojen yhteentoimivuus

Näin julkaiset dataa. Kuntien avoin data - miten liikkeelle Hami Kekkonen

LifeData Luonnonvaratiedon avoimuus uusien ratkaisujen lähtökohtana. Sanna Marttinen (LYNET) Riitta Teiniranta (SYKE) Eero Mikkola (Luke)

Kirjasto yliopiston tutkimusaineistopolitiikan toteuttajana. Pekka Olsbo Julkaisukoordinaattori Jyväskylän yliopiston kirjasto

Taideyliopiston tutkimusaineistopolitiikka Toteuttamissuunnitelma

Käytön avoimuus ja datanhallintasuunnitelma. Open access and data policy. Teppo Häyrynen Tiedeasiantuntija / Science Adviser

Tutkimuksen rahoittajien ja julkaisijoiden sekä tutkimusorganisaatioiden politiikkasuositukset. Yleiskatsaus nykytilanteeseen.

Tutkimusdatan hallinnan tilannekartoituksen suunnitelma

Rinnakkaistallentaminen ja Tampereen yliopiston julkaisuarkisto. Kati Mäki

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus. Anssi Kainulainen / CSC

Case: Helsinki Region Infoshare - pääkaupunkiseudun tiedot avoimiksi

TTA-hankkeen esittely

Palveluportaali Ailan käyttö

Avoimet lisenssit. Katsaus Creative Commons -lisensointiin. Työelämäpedagogiikan webinaari

Infrastruktuurin aineistonhallinta ja käytön avoimuus

CC0-lisenssi: case Finna

Avoimen tiedon ja yhteentoimivuuden palvelu. Avoindata.fi. Koulutus Paikkatiedon infrastruktuurin hyödyntäminen Kristiina Puharinen, Valtori

Julkaisujen avoimen saatavuuden tukeminen

Avoin tiede ja tutkimus TURUN YLIOPISTON DATAPOLITIIKKA

Theseus avoimen julkaisutoiminnan edistämisen välineenä ammattikorkeakouluissa

Rahoittajat ja tiedon julkisuus. Pirjo Hiidenmaa Suomen Akatemia

ASIAKASNÄKÖKULMA JULKAISUTOIMINNAN MURROKSEEN

Tiedelehtien avoimuus osana kustantajaneuvotteluja

Miksi tutkimusaineistoja halutaan avattavan? Jyrki Hakapää, Suomen Akatemia

Miksi Avointa Dataa? 11/15/13 Heikki Sundquist

Tutkimusdata ja julkaiseminen Suomen Akatemian ja EU:n H2020 projekteissa

Rinnakkaistallennuksen arkea, haasteita ja mahdollisuuksia

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

AVOIN TIEDE JA TUTKIMUKSEN NÄKYVYYS

Tutkimustietovaranto julkaisujen näkökulmasta

Tutkimusaineistopalvelut IDA & Etsin. Jessica Parland-von Essen

Julkinen data saataville: Käyttöluvan tausta ja tarkoitus

voimen tiedon ohjelma

TUTKIMUSDATAN HALLINNAN TILANNEKARTOITUKSEN RAPORTTI

Datanhallinta, laskennan resurssit ja osaaminen

Miten julkaisen työni yliopiston sähköisessä julkaisuarkistossa

Julkaisujen, aktiviteettien ja uutisten tietojen tallennus LaCRISjärjestelmään

TTA, PAS ja julkishallinnon standardisointi

ICT opetuksen ja tutkimuksen tukena

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

Oletko mukana tutkimuksen muutoksessa? Lue tästä, miten voit hyödyntää avoimen tieteen ja tutkimuksen mahdollisuudet!

TUTKIMUSDATAN KUVAILU. Kuvailun tiedotuspäivä Tieteenala-asiantuntija, FT Katja Fält

Pysyvät tunnukset ja niiden hyödyntäminen

Avoimen tieteen palvelut

JYX-julkaisuarkisto työtä ja kehitystyötä

Avoimen tieteen ja tutkimuksen edistäminen periaatetasolta käytännön toimiin

Finna Johtava avoimen kulttuurin ja tieteen hyödyntämisen väylä

Tieteen avoimuus, JY, Suomi, Ruotsi, Norja. Pekka Olsbo Julkaisukoordinaattori Jyväskylän yliopiston kirjasto

ATT-hankkeen tavoitteet vuonna Johtaja Riitta Maijala, OKM ATT työryhmäseminaari Tieteiden talo,

Avointa dataa Helsingin seudulta

Tietoarkiston palvelut. Arja Kuula-Luumi (Tietoarkisto) Tieteelliset lehdet ja tutkimusdata seminaari Tieteiden talo, Helsinki

Avoimen tieteen osaajakoulutus Työpaja: Avoin tiede ja tietohallinto

Jälkidigitaalinen tiede tieteellisen tiedon saatavuuden muutos

IDA-tallennuspalvelun esittely. CSC Tieteen tietotekniikan keskus Oy

Avoin data digitaalisen talouden, julkisten palvelujen ja päätöksenteon perustaksi

Avoimen tutkimuksen suunnittelu tietojärjestelmätieteen tutkijan näkökulmasta

Ostetaan avoimeksi? Avoimen aineiston hankinnan kriteerit. Irene Ylönen Informaatikko Avoimen tiedon keskus Jyväskylän yliopisto

Kuutoskaupunkien suositukset avoimista rajapinnoista

Avoin data digitaalisen talouden, julkisten palvelujen ja päätöksenteon perustaksi

Esittely: Helsinki Region Infoshare Seudun tietovarannot avoimiksi. Ville Meloni ja Pekka Vuori

Avoimen tiedon ohjelma Anne Kauhanen-Simanainen

Tulevaisuus on avoin. Avoimen TKI-toiminnan periaatteet Turun ammattikorkeakoulussa

Hiukkasfysiikan avointa dataa opetuskäytössä

Tulevaisuus on avoin. Avoimen TKI-toiminnan periaatteet Turun ammattikorkeakoulussa

Kokemuksia datan avaamisesta ja esimerkkejä avoimesta ympäristödatasta pääkaupunkiseudulta

FAIRDATA-PALVELUKOKONAISUUS Anssi Kainulainen. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus

Transkriptio:

Avointen aineistojen julkaisualusta Tanja Kantola, AVAA-projekti, CSC, 21.5.2013

AVAA-projekti OKM:n AVOIN-hankkeen osaprojekti CSC:llä 2/2013 3/2015 Vaatimusmäärittely-/ konseptointivaiheessa Toimeksianto: Toteutetaan avointen aineistojen julkaisualusta, joka tukee TTA:n kokonaisarkkitehtuurissa kuvattua tietoaineistojen julkaisuprosessia. Tietoa aineistojen julkaisun tukemiseen Työkaluja prosessin automatisointiin Liittymiä nyk. palvelujen välille

Tietoaineiston julkaisuprosessi (Lähde: Tutkimuksen tietoaineistot kokonaisarkkitehtuuri, v. 0.94)

Tarkennuksia Tietoaineiston julkaisu' datan julkaisu ei viittaa artikkeleihin tm. tutkimusjulkaisuihin, joista käytetään termiä julkaisu AVAA ei ota kantaa aineiston tallennuspaikkaan Tieteenalan omat (kans.väl. open access) säilytyspaikat TTA:n tallennuspalvelut (IDA, PAS) Yliopistojen tai kirjastojen (open access) repositoryt

Miten tukea tutkijoiden aineistojen avointa julkaisua?

Ohjeistus ja tiedonlevitys Joitain julkaisuprosessin vaiheita tuetaan parhaiten ohjeistuksella Ennen teknisiä ratkaisuja ja niiden hyödyntämiseksi tarvitaan valistusta ( infoportaali ). Tarjotaan helposti löydettävät, selkeät step-by-step-ohjeet ja tietopaketti parhaista käytännöistä: näin julkaiset tietoaineistosi. Hyödynnetään muualla julkishallinnossa tehtyä työtä suosituksia, ohjeita ja hyviä esimerkkejä aineistojen avaamiseksi Huomioidaan tutkijoiden aineistojen julkaisun erityistarpeet (mm. viittaukset julkaisujen ja aineiston välillä) Esimerkki: selkeät ohjeet tukevat ja motivoivat aineistojen julkaisua. (http://www.hri.fi/fi)

Julkaisuprosessin vaiheita 1. Valitse, valmistele aineisto 2. Liitä aineistoon mahd. avoin lisenssi 3. Tallenna vakiintuneeseen (open access) tallennuspaikkaan 4. Luetteloi aineistokatalogiin, anna pysyväistunniste (PID) 5. Julkaisun jälkeen: hae, käytä, yhdistele aineistoja, viittaa niihin

Valitse ja valmistele aineisto Esim 1: CERN CMS: max 50% CMS-kokeen aineistosta julkaistaan n. 3 vuoden viiveellä (embargo-jakso) Kompleksi hiukkasfysiikan aineisto dokumentoidaan hyvin Julkaistavan alkuperäisen formaatin lisäksi aineisto muunnetaan yksinkertaisempaan opetuskäyttöön soveltuvaan formaatissa Esim 2: T. Tutkija julkaisee artikkeliin liittyvän aineiston Tutkija tarkistaa aineiston laadun ja oikeellisuuden Muuntaa sen avoimeen, koneluettavaan formaattiin Tarvitaan tietoa formaateista (CSV, XML-pohjaiset..), kriteerejä aineistojen valintaan, ohjeita laatutarkistusten tekemiseen ja aineistojen kuvailuun AVAAn scope: kaikki tieteenalat. Tarkemmat ohjeet laaditaan parhaiten alakohtaisesti (esim. eri tieteenalojen XML-pohjaiset formaatit ja ohjelmistojen formaattimuunnostyökalut)

Liitä aineistoon lisenssi Lisenssi kertoo aineiston tuottajan ja käyttäjän oikeudet millä ehdoilla aineisto on laillisesti käytettävissä AVAA: tietoa lisensseistä, mahdollistetaan koneluettavan lisenssin liittäminen aineistoon helposti (seurataan mm. JHStyötä Avoimen datan lisenssimalli ), luvallisuus aineiston hakuehtona TTA suosittelee Creative Commons lisenssiperhettä ( vahva ehdokas, ei pakollinen) Panton Principles for Open Data in Science: Valitse mahd. avoin lisenssi: kaupallista tai muuta uudelleenkäyttöä ei tulisi rajoittaa Suositus erit. PDDL tai CCZero: Luovun kaikista yksinoikeuksista lain sallimissa rajoissa (suomennos meneillään) Esim. avoin CMS-data julkaistaan CC0-lisenssillä

Luetteloi aineistokatalogiin maailman löydettäväksi AVAA: liittymä TTA:n KATA-aineistokatalogiin Aineiston kuvailu metatiedoilla (viimeistään nyt) on välttämätöntä aineiston tulkinnan ja uudelleenkäytön mahdollistamiseksi Aineiston alkuperä, muuttujien sisältö, käyttöehdot, laatu jne. TTA:n minimimetatietomalli: kaikille tutkimusaineistoille yhteiset vähimmäismetatiedot riippumatta aineistotyypistä, tieteenalasta tai tuotantotavasta. Haaste: Kaikki tutkijat eivät ole tottuneet datan kuvailuun ja kokevat sen vaikeana ja työläänä esim. minimimetatietojen auto-generoinnista huolimatta. Tarvitaan ohjeita ja esimerkkejä siitä, miten aineisto kuvataan tarpeeksi tarkkaan

Anna aineistolle PID Tutkimusaineistojen julkaisun erityispiirre Pysyväistunniste (PID), esim. URN tai DOI - kansainvälisesti uniikki tunniste säilyy samana vaikka aineiston sijainti vaihtuisi. Mahdollistaa viittaukset julkaisujen ja aineiston välillä. Viittausmäärien kerääminen meritoituminen TTA:n KATA ja IDA generoivat URN-tunnisteen tai käyttäjä voi antaa muualta hankitun tunnisteen lisätessään aineiston palveluun.

Julkaisun jälkeen Data on mahdollisimman avoimesti saatavilla selkeässä ja helposti uudelleen käytettävässä formaatissa. Aineistojen tulisi löytyä helposti Esim. Linked Open Data menetelmien soveltaminen aineistoihin Aineistojen hyödyntämisen tulisi olla helppoa AVAA: työkaluja aineistojen lataamiseen, rajapintajakeluun, tarkasteluun ja vakiomuotoisiin visualisointeihin Pilottisovellukset, mm. avoimen CMS-datan hyödyntäminen lukio-opetuksessa Avoin julkaisu edistää tutkijan ansioitumista - työhön kertyy viittauksia, kun se on globaalisti saatavilla.

Haasteita Miten tästä tehdään tutkijoille helppoa ja vaivatonta & saadaan tutkijat toimimaan näin? Pelkkä keppi ei riitä pitkään tarvitaan toimintakulttuurin muutos kollektiivinen oivallus aineistojen hyvän hallinnan, kuvailun ja avoimen julkaisun hyödyistä tutkijalle itselleen Tutkijat kokevat usein, ettei aineiston julkaiseminen maksa vaivaa, mutta palkinto hyvin dokumentoidusta avoimesta aineistosta voi olla suuri Maine ja työn vaikuttavuus, palaute, muiden motivointi datan jakamiseen, aineiston kumuloituminen ja parantaminen Datan kuvailu vaatii ennemmin järjestelmällisemmän työskentelytavan omaksumista kuin ylimääräistä vaivaa merkataan kuvailutiedot jo aineiston syntyvaiheessa Vanha dokumentoitu aineisto on arvokasta- hyöty esim. 5 vuoden kuluttua tutkijalle itselleen

Tietoa Open Knowledge Foundation: Open Data Handbook, http://opendatahandbook.org/pdf/opendatahandbook.pdf UNESCO: Ocean Data Publication Cookbook http://classroom.oceanteacher.org/pluginfile.php/6842/mod_resource/content /4/CookBook_MG64.pdf Panton Principles for Open Data in Science, http://pantonprinciples.org/ Science Commons - Protocol for Implementing Open Access Data, http://sciencecommons.org/projects/publishing/open-access-data-protocol/ Nine simple ways to make it easier to (re)use your data, https://peerj.com/preprints/7 http://oad.simmons.edu/oadwiki/data_repositories - a list of subject repositories for sharing data and long-term preservation ROAR Registry of Open Access Repositories: http://roar.eprints.org/ University of Oregon Library, Research Data Management Best Practices http://library.uoregon.edu/datamanagement/guidelines.html Australian National Data Services (ANDS), http://ands.org.au/services/index.html

Palautetta? tanja.kantola@csc.fi