TTA-hankkeen esittely Pirjo-Leena Forsström TTA-hankkeen pääsihteeri
Tutkimuksen tietoaineistot TTA Opetus- ja kulttuuriministeriön TTA-hanke edistää tietoaineistojen kuvausten yhtenäistämistä, säilytystä ja käyttöä Hankkeessa tuotetaan tätä tukemaan: tutkimuksen tietoaineistojen prosessikartta tietoinfrastruktuurin palvelukokonaisuuden suunnittelu metatietomalli tutkimustiedon hallinnalle yhteinen metatietokatalogi/hakupalvelu tutkimusaineistoille tallennuspalvelu tutkimuksen tietoaineistoille yhteisen pitkäaikaissäilytysratkaisun valmistelu TTA-palvelukokonaisuus edistää tutkimuksen tietoaineistojen kansallista, eurooppalaista ja kansainvälistä yhteentoimivuutta.
Toimenpiteitä tietoaineistojen hyödyntämisen parantamiseksi
TTA-VISIO Suomessa on selkeä tietopolitiikka, jota yhteiset sähköiset palvelut tukevat. Julkisen sektorin hallinnoimat tietoaineistot sekä julkisen tutkimusrahoituksen tuella syntyneet tietoaineistot ovat lainsäädännön ja yhtenäisten käyttöehtojen ohjaamina pääsääntöisesti maksutta yhteiskunnan hyödynnettävissä. Pitkäjänteinen tietoinfrastruktuurin kehittämisen ja ylläpidon rahoitusjärjestelmä takaa, että olemassa olevat ja uudet tietoaineistot kuvaillaan ja ne ovat helposti löydettävissä ja otettavissa käyttöön tietoverkossa olevien palveluiden avulla. Kannustava ja oikeudenmukainen meriittijärjestelmä varmistaa uusien, laadukkaiden tietoaineistojen liittämisen tietoinfrastruktuuriin.
TTA-hankkeen hyödyt Keskitettyä tietoa tutkimuksen tietoaineistoista: helpompi löytää, helpompi käyttää Yhtenäisempiä käytäntöjä aineistojen hallintaan Yhteentoimivuuden lisääntyminen: metatietomalli, rajapinnat Monipuolisen palvelukokonaisuuden kehitys Tietoaineistojen säilymisen turvaaminen Paikallinen Säilyminen ja löytyminen epävarmaa Jaettu Säilymistodennäköisyys kasvaa, löydettävyys kasvaa
TTA palveluarkkitehtuuri
TTA-palvelut TTA-KATA - metadatakatalogi TTA-AVAA avointen aineistojen julkaisualusta TTA-IDA tutkimusaineistojen tallennuspalvelu www.tdata.fi datanhallinnan opas TTA User forum käyttäjäyhteisö Metatietomalli PAS
TTA-palvelut 2013 Perustuvat avoimen lähdekoodin ratkaisuihin IDA tallennuspalvelu (käytössä) (irods) KATA metadatakatalogi (pilotissa) (CKAN) AVAA avoimen datan julkaisualusta (käytössä) (Liferay) PAS Pitkäaikaissäilytys (2015), pilotit alkavat 2014 (useita OS komponetteja)
KATA-metadatakatalogi
KATA-projektin tavoitteet Rakentaa palvelu, joka: helpottaa tutkimuskäyttöön saatavilla olevien aineistojen löytämistä, hyödyntämistä ja uudelleenkäyttöä luo yhtenäistä käyttöehto- ja käyttöoikeuskulttuuria: omistajuus ja hyödyntämisoikeustiedot kytkettynä aineistoon synnyttää meriitin tutkijalle ja antaa tietoa rahoittajatahoille palvelu, jonne omat tutkimusdatat voi tuoda näkyville ohjaa metadatan syöttössä ja tukee muiden datojen kanssa yhtenäisestä kuvailua pitkäaikaissäilytykseen
KATA-metadatakatalogi tutkija voi tuoda oman tutkimusaineistonsa muiden tutkijoiden tietoisuuteen KATAn avulla katalogiin ei tallenneta itse aineistoa, vaan sen metatiedot, joiden perusteella muut tutkijat voivat löytää aineiston ja saavat tiedon siitä, miten he voivat saada aineiston käyttöönsä helpottaa metatiedon syöttöä ja muiden datojen kanssa yhtenäistä kuvailua; aineisto kuvaillaan vähintään TTA:n minimimetatietomallin mukaisesti laadukkaan kuvailukulttuurin edistäminen erityisesti minimimetatietomallin avulla monipuoliset hakuominaisuudet, joilla voi hakea keskitetysti useiden kohteiden dataa metadatan massatuontimahdollisuus
KATA katalogi nyt valmiina testattavaksi ennen varsinaista käyttöönottoa kiinnostusta toimia testaajana?
AVAA avointen aineistojen julkaisualusta
AVAA-projekti Tavoitteena on tarjota web-pohjaisia välineitä eri tieteenalojen tutkimusdatan avoimen saatavuuden edistämiseen yleiskäyttöisten välineiden rakentaminen on haasteellista mm. tieteenalojen aineistojen erilaisuus ja erilaiset tarpeet, esim. arkeologien kuva-aineistot vs. kielitieteilijöiden tekstikorpukset vs. numeerinen hiukkasfysiikan data valittiin linja, jossa edetään yksittäistapausten kautta ja pyritään tunnistamaan mahdollisimman yleistettävissä olevia esimerkkejä sekä kehittämään apuvälineitä näiden tukemiseen aloitettiin kolmen eri tieteenalan avoimen datan pilottisovellusten kehityksellä pilottien tarkoitus on tarjota kokemusta
Opetussovellus Cernin CMS-kokeen avoimen hiukkasfysiikan aineiston hyödyntämiseksi lukio-opetuksessa valmistuu 2014 (ks. Cernin artikkeli) Julkaistavan alkuperäisen formaatin lisäksi aineisto muunnetaan yksinkertaisempaan, avoimeen, koneluettavaan formaattiin ohjelmallista hyödyntämistä varten (tällä hetkellä JSON) Ilmakehätieteiden SMEAR-ryhmän mittausdatan visualisointi, JSONrajapintajakelu ja avoin lataus CSV-taulukkoina sekä HDF5-muodossa Paikkatietoaineistojen rajapintajakelu, testitapauksena OpenStreetMap WMS -palvelu ETRS-TM35FIN-koordinaatistossa Vuoden 2014 aikana WMS- ja WFS-rajapintapalvelut Kotimaisten kielten keskuksen murrekartta-aineistojen jakeluun
AVAA-pilotti SmartSMEAR on Helsingin yliopiston SMEAR-tutkimusasemien (Station for Measuring Ecosystem-Atmosphere Relations) tietokannassa olevan mittaustiedon visualisointi- ja lataustyökalu.
CMS-pilottia käsitteleviä artikkeleja on julkaistu useassa arvostetussa aikakauslehdessä ja Cernin etusivulla: International Science Grid This Week (27.11.2013): LHC data to be made public via open-access initiative Nature - International Weekly Journal of Science (26.11.2013): LHC plans for open data future Cern web home site (15.11.2013): LHC data to be made public via open access initiative
AVAA beta pilottiportaali on 2.12. alkaen avoinna verkossa osoitteessa avaa.tdata.fi Kysyttävää? avaa@csc.fi
IDA-tallennuspalvelu CSC Tieteen tietotekniikan keskus Oy
IDA tallennuspalvelu Yhteinen tallennuspalvelu tutkimuksen digitaalisten tietoaineistojen säilyttämiseksi ja uudelleenkäytön lisäämiseksi Tietoaineistojen ja metatiedon turvallinen säilytys Datan säilyminen eheänä ja muuttumattomana turvataan kopioiden ja niiden eheyden hallinnalla IDA-palvelussa tarjotaan 2017 loppuun saakka noin 3 petatavun (PT) tallennuskapasiteetin käyttöoikeuksia: Korkeakouluille varattu yhteensä 1 PT Suomen Akatemian projektit yhteensä 1 PT Erityishankkeet,1 PT
IDA tallennuspalvelun käyttäjäksi Yliopistoilla käyttöoikeusosuudet, päättävät itse miten oikeus jaetaan. Yliopistojen nimeämät IDA-yhteyshenkilöt linkkeinä yliopistojen ja CSC:n välillä. Lista yhteyshenkilöistä www.csc.fi/sivut/ida/esittely - sivulla Käyttölupalomake samalta www.csc.fi/sivut/ida/esittely -sivuilta, toimitetaan yhteyshenkilön allekirjoituksella varustettuna CSC:lle.
TTA datanhallinnan opas ja käyttäjäfoorumi
Datanhallinnan opas http://www.tdata.fi Datanhallinnan suunnittelu Datan säilyttäminen Datan jakaminen ja julkaiseminen Datan hakeminen ja uudelleenkäyttö Datan käsittely ja prosessointi CSC:llä Tutkimusprosessi ja data Paljon ohjeita, esimerkkejä ja valistusta tutkimusdatan hallintaan ja valmisteluun (kuvailu, lisenssit, formaatit)
Avoin keskustelufoorumi TTA-palvelujen käyttäjille Tuetaan käyttäjiä TTA-palvelujen käyttöönotossa Luodaan käyttäjien välille yhteys Kerätään palautetta palveluista Jaetaan tietoa Kartoitetaan kehittämistarpeita Uusien käyttäjien saaminen Sähköinen ympäristö tiiviisti muiden TTA-palveluiden yhteydessä, avataan vuoden 2014 alussa User forum -tilaisuuksia keväällä 2014. Ensimmäinen IDAyhteyshenkilötapaamisen yhteydessä
KATA-projektitiimi Pinja Koskinen, projektipäällikkö Mikko Koho Juho Lehtonen Mikael Karlsson Kiitokset ja yhteystiedot AVAA-projektitiimi Tanja Kantola, projektipäällikkö Pekka Järveläinen, projektipäällikkö IDA Jorma Paananen www.tdata.fi Irina Kupiainen TTA User Forum Johanna Blomqvist