PALVELUT KATA/AVAA/IDA Tuija Raaska, CSC, 2.12.2013 Tuija.Raaska@csc.fi
Tutkimuksen tietoaineistot TTA Opetus- ja kulttuuriministeriön TTA-hanke edistää tietoaineistojen kuvausten yhtenäistämistä, säilytystä ja käyttöä Hankkeessa tuotetaan tätä tukemaan: tutkimuksen tietoaineistojen prosessikartta tietoinfrastruktuurin palvelukokonaisuuden suunnittelu metatietomalli tutkimustiedon hallinnalle yhteinen metatietokatalogi/hakupalvelu tutkimusaineistoille tallennuspalvelu tutkimuksen tietoaineistoille yhteisen pitkäaikaissäilytysratkaisun valmistelu TTA-palvelukokonaisuus edistää tutkimuksen tietoaineistojen kansallista, eurooppalaista ja kansainvälistä yhteentoimivuutta.
TTA-hankkeen hyödyt Keskitettyä tietoa tutkimuksen tietoaineistoista: helpompi löytää, helpompi käyttää Yhtenäisempiä käytäntöjä aineistojen hallintaan Yhteentoimivuuden lisääntyminen: metatietomalli, rajapinnat Monipuolisen palvelukokonaisuuden kehitys Tietoaineistojen säilymisen turvaaminen Jaettu Paikallinen Säilyminen ja löytyminen epävarmaa Säilymistodennäköisyys kasvaa, löydettävyys kasvaa
TTA-palvelut TTA-KATA - metadatakatalogi TTA-AVAA avointen aineistojen julkaisualusta TTA-IDA tutkimusaineistojen tallennuspalvelu www.tdata.fi datanhallinnan opas TTA User forum käyttäjäyhteisö Metatietomalli PAS
KATA-metadatakatalogi
KATA-projektin tavoitteet Rakentaa palvelu, joka: helpottaa tutkimuskäyttöön saatavilla olevien aineistojen löytämistä, hyödyntämistä ja uudelleenkäyttöä luo yhtenäistä käyttöehto- ja käyttöoikeuskulttuuria: omistajuus ja hyödyntämisoikeustiedot kytkettynä aineistoon synnyttää meriitin tutkijalle ja antaa tietoa rahoittajatahoille palvelu, jonne omat tutkimusdatat voi tuoda näkyville ohjaa metadatan syötössä ja tukee muiden datojen kanssa yhtenäisestä kuvailua pitkäaikaissäilytykseen soveltuvien tietoaineistojen löytäminen
KATA-metadatakatalogi tutkija voi tuoda oman tutkimusaineistonsa muiden tutkijoiden tietoisuuteen KATAn avulla katalogiin ei tallenneta itse aineistoa, vaan sen metatiedot, joiden perusteella muut tutkijat voivat löytää aineiston ja saavat tiedon siitä, miten he voivat saada aineiston käyttöönsä helpottaa metatiedon syöttöä ja muiden datojen kanssa yhtenäistä kuvailua; aineisto kuvaillaan vähintään TTA:n minimimetatietomallin mukaisesti laadukkaan kuvailukulttuurin edistäminen erityisesti minimimetatietomallin avulla monipuoliset hakuominaisuudet, joilla voi hakea keskitetysti useiden kohteiden dataa metadatan massatuontimahdollisuus
KATA katalogi nyt valmiina testattavaksi ennen varsinaista käyttöönottoa kiinnostusta toimia testaajana?
AVAA avointen aineistojen julkaisualusta
AVAA-projekti Tavoitteena on tarjota web-pohjaisia välineitä eri tieteenalojen tutkimusdatan avoimen saatavuuden edistämiseen yleiskäyttöisten välineiden rakentaminen on haasteellista mm. tieteenalojen aineistojen erilaisuus ja erilaiset tarpeet, esim. arkeologien kuva-aineistot vs. kielitieteilijöiden tekstikorpukset vs. numeerinen hiukkasfysiikan data valittiin linja, jossa edetään yksittäistapausten kautta ja pyritään tunnistamaan mahdollisimman yleistettävissä olevia esimerkkejä sekä kehittämään apuvälineitä näiden tukemiseen aloitettiin kolmen eri tieteenalan avoimen datan pilottisovellusten kehityksellä pilottien tarkoitus on tarjota kokemusta erilaisten aineistojen avoimista formaateista ja jakelutavoista
AVAA-projektissa mukana olevia pilottisovelluksia ovat: Opetussovellus Cernin CMS-kokeen avoimen hiukkasfysiikan aineiston hyödyntämiseksi lukio-opetuksessa valmistuu 2014 (ks. Cernin artikkeli) Julkaistavan alkuperäisen formaatin lisäksi aineisto muunnetaan yksinkertaisempaan, avoimeen, koneluettavaan formaattiin ohjelmallista hyödyntämistä varten (tällä hetkellä JSON) Ilmakehätieteiden SMEAR-ryhmän mittausdatan visualisointi, JSON-rajapintajakelu ja avoin lataus CSV-taulukkoina sekä HDF5- muodossa Paikkatietoaineistojen rajapintajakelu, testitapauksena OpenStreetMap WMS -palvelu ETRS-TM35FIN-koordinaatistossa Vuoden 2014 aikana WMS- ja WFS-rajapintapalvelut Kotimaisten kielten keskuksen murrekartta-aineistojen jakeluun
AVAA-pilotti SmartSMEAR on Helsingin yliopiston SMEAR-tutkimusasemien (Station for Measuring Ecosystem-Atmosphere Relations) tietokannassa olevan mittaustiedon visualisointi- ja lataustyökalu.
CMS-pilottia käsitteleviä artikkeleja on julkaistu useassa arvostetussa aikakauslehdessä ja Cernin etusivulla: International Science Grid This Week (27.11.2013): LHC data to be made public via open-access initiative Nature - International Weekly Journal of Science (26.11.2013): LHC plans for open data future Cern web home site (15.11.2013): LHC data to be made public via open access initiative
AVAA beta pilottiportaali on 2.12. alkaen avoinna verkossa osoitteessa avaa.tdata.fi Kysyttävää? avaa@csc.fi AVAA-projekti on osa opetus- ja kulttuuriministeriön Tutkimuksen tietoaineistot -hanketta (TTA). AVAA on osa Tutkimuksen tietoaineistot (TTA) palveluita. Palvelun tuottaa ja sitä tukee CSC - Tieteen tietotekniikan keskus Oy.
IDA-tallennuspalvelu CSC Tieteen tietotekniikan keskus Oy
IDA tallennuspalvelu Yhteinen tallennuspalvelu tutkimuksen digitaalisten tietoaineistojen säilyttämiseksi ja uudelleenkäytön lisäämiseksi Tietoaineistojen ja metatiedon turvallinen säilytys Datan säilyminen eheänä ja muuttumattomana turvataan kopioiden ja niiden eheyden hallinnalla IDA-palvelussa tarjotaan 2017 loppuun saakka noin 3 petatavun (PT) tallennuskapasiteetin käyttöoikeuksia: Korkeakouluille varattu yhteensä 1 PT Suomen Akatemian projektit yhteensä 1 PT Erityishankkeet,1 PT
IDA tallennuspalvelun käyttäjäksi Yliopistoilla käyttöoikeusosuudet, päättävät itse miten oikeus jaetaan. Yliopistojen nimeämät IDA-yhteyshenkilöt linkkeinä yliopistojen ja CSC:n välillä. Lista yhteyshenkilöistä www.csc.fi/sivut/ida/esittely -sivulla Käyttölupalomake samalta www.csc.fi/sivut/ida/esittely -sivuilta, toimitetaan yhteyshenkilön allekirjoituksella varustettuna CSC:lle.
TTA datanhallinnan opas ja käyttäjäfoorumi
Datanhallinnan opas http://www.tdata.fi Datanhallinnan suunnittelu Datan säilyttäminen Datan jakaminen ja julkaiseminen Datan hakeminen ja uudelleenkäyttö Datan käsittely ja prosessointi CSC:llä Tutkimusprosessi ja data Paljon ohjeita, esimerkkejä ja valistusta tutkimusdatan hallintaan ja valmisteluun (kuvailu, lisenssit, formaatit)
Avoin keskustelufoorumi TTA-palvelujen käyttäjille Tuetaan käyttäjiä TTA-palvelujen käyttöönotossa Luodaan käyttäjien välille yhteys Kerätään palautetta palveluista Jaetaan tietoa Kartoitetaan kehittämistarpeita Uusien käyttäjien saaminen Sähköinen ympäristö tiiviisti muiden TTA-palveluiden yhteydessä, avataan vuoden 2014 alussa User forum -tilaisuuksia keväällä 2014. Ensimmäinen IDA-yhteyshenkilötapaamisen yhteydessä
Kiitokset ja yhteystiedot KATA-projektitiimi Pinja Koskinen, projektipäällikkö Mikko Koho Juho Lehtonen Mikael Karlsson AVAA-projektitiimi Tanja Kantola, projektipäällikkö Pekka Järveläinen, projektipäällikkö IDA Jorma Paananen www.tdata.fi Irina Kupiainen TTA User Forum Johanna Blomqvist