TTA-hankkeen esittely Pirjo-Leena Forsström TTA-hankkeen pääsihteeri
Sisällys Taustaa TTA-hanke Kokonaisarkkitehtuuri: tavoitetila
Toimenpiteitä tietoaineistojen hyödyntämisen parantamiseksi
TTA-VISIO Suomessa on selkeä tietopolitiikka, jota yhteiset sähköiset palvelut tukevat. Julkisen sektorin hallinnoimat tietoaineistot sekä julkisen tutkimusrahoituksen tuella syntyneet tietoaineistot ovat lainsäädännön ja yhtenäisten käyttöehtojen ohjaamina pääsääntöisesti maksutta yhteiskunnan hyödynnettävissä. Pitkäjänteinen tietoinfrastruktuurin kehittämisen ja ylläpidon rahoitusjärjestelmä takaa, että olemassa olevat ja uudet tietoaineistot kuvaillaan ja ne ovat helposti löydettävissä ja otettavissa käyttöön tietoverkossa olevien palveluiden avulla. Kannustava ja oikeudenmukainen meriittijärjestelmä varmistaa uusien, laadukkaiden tietoaineistojen liittämisen tietoinfrastruktuuriin.
Määritelmiä Tutkimuksen tietoaineistolla tarkoitetaan tässä työssä julkisin varoin tuotettuja sähköisiä tietoaineistoja ja -varantoja. Tietoaineistoihin kuuluvat sekä tutkimuksen tuottamat että tutkimuksen hyödynnettävissä olevat aineistot. Tutkimuksen tietoinfrastruktuurilla tarkoitetaan aineistojen sijaintiin, rakenteeseen, organisointiin, hakemistoihin ja luetteloihin, omistajuuteen, saatavuuteen, varmistukseen, tietoturvaan ja tietovarastoihin liittyvät keskeiset resurssit ja kyvykkyydet sekä niiden elinkaaren hallinta. TTA-palveluilla tarkoitetaan niitä tutkimuksen tietoinfrastruktuurin palveluita, jotka toteutetaan TTAhankkeessa. Joulukuuhun 2012 mennessä tällaisiksi palveluiksi on sovittu tallennuspalvelu IDA, metatietopalvelu KATA sekä pitkäaikaissäilytys PAS. Jatkossa uusista palveluista sopiminen tapahtuu valitun hallintomallin puitteissa
Käytännön tavoitteena on: tutkimuksen tietoinfrastruktuuri palveluineen toimii saumattomasti yhteen muun kansallisen tietoinfrastruktuurin kanssa ja tarjoaa tutkimuksen tietoaineistojen säilyttämisen ja hyödyntämisen yhteiset palvelut. Tietoinfrastruktuurin rakentaminen, kehittäminen ja ylläpito on pitkäjänteistä ja takaa, että tietoaineistot kuvataan ja tuodaan tietoinfrastruktuuripalvelujen piiriin. Eri toimijoiden välinen roolijako on selkeä. Kaikista tutkimuksen kannalta merkittävistä tietoaineistoista on tuotettu tarvittavat metatiedot ja kuvaukset on koottu niin, että tietoaineistot on helposti löydettävissä. Tietoaineistot säilytetään pysyvästi ja niille on annettu pysyvä tunnus. Tietoaineistot ovat palveluiden avulla helposti löydettävissä, saatavissa ja käytettävissä. Tutkimusorganisaatiot ja yhteenliittymät vastaavat tietoaineistojen metatietotyöhön tarvittavista työkaluista ja järjestelmistä.
Tietoaineistojen käyttötapoja
TTA-hankkeen hyödyt Keskitettyä tietoa tutkimuksen tietoaineistoista: helpompi löytää, helpompi käyttää Yhtenäisempiä käytäntöjä aineistojen hallintaan Yhteentoimivuuden lisääntyminen: metatietomalli, rajapinnat Monipuolisen palvelukokonaisuuden kehitys Tietoaineistojen säilymisen turvaaminen Tier 1 International data services Säilymistodennäköi syys kasvaa, löydettävyys Säilyminen kasvaa ja löytyminen epävarmaa Tier 2 National data services Tier 3 Institutions (Universities & Institutes) Tier 4 Small science researchers & research groups
Tutkimuksen tietoaineistot -hanke (TTA) Parantaa sähköisten tietoaineistojen hyödyntämistä tutkimuksessa. Vahvistaa tahtotilaa. Luo kansallista tietopolitiikkaa. Rakentaa tutkimuksen tietoinfrastruktuuria.
TTA, tutkimuksen tietoinfrastruktuuri hermosto, tiedonvälitys- ja säätelyjärjestelmä TTA-palvelukokonaisuus edistää tutkimuksen tietoaineistojen kansallista, eurooppalaista ja kansainvälistä yhteentoimivuutta
Tutkimuksen tietoaineistot TTA TTA-hanke edistää tietoaineistojen kuvausten yhtenäistämistä, säilytystä ja käyttöä. TTA-hankkeessa tuotetaan tätä tukemaan: tutkimuksen tietoaineistojen prosessikartta tietoinfrastruktuurin palvelukokonaisuuden suunnittelu metatietomalli tutkimustiedon hallinnalle yhteinen metatietokatalogi/hakupalvelu tutkimusaineistoille tallennuspalvelu tutkimuksen tietoaineistoille yhteisen pitkäaikaissäilytysratkaisun valmistelu TTA-palvelukokonaisuus edistää tutkimuksen tietoaineistojen kansallista, eurooppalaista ja kansainvälistä yhteentoimivuutta.
TTA palveluarkkitehtuuri
TTA-hankkeen rakenne 2011-2013 Koordinaatioryhmä Ohjausryhmä Metatieto - työryhmä Tietoinfrastruktuurityöryhmä TURE- pienryhmä PAS Tiedon saatavuustyöryhmä TUTKIMUS-IDA DATAKATALOGI DATANHALLINNAN PILOTTI AVAA-ALUSTA
TTA-periaatteet TTA-hankkeen palveluiden periaatteet koostuvat 1) yleisistä arkkitehtuuriperiaatteista 2) yleisistä palveluperiaatteista 3) palvelukohtaisesta käyttö- ja palveluperiaatteista
TTA-hankkeen arkkitehtuuriperiaatteet Tutkimuksen tietoinfrastruktuuri noudattaa ohjaavia periaatteita Tutkimuksen tietoinfrastruktuuria johdetaan strategialähtöisenä kokonaisuutena Tutkimuksen tietoinfrastruktuurissa on vältettävä tarpeetonta monimutkaisuutta Tutkimuksen tietoinfrastruktuuri on kerroksellinen, toiminnalliset ja tekniset tasot ymmärretään erillään toisistaan mutta toisiaan tukevia ja täydentäviä. Tutkimuksen tietoinfrastruktuuri pyrkii olemassa olevien komponenttien uudelleenkäyttöön ja yhdistelyyn tavoitteita tukevaksi kokonaisuudeksi Tutkimuksen tietoinfrastruktuuri palvelee yhteiskunnan kokonaisetua Tutkimuksen tietoinfrastruktuuri mukautuu eri tieteenalojen ja toimintojen tarpeisiin Tutkimuksen tietoinfrastruktuuri edistää tietoaineistojen uudelleen käyttöä Tutkimuksen tietoinfrastruktuuri kokoaa yhteen paikallisia ja keskitettyjä palveluita Tutkimuksen tietoinfrastruktuuri on teknologialtaan hallittu kokonaisuus
Yleiset palveluperiaatteet Palveluiden elinkaari ja palvelulupaus on kestävä ja hallittu (täsmentyy hallintomallityössä). Palveluiden ja aineistojen avoimuus, julkisuus ja tietoturva ovat tasapainoisesti hallittu kokonaisuus (täsmentyy lakiselvityksessä). Suomalaisessa tutkimusjärjestelmässä toimiville tutkijoille TTA-palvelujen käyttö on periaatteessa maksutonta ja hakemuksesta myönnettävää. Edellytyksenä maksuttomuuteen on, että tutkimus on julkista. TTA-hankkeen työryhmien ja palvelukehityksen tuloksille käytetään lisenssiä, jotta opetus- ja kulttuuriministeriö voi edistää syntyneen aineiston tehokasta käyttöä tekijänoikeuksien estämättä. Tähän käytetään lisenssiä, jossa käyttäjälle annetaan oikeus Jakaa eli kopioida, levittää, näyttää ja esittää teosta sekä Valmistaa muutettuja teoksia, ehdoilla että: Nimeä eli teoksen tekijä on ilmoitettava siten kuin lisenssin antaja on sen määrännyt (mutta ei siten että ilmoitus viittaisi lisenssinantajan tukevan lisenssinsaajaa tai teoksen käyttötapaa) Epäkaupallinen eli käyttäjä ei saa käyttää teosta kaupallisesti Jaa samoin eli jos käyttäjä tekee muutoksia tai käyttää teosta omien teostensa pohjana, tulee johdannaisteos jakaa samalla tai samankaltaisella lisenssillä. Lisenssi on: Creative Commons Nimeä-Epäkaupallinen-JaaSamoin 3.0 Muokkaamaton. Lisenssi päivitetään vastaamaan CC 4.0 versioita sen ilmestyttyä.
TTA-hanke ja infrastruktuuriryhmä
Toimeksianto Suunnitelma siitä, miten ja mitä palveluita tietoinfrastruktuurin tulee tietoaineistojen tuotannon tukemiseksi; hyödyntämisen tukemiseksi; sekä tutkimusinfrastruktuurien toiminnan tukemiseksi.
TTA-infrastruktuuri Auttaa tutkijoita ja tutkimusta tukemalla tutkimusdatan hallintaa ja hyväksikäyttöä Suurten datamäärien ja niihin perustuvan tutkimuksen maailmassa Tähtää tutkimusdatan mahdollisimman suureen avoimuuteen hyödyttää tiedettä ja koko yhteiskuntaa sekä lisää tutkimusinvestointien vaikuttavuutta datan julkisuus varmistaa tieteen luotettavuutta luo uuden väylän ansioitua tutkijana.
TTA-infrastruktuuriryhmä Tietojärjestelmäpäällikkö Esa-Pekka Keskitalo, Kansalliskirjasto (pj.) Sovellusarkkitehti Jari Suhonen, CSC (sihteeri) Tietoverkkoasiantuntija Tuomas Alaterä, Yhteiskuntatiet. tietoarkisto Tutkimuskoordinaattori Ella Bingham, HIIT Tutkijatohtori Miikka Dal Maso, Helsingin yliopisto Kehittämispäällikkö Markku Mäenpää, Kansallisarkisto Tietotekniikkaprojektipäällikkö Ville Tenhunen, Helsingin yliopisto Toimialapäällikkö Mikko Eklund, Geologian tutkimuskeskus Erikoistutkija Jouko Verho, KELA
Suunnittelun periaatteet
Strategia Kokonaisarkkitehtuuri Toteutus
Tämä on tavoitetilan kuvaus Tavoite on kuvattu ennen nykytilaa Muotoaan etsivä kokonaisuus: nykytila ei ennusta tavoitetilaa Nykytilaakin - = Tavoitetila Nykytila Kehitys
Tutkimuksen tietoaineistot Periaatteet ja käytännöt Aineistojen tuottajat Aineistojen hyödyntäjät Palvelut Prosessit Tietojärjestelmät
Tietoaineistojen keruu Päivitykset Varastointi Tietoaineistot Tarkistustiedot Sopimustiedot Julkaisut Laatuvarmistettu Palveluehdot data Kuvailutiedot Prosessoitu data Kokoelmatiedot Sanastot Raakadata Tunnisteet Ontologiat Viittaukset Raportit Organisaatiotiedot Luokitukset Paikkatiedot Versiotiedot Käyttäjätiedot Formaatit Käyttöehdot Tutkimustiedot Sijaintitiedot Saatavuustiedot Jatkokäyttö
Julkishallinnon linjaukset Kansalliset TTA kokonaisarkkitehtuuri Kansainväliset Olemassa olevat tutkimusinfrastruktuurit
Tutkimus Yliopistot Tutkijat Tutkimuslaitokset Päätöksentekijät Suomen Akatemia Tiedepolitiikka Opetus- ja kulttuuriministeriö Yhteisöt Palvelun tarjoajat Valtio Arkistot Kirjastot Tietotekniikkapalvelujen tarjoajat Yhteiskunta
Harmoninen Palvelut Prosessit Toiminnot Data Aineistot Palvelut Prosessit
Arkkitehtuuriperiaatteet (1) Tutkimuksen tietoinfrastruktuuri palvelee tutkimusta ja yhteiskuntaa Tutkimuksen tietoinfrastruktuuri mukautuu eri tieteenalojen ja toimintojen tarpeisiin
Arkkitehtuuriperiaatteet (2) Tutkimuksen tietoinfrastruktuurissa on vältettävä tarpeetonta monimutkaisuutta Tutkimuksen tietoinfrastruktuuri on kerroksellinen Tutkimuksen tietoinfrastruktuuri pyrkii olemassa olevien komponenttien uudelleenkäyttöön ja yhdistelyyn tavoitteita tukevaksi kokonaisuudeksi Tutkimuksen tietoinfrastruktuuri kokoaa yhteen paikallisia ja keskitettyjä palveluita Tutkimuksen tietoinfrastruktuuri on teknologialtaan hallittu kokonaisuus
Arkkitehtuuriperiaatteet (3) Tutkimuksen tietoinfrastruktuuri noudattaa ohjaavia periaatteita Tutkimuksen tietoinfrastruktuuria johdetaan strategialähtöisenä kokonaisuutena
Palvelut, prosessit, toiminnot
Tuota Käytä Valmistele Säilytä
Tutkiminen Uudelleen käyttöön otto Paketointi Säilyttäminen
Tietoaineistojen kuvailuohjeistus Tukipalvelut Uudelleen käyttöä tukevat palvelut Ulkoiset palvelut Tutkimustietorekisteri Käyttövaltuushallinta Rekisteritietoaineistot Tutkimusta tukevat palvelut Tunnisteet Tallennus Prosessointi Yhteisöpalvelut Auktoriteettitietokanta Käyttöön valmistelua tukevat palvelut Kuvailupalvelu Koontipalvelut Tietoaineistojen säilyttämistä tukevat palvelut Ontologiat Käyttäjätunnistus Säilytys Hallinta Levitys Integraatiopalvelut Pitkäaikaissäilytys Paikkatiedot
Tutkimusprosessia tukevat palvelut Tutkimuksen aikainen tallennustila Datan käsittelyn välineet Rajapinnat omien välineiden käyttämiseen Tutkijayhteisön kommunikaatio Tutkimuksen suunnittelu, dokumentaatio
Tietoaineistojen käyttöön valmistelua tukevat palvelut Kuvailutiedon luomisen palvelut Koontipalvelut: yhtenäisiä, rakenteisia kokonaisuuksia Käyttövaltuuksiin liittyvät palvelut
Säilyttämiseen ja uudelleenkäyttöön liittyvät palvelut Tallennustila Aineiston hallinnointi ja päivittäminen (curation) Pitkäaikaissäilytyksen palvelut Aineiston markkinointi Aineiston
Tukipalvelut Aineiston kuvailukäytäntöihin Kuvailun apuvälineiden käyttöön Tunnisteet, paikkatieto, kontrolloidut nimet ja termit Käyttäjien tunnistaminen Integraatio
Integraation ja yhteentoimivuuden haasteita Datan ominaisuudet datan avoimuus koneluettavuus uudelleenkäytön helppous Datan määrän kasvaminen Tiedonsiirron hitaus Hallinnan ja ymmärrettävyyden ongelmat Metadatan ominaisuudet Riittävyys ja laatu Erilaiset käytännöt ja standardit
Arviointi Asiakkaiden tarpeet Strategia Säädökset Johtaminen Tutkimus Käyttöön valmistelu Uudelleen käyttö Säilytys Tyytyväiset asiakkaat Tuki Kehittäminen
Tutkimus Tuotanto Käyttöön valmistelu Säilytys Tuki Uudelleen käyttö Tyytyväiset asiakkaat Väliaikaissäilyty s Kehittäminen Yhteiskäyttö Prosessointi Laadunvarmistus Julkaisu
Tutkimus Käyttöön valmistelu Säilytys Tuki Jatkokäytön edellykset Kehittäminen Uudelleen käyttö Tyytyväiset asiakkaat Hallinnointi Käyttöehdot Koostaminen Kuvailu Siirto Päivittäminen
Tutkimus Käyttöön valmistelu Säilytys Tuki Kehittäminen Uudelleen käyttö Tiedon haku Käyttöoikeuksien myöntäminen Tyytyväiset asiakkaat Aineiston luovuttamine n Aineiston siirtäminen Raportointi
Jatkosuunnitelmia
Roolit Organisointi Kehittäminen Linjaukset Kuvaukset Viestintä Hallintamalli Strateginen (painopiste alueet) Tutkimushallinto (tarpeet) Kansainväliset toimielimet (direktiivit, suositukset, lausunnot) Lainsäätäjät (lakimuutokset) Rahoittajat (budjetti) Yhteistyöelin (johtaminen) Koordinaatioelin (kehittämispolku) Toimeenpanoelin (projektisalkku) Taktinen (toiminta suunnitelmat) KIRJASTO- VERKKO- PALVELUT Operatiivinen (toteutus suunnitelmat) Infrastruktuuripolitiikka Kehitysprojektit (arkkitehtuurin mukaisuuden tarkistuspisteet) Palvelut (SLA, AUP) TTA arkkitehtuuriryhmä Infrastruktuurit
Nykytilan kuvaaminen Tietojen keräämiseen pohdittu eri vaihtoehtoja Pikemminkin karkeasti kuin yksityiskohtaisesti Myös tarpeet, suunnitelmat ja toiveet esiin
Kohti kehittämishankkeita
Kiitos!
IDA tallennuspalvelu Yhteinen tallennuspalvelu tutkimuksen digitaalisten tietoaineistojen säilyttämiseksi ja uudelleenkäytön lisäämiseksi Tietoaineistojen ja metatiedon turvallinen säilytys Datan säilyminen eheänä ja muuttumattomana turvataan kopioiden ja niiden eheyden hallinnalla
IDA palvelulupaus Palvelu takaa aineistojen säilyvyyden vähintään vuoden 2017 loppuun asti. Tähän mennessä selvitetään, jatketaanko tätä säilytystapaa vai hoidetaanko säilyttäminen uudella ratkaisulla. Palvelun käyttäjän ei tarvitse tässä vaiheessa erikseen huolehtia tietojen siirrosta. Palvelu takaa vähintään yhteensä 3 petatavun kapasiteetin palvelussa. Aineistoja palveluun siirrettäessä niihin liitetään automaattisesti minimimetatietoja. Käyttöosuuksien mukaisesta käytöstä ei tänä aikana koidu käyttäjille kustannuksia. Aineistojen omistajat päättävät itse niiden avoimuudesta ja käyttöpolitiikasta. Aineistojen omistajuus- ja tekijänoikeusasioiden selvittämistä ennen aineistojen siirtoa palveluun suositellaan voimakkaasti. Vuoden 2017 jälkeen aineistojen säilytys vaatii minimimetatietoja laajempia kuvailutietoja.
TTA-hankkeen piiriin kuuluvat tietoaineistot Suomen Akatemian tutkimusrahoituksen (akatemiahankkeet, huippuyksiköt, tutkimusohjelmat) sekä tutkimusympäristörahoituksen (tutkimusinfrastruktuurit) projektien tuottamat tietoaineistot Alussa 1 PT tallennuskapasiteetti Soveltuvin osien korkeakoulujen, ammattikorkeakoulujen ja tutkimuslaitosten tuottamat aineistot Alussa yhteensä 1 PT tallennuskapasiteetti Erillisrahoitetut ESFRI-hankkeet (esim. BBMRI, CLARIN) Yhteiskuntatieteellisen tietoarkiston aineistot Soveltuvin osin säätiöiden ja SHOK-yhteistyön piirissä olevat aineistot
TTA-palvelut IDA : tallennuspalvelu tutkimuksen digitaalisten tietoaineistojen (jatkossa data) säilyttämiseksi ja uudelleenkäytön lisäämiseksi. Ida mahdollistaa tutkimuksen tuottamien tietoaineistojen ja niihin liittyvän metatiedon turvallisen säilytyksen. Datan säilyminen eheänä ja muuttomattona sekä asiakkaan helposti saatavilla on palvelun ensisijainen tavoite. Säilytettävän datan muuttumattomuus turvataan kopioiden ja niiden eheyden hallinnalla. Suomen Akatemian hankkeet Erityishan kkeet, mm. ESFRIt Käyttöoike us Korkeakou lujen tietoaineis tot SA hankkeet 1 PB ESFRIt, FSD, pilotit ja lisäosuudet 1 PB TTApalveluihin Korkeakoulut 1 PB
KATA aineistokatalogi helpottaa tutkimuskäyttöön saatavilla olevien aineistojen löytämistä tuottaa tietoa aineistojen olemassaolosta rahoittajille mahdollistaa yhtenäisen käyttöehto- ja käyttöoikeuskulttuurin luomisen (omistajuus- ja hyödyntämisoikeustiedot aineistokatalogiin) mahdollistaa meriitin syntyminen tutkijalle auttaa tunnistamaan ja löytämään tietoaineistoja pitkäaikaissäilytykseen
IDA-KATA
Pitkäaikaissäilytys Inaktiivinen vaihe, säilytys IDA Luonti ja aktiivikäyttö Tutkimuksen tietoaineistopyramidi Julkaisu ja siihen liittyvä data Koosteet ja tulkinnat Datakokoelmat ja tietokannat Raakadata Pysyvää 2 5 % Väliaikaista 95-98%