Metsäntutkimuslaitoksen tutkimusaineistojen tietoarkkitehtuurin konsultointi



Samankaltaiset tiedostot
JHS 179 Kokonaisarkkitehtuurin suunnittelu ja kehittäminen Liite 4. Soveltamisohje perustason kuvauksien tuottamiseen

Tekijän nimi

KANSALLISEN DIGITAALISEN KIRJASTON KOKONAISARKKITEHTUURI. V3.0 Tiivistelmä

Tampereen kaupungin paikkatietostrategia Tampereen kaupunki

Yhteentoimivuusvälineistö

Kansallinen digitaalinen kirjasto Kokonaisarkkitehtuuri v3.0

Tutkimusaineistoprojektin loppuraportti / 32

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Julkisen hallinnon kokonaisarkkitehtuuri JHKA

Name in English Knowledge based data services -improving the life cycle and accessibility of environmental data provided for public interest

JHS 179 ICT-palvelujen kehittäminen: Kokonaisarkkitehtuurin kehittäminen Liite 2 Arkkitehtuurikehyksen kuvaus

KDK-ajankohtaispäivä museoille

- Korkeakoulutuksen ja tutkimuksen (linkitetty) tietomalli

AVOIN DATA AVAIN UUTEEN Seminaarin avaus Kansleri Ilkka Niiniluoto Helsingin yliopisto

JHS 179 ICT-palvelujen kehittäminen: Kokonaisarkkitehtuurimenetelmä

Yhteentoimivuusalusta ja sen hyödyntäminen kuntien/maakuntien taloushallinnossa Petri Tenhunen, VRK

Digitoinnin laadun ja taloudellisuuden puolesta!

LIFEDATA - PAREMPAA PALVELUA ASIAKKAILLE JA TIEDON KÄYTTÄJILLE

Avoimuus ja julkisen hallinnon tietohallinto. Yhteentoimivuutta avoimesti -seminaari Tommi Oikarinen, VM / JulkICT

Kuntasektorin asianhallinnan viitearkkitehtuuri 1.0. Kuntamarkkinat Tuula Seppo, erityisasiantuntija

Yhteinen kansallinen koodistopalvelu ( Suomi.fi koodistopalvelu )

Yhteentoimivuutta kokonaisarkkitehtuurilla

ICT-palvelujen kehittäminen - suositussarja Suvi Pietikäinen Netum Oy

JHS 179 Kokonaisarkkitehtuurin suunnittelu ja kehittäminen Liite 3. Arkkitehtuurin nykytilan ja tavoitetilan kuvaus

PALVELUITA DATANHALLINTAAN

Oppijan palvelukokonaisuus. Tietomallinnuksen laaja katselmointi

Julkisen hallinnon kokonaisarkkitehtuuri

Tietopolitiikan valmistelun tilanne O-P Rissanen JUHTA

TUTKIMUSDATAN KUVAILU. Kuvailun tiedotuspäivä Tieteenala-asiantuntija, FT Katja Fält

Suomi.fi-palvelutietovaranto

Korkeakoulujen tietohallinnon kehittäminen: tiedon yhteismitallisuus ja järjestelmien yhteentoimivuus. Johtaja Hannu Sirén

Opetustoimen sanastotyö. Toimialan tietohallinnon yhteistyökokous Ritva Sammalkivi

YHTEENTOIMIVUUS Mikael Vakkari Tiedonhallintapäällikkö

Kokonaisarkkitehtuurin kehittäminen Satu Pajuniemi. Conversatum Oy

Kokonaisarkkitehtuuri julkisessa hallinnossa 2016

Julkisen hallinnon kokonaisarkkitehtuurijaoston työsuunnitelma 2014

REKISTERI- JA TIETOKANTA-AINEISTOJEN SIIRTÄMINEN VAPA-PALVELUUN

Yhteentoimivuusalusta ja Sanastot-työkalu

Keskustelutilaisuus ICT-palvelujen kehittäminen -suositussarjasta

Sisällönhallinnan menetelmiä

FAIRDATA-PALVELUT. CSC Suomalainen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon ICT-osaamiskeskus. Anssi Kainulainen / CSC

TIETOHALLINTOLAKI (LUONNOS) Korkeakoulujen IT-päivät Erityisasiantuntija Olli-Pekka Rissanen

Tietojärjestelmät muutoksessa: Alueiden ja kuntien sote - kokonaisarkkitehtuurityö

Yhteentoimiva.suomi.fi - palvelukokonaisuuden ja työkalujen esittely

Kansallinen Palvelutietovaranto (PTV)

JHS 193 Paikkatiedon yksilöivät tunnukset Liite 1. URI:n muodostamisen prosessi

JHS 179 ICT-palvelujen kehittäminen: Kokonaisarkkitehtuurimenetelmä

Suvi Remes Miika Alonen Petri Mustajoki Totti Tuhkanen

Espoon arkkitehtuurin kehittäminen - Tiedonhallinta ja arkkitehtuuri kaupungin näkökulmasta

Tietopolitiikka Yhteentoimivuus ja lainsäädäntö , Sami Kivivasara ICT-toimittajien tilaisuus

KAM-sektori paikkatiedon kansallisessa ekosysteemissä. Mikko Lappalainen Nimitietopalvelua ja paikkatietopalvelua koskeva seminaari, 30.1.

JHS XXX ICT-palvelujen kehittäminen: Kokonaisarkkitehtuurimenetelmä

JHS 179 Kokonaisarkkitehtuurin suunnittelu ja kehittäminen Liite 2. Liiketoimintamallit ja kyvykkyydet KA-suunnittelussa

Yhteentoimivuus. Mikael Vakkari Neuvotteleva virkamies VM / JulkICT. Kohti yhteentoimivaa metatietoa

Tutkimusdatan hallinnan kansalliset välineet IDA, Etsin, AVAA. Stina Westman, ATT-hanke, CSC

Tiina Tuurnala Merenkulkulaitos. Paikkatietomarkkinat Helsingin Messukeskus

Tietohuollon kehittäminen ja kansallinen ohjaus. Kuntien paikkatietoseminaari Tommi Oikarinen, VM / JulkICT

Metatiedot lainsäädäntötiedon hallinnassa

PALVELUKUVAUS järjestelmän nimi versio x.x

Paikkatietojen tietotuotemäärittely

Sosiaalihuollon kokonaisarkkitehtuuri

Sähköinen säilyttäminen

Tutkimuksen pitkäaikaissaatavuuden palvelukokonaisuus

Uusi kansallinen palvelu tehostamaan SoTetutkimusta. Jaana Sinipuro, Projektijohtaja

Digitaalisen maailman mahdollisuudet OKM:n kirjastopäivät Minna Karvonen

Julkisen hallinnon kokonaisarkkitehtuuri

Arkkitehtuuri käytäntöön

Valtion taloushallinnon kokonaisarkkitehtuuri

Metatiedot organisaatioiden sisällönhallinnassa

Kuntien digitalisaation kannustin

Paikkatietojen tietotuotemäärittely

Sote-palveluhakemisto-projekti. Projektiryhmän kokous

Mikä on avoimen tuotteen hallintamalli perustiedot ja taustoitus. Jukka Kääriäinen, Tapio Matinmikko, Raija Kuusela

Yhteentoimivuus - kattaa strategisen, lainsäädännnöllisen, organisaatioiden välisen, semanttisen ja teknisen yhteentoimivuuden

Yhteentoimivuutta edistävien työkalujen kehittäminen

Millainen julkinen tietoarkkitehtuuri Suomessa tarvitaan?

Yhteentoimivuuden eri näkökulmat

Valtion raportoinnin ajankohtaiskatsaus

Yhteinen tiedon hallinta -kärkihanke

PALVELUITA AINEISTOJEN HALLINTAAN

TAPAS - puheenvuoro - TAPAS-päätösseminaari Tommi Oikarinen, VM / JulkICT

Koodistoeditorin tavoitteet ja tilannekatsaus

LifeData Luonnonvaratiedon avoimuus uusien ratkaisujen lähtökohtana. Sanna Marttinen (LYNET) Riitta Teiniranta (SYKE) Eero Mikkola (Luke)

Tiedonhallintalakiehdotus tiedonhallinnan kuvaukset

KAM-sektori yhteisen tiedon hallinnan edelläkävijänä. KDK-tietoarkkitehtuuriryhmän seminaari Jaana Kilkki, Kansallisarkisto

JHS 179 suosituksen uudistamishanke Suositusluonnoksen ja liitteiden esittely Keskustelutilaisuus Kansallismuseon auditorio

Avoimen tieteen ja tutkimuksen edistäminen periaatetasolta käytännön toimiin

Kuntien digitalisaation kannustinjärjestelmä

Korkeakoulujen yhteentoimivuusmalli

JHS 156 suosituksen päivitys

JULKISEN HALLINNON SÄHKÖISEN ASIOINNIN VIITEARKKITEHTUURI. Kuntaliitto Hannu Ojala Neuvotteleva virkamies/julkict

Yhteentoimivuus ja tiedonhallintalaki

Kokemuksia kokonaisarkkitehtuurityöstä

ATT-viitearkkitehtuuri

Varda varhaiskasvatuksen tietovaranto

Avoin tiede ja tutkimus TURUN YLIOPISTON DATAPOLITIIKKA

Näkökulmia yhteentoimivuuteen

Transkriptio:

Metsäntutkimuslaitoksen tutkimusaineistojen tietoarkkitehtuurin konsultointi Metsäntutkimuslaitos sivu 1/32

Sisällysluettelo 1 Tiivistelmä...3 2 Johdanto...5 3 Tiedon hallinnan tavoitetila...6 4 Tietoarkkitehtuurin nykytilan haasteita...7 5 Aineistojen hallinnan nykytila ja haasteet... 11 5.1 Aineistojen tallennusmuodot... 11 5.2 Aineistokokonaisuus käsitteenä... 12 5.3 Aineistojen ja aineistokokonaisuuksien väliset suhteet... 14 5.4 Aineistojen metatietojen kuvaaminen... 15 5.5 Yhteensopimattomat käsite- ja tietomallit... 15 6 Tietoarkkitehtuurin kehittämisen tavoitteita... 16 6.1 Käsitteistön yhtenäistäminen... 16 6.2 Käsite- ja tietomallien kehittäminen yhtenäisellä tavalla... 18 6.3 Aineistojen ja muiden kohteiden kuvaamisen kehittäminen... 18 6.4 Tiedon löydettävyyden parantaminen... 20 7 Käsite- ja tietomallinnus...22 7.1 Karkean tason käsitemalli...22 7.2 Tarkemman tason käsite- ja tietomallit... 22 8 Kehityssuunnitelma...23 8.1 Kehitysskenaarioita...23 8.1.1 Piilossa olevat aineistot... 23 8.1.2 Aineistoja ei voida yhdistää... 23 8.1.3 Henkilösidonnaisuus... 24 8.1.4 Eläköityminen...24 8.2 Pidemmän aikavälin tiekartta... 24 8.3 Välittömät jatkotoimenpiteet... 25 8.3.1 A. Organisaatiotasoinen strateginen kehitystyö... 25 8.3.2 B. Tiedon tallennuksen ja mallinnuksen kehittäminen... 25 8.3.3 C. Tiedon löydettävyyden kehittäminen... 26 9 Yhteenveto...26 10 Liitteet...27 sivu 2/32

1 Tiivistelmä Metlan tiedon hallinta on suurien haasteiden edessä. Metlassa on kerätty ja tuotettu dataa ja jalostettu aineistoja vuosikymmenien ajan. Tuona aikana organisaatiossa on syntynyt monia erilaisia tapoja tiedon hallintaan ja säilyttämiseen. Suurin osa datasta tallennetaan nykyään sähköisessä muodossa. Dataa kuvailevaa tietoa on tallennettu lisäksi tiedostoihin ja mappeihin. Suuret haasteet kohdistuvat ennen kaikkea tiedon säilytykseen, löytymiseen ja uudelleenkäyttöön. On ratkaistava, miten tulevaisuudessa pystytään hyödyntämään olemassa olevien ja uusien tietovarantojen sisältämä tietopääoma sekä tutkimuksessa että palveluissa. Metlan työskentelykulttuuri on ohjannut siihen, että yksittäiset tutkimusryhmät ja - hankkeet ovat kehittäneet omia tapojaan tiedon hallintaan. Tämä on saattanut olla tehokkainta ryhmän tai hankkeen näkökulmasta, mutta kulttuuri ei ole edistänyt tiedon hallintaa Metlassa kokonaisuudessaan parhaalla mahdollisella tavalla. Sähköisessä muodossa oleva data, jalostettu tieto ja aineistot olisi mahdollista saattaa kaikkien tietoa tarvitsevien saataville. Tämä ei kuitenkaan tapahdu automaattisesti, vaan edellyttää yhteisiä linjauksia, menetelmiä ja välineitä. Työskentelykulttuuria tulisikin muuttaa asteittain siten, että Metlan tietopääoma on tehokkaasti koko organisaation käytössä. Tutkimusaineistojen hallinnan kehittämisessä korostuvat tietojen säilyvyys, löydettävyys ja uudelleenkäytettävyys. Työn perusteet ja suuntaviivat on luotu Tutkimusaineistoprojektissa (2009/2010). Metlalla on erinomaiset mahdollisuudet kehittyä aktiiviseksi palveluja tarjoavaksi organisaatioksi, jonka tietovarannot ovat tehokkaasti löydettävissä ja käytettävissä sekä tutkimustyön pohjaksi että asiakkaiden monipuoliseen palveluun. Tulevaisuuden mahdollisia skenaarioita ovat: Metlan työskentelykulttuuri ohjaa tietojen keskitettyyn hallintaan ja jakamiseen sekä yhteistyön lisääntymiseen. Kaikki sellainen aineisto, jota ei ole erikseen käyttöoikeuksin rajoitettu, on vapaasti saatavilla ja helposti löydettävissä. Tiedon hallinnan menetelmät, linjaukset ja työkalut mahdollistavat datan ja aineistojen tehokkaan yhdistelyn ja kokoamisen. Resurssoimalla riittävästi tiedon hallinnan tukitoimintoihin (esim. data managerit) tutkijat on vapautettu ydintehtäviinsä. Tutkijoiden ja tiedon hallinnan asiantuntijoiden yhteistyönä tärkeimmät olemassa olevat aineistot on kuvattu ja ne hallitaan keskitetysti. Vuosikymmenten aikana syntynyt hiljainen tieto on saatu paremmin talteen. Skenaarioiden pohjalta voidaan esittää kehittämistä ohjaava tiedon hallinnan tavoitetila: Metlan sisäinen tiedon hallinta on järjestetty tukemaan tiedon jakamista Metla tarjoaa aktiivisesti tietoa sisäisille ja ulkoisille asiakkailleen Metla vastaa tehokkaasti yhteiskunnan tieto- ja palvelutarpeisiin sivu 3/32

Tavoitetilaan pyrkiminen edellyttää, että toimintakulttuuri muuttuu tiedon avoimuutta suosivammaksi. Osa tiedosta on tulevaisuudessakin luottamuksellista, salassa pidettävää tai muista syistä käyttörajoitettua. Tällöin tiedon käyttöoikeudet tulee määritellä voimassaolevan aineistopolitiikan mukaan. Tietoarkkitehtuurissa kuvataan nykytilan haasteet ja esitetään toimenpiteet, joihin tulee ryhtyä tavoitetilaan pääsemiseksi. Raportissa esitetään sekä pidemmän aikavälin tiekartta että välittömät jatkotoimenpide-ehdotukset. Toimenpiteet on jaettu kolmeen luokkaan niiden luonteen mukaan. Luokkaan A kuuluvat organisaatiotasoiset, laitostasoisia ratkaisuja ja rakenteita edellyttävät kehityskohteet. Luokassa B ovat tiedon säilytykseen ja hallintaan liittyvät toimenpiteet ja luokassa C tiedon löydettävyyttä parantavat toimenpiteet. Projektiryhmä ehdottaa seuraavia välittömiä jatkotoimenpiteitä. A. Organisaatiotasoinen kehitystyö (Vastuu: Laitoksen johto) Aineistopolitiikka otetaan käyttöön ja se ohjaa tiedon hallinnan kehittämistä. Palvelukartan laatiminen/päivittäminen käynnistetään. B. Tiedon tallennuksen ja mallinnuksen kehittäminen (Vastuu: Tutkimusaineistokantojen tietoarkkitehti) Aineistotietokantojen ja horisontaalisten tietovarantojen suunnittelu- ja toteutustyötä jatketaan siten, että yhteisen tietoympäristön yhteensopivuudesta ja tiedollisesta eheydestä huolehditaan. Aineistopalveluiden toimintaprosessien ja tehtävänkuvauksien olemassa olevat rakenteet kuvataan ja niitä kehitetään tarpeen mukaan. o Kaikelle tiedolle määritellään tietovastuullinen. o Yksi tieto sijaitsee pääsääntöisesti yhdessä paikassa (ns. master data). o Data manageri -rooli kuvataan. Käsite- ja tietomallinnuskoulutusta jatketaan ja linjatut mallinnusvälineet otetaan käyttöön. Käsite- ja tietomallinnuksen dokumentointitavat linjataan ja otetaan käyttöön, jotta tehtyä työtä voidaan hyödyntää jatkossa. C. Tiedon löydettävyyden kehittäminen (Vastuu: Tutkimusaineistojen hakupalvelujen arkkitehti) Aineistokartoituksen tulokset dokumentoidaan ja tehdään johtopäätökset jatkokehittämisestä. Ontologioiden kuvaaminen aloitetaan ja karkean tason käsitemallien kuvaamista jatketaan. Dynaamisen aineistokokonaisuuden käsite määritellään ja aineistokokonaisuuden muodostamisen kriteerit kuvataan. Tiedonhakuratkaisu (vertikaalipilotti) määritellään ja rajataan kuvattujen käsitemallien ja ontologioiden pohjalta. sivu 4/32

2 Johdanto Metsäntutkimuslaitoksen (Metla) tietoarkkitehtuurin kehittäminen on osa Tutkimusaineistoprojektia. Tietoarkkitehtuurin kehittämisprojektin tavoitteena on ollut kehittää tutkimusaineistojen tietoarkkitehtuuria. Pitkän aikavälin tavoite on saattaa olemassa oleva tutkimusaineisto sähköiseen muotoon ja viedä olemassa oleva sekä tulevaisuudessa kerättävä aineisto aineistokokonaisuuksittain sopiviin aineistotietokantoihin ja dokumentoida aineisto. Vertikaalisten aineistotietokantojen lisäksi tietoa tallennetaan horisontaalisiin tietokantoihin, kuten koerekisteri (Kuva 1). Yksi keskeinen kehittämisen kohde onkin määritellä ja kuvata aineistokohtaisten ja yleisten horisontaalisten tietokantojen välisiä suhteita. Kuva 1. Horisontaaliset ja vertikaaliset aineistotietokannat Tutkimusaineistojen hallinnan kehittämisessä korostuvat tietojen säilyvyys, löydettävyys ja uudelleenkäytettävyys. Tietoarkkitehtuurilla on keskeinen rooli kehitystyössä. Yhtenäistetyt sanastot, koordinoidut käsite- ja tietomallit, kurinalainen metatietojen kuvaaminen ja tiedon jakamiseen kannustava aineistopolitiikka yhdessä luovat edellytyksiä yhä tehokkaammalle ja laadukkaammalle tutkimustyölle. Tutkimusaineistojen tietoarkkitehtuurin kuvaamisen lähtökohtana on pidetty kokonaisarkkitehtuurimenetelmää ja sen sisältämiä kuvaustapoja. Menetelmän mukaan organisaation tietojen tulee tukea toimintaa, prosesseja ja palveluja. Osana kokonaisarkkitehtuuria tulisi kuvata myös ne tietojärjestelmät ja teknologiat, joilla tietojen hallinta käytännössä järjestetään. Tässä projektissa on keskitytty yksinomaan tietoarkkitehtuuriin. Muihin kokonaisarkkitehtuurin osa-alueisiin viitataan mahdollisina jatkokehittämisen kohteina. sivu 5/32

Tietoarkkitehtuuria tarkastellaan sekä ylhäältä alas että alhaalta ylös. Tavoitteena on toisaalta tunnistaa ja jäsentää Metlan tärkeimpiä aineistokokonaisuuksia ja niiden välisiä suhteita. Lisäksi on aloitettu karkean tason käsitteiden kuvaaminen, minkä tarkoituksena on linjata eritasoista käsitemallinnusta yhtenäisesti. Toisaalta tavoitteena on kehittää käsite- ja tietomallinnusta, jotka tukevat konkreettisia tietokantatoteutuksia. Raportissa esitellään aineistojen hallinnan ja tietoarkkitehtuurin nykytilaa ja siihen liittyviä haasteita. Raporttiin on haasteiden perusteella kirjattu tärkeimpiä kehittämiskohteita ja esitetty miten kehittäminen on jo laitostasolla tai Tutkimusaineistoprojektissa aloitettu. Raportissa on dokumentoitu projektin aikana pidetyt koulutustilaisuudet sekä projektissa laaditut karkean tason käsitekartat. Raportti sisältää myös kehityssuunnitelman, jossa on kuvattu sekä pidemmän aikavälin kehittämisen tiekartta että ehdotukset välittömiksi jatkotoimenpiteiksi. 3 Tiedon hallinnan tavoitetila Tietoarkkitehtuurin kehittämisellä tavoitellaan tiedon tehokkaampaa hallintaa ja luodaan edellytyksiä tiedon monipuoliselle hyödyntämiselle. Tiedon hallinnan tavoitetila vuoteen 2015 mennessä voidaan tiivistää seuraavasti: Metlan sisäinen tiedon hallinta on järjestetty tukemaan tiedon jakamista Metla tarjoaa aktiivisesti tietoa sisäisille ja ulkoisille asiakkailleen Metla vastaa tehokkaasti yhteiskunnan tieto- ja palvelutarpeisiin Tavoitetilassa Metlan sisäinen tiedon hallinta on järjestetty siten, että se tukee tiedon säilymistä, jakamista ja löytymistä. Yhteiskäyttöisten tietojen tulee olla helposti löydettävissä ja saatavissa tietojärjestelmistä ja aineistotietokannoista. Tämä on edellytys sille, että tutkimus voi hyödyntää tehokkaasti olemassa olevaa tietoa. Tieto (tutkimusaineistot) on tutkimusorganisaation tärkein pääoma asiantuntevan henkilöstön ohella. Tutkijoiden välistä yhteistyötä ja tiedon jakamista tulee tukea tiedon hallinnan keinoin. Tulevaisuudessa Metla tarjoaa aktiivisesti tietoa sisäisille ja ulkoisille asiakkailleen. Tavoitteena on, että tietoa tarjoillaan asiakkaiden tarpeiden mukaisissa kokonaisuuksissa. Tämä edellyttää asiakkaiden tarpeiden entistä tarkempaa huomiointia ja palvelujen kehittämistä tarpeiden mukaisiksi. Toimintakulttuuria tulee kehittää suosimaan tietojen jakamista keskeisten yhteistyökumppaneiden kanssa. Metla vastaa tehokkaasti yhteiskunnan tieto- ja palvelutarpeisiin viranomaistehtäviensä velvoittamana. Metlan palvelujen tulee täyttää ne lakisääteiset velvollisuudet, jotka sillä on toimialastansa vastaavana viranomaisena. Kehittämisen toimenpiteet tulee suunnata siten, että tietovarannot ja tietopääoma ovat avoimesti ja vaivattomasti saatavilla niitä käyttäville. Tavoitetilaan pyrkiminen edellyttää, että toimintakulttuuri muuttuu asteittain tiedon sivu 6/32

avoimuutta suosivaksi. Tiedon avoimuudella tarkoitetaan sitä, että lähtökohtaisesti tutkimustyössä syntyvä data ja jalostettu tieto jaetaan koko yhteisön hyödynnettäväksi. Tämä ei tarkoita kaiken datan jakamista rajoituksetta. Luottamuksellisen, salassa pidettävän ja muilla perusteilla rajoitetun tiedon käyttöoikeuksista tulee huolehtia. Päälinjat tiedon julkisuudesta, saatavuudesta ja käyttöoikeuksista määritellään aineistopolitiikassa. Metlan ydinprosessit ovat tutkimus- ja kehittämispalvelut sekä tiedon ja teknologian siirto sekä viranomaispalvelut. Ydinprosessien laadun parantaminen edellyttää tiedon hallinnan ja tietoarkkitehtuurin kehittämistä aineistopolitiikan ja palvelukartan ohjaamana seuraavasti. Tiedon säilyminen ja aineiston dokumentointi tulee turvata Metlan tietovarantojen tulee olla aineistopolitiikan linjaamalla tavalla asiantuntijoiden käytössä Metlan tulee tarjota tietointensiivisiä palveluja asiakkailleen tehokkaasti, asiakkaiden tarpeista lähtien ja asiakkaan ymmärtämällä kielellä Tiedon jakamista tulee kehittää tutkijoiden ja tutkimushankkeiden välillä sekä yhdessä kumppanien ja sidosryhmien kanssa Tutkimuksen ja kehittämisen kannalta oleellisen aineiston tulee olla löydettävissä ja saatavissa sekä tunnettuihin että ennakoimattomiin tutkimuskohteisiin Olemassa olevaa tietoa tulee pystyä aikaisempaa tehokkaammin uudelleen käyttämään Tiedon hallinnan keinoin tulee varmistaa, että oikea tieto on saatavilla oikeassa paikassa oikeaan aikaan 4 Tietoarkkitehtuurin nykytilan haasteita Projektin alussa järjestettiin haastattelukierros, jossa selvitettiin tietoarkkitehtuuriin ja aineistojen hallintaan liittyviä suurimpia haasteita ja tärkeimpiä kehittämiskohteita. Kartoitusta varten haastateltiin 10 osapuolta, jotka on lueteltu alla. Koerekisteri (Jyrki Koivuniemi, Jorma Nykänen, Sointu Virkkala) Metsägenetiikan ja metsän jalostuksen tietokanta (Matti Haapanen, Leena Yrjänä, Arto Aalto) Maantutkimus (Hannu Ilvesniemi, Mikko Kukkola, Anna Saarsalmi, Pekka Tamminen, Martti Lindgren, Markku Tamminen, Pasi Aatsinki) Suontutkimus (Hannu Hökkä, Timo Penttilä, Markku Tamminen, Inkeri Suopanki, Mikko Moilanen, Marja-Leena Piiroinen) Inka/Tinka/Sinka ja Puuntuotostutkimus (Merja Aro, Sauli Valkonen, Harri sivu 7/32

Mäkinen, Timo Siitonen, Tapio Huttunen) VMI -aineistot (Kari T. Korhonen, Sakari Tuominen) Sosioekonomisia aineistoja (metsänomistajatutkimus) ja luonnon virkistyskäyttö (Heimo Karppinen, Marko Neuvonen) Metsäeläintieteelliset aineistot; Heikki Henttosen (myyrä) aineistot (Heikki Henttonen, Juha Siitonen, Antti Pouttu) Tilastopalvelu (Esa Ylitalo, Martti Aarne) Tietohallinto (Olavi Kurttio, Jukka Pöntinen, Pauli Leppänen) Alle on luetteloitu keskeisimmät tunnistetut haasteet. Kunkin haasteen kohdalle on kirjattu ne toimenpiteet, jotka on jo aloitettu laitostasolla tai Tutkimusaineistoprojektissa tai joihin tulisi ryhtyä. Tarkempi kuvaus haastattelun tuloksista löytyy projektin väliraportista. Aineistopolitiikan määrittely Haaste: Metlassa kehitetään parhaillaan aineistopolitiikkaa. Aineistopolitiikassa kuvataan pelisäännöt, jotka linjaavat muun muassa tietojen jakamiseen, avoimuuteen ja käyttöoikeuksiin liittyviä kysymyksiä. Toimenpiteet: Aineistopolitiikka valmistuu 2010 aikana. Prosessien/palveluiden ja tietotarpeiden yhteydet Haaste: Tyypillinen tietoarkkitehtuurin kuvausmenetelmä on prosessien ja niiden tietotarpeiden välisten yhteyksien kuvaaminen. Kuvaustavan edellyttämiä määrämuotoisia prosessikuvauksia on laadittu varsin vähän. Prosessien kuvaamisella olisi mahdollista tunnistaa yksityiskohtaisia tietotarpeita tehokkaammin. Prosessikuvaukset voisivat toimia myös toiminnan kehittämisen pohjana. Tietotarpeita voidaan kartoittaa myös tunnistamalla organisaation keskeiset palvelut ja kuvaamalla ne palvelukarttana. Palveluiden kartoittamisessa painottuvat asiakkaiden tarpeet. Toimenpiteet: Ehdotetaan, että Metlan palvelut kartoitetaan ja määritellään palvelukarttana. Palveluiden tietotarpeet analysoidaan. Tunnistetut tietotarpeet luovat pohjan aineistokokonaisuuksien määrittelylle ja tietojen yhdistämiselle ja koostamiselle aineistotietokannoista. Palveluiden kartoittaminen ja kehittäminen koskee koko organisaatiota, joten se on laitostasoinen strateginen tehtävä. Tiedon hankinnan koordinointi Haaste: Ulkopuolisten aineistojen tietotarpeita ei aina koordinoida tarkasti, mikä saattaa johtaa päällekkäisen tiedon hankintaan. Esimerkiksi paikka- ja karttatietoaineistojen hankintaan ja käyttöön tarvittaisiin yhteinen strategia. Toimenpiteet: Hankinta on koordinoitava keskitetysti organisaatiotasolla. Paikkatietoaineiston tallentaminen mahdollistuu koealatasolle saakka Tutkimusaineistoprojek- sivu 8/32

tissa toteutettavan koerekisteriuudistuksen myötä (Koerekisteriosaprojekti). Aineistokokonaisuus -käsitteen määrittely Haaste: Aineistokokonaisuus käsitteenä on epäselvä. Aineistokokonaisuuksien ymmärtäminen samalla tavalla Metlassa on tärkeää erityisesti Metlan palvelujen kehittämisen, tietojen koostamisen ja yhteiskäyttöisyyden sekä metatietojen kuvaamisen kannalta. Toimenpiteet: Työ on aloitettu Tutkimusaineistoprojektiin kuuluvassa Metatiedon osaprojektissa, jossa on käynnistetty aineistokartoitus. Aineistokokonaisuudet voidaan jatkossa käsittää dynaamisina aineistotietokannoista tuotettuina koosteina. Jatkossa tulee kuvata kriteerit ja periaatteet, joilla eri näkökulmista rajattuja aineistokokonaisuuksia voidaan tuottaa. Aineistokokonaisuudet ja niiden väliset suhteet Haaste: Aineistokokonaisuudet ja niiden väliset suhteet tulee kuvata siten, että aineistoja voidaan yhdistää tavoilla, jota ei tiedon keruun ja tuottamisen aikaan ole osattu ennustaa. Toimenpiteet: Aineistokokonaisuudet ja niiden väliset suhteet kuvataan käsite- ja tietomalleilla käyttäen yhtenäistä metatietokuvaustapaa. Työ on aloitettu tutkimusaineistoprojektissa. Yhtenäisen käsitteistön pohjalta kehitettävää kokonaisratkaisua tulisi pilotoida rajatulla kohdealueella. Pilotissa kehitetään kohtuullisella panostuksella tiedon tuottamisen, hallinnan ja hakemisen kattava ratkaisu, jonka perusteella voidaan arvioida mallin toimivuus. Sisällöltään rajatun pilotin (vertikaalipilotti) avulla pyritään todentamaan yhdenmukaisen käsitemallinnuksen hyödyt tietojen hallinnassa ja haussa. Tutkimusaineistojen ja horisontaalisten tietovarantojen väliset yhteydet Haaste: Tutkimushankkeiden ja tieteenalojen tietojen ja horisontaalisten tietovarantojen (esim. koerekisteri) tietojen väliset suhteet (Kuva 1) tulisi kuvata niin, että tiedot ovat yksiselitteisesti löydettävissä ja yhdistettävissä. Toimenpiteet: Työ on aloitettu pilottiaineistojen osalta Tutkimusaineistoprojektin koerekisteriuudistuksessa. Koerekisteri on yksi merkittävimmistä horisontaalisista tietovarannoista Metlassa. Muuttuja-käsitteiden yhtenäistämisellä parannetaan avaintietojen käyttöä tietojen yhdistämisessä. Käsitteiden yhtenäistäminen laajemminkin lisää tietojen vertailukelpoisuutta ja käytettävyyttä eri järjestelmien välillä. Tietojen hajaantunut säilytys Haaste: Verkkolevylle tiedostomuotoon tai tutkijoiden tietokoneille tallennetut tai pelkästään paperimuodossa olevat tiedot ovat riskialttiita häviämään esim. eläköitymisen myötä. Ymmärtämys aineistoista ja niiden yksityiskohtaisesta sisällöstä on henkilösidonnaista. Tiedon hakemisen ja uudelleenkäytön kannalta keskitetyt tietokantapohjaiset ratkaisut ovat kestävämpi ratkaisu. Toimenpiteet: Tieto on tallennettava sähköiseen muotoon. Tallennettava data on sivu 9/32

dokumentoitava siten, että tiedon käyttö ei ole henkilösidonnaista. Datan säilytyksessä siirrytään asteittain keskitettyihin tietokantoihin. Säilytys sekä dokumentointiohjeistukset tulee ajantasaistaa ja dokumentointitavat yhtenäistää. Laatukäsikirjojen ohjeita ja muita aineistonkeruu, -säilytys ja dokumentointiohjeita tulee suunnitella, ylläpitää, kehittää ja noudattaa. Käsite- ja tietomallien osaamisen kehittäminen Haaste: Tietokantojen kehittäminen edellyttää käsite- ja tietomallien kuvaamistaitojen osaamista, ja aineistojen kuvaamista tarkemmalla tasolla (kts. kappale 7). Tietokantojen kehittäjien tulee hankkia soveltuvaa koulutusta. Toimenpiteet: Tutkimusaineistoprojekti on tarjonnut käsite- ja tietomallinnuskoulutusta mallinnuksesta vastaaville henkilöille ja mallinnusväline (sekä sen käyttökoulutus) on ostettu. Lisää tukea ja koulutusta hankitaan tarpeen mukaan. Tarkemman tason mallinnustyö on aloitettu Tutkimusaineistoprojektin osaprojekteista/piloteista, joita ovat Koerekisteri, MaaPuu -kannan aineistot (mm. maan-, suon- ja puuntuotostutkimuksen puustonmittausaineistot) sekä Metsägenetiikan ja Metsänjalostuksen kannan materiaali. Näissä kaikissa kehitetään käytännön tietokantaratkaisuja. Myös muiden aineistojen mallinnustyö on aloitettu (mm. sosioekonomiset aineistot). Master data -mallin kehittäminen Haaste: Tiedon hallintaan tulisi kehittää ns. master data -mallia, jolla tarkoitetaan tiedon tallentamista ja ylläpitoa ensisijaisesti yhdessä paikassa. Tiedon päällekkäinen säilyttäminen ja epäsystemaattinen versiointi saattavat heikentää tiedon laatua ja luotettavuutta. Toimenpiteet: Master data -mallin kehittäminen alkaa määrittelemällä ne tiedot, jotka ovat yhteisiä koko organisaatiolle tai useille osapuolille. Näiden tietojen osalta on linjattava vastuutaho ja konkreettinen tietokanta, jossa kyseinen data hallitaan. Master data tulee huomioida tietokantojen suunnittelun yhteydessä. Käytännön toimenpiteenä aineistopalveluiden toimintaprosessien ja tehtävänkuvauksien olemassa olevat rakenteet kuvataan ja niitä kehitetään tarpeen mukaan. Tietovastuullisten ja tietojen omistajien määrittely Haaste: Osana tietoarkkitehtuurin kehittämistä tulisi määritellä tietojen omistajuudet ja vastuutahot. Kaikilla tietovarannoilla tulisi olla vastuullinen, joka vastaa tietovarannon tietojen laadusta, eheydestä ja ajantasaisuudesta. Toimenpiteet: Tiedon tuottamis- ja tallennusvaiheessa määritellään tiedon tai tietokokonaisuuden vastuutaho. Tiedon vastuutaholla tässä yhteydessä tarkoitetaan yksiselitteisesti nimettyä tahoa, joka omistaa tiedon ja vastaa siitä tiedon elinkaaren eri vaiheissa. Data manageri -roolin määrittely ja resurssointi Haaste: Aineistojen kurinalainen hallinta ja metatietojen kuvaaminen edellyttävät riit- sivu 10/32

täviä resursseja. Data managerin roolissa olevat henkilöt avustavat tutkijoita tietojen tallentamisessa, dokumentoinnissa, käsittelyssä ja hakemisessa. Data manageri on rooli, jossa oleva henkilö tuntee sekä tutkimusaineistoja eli Metlan substanssia että tiedon hallinnan menetelmiä, järjestelmiä ja tekniikoita. Toimenpiteet: Data managerien rooli määritellään osana aineistopalvelujen työnkuvaa, tehtävänään aineistotyö ja aineistotietokantojen ylläpito sekä kehitys. Aineistojen metatiedot Haaste: Metatietojen kuvaamiseen tarvitaan ohjeistusta ja välineitä. Aineistojen kuvailun metatietojen tulee perustua yhtenäistettyihin sanastoihin ja tulevaisuudessa ontologioiden hyödyntämiseen (Taulukko 1). Toimenpiteet: Vuoden 2009 aikana Tutkimusaineistoprojektin metatietoryhmä tutustui eri metatietoformaatteihin, minkä perusteella se valmisteli Metlan tutkimusaineistoille sopivan formaatin. Formaatissa on aineiston yleistiedot, aikaviite sekä aineiston rakenteen, laadun, paikkatiedon, muuttujien, saatavuuden ja itse metatietojen kuvausta yhteensä 36 elementtiä. Sovitun formaatin elementit perustuvat Data Documentation Initiative (DDI) -, Federal Geographic Data Committee (FGDC) ja Ecological Metadata Language (EML) formaatteihin sekä JHS -suosituksiin. Osa metatiedoista on jo olemassa koerekisterissä tai tulevissa aineistotietokannoissa. Aineistojen kartoituksessa käytetään 9 peruselementtiä, jotta kuvaaminen olisi riittävän kevyttä ja kartoitukseen saataisiin osallistuman mahdollisimman monia tahoja. Kartoituksen jälkeen aineisto analysoidaan ja arvioidaan mahdollinen täydentävien tietojen tarve. Sanastotyö on aloitettu. Käsitemalleja on kuvattu osana tietoarkkitehtuurin kehittämistä. Ontologian kuvaaminen ollaan aloittamassa TSK Sanastokeskuksen ja Viikin AFO-ryhmän kanssa. Tavoitteena on, että ensimmäinen versio Metlan metsäontologiasta olisi valmiina syksyllä 2010. Aineistokartoituksessa tunnistetun "aineiston", ontologian ja käsitemallien perusteella suunnitellaan ensimmäinen version semanttisesta hausta. Tiedonhakuratkaisussa arvioidaan, miten haku voidaan ulottaa aineistoihin saakka ja miten erilaiset käsitemallit ja sanastot tukevat toisiaan (ns. vertikaalipilotti). Uuden koerekisterin ja aineistokantojen toteutuessa aineistokartoituksen metatietoja korvataan näiden järjestelmien metatiedoilla. 5 Aineistojen hallinnan nykytila ja haasteet 5.1 Aineistojen tallennusmuodot Tieto on informaatiota, joka voi olla vahvasti tiedostosidonnaista (mm. asiakirjat, kuvat, kartat). Tällaista tietoa nimitetään usein ei-rakenteiseksi tiedoksi. Tieto voi olla myös dataa, jota tutkimuskäytössä irrotetaan tiedostoista ja kootaan kunkin tutkimusasettelun mukaisiksi kokonaisuuksiksi. Tällöin puhutaan rakenteisesta tiedosta. Yksi aineistojen hallinnan keskeisistä päämääristä on edistää tietojen keskitettyä hal- sivu 11/32

lintaa ja vähentää erilaisten tallennusformaattien ja -tapojen kirjoa. Perinteisesti verkkolevyt ja tutkijoiden omat tietokoneet ovat primääridatan pääasiallinen tallennuspaikka. Myös osa jalostetusta ja analysoidusta tutkimustiedosta sijaitsee tutkijoiden omilla tietokoneilla. Verkkolevyratkaisuissa ja tutkijoiden tietokoneissa tietoa säilytetään tiedostomuodossa. Tiedostomuotoinen tutkimusaineisto on tehotonta joustavuutta vaativassa työssä. Yksittäisen tutkijan tai tutkimusryhmän kannalta nämä tiedon tallennusmuodot saattavat olla riittäviä, mutta laajempaa tietojen hyödyntämistä ja uudelleenkäyttöä ne eivät edistä. Aineistojen hallinnassa tulee jatkossa pyrkiä määrämuotoisen tiedon tallentamiseen rakenteisessa muodossa keskitettyihin tietokantoihin. Tietokannassa data on sijoitettu sille suunnitellun tietorakenteen mukaisiin tauluihin, joista hakupalveluiden avulla voidaan poimia ja yhdistellä rajattomasti tietoa aina uusiksi kokonaisuuksiksi. Tämä on välttämätöntä sekä tiedon löytymisen että käytettävyyden kannalta. Erityisesti sellainen tutkimusaineisto, jolla on merkitystä jatkotutkimuksessa ja josta muut tutkimusalueet voisivat hyötyä, tulisi saattaa käytettäväksi. Osa raaka- ja luonnosaineistosta on sellaista, jota ei pidä vaatia avaamaan jatkokäyttöön. Tällaiset tiedot voivat olla luonteeltaan keskeneräisiä luonnoksia, joita ei ole tarkoitettukaan jaettavaksi. Kyseessä voi olla myös sellaisia tietoja, joita tutkija/tutkimusryhmä ei halua jaettavaksi ennen tiettyä ajankohtaa tutkimukseen liittyvistä syistä. Tutkimusaineistotietokantoihin viennin yhteydessä tieto irrotetaan tiedostoista, se tarkastetaan ja dokumentoidaan yksityiskohtaisesti ja sijoitetaan kannan tietotauluihin tietotyypeittäin suureksi tietomassaksi. Tietokantaan siirtämisen yhteydessä aineistokokonaisuudet dokumentoidaan yhteisesti sovitulla metatietostandardilla ja yksittäiset tiedot dokumentoidaan sekä harmonisoidaan mittayksiköiden, esitystapojen, koodistojen, nimistöjen jne. suhteen. Dokumentointi ja harmonisointi ovat edellytys tietojen haulle ja yhdistelylle yksittäisten tutkimusten aineistoa muodostettaessa. Erilaisten hakupalveluiden avulla tietoa voi poimia ja yhdistellä ilman manuaalisia välivaiheita tarpeen mukaisiksi kokonaisuuksiksi. 5.2 Aineistokokonaisuus käsitteenä Aineistokokonaisuus on keskeinen käsite Metlan aineistojen hallinnan ja jakamisen kannalta. Aineistokokonaisuudesta ei ole kuitenkaan ollut olemassa yhtä kaikkien samoin ymmärtämää määritelmää, mikä on aiheuttanut epäselvyyttä käsitteestä puhuttaessa. Tarkkaa kuvaa ei ole myöskään siitä, mitä ja millaisia aineistoja Metlassa on olemassa. Tutkimusaineistoprojektiin kuuluva Metatiedon osaprojekti on käynnistänyt aineistokartoituksen, jonka tavoitteena on ottaa selvää, mitkä ovat Metlan keskeisimmät aineistot, miten niitä hallitaan ja miten ne on kuvattu tällä hetkellä. Kartoituksen tuloksia tullaan hyödyntämään aineistokokonaisuuksien analysoinnissa. Aineistokartoitus on ensiarvoisen tärkeä jo siksi, että siten saadaan käsitys aineistojen laadusta ja sijainnista. Kartoitus on välttämätön myös aineistojen hallinnan jatkotoimenpiteiden suunnittelussa. Kartoituksella on myös yhteiskunnallista merkitystä, sillä vuosien ja vuosikymmenten aikana kerätty tutkimusaineisto on osa kansal- sivu 12/32

lisomaisuutta, jonka säilyvyys on turvattava. On olemassa merkittävä riski, että piilossa olevien ja dokumentoimattomien aineistojen myötä katoaa suuri määrä ns. hiljaista tietoa tutkijoiden ja muiden asiantuntijoiden siirtyessä eläkkeelle. Aineistokokonaisuuden käsitettä voidaan tarkastella myös Metlan asiakkaille tarjottavien palvelujen kautta. Suurin osa palveluista on ns. tietointensiivisiä, eli ne perustuvat olemassa olevan tiedon hyödyntämiseen. Esimerkkejä palveluista ovat koulutus, neuvonta ja viranomaistehtävät. Palveluiden tietotarpeiden tunnistaminen edellyttää palveluiden tunnistamista ja määrittelyä palvelukarttana. Palveluiden tietotarpeet ovat tärkeä lähtökohta aineistokokonaisuuksien määrittelylle. Perinteinen malli sisällön tuottamiseen, hallintaan ja jakeluun on ns. siilomainen malli (Kuva 2). Mallissa jokin hanke, yksikkö tai muu organisaation osa tuottaa ja hallitsee omat tietonsa ja kehittää tiedon jakelukanavat ja -tavat itse. Yksittäisen tahon kannalta ratkaisu voi olla toimiva ja perusteltu, mutta organisaation kokonaisetua ratkaisu ei palvele. Siilomaisuus johtaa useisiin erilaisiin teknisiin ratkaisuihin, päällekkäiseen ylläpitoon, yhteistyön heikkenemiseen ja tietojen uudelleenkäytön vähenemiseen. Kuva 2. Sisällön ja aineistojen tuottaminen, hallinta ja jakelu siiloina Tämän hetkisen näkemyksen mukaan aineistokokonaisuus tulisi mieltää dynaamisesti muodostettavaksi koosteeksi olemassa olevista aineistoista ja tietolähteistä. Tämä edellyttää niiden näkökulmien tunnistamista, joista aineistokokonaisuuksia on mielekästä tuottaa. Yhden lähtökohdan näkökulmien tunnistamiselle tarjoaa edellä mainitut palveluiden tietotarpeet. Toinen tärkeä lähtökohta on Metlan karkean tason käsitekartta ja siinä kuvatut käsit- sivu 13/32

teet. Keskeisimmät käsitteet (esim. Painoala, Tieteenala, Osaamisalue, Tutkimusohjelma, Hanke) edustavat näkökulmia, joiden kautta aineistokokonaisuuksia voi olla hyödyllistä määritellä. Yksinkertaistetusti voidaan sanoa, että tutkimusohjelmat ja - hankkeet tuottavat aineistot, jotka kuuluvat tiettyyn tieteenalaan. Näin ollen aineiston konkreettinen vastuutaho on kyseisen tieteenalan edustaja. Painoalueet ja osaamisalueet voidaan nähdä näkökulmina, joiden kautta tulisi pystyä hakemaan aineistoja tai muodostamaan aineistokokonaisuuksia. Aineistokokonaisuuksien dynaaminen koostaminen edellyttää, että aineistojen metatiedot on kuvattu riittävän kattavasti ja tasalaatuisesti. Aineistokokonaisuuden paketointi halutun näkökulman tai hakukriteereiden mukaan on mahdollista vain, jos aineistojen kuvailutiedot ovat yhdenmukaisia ja perustuvat yhteisiin sanastoihin ja ontologioihin. Hakukoneavusteisen sisällönhallinnan perusmalli kuvaa periaatteet, joiden mukaan dynaamisten aineistokokonaisuuksien luonti on mahdollista (Kuva 3). Tietojen tuottamisen yhteydessä aineistoista tulee kuvata systemaattisesti metatiedot. Aineistot tallennetaan keskitettyihin aineistotietokantoihin. Eri käyttäjille tai käyttäjäryhmille voidaan dynaamisesti poimia tietokannoista erilaisia näkymiä, jotka voivat vastata aineistokokonaisuuksia. Kuva 3. Hakukoneavusteisen sisällönhallinnan perusmalli 5.3 Aineistojen ja aineistokokonaisuuksien väliset suhteet Aineistojen välisiä suhteita keskenään ja suhteessa horisontaalisiin järjestelmiin ei ole aiemmin kuvattu selkeästi. Toisaalta suhteiden kuvaaminen on hankalaa, mikäli aineistoja ei tunneta eikä niitä ole tallennettu yhtenäisin menetelmin. Tämä on aiheuttanut ongelmia tietojen koostamisessa ja yhdistämisessä eri järjestelmien välillä. sivu 14/32

Suhteiden kuvaaminen on aloitettu Tutkimusaineistoprojektissa. Koerekisteriuudistuksen myötä kehitetään koerekisterin ja aineistotietokantojen välistä vastuunjakoa ja yhtenäistetään avaintietojen kuvaamista. Asteittain tarkentuva ja aineistotyypeittäin tapahtuva käsitemallinnus on aloitettu. Mallinnustyö yhtenäistää eri kohdealueiden käsite- ja tietomalleja ja johtaa yhdenmukaisiin tietokantarakenteisiin. Myös muuttujien yhdenmukaistus on aloitettu työryhmätyöskentelynä. Muuttujien yhdenmukaistaminen kattaa muuttujakäsitteiden harmonisoinnin, nimeämisen yhtenäistämisen ja tarvittavien metatietojen kuvaamisen. 5.4 Aineistojen metatietojen kuvaaminen Metatietojen kuvaaminen on aineistojen hallinnan sekä tiedon hakemisen ja koostamisen kulmakivi. Metatiedoilla tarkoitetaan tiedon ymmärrettävyyttä lisääviä, kuvailevia tietoja. Metatietojen kuvaaminen on ollut melko satunnaista eikä ole perustunut yhtenäisiin käytäntöihin ja kuvauspohjiin. Tutkimusaineistoprojektiin kuuluvassa Metatiedon osaprojektissa on suunniteltu metatietojen kuvauspohja. Kuvauspohja tulee ottaa pilotoinnin jälkeen käyttöön. Metatietojen kuvaamisen tulee perustua yhdessä sovittuihin sanastoihin. Sanastojen yhtenäistäminen tarkoittaa käytännössä sitä, että jokin yhteisö harmonisoi jonkin kohdealueen käsitteet ja sopii käsitteitä edustavista termeistä. Harmonisoidut sanastot ovat edellytys luotettavalle tietojen löytymiselle ja yhdistämiselle. Tekstimuotoisista asiasanoista ja sanastoista tulisi siirtyä asteittain konelukuisten ontologioiden käyttöön. Ontologiatyötä johtaa Suomessa FinnONTO-tutkimushanke, jossa on kuvattu sekä yleisiä että erityisalojen ontologioita. Metatiedon osaprojektissa on käynnistymässä pilotti, jossa valitaan kohdealue ja laaditaan sille ontologia. Pilotin jälkeen tulee arvioida ontologisoinnin jatkotoimenpiteet. Sanastojen kehittämisessä tulisi ottaa huomioon koko metsäsektorin intressiyhteisö. Resurssien tehokas hyödyntäminen ja tietojen ja järjestelmien yhteentoimivuus edellyttävät, että sanastojen määrittelyyn osallistuvat myös Metlan keskeiset sidosryhmät. Useat osapuolet jakavat saman käsitteistön, joten olisi kokonaisuuden kannalta hyödyllistä, että osapuolet sopivat yhteisistä käsitteistä määritelmineen. 5.5 Yhteensopimattomat käsite- ja tietomallit Käsite- ja tietomalleja on kehitetty pääasiassa sektori-, järjestelmä- tai tietokantakohtaisesti. Yksittäisen tietokantaratkaisun kannalta tämä on voinut olla toimiva ratkaisu, mutta tietojen yhdistämisen ja vaihtamisen kannalta ongelmallista. Tiedon hallinnan tämän päivän merkittävimpiä kehityssuuntia ovat tietojen yhteiskäyttö ja tiedon hyödyntäminen ennalta suunnittelemattomissa kohteissa. Keskenään yhteensopimattomat käsite- ja tietomallit ovat muodostaneet esteen tietojen tehokkaalle yhdistelylle. Jatkossa tietokantojen suunnittelun tulee pohjautua yhdenmukaisiin käsite- ja tietomalleihin. Käsitemallien määrittelyn tulee alkaa karkeimmalta tasolta, jolla määritellään yleiset sivu 15/32

ylätason käsitteet. Tämä tarjoaa lähtötason, josta voidaan lähteä tarkentamaan alemman tason käsitemalleja. Tarkemman tason käsitemallien tulee perustua karkeamman tason malleihin, jotka takaavat yhtenäisen nimeämisen ja alemman tason mallien yhteensopivuuden. Käsite- ja tietomallinnustyö on aloitettu Tutkimusaineistoprojektiin kuuluvassa Tietohallinnon osaprojektissa. Käsite- ja tietomallinnuskoulutus on aloitettu ja mallinnus on käynnissä. Tavoitteena on ensi vaiheessa mallintaa valitut pilottiaineistot (Maa- Puu -kannan puustonmittausaineisto, Metsägenetiikan ja Metsänjalostus -kannan sisältö), Metlan muut keskeiset aineistot ja koerekisteri yhtenäisellä tavalla. 6 Tietoarkkitehtuurin kehittämisen tavoitteita Tietoarkkitehtuurin kehittämiskohteet vaikuttavat kaikkiin tiedon elinkaaren vaiheisiin (Kuva 4). Seuraavissa luvuissa on nostettu esiin keskeisimpiä kehittämisen kohteita. Kunkin kohteen osalta on esitelty myös niitä toimenpiteitä, joihin on jo ryhdytty käynnissä olevassa Tutkimusaineistoprojektissa ja sen osaprojekteissa. Myös tiedon tuottajien, jalostajien ja käyttäjien roolit on hahmoteltu. Kuva 4. Tietoarkkitehtuurissa kehitettävät tiedon elinkaaren vaiheet ja kehityskohteet* sekä tiedon tuottajien, jalostajien ja käyttäjien roolit elinkaaren eri vaiheissa 6.1 Käsitteistön yhtenäistäminen Käsitteiden määrittelyllä ja yhtenäistämisellä pyritään kehittämään kommunikointia sekä ihmisten että tietojärjestelmien välillä. Hyvin ja täsmällisesti määritellyt käsitteet luovat pohjan semanttiselle yhteentoimivuudelle. Käyttäjän (ihmisen) kannalta käsitteiden määrittely luo perustan sille, että asiat voidaan ymmärtää samalla tavalla Metlan sisällä ja Metlan sidosryhmien kesken. Terminologisella sanastotyöllä tähdätään erikoisalojen (esim. metsäntutkimus) käsittei- sivu 16/32

den määrittelyyn ja sovitaan, mitä termejä käsitteistä on suositettavaa käyttää eri kielillä. Sanastotyön tavoitteena on parantaa viestinnän laatua varmistamalla, että samoista asioista puhutaan samoilla nimityksillä. Järjestelmien kehittämisen kannalta käsitteiden määrittely luo perustan sille, että tietoja voidaan yhdistellä ja vaihtaa järjestelmien kesken. Tavoitteena on, että tiedon merkitys säilyy, kun sitä käytetään muissa kuin sen tuottaneessa järjestelmässä. Käsitteiden konkreettisia teknisiä ilmentymiä ovat esimerkiksi käsite- ja tietomallien luokat ja attribuutit sekä XML-sanomien elementit. Perinteisesti terminologisia sanastoja ja teknisiä käsite- ja tietomalleja on kehitetty eri tekijöiden toimesta eri tarkoituksiin. Ihmisten toiminnassaan käyttämät käsitteet ja tietojärjestelmissä käytetyt käsitteet eivät ole kohdanneet nimeämiseltään tai määritelmiltään. Käsitemäärittelytyö tuleekin aloittaa karkeimmalta tasolta mallintamalla valitun kohdealueen keskeiset ylätason käsitteet käsitekarttoina. Tässä projektissa kohdealueeksi on valittu Metlan tutkimusaineistojen hallintaan oleellisesti liittyvä käsitteistö. Karkean tason käsitekartat muodostavat lähtökohdan sekä keskeisistä käsitteistä viestimiselle ihmisten kesken että tarkemman tason käsitekarttojen ja käsitemallien laadinnalle. Karkean tason käsitemallin tärkeimmät hyödyntämiskohteet ovat: sivu 17/32 1. Lähtökohta tarkemman tason käsitemalleille, tietomalleille ja tietokantarakenteille 2. Tiedon hakua ja yhdistämistä tukevan ontologisoinnin lähtötaso 3. Aineistokokonaisuuksien tunnistamista ja jäsentämistä tukeva malli JUHTA on huhtikuussa 2010 julkaissut suosituksen JHS 175 Julkisen hallinnon sanastotyöprosessi. Suositus linjaa ja ohjeistaa saman käsitteellisen kokonaisuuden jakavien tahojen organisoitumista intressiyhteisöksi käsitteiden teknistä nimeämistä ISO 11179-5 standardin kolmitasoisen nimeämiskäytännön mukaan kunkin käsitteen määrittelyä sovittujen metatietojen avulla ja viemistä keskitettyyn sanastotyövälineeseen (pilottijärjestelmä kehitteillä) Metla yhdessä sen tärkeimpien sidosryhmien kanssa muodostaa intressiyhteisön, jonka tulisi yhdessä määritellä toimialan keskeisiä käsitteitä. Tutkimusaineistoprojektiin kuuluvassa Metatiedon osaprojektissa on aloitettu käsitteiden määrittelytyö. Liikkeelle on lähdetty muuttujien määrittelyjen ja metatietojen kuvaamisesta. Ensi vaiheessa tulee keskittyä käsitteiden ymmärrettävistä nimistä sopimiseen ja käsitteiden määritelmiin. Apuna työssä voidaan käyttää terminologisen sanastotyön asiantuntijoita. Seuraavassa vaiheessa voidaan laatia JHS-suosituksen mukaiset tekniseen nimeämiseen liittyvät yksityiskohdat. Jatkossa tulee arvioida myös, missä vaiheessa käsitteet voidaan viedä julkishallinnon yhteiseen sanastotyövälineeseen eli JHS-metatietokirjastoon.

6.2 Käsite- ja tietomallien kehittäminen yhtenäisellä tavalla Käsite- ja tietomallien kehittämisessä pyritään yhtenäisiin mallintamistapoihin. Yhtenäisten mallien hyötyjä ovat: Käsite- ja tietomallit luovat pohjan yhtenäiselle ja ajantasaiselle tietoarkkitehtuurille sekä tietokantojen kehittämiselle ja ylläpidolle. Yhdenmukainen ja kurinalainen mallintamistapa organisaatiossa edistää osaamisen kehittymistä ja siirtymistä sekä kommunikointia eri osapuolien kesken. Yhtenäinen nimeäminen, yhdenmukaiset tietorakenteet ja keskitetysti sovitut avaintiedot lisäävät mallien ymmärrettävyyttä ja helpottavat tietojen yhdistämistä ja koostamista useista tietojärjestelmistä ja tietokannoista. Standardit kuvaustavat ja -notaatiot lisäävät mallien elinkaarta ja mahdollistavat mallinnus- ja kehitysvälineistä riippumattoman esitysmuodon. Käsite- ja tietomallien kehittäminen on aloitettu Tutkimusaineistoprojektiin kuuluvassa Tietohallinnon osaprojektissa. Käyttäjille on tarjottu koulutusta, mallinnusväline on valittu ja tietokokonaisuuksien mallintaminen on aloitettu hankkeen pilottiprojekteissa. Sisällön asiantuntijat (Data managerit, tutkijat) sekä tekniset asiantuntijat yhdessä huolehtivat vaadittavien mallinnuskuvausten syntymisestä. Mallinnustyön pohjalta suunnitellaan ja kehitetään tietoarkkitehtuurikuvausta sekä tietokantaratkaisuja. Tämä edellyttää, että asiantuntijoille resurssoidaan riittävästi työaikaa mallien laadintaan, arkkitehtuurin suunnitteluun ja tietokantojen kehitykseen sekä ylläpitoon. 6.3 Aineistojen ja muiden kohteiden kuvaamisen kehittäminen Jotta tietoon päästään tehokkaasti ja luotettavasti kiinni, on tieto kuvattava laadukkaasti ja systemaattisesti (Kuva 5). Tutkimusaineistoprojektiin kuuluvassa Metatiedon osaprojektissa ovat käynnistyneet kuvaamisen kehittämiseen liittyvät toimenpiteet. Tiedon tuottaminen käynnistyy keräämällä havaintokohteesta, kuten kokeesta dataa havaintoina ja näytteinä. Havainnoista ja näytteistä kerättävä primääridata tulisi tallentaa tietokantaan ja se pitäisi kuvata systemaattisesti. Primääridataa jalostetaan analyysissä laskentadataksi, joka tulisi tallentaa ja kuvata kuten primääridata. Havaintokohteen yleiset metatiedot tulee tallentaa yhtenäisellä tavalla, kuten kokeiden tiedot koerekisteriin. Tutkimustyössä syntyy runsaasti ei-rakenteista tietoa eli tekstidokumentteja, kuvia, äänitallenteita ja multimediaa. Ei-rakenteisen tiedon hallinta ja löytyminen edellyttää metatietojen kuvaamista kattavasti. Aineisto voi sisältää dataa ja jalostettua tietoa eri muodoissaan. Aineisto itsessään pitää kuvata metatiedoin. Tutkimustyön lopputuotteet ovat tavallisesti julkaisuja, joiden laadinnassa hyödynnetään kaikkea tutkimus- sivu 18/32

prosessin aikana syntynyttä ja tuotettua tietoa ja aineistoja. Taulukkoon 1 on tehty yhteenveto kuvattavista kohteista ja luonnehdittu kustakin kohteesta kuvattavia tietoja. Kuva 5. Tiedon jalostuminen ja kuvauskohteet Käynnissä olevan aineistokartoituksen avulla on tarkoitus saada käsitys siitä, mitä aineistoja Metlassa on, miten aineistoja säilytetään ja miten ne on tällä hetkellä kuvattu. Kartoituksen perusteella tulee päättää, mitkä ovat tiedon karkeustasot, joilla metatietokuvauksia tulisi laatia. Karkeustaso voi vaihdella yksittäisistä tiedoista laajoihin aineistokoosteisiin. Taulukko 1. Kuvattavat kohteet ja niistä kuvattavat tiedot sivu 19/32

Kuvausten yhteismitallisuus edellyttää, että kohteista kuvataan samat metatiedot samoin kriteerein. Tähän tarkoitukseen Tutkimusaineistoprojektiin kuuluvassa metatiedon osaprojektissa on kehitetty metatietojen kuvauspohja, jota tulee käyttää kuvaamisessa. Yhdessä sovittu kuvauspohja ei ole riittävä, mikäli yksittäisten metatietokenttien arvoalueita ei ole määritelty ja täyttämistä ohjeistettu. Valmiit sanastot, koodistot ja automaattisesti generoituvat kenttien arvot ohjaavat yhteismitallisten kuvausten tuottamiseen. Koodistot voivat olla Metlan oman toiminnan tueksi kehittämiä tai yleisiä kansallisia tai kansainvälisiä koodistoja. Tavoitteena on käyttää valmiita ulkoa saatavia koodistoja (esim. kuntakoodit, maakoodit, kielikoodit) aina kun se on tarkoituksenmukaista. Sisältöä kuvaavien asia- tai avainsanojen tulisi perustua määriteltyihin asiasanastoihin. Suositeltavaa on, että toimiala kehittää yhdessä koko toimialan kattavia sanastoja tiedon yhteiskäyttöisyyden edistämiseksi. Sana- ja merkkipohjaisista asiasanastoista ollaan siirtymässä vaiheittain ontologioiden käyttöön. Ontologioiden määrittely lähtee tavallisesti liikkeelle olemassa olevista sanastoista. Ontologioilla määritellään käsitteet ja niiden suhteet. Ontologiat kuvataan merkkauskielillä, jotka ovat koneluettavassa muodossa. Ontologiat mahdollistavat koneellisen päättelyn täsmällisesti määriteltyjen käsitesuhteiden perusteella. Metatiedon osaprojektissa on käynnistymässä pilotti, jossa valitaan kohdealue ja laaditaan siitä ontologia. Suurin haaste metatietojen tuottamisessa on kuvausten tuottamisen resurssointi. Metatietojen laadinta edellyttää ihmistyövoimaa, vaikka apuna käytettäisiin ns. automaattista annotointia tukevia välineitä. Annotointi tarkoittaa tietyn kohteen metatietojen kuvaamista. Metatietojen laadukas tuottaminen edellyttää, että sisällön asiantuntijat (tutkijat, muut asiantuntijat) ja tiedon hallinnan osaajat (Data managerit) yhdessä huolehtivat vaadittavien kuvausten syntymisestä. Tämä edellyttää, että molemmille ammattiryhmille resurssoidaan riittävästi työaikaa metatietokuvausten laadintaan. On myös tärkeää, että metatietojen tuottaminen mielletään ja määritellään oleelliseksi osaksi tiedon elinkaaren hallintaa. Käytännössä tämä tarkoittaa sitä, että tieto tulee kuvailla asianmukaisesti heti tiedon synty- tai tuottamishetkellä tai viimeistään siinä vaiheessa kun tieto jaetaan muiden käyttöön tai siirretään säilytykseen. 6.4 Tiedon löydettävyyden parantaminen Yhtenäiset sanastot, koneluettavat ontologiat ja metatietojen systemaattinen kuvaaminen yhdessä ovat keinoja tiedon löydettävyyden parantamiseen. Mitä et voi löytää, sitä et voi hyödyntää. Tiedon löydettävyyden perusehtoja ovat: Tieto on tallennettu siten, että se voidaan saavuttaa hakuvälineillä sivu 20/32

Tieto on kuvattu siten, että se löytyy luotettavasti käyttäjän antamilla hakukriteereillä Tieto on sellaisessa muodossa, että tiedon hyödyntäjä voi ottaa sen käyttöönsä Luvussa 5.2 esiteltiin aineistokokonaisuuden muodostuminen dynaamisesti aineistojen haku- ja koostamishetkellä. Kuvassa 6 on hahmoteltu kerrosmalli tiedon tarjoiluun eri käyttäjäryhmille. Kuva 6. Tiedon tarjoilu eri käyttäjäryhmille Kerrosmallia voidaan tarkastella ylhäältä alaspäin. Metlan tietojen ja palvelujen käyttäjiä ovat muun muassa yksityishenkilöt, omat ja ulkopuoliset tutkijat, yritykset ja ammatinharjoittajat, oma henkilöstö sekä viranomaiset. Järjestelmä asiakkaana tarkoittaa, että Metlan tietoja voidaan siirtää suoraan jonkin sidosryhmän tietojärjestelmään. Verkossa olevia palvelukanavia ovat julkinen internet (Web) sekä intranet omalle henkilöstölle ja extranet kumppaneille. Palvelukanava voi olla myös suora asiakaskontakti puhelimitse, toimistossa tai kentällä. Tällöin Metlan aineistojen ja tietovarantojen tulee olla asiakaspalvelijan käytössä. Automaattinen tiedonsiirto vastaa tietojen vaihtamisesta tietojärjestelmien välillä. Palvelukanavissa tarjottava tieto perustuu asiakkaan tai muun tiedon käyttäjän määrittelemiin näkymiin. Yksi näkymä voi vastata dynaamisesti muodostettua aineistokokonaisuutta. Näkymien tuottaminen edellyttää tehokasta tiedonhakusovellusta. Palvelunäkymien ja aineistokokonaisuuksien muodostaminen edellyttää metatietojen kurinlaista ja yhtenäistä kuvaamista. Metatietojen kuvaamisessa tulee käyttää keski- sivu 21/32

tetysti määriteltyjä kuvauspohjia. Metatietokenttien arvoalueiden tulee perustua yhdessä sovittuihin sanasoihin ja koodistoihin. Hakusovellus hyödyntää koneluettavia ontologioita semanttiset hakujen toteuttamisessa. Mallin alimmassa kerroksessa ovat aineistotietokannat. Jatkossa tietojen tallentamista määrämuotoiseen, rakenteiseen muotoon tulee lisätä. Myös ei-rakenteinen, tiedostomuotoinen aineisto tulee kuvata metatiedoin, jotta se on löydettävissä. Tiedon haun ratkaisun pilotointi aloitetaan 2010 syksyllä. Ensi sijassa haetaan kokemusta semanttisen webin ontologioiden hyödyntämisestä semanttisten hakujen toteuttamisessa. Projektissa on hahmoteltu myös laajempaa pilotointia, jossa haut kohdistuisivat erityyppisiin sisältöihin ja datoihin. Rajaamalla pilotointi kohdealueeltaan vertikaalisesti voidaan pilotoida teknistä ratkaisua kohtuullisella resurssoinnilla. 7 Käsite- ja tietomallinnus 7.1 Karkean tason käsitemalli Tutkimusaineistoprojektissa on aloitettu karkean tason käsitemallien (käsitekarttojen) kuvaaminen. Karkean tason käsitemallin suunnittelussa sekä aineistokokonaisuuksien hahmottamisessa hyödynnettiin professorikokouksessa (26.3.2010) järjestetyn työpajatyöskentelyn tuloksia. Projektissa on kuvattu seuraavat käsitekartat: Metlan karkean tason käsitemalli (Liite 1) Metla Tutkimusaihe käsitekartta (Liite 2) Metla Aineisto käsitekartta (Liite 3) Karkean tason käsitekartan tehtävä on kiinnittää yleisimmät ylimmän tason käsitteet, niistä käytettävät termit ja käsitteiden väliset suhteet. Käsitekartat auttavat ihmisten välistä kommunikointia Metlan käsitteistä keskustellessa. Käsitekartat luovat myös lähtötason, josta voidaan edetä tarkemman tason käsitemallien kuvaamiseen. 7.2 Tarkemman tason käsite- ja tietomallit Käsite- ja tietomallit ovat tärkeä osa tutkimusaineiston yksityiskohtaista sisällönkuvausta. Tutkimusaineistoprojektin tarkoitus on yhtenäistää Metlan kuvauskäytäntöä ja nostaa mallinnusosaamisen tasoa. Tämän tavoitteen saavuttamiseksi Metlaan ostettiin Database Visual Architect -mallinnustyökalu ja järjestettiin neljä koulutustapahtumaa kevään 2010 aikana, kestoltaan 1-2 päivää. Näissä tapahtumissa on opiskeltu UML mallinnusmenetelmää, mallinnustyökalun käyttöä ja tietomallien laatimista. Pohjana on käytetty mm. Metlan aineistoja. Lisäksi käytännön käsite- ja tietomallinnusta on opiskeltu puustonmittaustyöpajassa, jossa mallinnettiin kestokokeiden puustonmittausaineisto. Koulutukseen on osallistunut 10-20 metlalaista tapahtumasta riippuen. Tästä eteenpäin järjestetään tarvittaessa mallinnustyöpajoja eri aineistokokonaisuuksista. Metlassa tarvitaan myös ohjeet, miten mallinnusasioissa toimitaan ja mitä aineiston kuvauksen tulee sisältää. Yhtenä osana aineiston kuvauksen sisältöä ovat sivu 22/32

käsite- ja tietomallit. 8 Kehityssuunnitelma 8.1 Kehitysskenaarioita Nyt meneillään olevilla piloteilla (esim. MaaPuu tai Metsägenetiikan ja Metsänjalostuksen -kantaratkaisut) hankitaan kokemusta sekä mallintamisesta että mallien toimivuudesta käytännössä. Kunkin aineiston kohdalla joudutaan arvioimaan, mitä kannattaa viedä tietokantaan ja mitä säilyttää muilla tallennustavoilla. Mallinnusohjeet laaditaan saatujen kokemusten pohjalta. Liitteessä 4 on käsitemalli MaaPuu-aineiston puustonmittausosasta ja liitteessä 5 tietomalli metsänjalostuksen Siemen- ja toimenpiderekisterin keskeisistä tauluista. Seuraavissa luvuissa on kuvattu mahdollisia skenaarioita, mikäli tietoarkkitehtuuria ja tiedon hallintaa ei määrätietoisesti kehitetä. Kunkin skenaarion osalta on kuvattu riskit ja ei-toivottu asioiden eteneminen. Jokaiseen skenaarioon esitetään lisäksi vaihtoehtoinen, hyvää tietoarkkitehtuuria noudattava eteneminen. 8.1.1 Piilossa olevat aineistot Riskiskenaario: Toimintakulttuuri ohjaa tutkijoita, hankkeita ja yksiköitä säilyttämään tuottamiaan tietoja vain itsellään. Muut asiantuntijat eivät tiedä aineistojen olemassaolosta. Kerätty ja tuotettu tieto hyödyttää ainoastaan suppeaa tutkijoiden joukkoa, koska tiedon jakaminen ei ole rutiininomainen, tiedon elinkaareen liittyvä tehtävä. Tieto unohtuu, tuhoutuu, ymmärtämys tiedosta ei säily tai tieto ei periydy. Vaihtoehtoinen skenaario: Työskentelykulttuuri ohjaa tietojen säilymiseen, jakamiseen ja keskitettyyn hallintaan sekä yhteistyön lisääntymiseen (Kuva 3). Kaikki sellainen aineisto, jota ei ole erikseen käyttöoikeuksin rajoitettu, on pääasiassa vapaasti saatavilla ja helposti löydettävissä. Linjaukset aineistojen käyttöoikeuksista ja käyttörajoituksista määritellään aineistopolitiikassa. Metlan yhteinen tietopääoma on tehokkaasti sekä pitkäaikaisten, suunniteltujen että uusien tutkimuskohteiden käytössä. 8.1.2 Aineistoja ei voida yhdistää Riskiskenaario: Uudet tutkimus- ja palvelutarpeet edellyttävät tietojen koostamista ja yhdistämistä useista eri tietolähteistä ja tietovarannoista. Riskinä on, että aineistoissa on käytetty erilaisia käsitteitä ja eri tietokantoja linkittävät avaintiedot puuttuvat. Vaikka tiedot löytyvät ja niitä on kuvattu, niistä ei pystytä tekemään koosteita ja luotettavaa analyysiä, koska ne poikkeavat liikaa käsitteistöltään. Vaihtoehtoinen skenaario: sivu 23/32