Kansainvälisen tutkimusinfrastruktuurin juridinen muoto ja tutkimusinfrastruktuurin asettamat ehdot liittymiselle



Samankaltaiset tiedostot
U 5/2015 vp. Helsingissä 1 päivänä heinäkuuta Opetus- ja kulttuuriministeri Sanni Grahn-Laasonen. Opetusneuvos Petteri Kauppinen

Kielipankki ja FIN-CLARIN

Mitä voin lainata Kielipankista?

Opintovierailut. Euroopan unionin. poikittaisohjelma. opintovierailut koulutuksen asiantuntijoille

Ulkopaikkakuntalaisille ja ulkomaalaisille annettavasta hoidosta perittävät maksut alkaen

Kielipankin analyysityökalut ja aineistot Työmarkkinatilanteen tutkiminen lehtiaineiston avulla

Kansainvälisen tilausliikenteen matkustajat 2018

Kielipankki ja FIN-CLARIN. Mietta Lennes Nykykielten laitos, Helsingin yliopisto

ANNEX LIITE. asiakirjaan KOMISSION KERTOMUS EUROOPAN PARLAMENTILLE JA NEUVOSTOLLE

Ferratum Oyj:n Eurooppalainen Kesäbarometri 2015

Lomakausi lähestyy joko sinulla on eurooppalainen sairaanhoitokortti?

L 90/106 Euroopan unionin virallinen lehti

KOMISSION DELEGOITU ASETUS (EU) N:o /, annettu ,

KOMISSION TIEDONANTO

Kansainvälisen reittiliikenteen matkustajat 2018

Kansainvälisen reittiliikenteen matkustajat 2018

Ferratum-ryhmän Euroopan ja Kansainyhteisön maiden Joulubarometri 2015

Ehdotus NEUVOSTON PÄÄTÖS. talous- ja sosiaalikomitean kokoonpanon vahvistamisesta

A8-0321/78

Sisäasiainministeriö E-KIRJELMÄ SM

Linnea2-konsortion säännöt

Komissio toimitti 13. toukokuuta 2015 eurooppalaisen ohjausjakson puitteissa neuvostolle

Ehdotus NEUVOSTON ASETUS

KOMISSION TIEDONANTO NEUVOSTOLLE

Eurooppalainen ohjausjakso: yhdennetyt maakohtaiset suositukset Hyväksyminen ja toimittaminen Eurooppa-neuvostolle

Töihin Eurooppaan EURES

Euroopan alueiden komitea (AK): Paikallis- ja aluehallintoa edustava neuvoa-antava elin Euroopan unionissa

Euroopan unionin neuvosto Bryssel, 18. toukokuuta 2017 (OR. en) Jeppe TRANHOLM-MIKKELSEN, Euroopan unionin neuvoston pääsihteeri

Euroopan unionin virallinen lehti L 189/19

BELGIAN KUNINGASKUNTA, BULGARIAN TASAVALTA, TŠEKIN TASAVALTA, TANSKAN KUNINGASKUNTA, SAKSAN LIITTOTASAVALTA, VIRON TASAVALTA, IRLANTI,

Lapin TE-toimisto/EURES/P Tikkala

KOMISSION TIEDONANTO NEUVOSTOLLE

Ehdotus NEUVOSTON PÄÄTÖS. alueiden komitean kokoonpanon vahvistamisesta

SOVELLETTAVAT KORVAUSMÄÄRÄT

Julkinen kuuleminen TV UHF taajuuksien käytöstä tulevaisuudessa: Lamyn raportti

European Survey on Language Competences (ESLC) EU:n komission tutkimus vieraiden kielten osaamisesta EU-maissa

Työhön ja työnhakuun ulkomaille. Leena Ikonen, Kela

SOVELLETTAVAT KORVAUSMÄÄRÄT

KOMISSION KERTOMUS EUROOPAN PARLAMENTILLE JA NEUVOSTOLLE

NEUVOTTELUT BULGARIAN JA ROMANIAN LIITTYMISESTÄ EUROOPAN UNIONIIN

KOMISSION TIEDONANTO NEUVOSTOLLE. Euroopan kehitysrahastoa koskevat rahoitustiedot

Ehdotus NEUVOSTON PÄÄTÖS. Euroopan unionin liittymisestä puuvilla-alan kansainväliseen neuvoa-antavaan komiteaan (ICAC)

Talouden näkymät kiinteistö- ja rakentamisalan kannalta

TYÖOLOJEN KEHITYS. Näin työmarkkinat toimivat EVA. Hanna Sutela Erikoistutkija, YTT

IDA-tallennuspalvelun käyttölupahakemus

Yrittämisen edellytykset Suomessa. Varatoimitusjohtaja Antti Neimala Sähköurakoitsijapäivät , Hyvinkää

TUTKIMUSINFRASTRUKTUURIHAKU FIRI Riitta Mustonen

Talouden rakenteet 2011 VALTION TALOUDELLINEN TUTKIMUSKESKUS (VATT)

Kääntyykö Venäjä itään?

Ehdotus neuvoston päätökseksi alueiden komitean kokoonpanon vahvistamisesta

Turvallisuus meillä ja muualla

Euroopan unionin neuvosto Bryssel, 22. heinäkuuta 2015 (OR. en)

NEUVOTTELUT BULGARIAN JA ROMANIAN LIITTYMISESTÄ EUROOPAN UNIONIIN

Kansallinen digitaalinen kirjasto -tilannekatsaus. Digiajasta ikuisuuteen -seminaari Minna Karvonen

MichaelPlus. Hankkeen esittely Mikael Vakkari Suunnittelija MichaelPlus hanke

Korkeakouluopiskelijoiden työharjoittelu ulkomailla Valokuvat: Jaana Mutanen_jaMu

LIITE. asiakirjaan KOMISSION TIEDONANTO EUROOPAN PARLAMENTILLE, EUROOPPA- NEUVOSTOLLE JA NEUVOSTOLLE

KOMISSION TIEDONANTO NEUVOSTOLLE. Euroopan kehitysrahastoa koskevat rahoitustiedot

Vart är Finlands energipolitik på väg? Mihin on Suomen energiapolitiikka menossa? Stefan Storholm

995 der Beilagen XXIV. GP - Staatsvertrag - 07 Änderungsprotokoll in finnischer Sprache-FI (Normativer Teil) 1 von 8

13060/17 ADD 1 1 DPG

Eräät maat julkaisevat korttinsa eri kieliversioina, josta johtuen mallikortteja on useita.

Hankkeet ja yhteentoimivuus. OKM:n kirjastopäivät Minna Karvonen

Euroopan unionin neuvosto Bryssel, 3. maaliskuuta 2017 (OR. en)

TARKISTUKSET FI Moninaisuudessaan yhtenäinen FI. Euroopan parlamentti 2016/0231(COD)

KOULUJEN YHTEISTYÖHANKKEET

KOMISSION DELEGOITU ASETUS (EU) N:o /, annettu ,

Ehdotus NEUVOSTON PÄÄTÖS

EUBIONET III -selvitys biopolttoainevaroista, käytöstä ja markkinoista Euroopassa?

LIITE. Euroopan parlamentin vaaleja koskevien komission suositusten täytäntöönpanoon liittyvät jäsenvaltioiden vastaukset.

ALV-yhteenvetoilmoitus

Arvoisa juhlayleisö, Mitä tämä voi olla käytännössä?

EUROOPAN UNIONIN NEUVOSTO

Miten lisää kilpailukykyä? Partneripäivät Leena Mörttinen

Kevät Mitä vaikutusmahdollisuuksia Suomella on Euroopan unionin päätöksentekojärjestelmässä?

Kirjastot digitalisoituvassa maailmassa: haasteita, linjauksia ja olennaisuuksia

LIITE. asiakirjaan. ehdotus neuvoston päätökseksi

Mikä on avoimen tuotteen hallintamalli perustiedot ja taustoitus. Jukka Kääriäinen, Tapio Matinmikko, Raija Kuusela

Sisämarkkinoiden tulostaulu

PÄÄTÖKSET Euroopan unionin virallinen lehti L 64/13

Pyydämme yritystänne täyttämään oheisen vuotta 2009 koskevan lomakkeen mennessä.

I. TIEDONSAANTIPYYNTÖ. joka koskee valtiosta toiseen tapahtuvaa työntekijöiden käyttöön asettamista palvelujen tarjoamisen yhteydessä

Ferratum Oyj Eurooppalainen Kesäbarometri 2015

Euroopan parlamentin kokoonpano vuoden 2014 vaalien jälkeen

Ehdotus NEUVOSTON PÄÄTÖS

Finanssipolitiikka EU:ssa. Finanssineuvos Marketta Henriksson

Suomen mahdollisuudet innovaatiovetoisessa kasvussa

Korkeakoulukirjastojen keskitetyt kirjastoverkkopalvelut Kristiina Hormia-Poutanen

koulutuksesta kuvaajia

Niin sanottu kestävyysvaje. Olli Savela, yliaktuaari

Ehdotus NEUVOSTON ASETUS

ASIAKASLIITTYMÄ. Erikoiskirjastokokous Ari Rouvari Kansalliskirjasto

Ajankohtaista kunta- ja aluetiedoista

Terveysosasto/nh. Sairaanhoito EU:ssa. Noora Heinonen

SÄÄDÖSKOKOELMAN SOPIMUSSARJA Julkaistu Helsingissä 5 päivänä joulukuuta 2011

Datanhallinta, laskennan resurssit ja osaaminen

Ulkomainen työvoima teknologiateollisuudessa. Teknologiateollisuus ry:n ja Metallityöväen Liitto ry:n opas yrityksille ja niiden työntekijöille

Esimerkkejä Euroopasta. Koonnut (2012): Tutkija Anneli Miettinen

Panimo- ja virvoitusjuomateollisuusliitto

EU:n liikenneturvallisuusohjelma tuottaa hyviä tuloksia tavoite ihmishengen säästämisestä Euroopan teillä voidaan saavuttaa vuonna 2010

Transkriptio:

Common Language Resource and Technology Infrastructure (CLARIN), Yhteinen kieliaineistojen ja -teknologian infrastruktuuri (CLARIN), Den gemensamma infrastrukturen för språkresurser och språkteknologi (Clarin) Yhteystiedot Tutkimusjohtaja Krister Lindén Unioninkatu 40, 00014 Helsingin yliopisto, puh. (09) 191 29303, s-posti: krister.linden@helsinki.fi TUTKIMUSINFRASTRUKTUURIN PERUSKUVAUS CLARIN ERIC (www.clarin.eu) on Eurooppalainen tutkimusinfrastruktuurikonsortio, joka on sitoutunut luomaan yhteiskäyttöisen ja yhteensopivan tutkimusinfrastruktuurin kielivaroille ja kieliteknologialle. Tarkoitus on lieventää nykyistä pirstoutuneisuutta tarjoamalla vakaa, pysyvä, helppokäyttöinen ja laajennettava infrastruktuuri edistämään tietotekniikalla humanististen tieteiden tutkimusta. Konsortio koostuu kunkin maan kansallisesta tutkimusinfrastruktuurista, joiden hallitsemien kielivarojen yhteensopivuuden ja yhteiskäytön toteuttamiseksi, kehittämiseksi ja varmistamiseksi CLARIN ERICillä on hallintoelimet ja perussääntö. Tutkimusinfrastruktuurin isäntämaa on Alankomaat ja siinä on tällä hetkellä 9 jäsentä. Suomen kansallinen tutkimusinfrastruktuuri on FIN-CLARIN, jota koordinoi Helsingin yliopisto. Kansainvälisen tutkimusinfrastruktuurin juridinen muoto ja tutkimusinfrastruktuurin asettamat ehdot liittymiselle CLARIN ERIC on 29.2.2012 perustettu Euroopan komission päätöksellä 2012/136/EU eurooppalaiseksi tutkimusinfrastruktuurikonsortioksi. CLARIN ERICIN perussäännön (http://eurlex.europa.eu/lexuriserv/lexuriserv.do?uri=oj:l:2012:064:0013:0028:fi:pdf) liittymiselle asettamat ehdot ovat: 1. Isäntämaan kautta Euroopan Unionin komissiolle annettava hakemus Suomen ottamiseksi CLARIN ERICin täysjäseneksi; jäsenyyttä koskeva sitoumus annettaisiin vähintään viideksi vuodeksi. 2. Kansallisesti ainakin yhden Clarin-keskuksen ylläpito ja kehittäminen; keskus tuottaa perussäännön mukaisesti tutkimusinfrastruktuurinpalvelut ja niiden tarvitsemat tekniset järjestelmät kuten todentamis- ja valtuutusjärjestelmät ; Suomen Clarin-keskus olisi Helsingin yliopiston koordinoima FIN- CLARIN. 3. CLARIN ERICin vuosittaisen jäsenmaksun maksaminen; jäsenmaksu perustuu Eurostatin tilastoihin mukaiseen prosenttiosuuteen bruttokansantuotteesta ja olisi vuonna 2013 n. 25 000 euroa, samoin vuonna 2014, jos sitoumus annetaan vähintään viideksi vuodeksi. 4. Osallistuminen CLARIN ERICin perussäännön mukaiseen ylintä päätösvaltaa käyttävään jäsenten kokoukseen, mikä edellyttää Suomen edustajan/jien nimeämistä. 5. Kansallisen keskuksen (konsortion) toiminnan koordinoinnista vastaavan kansallisen koordinaattorin nimeäminen 1

Liittymissääntöihin perustuen Suomi sitoutuu maksamaan jäsenmaksun viideksi vuodeksi (noin 25 000 euroa vuodessa tai, jos siihen sitoudutaan lyhyemmäksi ajaksi, korotettuna 25 %:lla) ja siihen että nimetään ja valtuutetaan Suomea edustava taho, luodaan kielivarakonsortio, nimetään kansallinen koordinaattori sekä hoidetaan muut perussäännön artiklan 6.2. kohtien e-l mukaiset velvoitteet. Perustajajäseniä oli 8 maata ja yksi valtioidenvälinen organisaatio 2012: Itävalta, Bulgaria, Tšekki, Tanska, Viro, Saksa, Alankomaat, Puola ja Hollannin kielen unioni (Nederlandse Taalunie). Niiden panostukset selviävät perussäännön vuosimaksutaulukosta. Liittymissääntöihin perustuen Suomi sitoutuu maksamaan jäsenmaksun viideksi vuodeksi (noin 25 000 euroa vuodessa tai, jos siihen sitoudutaan lyhyemmäksi ajaksi, korotettuna 25 %:lla) ja siihen että nimetään ja valtuutetaan Suomea edustava taho, luodaan kielivarakonsortio, nimetään kansallinen koordinaattori sekä hoidetaan muut perussäännön artiklan 6.2. kohtien e-l mukaiset velvoitteet. Aiesopimuksen (MoU) allekirjoitti vuonna 2011 15 maata ja yksi valtioidenvälinen organisaatio: Itävalta, Bulgaria, Kroatia, Tšekki, Tanska, Viro, Suomi, Ranska, Saksa, Kreikka, Latvia, Liettua, Alankomaat, Norja, Puola ja Hollannin kielen unioni. Ranska on aikeissa hakea tarkkailijajäseneksi. Liettua, Portugali, Kreikka ja Ruotsi valmistautuvat liittymään CLARIN ERICin jäseniksi. YLEISET PERUSTELUT SUOMEN LIITTYMISESTÄ KANSAINVÄLISEEN TUTKIMUSINFRASTRUKTUURIIN Odotettavissa olevat tulokset ja vaikuttavuus CLARIN ERIC tarjoaa uuden alustan humanistiselle tutkimukselle, jossa tutkijat voivat työskennellä omilla työasemilla: löytää kielivaroja suurista kokoelmista, saada saumattomasti tarvittavia käyttölupia ja ruveta välittömästi tekemään tutkimusta. Tämä lisää tehokkuutta tutkimustoimintaan, kun CLARINin välityksellä voi päästä käsiksi tutkittavan kielen erilaatuisiin aineistoihin joko kotimaassa tai ulkomailla. Tehokkuutta lisääntyy myös kun CLARINin yhteistyötahojen avulla saatavilla olevien aineistojen määrä moninkertaistuu liittymisen kautta. Uusilla välineillä moni tutkimusongelma, joka aikaisemmin kesti viikkoja, voidaan nyt ratkaista tunnissa tai jopa minuuteissa. Monia väitteitä, jotka aikaisemmin olivat intuition varassa, voidaan tukea kiistattomilla ja monipuolisilla näytöillä. Uudet säännöllisyydet ja harvinaiset poikkeukset ovat helpompia todeta kuin perinteisillä työkaluilla. Humanistinen tutkimus tulee tällä tavalla helpommin toistettavaksi ja mitattavaksi, kun kielivarat, joihin väitteet perustuvat, ovat saatavilla muille tutkijoille, jotta he voivat verifioida tai falsifioida väitteitä. Tämä johtaa parempiin ja luotettavampiin tuloksiin. Teknologinen laatu ja merkittävyys innovaatiotoiminnalle Kielimateriaalin iso määrä on tarpeen kun kehitetään kieliteknologiaa, erityisesti kun käytetään koneoppimista ja tilastollisia menetelmiä. Sellaisten menetelmien kehittäminen ja soveltaminen suomen kansalliskieliin tehostaa Suomen ohjelmistoteollisuuden kilpailukykyä. Esim. HFST (Helsinki Finite-State Technology) on äärellistilaisiin menetelmiin perustuva sovellusten ja menetelmien kokoelma, jota FIN-CLARINissa on kehitetty. HFST tarjoaa uusia mahdollisuuksia kieliriippumattomien sovelluksien kehittämiseen, kun kieleen liittyvät komponentit voidaan esittää transduktoreina, siis datana. Tällaisia HFST:n mukaisia kielen analysaattoreita, oikolukuohjelmia ja muita työkaluja on jo olemassa noin 100 kielelle ja ne ovat tarjolla CLARINin verkkopalvelujen ja muiden sovelluksien kautta. Yhteiskunnallinen merkitys ja muut vaikutukset Kulttuurien välinen ymmärrys on integroituvassa Euroopassa ja maailmassa tärkeä. Ensisijaisesti FIN-CLARIN tekee yhteistyötä EU:ssa, mutta jo nyt CLARIN hakee yhteistyötahoja vastaavissa hankkeissa USA:sta ja Australiasta, kuten Project Bamboo (http://www.projectbamboo.org/), sekä muissa vastaavissa hankkeissa Aasiasta ja Etelä- Amerikasta. Erikielisten kielivarojen saatavuus eri maista ja mantereilta edistää humanistista tutkimusta, jonka eräs tärkeä tehtävä on kulttuurien ymmärryksen kautta edistää yhteistyötä muiden maiden kanssa mm. kulttuurin ja talouden alalla. 2

Tarvitaan riittävästi kielivaroja rakentamaan käyttökelpoista kieliteknologiaa. Hyviä kielityökaluja tarvitaan päivittäiseen työskentelyyn ja kommunikointiin. Ihmisten identiteetti rakentuu äidinkieleen. Suomessa on hätkähdyttävän pienet kielivarat tarjolla verrattuna naapurimaihin puhumattakaan isommista maista kuten Saksa, Ranska ja Iso-Britannia. Lisätietoa tästä on saatavissa suomea kuvaavasta osiosta sarjassa Language White Paper Series (http://www.meta-net.eu/whitepapers/volumes/finnish). HFST (Helsinki Finite-State Transducer Technology) osana FIN-CLARINia tarjoaa uutta työnjakoa tavallisten ohjelmistotuottajien ja kieliteknologiavalmistajien välille, koska tällä tavalla voidaan tarjota yhteinen formaatti eri kielille ja vakiomuotoinen tapa liittää tavanomaisiin ohjelmiin kielipalveluja kuten oikolukua ja kieliopintarkistusta, konekäännöstä ja tiedonhakua. Suomessa kehitetty äärellistilaisiin menetelmiin perustuva kieli-infrastruktuuri on jo herättänyt kansainvälistä kiinnostusta esim. Ranskassa, Saksassa, Espanjassa ja pohjoismaissa sekä tuonut Suomeen kansainvälisiä tutkijakoulutettavia. FIN-CLARINissa kehitettyjä menetelmiä on Suomessa sovellettu erilaisissa TEKES-hankkeissa ja esim. Kansallisen digitaalisen kirjaston projektissa. Vastaisuudessa menetelmät voivat esim. tehostaa hakua ja luokittelua näissä projekteissa. Samanlaiset ja paljon laajemmat sovellusmahdollisuudet löytyvät julkisen sektorin palveluista kansalaisille kuten http://suomi.fi. FIN-CLARINin Kielipankilla on Internetissä jonkin verran kaikille suunnattuja aineistoja ja palveluja, jotka ovat ilmaisia tutustumistarkoitukseen. Tarjolla on valmiiksi prosessoituja laajoja julkisia aineistoja hakuliittymällä, jotta niistä voi hakea näytteitä kielenkäytöstä kieliopillisilla hakuehdoilla. Tämä palvelu on osoittautunut erittäin suosituksi freelancekääntäjien keskuudessa. Haluttu asema kansainvälisessä tutkimusinfrastruktuurissa Suomen tulisi mahdollisimman pian hakea täysjäsenyyttä CLARIN ERICissä, koska vain sillä tavalla voimme olla täysivaltaisesti mukana vaikuttamassa siihen millaiset standardit ja yhteiskäyttöiset menetelmät ja tavat aineistoille ja kieliteknologialle luodaan. CLARIN ERICillä on oikeus osallistua Euroopan komission järjestämiin projektihakuihin ja sellaiset hankkeet lähtevät liikkeelle eri maiden välisenä yhteistyönä. Olemalla CLARIN ERICissä mukana, voimme paremmin varmistaa että saamme tietoa yhteisistä hankesuunnitelmista ja että pääsemme niihin mukaan. Jäsenyyden avulla pääsemme mukaan kansallisten palvelukeskusten yhteistyöelimeen Standing Committee for Technical Centres ja kansallisten konsortioiden yhteistyökomiteaan National Coordinators Forum. Koska Helsingin yliopisto oli mukana CLARINin valmisteluvaiheessa EU-projektin jäsenenä ja oli silloin erityisesti vastuussa lakiteknisestä valmistelusta, on Suomelle annettu puheenjohtajuus lakiteknisessä valiokunnassa CLARIN ERIC Committee for Legal Issues. Valiokunta on vastuussa kaikesta CLARIN ERICin toimintaan liittyvien lakiteknisten asioiden valmistelusta, erityisesti kieliaineistoihin, niitä käsitteleviin tietokoneohjelmiin sekä CLARIN-keskusten yhteistoimintaan liittyvistä sopimusteknisistä asioista, jotka vaikuttavat koko EU:n kieliyhteisön toimintaan. Ajankohtaisuuden perusteet CLARIN ERIC on perustettu 2012 ja Helsingin yliopisto on pitkään tehnyt työtä tällä alueella. Helsingin yliopisto rupesi jo 1987 kehittämään University of Helsinki Corpus Server -kielivarapalvelinta ja on yhdessä CSC:n kanssa vuodesta 1997 ylläpitänyt Suomessa humanistista infrastruktuuria Kielipankin muodossa kielivarojen säilytys- ja työstämispaikkana. Molemmat osapuolet osallistuivat CLARINin valmisteluprojektiin vuodesta 2006 lähtien ja olivat mukana valmistelemassa CLARIN ERICin syntymistä. Vuonna 2007 perustettiin aiesopimuksella Helsingin yliopiston koordinoima FIN-CLARINin kielivarakonsortio, johon kuuluu 7 muuta yliopistoa, CSC ja Kotus. CLARIN ERICin perustamisen myötä on vihdoin saatu aikaan se mihin on jo yli 25 vuotta tähdätty. Suomen liittyminen CLARIN ERICiin varmistaisi mahdollisuudet vaikuttaa siihen, että Euroopan-laajuisesta CLARINista tulee sellainen, että siitä on mahdollisimman paljon hyötyä suomalaisille tutkijoille. HANKKEEN RAKENTEIDEN JA PALVELUJEN VALMIUDET 3

Kansallisen hankkeen/osallistumisen lyhyt kuvaus suhteessa kansainväliseen hankkeeseen: FIN-CLARIN (www.helsinki.fi/finclarin) tuo käyttäjille laajat digitaaliset kielivara- ja kielityökalukokoelmat. FIN-CLARIN palvelee laajaa tutkimusyhteisöä, joka koostuu sekä humanisteista että yhteiskuntatieteiden ja tietojenkäsittelytieteen edustajista. FIN-CLARINin tärkein hyöty on aineistojen määrässä ja monimuotoisuudessa sekä niiden saatavuudessa, jonka se tarjoaa tutkijoille. Tavoite on tarjota kokoelmia eri aikakausilta, lajityypeiltä ja alueilta sekä kielen eri ilmenemismuodoista kuten tekstistä, äänestä, kuvasta ja videosta. Työkalut ja materiaalit palvelevat tutkijoita, opettajia ja opiskelijoita humanismin eri aloilta kuten kielen, kulttuurin, kirjallisuuden ja historian tutkijoita sekä jossain määrin myös sosiaalitieteiden ja informaatiotieteiden aloilta. FIN-CLARIN tulee olemaan kansallinen solmu CLARIN ERICissä, joka on perustettu 29. helmikuuta 2012 Euroopan komission päätöksellä 2012/136/EU. CLARIN ERIC tarjoaa tekniset puitteet sekä normit ja käytänteet, jotka mahdollistavat Euroopan kielivarojen helpon ja sujuvan yhteiskäytön laajoille kansainvälisille akateemisille tutkijajoukoille EU:ssa. Jo vuonna 1997 ruvettiin tarjoamaan kielivarojen ja kielityökalujen käyttöä tutkijoille Kielipankissa yhteistyönä Helsingin yliopiston ja CSC:n välillä. Vuodesta 2007 Kielipankki on toiminut FIN-CLARINin 8 yliopiston ja Kotuksen epävirallisen kielivarakonsortion valvomana, jossa CSC on tietoteknisenä palvelukeskuksena. Kielipankki käyttää jo nyt CLARIN ERICin hyväksymää todentamis- ja valtuutusjärjestelmää sekä muita CLARIN-keskuksissa käytettyjä verkkopalveluja ja ohjelmistoja. Tavoite on lisätä ja vahvistaa yhteistyötä sekä Suomessa että muualla EU:ssa ja varmistaa, että CSC:stä tulee vähintään CLARINin B-tason keskus, joka tarjoaa kielivaroja ja kielityökaluja käyttäjille kansallisesti ja kansainvälisesti. FIN-CLARIN kerää kielivaroja sekä ylläpitää ja kehittää kielityökaluja parantaakseen kansallisten (ja Euroopan-laajuisten) kieliaineistojen löydettävyyttä ja sisällön haettavuutta. Hallintorakenne Suomessa Helsingin yliopiston (HY) Nykykielten laitoksella on FIN-CLARINin koordinaatiovastuu ja toimii kansallisen koordinaattorin kotiyliopistona. Helsingin yliopisto on vastuussa aineistojen hankinnasta (yhdessä aineistojen tuottajien kanssa) ja siitä että hankitut aineistot vastaavat CLARINin asettamia standardeja. HY vastaa myös hyväksyttyjen aineistojen muokkaamisesta tietokantoihin. Aineistojen hankinta sisältää aineistotuottajien neuvontaa kielityökalujen ja kielivarojen formatointistandardeista ja sopimuskäytänteistä. Lisäksi HY joko kehittää työkaluja prosessoimaan ja automaattisesti annotoimaan kielivaroja tai hankkii sellaisia työkaluja esim. alihankintana. HY:llä on myös päävastuu tiedon levittämisestä työkaluista ja kielivaroista sekä tutkijoiden kouluttamisesta kursseilla ja verkkosivujen avulla. CSC on vastuussa sekä Kielipankin teknisestä infrastruktuurista että teknisen asiantuntemuksen tarjoamisesta palvelujen kehittämiseksi. CSC ylläpitää Kielipankin tietokoneita ja tallennusalustoja, asentaa tietokantojen ja ohjelmien uusia versioita sitä mukaa kuin ne ilmestyvät ja auttaa räätälöimään ja kehittämään kielityökaluja ja tutkijan työympäristöä. CSC on vastuussa Kielipankin todentamis- ja valtuutusjärjestelmästä, varaa käyttäjätilaa ja tarjoaa pääsyn Kielipankkiin. CSC osallistuu CLARIN-palvelujen käyttöönottoon ja kansainvälisen harmonisointiin. Erityisesti CSC tarjoaa vähintään B-tasoisen CLARIN-keskuksen. CSC tarjoaa Kielipankin verkko- ja intranet-sivuille teknisen alustan sekä osallistuu HY:n ja muiden FIN-CLARINin jäsenten Kielipankki-palvelujen koulutukseen. FIN-CLARINin kaikkien jäsenten piirissä on laaja käyttäjäkunta kansallisille ja kansainvälisille kielivaroille. Kaikki jäsenet osallistuvat kansallisten kielivarojen kartuttamiseen ja kehittämiseen. FIN-CLARIN on Suomen akateemisten tutkimusorganisaatioiden kielivarakonsortio joka koostuu kaikista digitaalisten kielivarojen oleellisista tekijöistä Suomessa. Kielivarakonsortiolla on vuodesta 2007 voimassaoleva aiesopimus. FIN- CLARINilla on johtoryhmä joka valvoo sen toimintaa ja edistymistä. Tutkimusinfrastruktuurin käyttöaste ja käyttöpolitiikka Käyttäjä pääsee sisään FIN-CLARINin Kielipankkiin kotiylipistonsa käyttäjätunnuksella ja salasanalla. Näin on jo nyt sekä Suomen että muiden Pohjoismaiden, Saksan ja Alankomaiden tutkijoiden ja korkeakouluopiskelijoiden kohdalla. Tarkoitus on että tätä laajennetaan koko EU:n alueelle sitä mukaa kuin maat liittyvät EduGain-nimiseen 4

käyttäjätunnistusyhteisöjä yhdistävään palveluun. Kielipankin käyttö on ilmaista tutkijoille ja korkeakouluopiskelijoille. Muilta voidaan periä maksu palvelukustannusten kattamiseksi. Tällä hetkellä Kielipankilla on n. 300 rekisteröityä käyttäjää. Tavoite on että käyttäjien määrä olisi 600 tutkijaa, opettajaa ja tutkijakoulutettavaa Suomessa sekä saman verran ulkomailta. Lisäksi meillä on tavoitteena että Suomessa olisi käyttäjinä 2000 korkeakouluopiskelijaa. Julkisten ja kaikille avointen palvelujen käyttäjien IP-osoitteita on tarkoitus tilastoida, jotta myös anonyymien käyttäjien määriä voidaan jatkossa raportoida. TUTKIMUSINFRASTRUKTUURIN KUSTANNUKSET Investoinnit Suomessa Jo 1980-luvun lopussa oli Helsingin yliopistolla vireillä hanke nimeltä Helsinki University Corpus Server (http://www.ling.helsinki.fi/uhlcs/data/databank.html). Tämä oli palvelin, johon kerättiin kielivaroja Helsingin yliopistossa maailman kielistä. Parhaimmillaan oli tarjolla näytteitä yli 50 kielestä. Jo 1990-luvun alussa suomen-, ruotsin-, englannin- ja suahilinkieliset korpukset sisälsivät useita miljoonia sanoja. Vuonna 1997 perustettiin Kielipankki (www.helsinki.fi/kielipankki), joka oli silloin yhteistyöprojekti Helsingin yliopiston ja CSC:n kesken. Tämän myötä tuli mahdolliseksi hankkia ja tarjota kielivarojen lisäksi Helsingin yliopistossa ja myös muualla kehitettyjä ja eri yrityksissä jatkojalostettuja kielityökaluja kaikille yliopistoille yhteiseen käyttöön, kunhan käyttäjät hankkivat henkilökohtaisen käyttöluvan CSC:n palvelimelle. Vuonna 2007 luotiin aiesopimuksella FIN-CLARIN, eli valtakunnallinen kielivarakonsortio (www.helsinki.fi/finclarin), jonka tarkoitus on Helsingin yliopiston johdolla koordinoida 8 suomalaisen yliopiston, CSC:n ja Kotuksen välistä kielivarojen ja kielityökalujen kehitystyötä. Kielipankki (www.kielipankki.fi) on FIN-CLARINin tärkein palvelu, jonka teknistä infrastruktuuria CSC ylläpitää. Vuonna 2007 käynnistyi myös CLARINin valmisteluvaihe EU-tasolla, jossa Suomi oli mukana Helsingin yliopiston edustuksella. Tästä lähtien Helsingin yliopisto on käyttänyt n. 500 000 euroa vuodessa suoraan palkkoihin ja sivukuluihin FIN-CLARINin puitteiden rakentamiseen sekä n. 200 000 euroa vuosittain virkatyönä ja erilaisten projektien kautta kielivarojen ja kielityökalujen tuotantoon. Muissa FIN-CLARINin jäsenorganisaatioissa on keskimäärin käytetty virkatyönä ja erilaisten projektien kautta n. 200 000 euroa vuosittain per organisaatio. CSC:ssä on käytetty kokonaiskustannusmallin mukaisesti n. 300 000 euroa vuodessa Kielipankin teknisen infrastruktuurin ylläpitoon ja CLARINin puitteiden kehittämiseen. Kansallinen koordinaattori neuvottelee CLARIN ERICin kanssa kansallisen konsortion puolesta siitä, miten perussäännön artiklan 6.2. kohtien e-l mukaiset velvoitteet täytetään sekä miten Suomessa edistetään perussäännön 2. artiklassa esitettyjä CLARINin tavoitteita. Alustava hahmotelma tälle on dokumentissa Membership Agreement (ks. www.helsinki.fi/finclarin/konsortiosopimus). Alla on artiklan 6.2. eri kohdat. CLARIN ERICin perussäännön artiklan 6.2. mukaan, jäsenten on a) maksettava liitteessä 2 määritetty vuosimaksu; b) nimettävä 3.4. artiklassa mainittu edustava taho ja pidettävä yleiskokous aina tietoisena siitä, mikä edustava taho on; c) valtuutettava edustava tahonsa täysin oikeuksin äänestämään kaikista yleiskokouksessa käsiteltävistä ja esityslistalla julkaistuista aiheista; d) luotava kansallinen konsortio täyttämään tästä perussäännöstä seuraavat kansalliset velvoitteet; e) nimettävä kansallinen koordinoija vastaamaan kansallisesta konsortiosta; f) tarjottava vähintään yksi tieto- ja palvelukeskus; g) tarjottava yhteisesti sovittu käyttäjien todentamis- ja valtuutusjärjestelmä; h) tarjottava yhteisesti sovittuja palveluja; i) edistettävä merkityksellisten standardien soveltamista kansallisten aineistojen ja työkalujen kehittämishankkeisiin; j) tarjottava tarvittava tekninen yhteensopiva infrastruktuuri, joka mahdollistaa pääsyn; 5

k) edistettävä CLARIN-palvelujen käyttöönottoa valtionsa tutkijoiden parissa ja kerättävä käyttäjien palautetta ja vaatimuksia; l) tuettava jäsenenä olevan valtion CLARIN-keskuksia helpottamalla niiden yhdentymistä kansallisiin ja muihin merkityksellisiin infrastruktuureihin. Jäsenyyden välttämättömät kustannukset Suomessa 2013 2017 Tiivistettynä - jäsenmaksut - kv-keskuksen ylläpito (aineistojen säilyttäminen, kartuttaminen ja käyttökelpoiseksi saattaminen) - käyttäjille tarjottavat palvelut ja palveluissa tarjottavien järjestelmien ylläpito ja kehittäminen Kv-jäsenmaksut eriteltyinä eri vuosille Perussäännön Liitteessä 2 VUOSIMAKSUT kohdassa k) määritellään että maksuosuudet perustuvat valtion vuoden 2010 bruttokansantuotteen prosentuaaliseen osuuteen unionin bruttokansantuotteesta kyseisenä vuonna (EUROSTATin mukaan): e) jokaisen jäsenen maksuosuus vahvistetaan viideksi vuodeksi, ja se nousee vuosittain kaksi prosenttia inflaation ja kustannusten nousun kattamiseksi. f) myöhempinä vuosina liittyvät jäsenet maksavat kyseiseksi vuodeksi vahvistetun indeksoidun maksuosuuden; j) vuoden aikana liittyvien tahojen maksuosuus lasketaan suhteessa jäljellä oleviin kuukausiin alkaen liittymiskuukauden ensimmäisestä päivästä; k) maksuosuudet perustuvat valtion vuoden 2010 bruttokansantuotteen prosentuaaliseen osuuteen unionin bruttokansantuotteesta kyseisenä vuonna (EUROSTATin mukaan) seuraavan kaavan mukaisesti: Niiden jäsenten vuosimaksua, jotka eivät alun perin sitoudu viiteen vuoteen, nostetaan 25 prosenttia niin kauan kuin sitoumusta jäljellä olevalle kaudelle ei ole tehty. Jos maksuosuuteen sitoudutaan viiden vuoden jäljellä olevaksi ajaksi tai jos jäsen pysyy viisi vuotta konsortiossa, suoritetaan järjestelyt sen varmistamiseksi, että jäsen ei maksa yhteensä enemmän kuin näiden viiden vuoden tavanomaiset maksut. Aineistot ja palvelut pitää tehdä alusta lähtien CLARIN-standardien mukaan. Yksittäisten tutkimusprojektien tutkimusaineistojen osalta tarkoitus on, että aineistoja tuotetaan tutkimusprojekteissa. Tällä tavalla voidaan varmistaa, että uusi aineisto on ainakin yhden tutkimusryhmän mukaan tarpeellinen ja myöhemmin myös muille käyttökelpoinen. Erillisaineistojen keskitetty lisääminen tutkimusinfrastruktuuriin rahoitetaan vain, mikäli aineisto on poikkeuksellisen laaja, monikäyttöinen ja jatkuvasti karttuva. Esimerkkejä tällaisesta ovat YLEn arkisto, YLEn uutistekstit ja Kansalliskirjaston verkkosivu- ja lehtikokoelmat, jolloin rahoitus voi kohdistua tuotantoprosessin automatisointiin, jotta tällaiset aineistot saataisiin jatkossa mahdollisimman automaattisesti FIN-CLARINin aineistokokoelmiin. Laajojen, monikäyttöisten, jatkuvasti karttuvien aineistojen liittäminen vie aikaa ja on luonteeltaan prosessi pikemmin kuin projekti, joten sellaisten lisääminen on parempi nähdä osana FIN-CLARINin pitkäaikaista operatiivista toimintaa kuin yksittäisinä investointeina. Prosesseja voi tietysti tehostaa kertainvestoinneilla ja esim. FIN-CLARIN-CONTENTprojekti keskittyy päättyneiden tutkimusprojektien valmiiden aineistojen hankkimiseen FIN-CLARINin kokoelmiin. Pilottihankkeilla selvitetään laajojen monikäyttöisten aineistojen liittämistä kokoelmiin. CLARIN ERICissä virtuaalisen toimintaympäristön takia toimintavaiheen operatiiviset kustannukset ovat pitkälti samat vuodesta toiseen korjattuina vuosittaisilla inflaatiokorotuksilla. FIN-CLARIN on jo olemassa ja sitä on voitu käyttää viimeiset viisitoista vuotta. Sitä mukaa kun FIN-CLARINia laajennetaan sen hyödyllisyys kasvaa. Jos sitä ei jatkuvasti ylläpidetä, sen hyödyllisyys vastaavasti vähenee, koska ohjelmistoympäristöt muuttuvat ja kaipaavat ohjelmien päivitystä, kieli muuttuu ja aineistoja tulee lisää eri aineistotuottajilta. Rahoitusrakenne ja rahoitusyhteistyö 2013 2017 Helsingin yliopisto ja CSC hoitavat FIN-CLARINin kansallisen operatiivisen toiminnan ja tukevat CLARINin kansainvälistä 6

toimintaa. Molemmat tekevät yhdessä työtä CLARIN ERICin ja FIN-CLARIN-kielivarakonsortion eteen ja edistävät tutkimusinfrastruktuurin puitteita kuten laitteisto- ja sisältöteknisen infrastruktuurin kehittämistä sekä käyttäjien neuvontaa laitteistojen ja sisällön käytössä. Molempien osalta omarahoitussitoumukset ovat olemassa vuosille 2013 2019. Suomen Akatemia tutkimusinfrastruktuureille varatuista määrärahoista varaudutaan CLARIN-ERIC jäsenyydestä koituviin välttämättömiin kustannuksiin säännösten mukaisesti. Muut FIN-CLARIN-konsortioon osallistuvat tahot kuin HY ja CSC edustavat tutkimusinfrastruktuurin käyttäjiä, jotka silloin tällöin tuottavat aineistoja tai palveluja lisättäviksi tutkimusinfrastruktuuriin oman tutkimustoimintansa sivutuotteina. Tätä ja vastaavaa aineistotuotantotoimintaa Helsingin yliopistolla ei katsota FIN-CLARINin operatiiviseksi toiminnaksi. 7