Tiedonlouhinta (kl 2013) Kurssin kuvaus. Esitiedot. Kurssin arvostelu



Samankaltaiset tiedostot
TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

Johdatus tekoälyyn. Luento : Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

MONISTE 2 Kirjoittanut Elina Katainen

Tiedonlouhinta (kl 2013) Tiedonlouhinta 2013/L1 p. 1

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen

805306A Johdatus monimuuttujamenetelmiin, 5 op

Matemaatikot ja tilastotieteilijät

Tähtitieteen käytännön menetelmiä Kevät 2009

Tekoäly ja koneoppiminen metsävaratiedon apuna

Esimerkkejä vaativuusluokista

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tiedonlouhinta ja sen mahdollisuudet

MS-C2111 Stokastiset prosessit

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Viikko 1: Johdantoa Matti Kääriäinen

Tilastotiede ottaa aivoon

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Tilastotiede ottaa aivoon


MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi


I Data ja sen esiprosessointi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Rottien hyvinvointiin ja stressiin vaikuttavat tekijät

A130A0760 Ekonomin viestintätaidot

Mustat joutsenet pörssikaupassa

Korkealämpötilakemia

ALGORITMIT & OPPIMINEN

Tilastolliset ohjelmistot A. Pinja Pikkuhookana

T DATASTA TIETOON

805306A Johdatus monimuuttujamenetelmiin, 5 op

Vastuuopettaja. Kurssiesite Lausekielinen ohjelmointi Syksy Tavoitteet ja keinot. Lausekielinen ohjelmointi (10 op)

Korkealämpötilakemia

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Tiedonlouhinta 2013/L3 p. 1. Data-avaruus. Olk. muuttujat A 1,...,A k, joiden arvoalueet. Dom(A 1 ),...,Dom(A k ). Silloin D = Dom(A 1 )...

JOHDATUS TEKOÄLYYN TEEMU ROOS

Roolipeliharjoitus. - Opiskelijoiden suunni=elemat neuvo=eluvideot ja niiden vertaisarvioinnit

Ohjelmistojen mallintaminen, kesä 2009

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Avainsanojen poimiminen Eeva Ahonen

Laskennallinen data-analyysi II

Poikkeavuuksien havainnointi (palvelinlokeista)

Introduction to Machine Learning

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

SAS-ohjelmiston perusteet 2010

Datasta arvoaliiketoiminnalle. Kirsi Pietilä Business Intelligence Lead

ABTEKNILLINEN KORKEAKOULU Tietoverkkolaboratorio

Harjoitus 7: NCSS - Tilastollinen analyysi

Ongelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan?

Palautekysely tilastollisen signaalinkäsittelyn kurssiin

Tilastollinen päättely II (MAT22003), kevät 2019

TN-IIa (MAT22001), syksy 2017

JOHDATUS TEKOÄLYYN TEEMU ROOS

Kurssiesite Lausekielinen ohjelmointi Syksy Jorma Laurikkala Tietojenkäsittelytieteet Informaatiotieteiden yksikkö Tampereen yliopisto

Markkinoitten mallintaminen ja Internet-markkinat

pitkittäisaineistoissa

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Kurssiesite Lausekielinen ohjelmointi II Syksy Jorma Laurikkala Tietojenkäsittelytieteet Informaatiotieteiden yksikkö Tampereen yliopisto

Kandidaatintutkielma 6 op (+Äidinkielinen viestintä 3 op) (+Tutkimustiedonhaku 1 op) (+Kypsyysnäyte 0 op) Kevät 2015 Jaakko Kurhila

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Sarjat ja integraalit, kevät 2014

Vastuuopettaja. Kurssiesite Lausekielinen ohjelmointi I Syksy Lausekielinen ohjelmointi I (5 op) Lausekielinen ohjelmointi I (5 op)

Kurssiesite Lausekielinen ohjelmointi I Syksy Jorma Laurikkala Tietojenkäsittelytieteet Informaatiotieteiden yksikkö Tampereen yliopisto

DOB valmennus Data-analyysi. Koneoppiminen. CC by

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Vieraiden kielten aineenopettajakoulutus/aikataulu viikoille 36 38/Minna Maijala [ ]

ESOMAR-terveiset. Maris Tuvikene. Tuvikene Maris Julkinen 1

Tentissä ratkaistaan neljä ohjelmointitehtävää Javalla. Tehdään sähköisesti mikroluokan Windows-koneilla.

Älykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach

Kurssiesite Lausekielinen ohjelmointi I Kesä Jorma Laurikkala Tietojenkäsittelytieteet Luonnontieteiden tiedekunta Tampereen yliopisto

Mittaustekniikka (3 op)

Ohjelmistojen mallintaminen, kesä 2010

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Tentissä ratkaistaan neljä ohjelmointitehtävää Javalla. Tehdään sähköisesti mikroluokan Windows-koneilla.

YLIOPPILASKOE ON KYPSYYSKOE. Vastuu on Sinulla tutkinnon ajoituksesta ja valinnoista

KVANTITATIIVISET TUTKIMUSMENETELMÄT MAANTIETEESSÄ

Ruokinta-automaattidatan analyysi

Tässä luvussa käsitellään optimaalisten piirteiden valintaa, luokittelijan optimointia ja luokittelijan suorituskyvyn arviointia.

S11-04 Kompaktikamerat stereokamerajärjestelmässä. Projektisuunnitelma

YLIOPPILASKOE ON KYPSYYSKOE. Vastuu on Sinulla tutkinnon ajoituksesta ja valinnoista

Kandidaatintutkielma 6 op (+Äidinkielinen viestintä 3 op) (+Tutkimustiedonhaku 1 op) (+Kypsyysnäyte 0 op) Syksy 2014 Jaakko Kurhila

Ohjelmistoprosessit ja ohjelmistojen laatu Ohjelmistoprosessit ja ohjelmistojen laatu (4op)

Tekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi

Tiedonlouhinta-kurssi: arviointimenetelemät, tilastoja ja kiinnostavia hahmoja

S09 04 Kohteiden tunnistaminen 3D datasta

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Algoritmit 2. Luento 6 To Timo Männikkö

Tilastollinen päättely II (MAT22003), kevät 2018

pisteet Frekvenssi frekvenssi Yhteensä

35 la pe la

A35C00250 Hankintojen johtaminen Kurssin esittely

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

Transkriptio:

Tiedonlouhinta (kl 2013) Kurssin kuvaus 00 11 00 11 00 11 01 01 01 01 11000 111 11000 111 00 11 joko kandidaatti- tai maisteritason valinnainen kurssi Toteutus pääasiassa ongelmalähtöisesti (tiedonlouhintaprosessin harjoittelu oikealla datalla) Yleiskuva menetelmistä ja niiden valinnasta luennoilla (vain 4 vk) Perustaitojen harjoittelu laskuharjoituksissa (4 vk) Ei koetta, mutta edellyttää aktiivista työskentelyä kurssin aikana! (4op 108h) Tiedonlouhinta 2013/L2 p. 1 Tiedonlouhinta 2013/L2 p. 2 Esitiedot TKT-opiskelijat: Ohjelmointi-kurssit, TRA1 ja perus-linux-taidot Muiden alojen ihmiset: perustaidot tietokoneen käytöstä ja sopiva datajoukko harjoitustyöaiheeksi Täytä esitietokysely heti! (kurssisivulla) Luentoja saavat tulla kuuntelemaan muutkin (mutta harjoitusryhmiin ei ylimääräisiä) Kurssin arvostelu Harjoitustyöt 75% pisteistä (sis. esityksen arvion) Harjoituspisteet 25% pisteistä (mikroharjoituksista 3 läsnäolopistettä) Esitykset arvioidaan yhdessä Ryhmä saa ehdottaa, miten harjoitustyöpisteet jaetaan ryhmäläisten kesken Tiedonlouhinta 2013/L2 p. 3 Tiedonlouhinta 2013/L2 p. 4

Opettajat Alustava ohjelma Wilhelmiina Hämäläinen (luennoija, Kuopion harjoitukset ja ohjaus) whamalai@cs.uef.fi Kurssin ajan vastaanottoaika ti klo 15-16 (Technopolis F007) tai sopimuksen mukaan Mikko Malinen (Joensuun harjoitukset ja ohjaus) mmali@cs.uef.fi Viikko 15 Luento ma 8.4. Luento ti 9.4. Viikko 16 Luento ma 15.4. Luento ti 16.4. Kurssin esittely, johdatus tiedonlouhintaan Datan tyypit ja esiprosessointi. Harjoitustöiden jako ja ohjeistus. Mikroharjoitukset. Tapaamiset ohjaajan kanssa Tilastollisten riippuvuuksien haku Bayesläinen riippuvuuksien mallinnus Harjoitukset. Loput tapaamiset ohjaajan kanssa Tiedonlouhinta 2013/L2 p. 5 Tiedonlouhinta 2013/L2 p. 6 Viikko 17 Luento ma 22.4. Luento ti 23.4. Viikko 18 Luento ma 29.4. Luento to 2.5. Luokittelusäännöistä ja luokittelijoista Klusterointi Harjoitukset Erikoisempien hahmojen haku (verkkodata, aikasarjadata) Oikean menetelmän valinta. Tulosten järkevyyden ja merkitsevyyden arviointi. Harjoitukset Viikko 19 Viikko 20 Viikko 21 Luento ma 22.5. Luento ti 23.5. Omatoimista työskentelyä. Tapaamiset ohjaajan kanssa Omatoimista työskentelyä. Loppuesitykset Loppuesitykset Loppuraporttien palautus Tiedonlouhinta 2013/L2 p. 7 Tiedonlouhinta 2013/L2 p. 8

Mitä on Tiedonlouhinta? Data mining (DM) ( data fishing, data snooping, information harvesting ) Knowledge discovery (from databases) (KDD) Intuitiivisesti Laskennallisesti epätriviaalia data-analyysia (uuden informaation etsimistä datasta) Määritelmiä A non-trivial process of identifying valid, novel, potentially useful and ultimately understandable patterns in data. (Fayyad et al. 1996) Automatic or semi-automatic analysis of large quantities of data to extract previously unknown interesting patterns such as groups of data records, unusual records and dependencies. (wikipedia) Analysis of (often large) observational data sets to find unsuspected relationships and to summarize the data in novel ways that are both understandable and useful to the data owner. (Hand et al. luku 1) Tiedonlouhinta 2013/L2 p. 9 Tiedonlouhinta 2013/L2 p. 10 Data-analyysi raaka data informaatio raaka data=prosessoimattomia ja tulkitsemattomia faktoja, esim. mittausten tuloksia datalla itsessään ei mitään merkitystä informaatio=tietoa jolla on merkitys, tulkittua dataa informaation voi esittää myös rakenteellisena mallina suhteellisia termejä: yhden prosessin tuloksena saatu informaatio voi olla toiselle prosessille dataa Tiedonlouhinta 2013/L2 p. 11 Esimerkki: Data vs. informaatio Data: maanpinnan korkeus eri mittauspisteissä ympäri Suomea eri vuosina Informaatiota: Suomen korkein kohta on Haltilla suurin osa maasta on alankoa (alle 200m merenpinnasta) Suomen keskikorkeus on n. 154m Oulun Kemin alueella maa kohoaa n. 9 mm vuodessa maanpinnan korkeusmalli Tiedonlouhinta 2013/L2 p. 12

Data-analyysia harjoittavia tieteenaloja Tiedonlouhinnan lisäksi tilastotiede (erityisesti deskriptiivinen tilastotiede, eksploratiivinen data-analyysi) koneoppiminen (machine learning) (sis. hahmon tunnistuksen, pattern recognition) informaation eristäminen tekstistä (information extraction from text) (luonnollisen kielen prosessoinnin, tiedonhaun (information retrieval) ja DM:n välimaastossa) Tiedonlouhinta 2013/L2 p. 13 Tiedonlouhinta vs. tilastotiede? Tiedonlouhinnan juuret eksploratiivisessa data-analyysissa (exploratory data analysis): tavoite etsiä uusia piirteitä datasta laskennallisesti hankalaa! Tarve algoritmeille Tiedonlouhinta mahdollisti monimutkaisempien mallien etsinnän Keskeinen ero laskennallinen elementti tiedonlouhinta edellyttää epätriviaalia laskentaa eli kekseliäitä algoritmeja Käytännön eroja: tiedonlouhinnassa paljon suuremmat datajoukot tilastotieteessä tilastollisen merkitsevyyden arviointi keskeistä Tiedonlouhinta 2013/L2 p. 14 Tiedonlouhinta vs. koneoppiminen? Rajanveto vaikeaa! Joskus molemmat luetaan kattokäsitteen Knowledge discovery alle Koneoppimisen osa-alueet Ohjattu koneoppiminen (supervised ML): ennustava (prediktiivinen) mallinnus (esim. luokittelu) Ohjaamaton koneoppiminen (unsupervised ML): kuvaava (deskriptiivinen) mallinnus (esim. klusterointi) Filosofinen ero Koneoppiminen Uskomus että data on jonkin mallin tuottamaa. Tavoite löytää datan parhaiten selittävä/kuvaava malli. Tiedonlouhinta: Data on ensisijaista. Sillä ei välttämättä ole mitään mallia tai vain lokaaleja hahmoja (osittaismalleja). Tavoite löytää kaikki kiinnostavat hahmot. Tiedonlouhinnassa lähinnä deskriptiivistä mallinnusta Tiedonlouhinta 2013/L2 p. 15 Tiedonlouhinta 2013/L2 p. 16

Malli vs. hahmo (Hand et al luku 6) DM vs. ML: Käytännön eroja (yleistys) Malli (model) kattava, abstrakti esitys datasta globaali eli koskee kaikkia datapisteitä esim. Kaikki opiskelijat voidaan luokitella laiskoihin ja ahkeriin laskuharjoituspisteiden ja luentoaktiivisuuden perusteella. Hahmo (pattern) jotain datan osaa kuvaava piirre (paikallinen malli) lokaali eli koskee vain tiettyjä datapisteitä esim. Korkeat harjoituspisteet indikoivat hyvää arvosanaa. Tiedonlouhinta 2013/L2 p. 17 Koneoppimisessa monimutkaiset mallit huonommin skaalautuvat algoritmit pienemmät datajoukot (satoja tuhansia rivejä, kymmeniä muuttujia) data ja muuttujat valittu huolella mallinnustarkoitukseen Tiedonlouhinta 2013/L2 p. 18 Yhteenveto: Tieteenalojen suhteet Tiedonlouhinnassa suhteellisen yksinkertaiset hahmot tehokkaammat algoritmit suuret datajoukot (jopa miljoonia rivejä, satoja tuhansia muuttujia) data saatu usein jonkin toisen projektin sivutuotteena model > data complex models we know, what we want to learn MACHINE LEARNING DATA MINING STATISTICS we know, what we are looking for data > model simple models or local patterns we don t know, what we are looking for small amount of data Tiedonlouhinta 2013/L2 p. 19 Tiedonlouhinta 2013/L2 p. 20

Tiedonlouhintaprosessi Prosessin tyypilliset vaiheet Edellyttää yhteistyötä eri alojen ihmisten välillä! 1. Ongelman määrittely datan ja taustateorian ymmärtäminen DATA Ongelman analysointi sovellusalan asiantuntijat ja louhija Tiedon louhinta louhija Tulosten analysointi sovellusalan asiantuntijat ja louhija UUSI TIETO 2. Esiprosessointi datan siivous, piirteiden eristys ja valinta 3. Tiedonlouhinta (mallinnus/hahmojen haku) 4. Tulosten luotettavuuden arviointi Tiedonlouhinta 2013/L2 p. 21 5. Tulosten havainnollinen esitys ja tulkinta Tiedonlouhinta 2013/L2 p. 22 1. Ongelman määrittely 2. Esiprosessointi Datan ymmärtäminen: mitä muuttujat mittaavat/kuvaavat? Paljonko dataa on (suhteessa muuttujien määrään)? Millaisia hahmoja olisi kiintoisaa/hyödyllistä löytää? Mitä tiedetään ennestään? Taustateoriaan kannattaa louhijankin perehtyä! Vaikeus: Eri alojen ihmisten löydettävä yhteinen kieli (koeta puhua siten, että maallikkokin ymmärtää) Datan yhdistys (eri lähteistä) (voi vaatia normalisointia tms.) Alustava analysointi: muuttujien keskiarvot, keskihajonnat, jakaumat, korrelaatiot (tilastollisilla työkaluilla) Datan siivous: puuttuvien arvojen käsittely, virheiden tarkistus ja korjaus Uusien potentiaalisesti hyvien muuttujien johtaminen (esim. muuttujien yhdistys, diskretointi, normalisointi) Tiedonlouhinta 2013/L2 p. 23 Tiedonlouhinta 2013/L2 p. 24

2. Esiprosessointi (jatk.) Mallinnuksen kannalta hyvien muuttujien valinta Jos mahdollista, aluksi ei kannata karsia mitään, ennen kuin tiedetään, mitkä muuttujat tarpeettomia Jos laskennallisesti mahdotonta, luodaan vaihtoehtoisia datajoukkoja (samaa asiaa kuvaavat vaihtoehtoiset muuttujat eri joukkoihin) ttujien valintamenetelmät eivät koskaan takaa optimaalista tulosta! (NP-kova ongelma) 3. Tiedonlouhinta Aina kannattaa aloittaa riippuvuusanalyysistä! muuttujien ja mallinnusmenetelmien valinta Yleensä deskriptiivinen mallinnus auttaa prediktiivisten mallien muodostuksessa esim. Deskr: Etsitään 100 merkitsevintä muuttujaan Diabetes liittyvää riippuvuussääntöä Pred: Etsitään (valikoidusta datasta) paras diabetesta ennustava malli Tyypillisiä mallinnusmenetelmiä riippuvuusanalyysi, klusterointi, luokittelu Tiedonlouhinta 2013/L2 p. 25 Tiedonlouhinta 2013/L2 p. 26 Tiedonlouhinta: Riippuvuusanalyysi Annettu joukko kategorisia muuttujia R = A 1,...,A k, etsi merkitsevimmät tilastolliset riippuvuussäännöt muotoa X C (X R, C R) esim. A 1,A 4 A 9 A 2 (A 1 ja A 4 lisäävät A 2 :n todennäköisyyttä) esim. geeni elintapa sairaus -datasta voi löytyä ApoE-e4, alkoholiakohtuudella Alzheimer Tiedonlouhinta: Klusterointi Jaa datapisteet samankaltaisten/lähekkäisten pisteiden muodostamiin ryhmiin eli klustereihin harj. pisteet Esim. opiskelijoiden klusterointi luennoille osallistumisen (kerrat) ja harjoituspisteiden perusteella Annettu joukko numeerisia muuttujia R = A 1,...,A k sekä C, muodosta lineaarinen malli joka ennustaa parhaiten C:tä Malli muotoa C = β 1 B 1 +β 2 B 2 +...β m B m +α, missä B i R. Tiedonlouhinta 2013/L2 p. 27 luennot Tiedonlouhinta 2013/L2 p. 28

Tiedonlouhinta: Luokittelu Annettuna datapisteiden luokittelu (jako luokkiin), muodosta malli, joka määrittää pisteen luokan muiden muuttujien perusteella. esim. päätöspuu pelto- ja koivuhiiren erotukseen painon, vartalon ja hännän pituuden perusteella >7cm <8cm hännän pituus <20g vartalon pituus <7cm paino >8cm peltohiiri >20g peltohiiri 4. Tulosten luotettavuuden arviointi Ovatko löydetyt hahmot tai mallit järkeviä?? (Muista aina tarkistaa!) voi olla, ettei datasta oikeasti löydy mitään mallia mallinnusmenetelmä palauttaa silloin jonkin satunnaismallin Prediktiivisten mallien validointi helppoa: määritetään hyvyysmitta (tai virhemitta, esim. väärin luokiteltujen alkioiden osuus) malli opitaan opetusjoukosta (training set) ja sen virhettä tutkitaan testijoukossa opetus- ja testijoukkojen oltava edustavia! vaihtoehto ristiinvalidointi koivuhiiri peltohiiri Tiedonlouhinta 2013/L2 p. 29 Tiedonlouhinta 2013/L2 p. 30 4. Tulosten luotettavuuden arviointi (jatk.) 5. Tulosten esitys ja tulkinta Deskriptiivisten mallien luotettavuuden arviointi vaikeampaa Tavoite: halutaan takuita, että löydetty hahmo ei johdu sattumasta Mielellään takuita myös siitä, että samanlainen hahmo pätee jatkossa, samasta samantapaisesta populaatiosta kerättävässä datassa välineenä hahmon tilastollisen merkitsevyyden arviointi Tulokset kannattaa esittää mahdollisimman havainnollisesti (esim. graafisesti), jolloin oleellinen erottuu Alan asiantuntija keskeisessä roolissa! Löytyikö jotain uutta? Voiko tulosten pohjalta muodostaa uutta hypoteesia? Miten sitä voisi tutkia lisää? Johtaa useimmiten uuteen louhintakierrokseen: kokeillaan uusia muuttujia ja mahdollisesti uusia menetelmiä Kierrokset lopetetaan vasta, kun ollaan tyytyväisiä tai mitään uutta ei näytä enää löytyvän Tiedonlouhinta 2013/L2 p. 31 Tiedonlouhinta 2013/L2 p. 32

Tarvitaanko tiedonlouhintaan tietojenkäsittelytieteilijää? Täydellinen data-analyysi silti jokseenkin mahdotonta Miksi? Soveltava tiedonlouhinta: käytetään yleensä valmiita työkaluja Periaatteessa kuka tahansa oppii käyttämään (pitää vain tuntea perusteet mitä kannattaa tehdä ja miten) Valmiita helppokäyttöisiä työkaluja on, mutta ei uusimmista algoritmeista (ohjelmoija osaa toteuttaa algoritmin) Joskus ongelma vaatii ihan uutta menetelmää (uudenlaisen hahmon hakua) tarvitaan tiedonlouhinta-algoritmien suunnittelijaa ja ohjelmoijaa Tiedonlouhinta 2013/L2 p. 33 Tiedonlouhinta 2013/L2 p. 34 Tarvitaanko tietojenkäsittelytieteilijää? Esiprosessointivaiheessa tarvitaan yleensä ohjelmointitaitoja (uusien hyvien muuttujien muodostus on taidelaji!) Mutta: jos data on tosi siistiä, muuttujat hyviä ja työkalu kattava, voi louhinnasta selvitä osaamatta koodata riviäkään. Työelämässä tiedonlouhijoilla ja data-analyytikoilla on paljon kysyntää (ja kysyntä kasvaa)! Tiedonlouhinta 2013/L2 p. 35