SUOMEN IMAGE2000 JA CORINE LAND COVER 2000 TARKKUUDEN ARVIOINTI

Koko: px
Aloita esitys sivulta:

Download "SUOMEN IMAGE2000 JA CORINE LAND COVER 2000 TARKKUUDEN ARVIOINTI"

Transkriptio

1 SUOMEN IMAGE2000 JA CORINE LAND COVER 2000 TARKKUUDEN ARVIOINTI Markus Törmä Suomen ympäristökeskus Tietokeskus Geoinformatiikka ja alueidenkäyttöyksikkö

2 SISÄLLYSLUETTELO 1. JOHDANTO IMAGE2000 ja CORINE LAND COVER Tiedon tuottaminen Suomessa IMAGE2000 kuvien prosessointi CLC2000 tulkinnan suorittaminen CLC2000 luokat Euroopan ympäristöviraston ohjeet validoinnin suorittamiseksi IMAGE2000 GEOMETRINEN TARKKUUS Geometrisen tarkkuuden määrittäminen IMAGE2000:n geometrinen tarkkuus CLC2000 TEMAATTISEN TARKKUUDEN ARVIOINTI Temaattisen tarkkuuden arvioinnin menetelmät Jatkuvat muuttujat Luokittelu Visuaalinen arviointi Jatkuvat muuttujat Tulkinnan testikuviot Tulkinnan testikuviot, Ylä Lappi Vertailu VMI koeloihin Kasvipeitteisyysestimaatin tarkkuudesta Luokittelutarkkuus VMI vertailu SLICES vertailu BIOPRESS vertailu Pinta alojen vertailu YHTEENVETO

3 1. JOHDANTO Paikkatiedon tarkkuuden voidaan määritellä olevan havaintojen, laskentatulosten tai estimaattien vastaavuutta tai läheisyyttä niiden todellisiin arvoihin tai arvoihin jota pidetään tosina (USGS, 1997). Paikkatieto koostuu kohteen sijaintitiedosta ja ominaisuustiedosta. Ensin mainittu vastaa kysymykseen missä ja jälkimmäinen kysymykseen mitä. Kaukokartoitusaineiston tulkinnan tai olemassa olevan paikkatiedon analyysin ja yhdistelyn tuloksen syntyneen uuden paikkatiedon tarkkuuden arviointi on tärkeä vaihe aineiston tuotannossa, koska sen avulla paikkatiedon käyttäjä saa käsityksen aineiston käyttökelpoisuudesta tarkoituksiinsa. Tämä dokumentti käsittelee IMAGE2000 ja Corine Land Cover 2000 luokittelun kansallisen ja eurooppalaisen version tarkkuuden arviointia. Luvussa 2 käsitellään IMAGE2000 satelliittikuvien oikaisun tarkkuutta. Luku 3 käsittelee tuotetun paikkatiedon sekä tulkinnan välivaiheiden temaattista tarkkuutta. Temaattisen tarkkuuden arviointi on jaettu lopputuloksen visuaaliseen arviointiin (luku 3.2), tulkinnan välivaiheiden eli puusto ja kasvillisuusmuuttujien estimoinnin tarkkuuden arviointiin (luku 3.3), tulkinnan lopputuloksen luokittelutarkkuuden (luku 3.4) sekä tulkinnan lopputuloksen pinta alojen tarkkuuden (luku 3.5) arviointiin. Luku 4 esittelee tarkkuuden arvioinnin johtopäätökset. 1.1 IMAGE2000 ja CORINE LAND COVER 2000 Euroopan komissio aloitti CORINE ohjelman 1980 luvun puolivälissä tarkoituksena hankkia ympäristöön liittyvään paikkatietoa Euroopan Unionin alueelta, joka olisi laadultaan homogeenista siirryttäessä valtiosta toiseen (Heymann et.al., 1994). CORINE maankäyttö / peiteluokittelu (CLC) perustuu satelliittikuvien visuaaliseen tulkintaan ja saatavilla olevaan karttamateriaaliin. Aluksi tulkinta tehtiin piirtämällä tulkinta satelliittikuvan filmikopion päälle kiinnitetylle muoville, myöhemmin käyttäen tietokonetta ja paikkatietojärjestelmiä (Bossard et.al., 2000). Kartoitusmittakaava on 1:100000, sijaintitarkkuus 100 metriä ja pienin kartoitettava alue kooltaan vähintään 25 hehtaaria. Luokkajärjestelmä on hierarkkinen ja sisältää 5 luokkaa ensimmäisellä, 15 toisella ja 44 kolmannella tasolla (Büttner et.al., 2002). CLC luokittelun päivittämiseksi Euroopan ympäristövirasto ja Euroopan unionin tutkimuskeskus aloittivat IMAGE2000 ja CLC2000 projektit. IMAGE2000 projekti käsittää Euroopan unionin kattavan satelliittikuvapeiton hankinnan ja kuvien oikaisun. Tätä kuvapeittoa käytetään CLC2000 projektissa CLC tietokannan päivittämiseen ja maanpeitteeseen liittyvien muutosten määrittämiseen vuosina Päivitys perustuu visuaaliseen tulkintaan (Bossard et.al., 2000). 1.2 Tiedon tuottaminen Suomessa Suomen ympäristökeskus on ollut vastuussa Suomen IMAGE2000 ja CLC2000 projektien hallinnoimisesta sekä tiedon tuottamisesta. Valtion teknillinen tutkimuskeskus on tuottanut menetelmiä ja tietokoneohjelmia joilla on suoritettu satelliittikuvien ilmakehäkorjaukset sekä kuvien tulkinta. Metsähallitus ja UPM Kymmene ovat antaneet metsäninventointitietoja projektin käyttöön. Metsäntutkimuslaitos on osallistunut lopputuloksen tarkkuuden arviointiin. 2

4 1.2.1 IMAGE2000 kuvien prosessointi Metria Sweden suoritti satelliittikuvien oikaisun orto oikaisuna käyttäen satelliitin ratatietoja, maastotukipisteitä ja maastomallia. Pilvet ja näiden varjot poistettiin manuaalisen tulkinnan ja digitoinnin avulla. Ilmakehäkorjaus suoritettiin VTT:n kehittämän korjausohjelman avulla joka perustuu SMAC algoritmiin. Ohjelman ilmakehää kuvaavista parametreista AOD (Atmospheric Optical Density) määritettiin käyttäen kuvaan perustuvaa menetelmää kullekin kuvalle erikseen. Lapissa (kasvillisuusvyöhykkeet 4c ja 4d) suoritettiin topografiakorjaus käyttäen Ekstrandin menetelmää. Satelliittikuvat mosaikoitiin kasvillisuusvyöhykkeiden mukaisiksi kuvamosaiikeiksi. Tulkinta tehtiin sekä mosaiikeille että yksittäisille kuville. Estimoitujen tarkkuustunnusten perusteella tehtiin valinta kumpaa käytettiin lopullisen luokittelun tekemiseen CLC2000 tulkinnan suorittaminen Suomen CLC2000 luokittelu perustuu olemassaoleviin paikkatietoaineistoihin ja satelliittikuvista tulkittuun maanpeitetietoon (kuva 1.1). Paikkatietoaineistoja käytetään maankäytön määrittämiseen sekä apuna satelliittikuvien tulkinnassa. Satelliittikuvia käytetään maanpeitetiedon hankintaan sekä paikkatietoaineistojen päivittämiseen. Maanpeitetietojen estimoitiin käytettiin VTT:n kehittämää PROBA estimointimenetelmää. Maastokoealatietojen avulla kasvillisuutta kuvaaville muuttujille määritettiin estimaatit kullekin satelliittikuvan pikselille. Estimoituja muuttujia olivat mm.: Puuston pituus Puuston latvuspeitto Puuston latvuspeitto havupuille Puuston latvuspeitto lehtipuille Input Map Data Reference data Corine main classes 1. Artificial surface Topographic Database Satellite Images 2. Agricultural areas 3. Forest 4. Wetlands 5. Water bodies SLICES Semiautomatic Digitalisation Kuva 1.1: Suomen CLC2000 luokittelun pääluokat sekä näiden pääasialliset tietolähteet. 3

5 Tulkinta stratifioitiin suomaskin avulla siten että mineraalimaat ja turvemaat tulkittiin erikseen. Lisäksi Lapissa määritettiin aluskasvillisuutta ja maaperää kuvaavia muuttujia. Ylä Lapista ei ollut saatavilla suomaskia joten siellä tulkintaa ei stratifioitu. Rakennettujen ja maatalousmaiden osalta lopullinen CLC2000 luokitus perustuu paikkatietoaineistoihin, lähinnä SLICES maankäyttöelementtiin. Vesialueet on luokiteltu paikkatietoaineistojen perusteella täydentäen näitä satelliittikuvan tulkinnalla. Metsät sekä vähäpuustoiset kankaat ja kosteikot on tulkittu käyttäen estimoituja kasvillisuusmuuttujia ja sääntöpohjaista tulkintaa. Tulkinnan tuloksena syntyi CLC2000 luokittelun kansallinen versio joka on rasterimuodossa ja sen pienin alueellinen yksikkö on 25 m x 25 m kokoinen kuvapikseli. Kansallinen versio yleistettiin käyttäen Euroopan ympäristöviraston ohjeita (Heymann et.al., 1994) jolloin tulokseksi saatiin CLC2000 luokittelun eurooppalainen versio joka on vektorimuodossa ja pienin kartoitettava yksikkö 25 hehtaaria CLC2000 luokat CLC2000 luokittelun perustana on hierarkinen luokittelujärjestelmä, jossa on kaikenkaikkiaan 44 luokkaa tasolla 3. Näistä Suomessa on käytössä 31 luokkaa. Lisäksi Suomessa joitakin luokkia on tarkennettu neljännen tason luokilla. Luokkien nimet ja luokkahierarkia on esitetty taulukossa 1.1. Tarkemmat kuvaukset luokista löytyvät dokumentista xxx. Taulukko 1.1: CLC2000 luokkien nimet ja koodit luokittelutasoilla 1 4. Luokat joita ei käytetä Suomessa on merkitty merkinnällä "**". Taso 1 Taso 2 Taso 3 Taso 4 1 Rakennetut alueet 1.1 Asuinalueet Tiiviisti rakennetut asuinalueet Väljästi rakennetut asuinalueet 1.2 Teollisuuden, palveluiden ja liikenteen alueet 1.3 Maa aineisten ottoalueet, kaatopaikat ja rakennustyöalueet 1.4 Virkistys ja vapaaajan toiminta alueet Teollisuuden ja palveluiden alueet Liikennealueet Satama alueet Lentokenttäalueet Maa aineisten ottoalueet Kaatopaikat Rakennustyöalueet Taajamien viheralueet ja puistot Urheilu ja vapaaajan toiminta alueet Kesämökit Muut urheilu ja vapaa ajan toiminta alueet 2 Maatalousalueet 2.1 Peltomaat Pellot Käytössä Hylätty Keinokastellut pellot** Riisipellot** 2.2 Puu ja pensasviljelmät Viinitarhat** Hedelmäpuu ja 4

6 3. Metsät sekä avoimet kankaat ja kalliomaat 4. Kosteikot ja avoimet suot marjapensasviljelmät Oliivipuuviljelmä**t 2.3 Laidunmaat Laidunmaat 2.4 Heterogeeniset maatalousvaltaiset alueet Yhdistelmäviljelmät** Peltojen ja niittyjen muodostama mosaiikki Pienipiirteinen maatalousmosaiikki Puustoiset pelto ja laidunmaat** 3.1 Sulkeutuneet metsät Lehtimetsät Lehtimetsä mineraalimaalla Lehtimetsä turvemaalla Lehtimetsä kalliomaalla Havumetsät Havumetsä mineraalimaalla Havumetsä turvemaalla Havumetsä kalliomaalla Sekametsät Sekametsä mineraalimaalla Sekametsä turvemaalla Sekametsä kalliomaalla 3.2 Harvapuustoiset metsät, pensastot sekä avoimet kankaat 3.3 Avoimet kankaat ja kalliomaat 4.1 Sisämaan kosteikot ja avosuot Luonnonniityt Varvikot ja nummet Nahkealehtisen kasvillisuuden alueet** Harvapuustoiset alueet Rantahietikot ja dyynialueet Kalliomaat Niukkakasvustoiset kangasmaat Paloalueet** Jäätiköt ja pysyvän lumen alueet** Harvapuustoinen alue mineraalimaalla Harvapuustoinen alue turvemaalla Harvapuustoinen alue kalliomaalla Erittäin harvapuustoiset alueet mineraalimaalla Harvapuustoinen alue tunturissa Harvapuustoinen alue, sähkölinja Sisämaan kosteikot Kosteikko maalla Kosteikko vedessä 5

7 4.1.2 Avosuot Luontainen avosuo Turvetuotantoalue 4.2 Rannikon kosteikot Merenrantakosteikot Kosteikko maalla Kosteikko vedessä Merenrannan suolamaat** Vuorovesialueet 5. Vesialueet 5.1 Sisävedet Joet Järvet 5.2 Merivedet Rannikon laguunit** Jokisuistot** Meri Euroopan ympäristöviraston ohjeet validoinnin suorittamiseksi Euroopan ympäristöviraston ohjeet validoinnin suorittamiseksi löytyvät julkaisusta Bossard et.al. (2000). Menetelmässä valitaan ositetulla satunnaisotannalla testipisteitä joiden ympäristö tulkitaan samalla menetelmällä kuin tehtäessä varsinainen CLC2000 tulkinta. Osittaminen voi perustua alueeseen tai CLC2000 tulkinnan luokkaan. Tulokseksi saadaan oikein tulkittujen alueiden osuudet ositteille ja koko alueelle. Esitetyn menetelmän hyvänä puolena on että vertailu tulkinnan ja referenssin välillä tehdään huomioiden vertailukohdan ympäristö, eikä verrata CLC2000 tulkinnan polygonia pistemäiseen referenssiin. Heikkoutena on että menetelmä on erittäin työläs toteuttaa ja siten kallis, sekä perustuu samaan tulkintamenetelmään ja saman tulkintamateriaalin käyttämiseen kuin tehtäessä CLC2000 tulkintaa joten vertailtavia kahta tulkintaa ei voi pitää täysin toisistaan riippumattomina. 6

8 2 IMAGE2000 GEOMETRINEN TARKKUUS Suomen IMAGE2000 käsittää 37 Landsat ETM kuvaa. Kuvat muodostavat melkein pilvettömän peiton Suomen alueesta, vain noin 0.55% (1700 km 2 ) Suomen maa alueesta jää pilvien peittoon. Metria Sweden suoritti maastomallin avulla kuvien orto oikaisun Suomen yhtenäiskoordinaatistoon (YKJ). Oikaisun tukipisteinä käytettiin järvien painopisteitä. Satelliittikuvasta vesialueet tulkittiin kynnystämällä lähi infrakanava. Referenssimateriaalina käytettiin vesistöjen rantaviiva tietokantaa. Tämän avulla järville määritettiin painopisteiden koordinaatit ja etsittiin vastinpisteet kuvilta tulkituista järvistä. Osa tukipisteistä käytettiin varsinaiseen ortooikaisuun ja osa jätettiin oikaisun testipisteiksi. Oikaisussa apuna käytetyn digitaalisen karttadatan on tuottanut Maanmittauslaitos ja se tarkkuudeksi on arvioitu järvien rantaviivojen paikannuksen osalta 5 20 metriä ja maastomallin korkeuden osalta parempi kuin 2 metriä (CLC2000). 2.1 Geometrisen tarkkuuden määrittäminen Metria toimitti kunkin kuvan osalta tiedoston jossa oli testipisteiden tunnusten lisäksi kuvalta ja referenssimateriaalista määritetyt YKJ koordinaatit, näistä lasketut residuaalit sekä keskimääräiset RMSE virheet. Nämä tiedot olivat 32 kuvalle (taulukko A.1), kuvasta 192/11 ne puuttuivat. Geometrisen tarkkuuden määrittämiseen liittyvät kuvat ja taulukot ovat liitteessä A. Testipisteiden koordinaateista laskettiin residuaalit kummallekin koordinaatille kaavoilla: ja δ δ E N = R E = R N I I E, N, joissa R tarkoittaa referenssimateriaalista ja I kuvalta määritettyä koordinaattia. Testipisteiden residuaaleista laskettiin laskettiin seuraavat oikaisun onnistumista kuvaavat arvot koko alueelle ja kuvittain (taulukot A.1 ja A.2): Keskimääräinen residuaali, ts. E ja N koordinaatin residuaalin keskiarvo: Ere, Nre Residuaalien hajonta: Estd, Nstd Suurimmat residuaalit: Emax, Nmax Keskimääräinen residuaalivektorin pituus: VLME Residuaalivektorin hajonta: VLSTD Suurin residuaalivektorin pituus: VLMAX RMSE virheet (Root Mean Square Error) laskettiin kaavoilla RMSE E = n i= 1 δ n 2 Ei, 7

9 ja RMSE N = n i= 1 δ n 2 Ni. Planimetrinen RMSE virhe laskettiin kaavalla: 2 E RMSE = RMSE + RMSE P 2 N. 2.2 IMAGE2000:n geometrinen tarkkuus Oikaisun testipisteitä oli yhteensä 339 kappaletta (taulukko A.1). Kuvittain testipisteiden määrä vaihteli 2 (kuva 189/12) ja 38 (kuva 189/16) välillä, keskiarvon ollessa 11, mediaanin 9 ja hajonnan 7 testipistettä. Testipisteiden residuaalivektorit on kuvattu ETM kuvittain kuvissa A.1 A.4. Negatiivinen residuaali tarkoittaa että oikaistu kuva on koordinaatista riippuen liikaa idässä tai pohjoisessa. Oikaisun onnistumista kuvaavat arvot ovat taulukoissa A.1 ja A.2 sekä kuvissa A.5 A.8. Testipisteiden perusteella IMAGE2000 kuvat on oikaistu varsin hyvin. Kummankin koordinaatin residuaalien keskiarvot (taulukko A.1: sarakkeet ERE ja NRE sekä kuva A.5) ovat lähellä nollaa jolloin negatiiviset ja positiiviset residuaalit kumoavat toisensa. Suurin osa testipisteistä on lähempänä kuin 10 metriä oikeasta kohdastaan. Yksittäisistä kuvista pienimmät keskimääräiset residuaalit ovat alle 0.1 metriä kuvilla 188/15 (E koordinaatti) ja 188/16 (Nkoordinaatti). Suurimmat residuaalit olivat kuvilla 191/15 (E koordinaatti, 7.0 metriä) ja 186/17 (N koordinaatti 5.9 metriä). Residuaalit olivat suuria, ts. keskiarvot olivat suurempia kuin 5 metriä yhteensä 9 kuvalla. Suuri residuaalien keskiarvo viittaa siihen että residuaalit eivät ole jakautuneet satunnaisesti vaan ne ovat suuntautuneet systemaattisesti johonkin suuntaan. Residuaalien suuri hajonta (taulukko A.1, sarakkeet Estd ja Nstd) viittaa siihen että osa kuvasta on onnistuttu oikaisemaan hyvin ja osa huonosti. Hajontojen osalta parhaita kuvia ovat 195/12 ja 189/16, huonoimpia 192/13 ja 189/12. Suurimmat yksittäisten testipisteiden residuaalit (taulukko A.1, sarakkeet Emax ja Nmax) ovat 32.5 metriä E koordinaatin (kuva 191/15) ja 26.6 metriä N koordinaatin osalta (kuva 194/12). E koordinaatin osalta muita suuria maksimiresiduaaleja, ts. suurempia kuin 25 metriä, oli kuvilla 192/13, 194/12, 190/15 ja 191/17. Residuaalivektorien pituudet ovat keskimäärin 11 metriä (taulukko A.2, kuva A.7) ja suurin osa on pituudeltaan alle 20m. Pienimmillään kuvan keskimääräinen residuaalivektorien pituus on 5.7 metriä kuvalla 189/16. Kuvia joilla tämä arvo on pienempi kuin 10 metriä on 9 kappaletta. Tarkasteltaessa kuvien residuaalivektorien keskimääräisiä pituuksia ja hajontoja huonoimmat kuvat ovat 189/12, 189/13 ja 191/15. Suurin yksittäinen residuaalivektorin pituus on kuvalla 191/ metriä eli noin 1.5 pikseliä. Koordinaattien suuntaiset RMSE virheet ovat hieman alle 10 metriä (taulukko A.2: sarakkeet ERMSE ja NRMSE, sekä kuva A.8), yhdistelmä eli planimetrinen RMSE hieman yli 10 metriä (taulukko A.2: sarake PRMSE sekä kuva A.8) eli noin puoli pikseliä. RMSE on residuaalien neliöiden keskiarvon neliöjuuri eli se on suurempi kuin residuaalien absoluuttisten arvojen 8

10 keskiarvo koska neliöinti painottaa suuria residuaaleja. Residuaalien absoluuttisten arvojen keskiarvo kaikille testipisteille on 7.1 metriä E koordinaatille ja 6.6 metriä N koordinaatille. Planimetrisen RMSE:n mukaan paras kuva on 189/16 ja huonoimmat 189/12, 189/13 ja 191/15. Oikaisupisteiden residuaalien jakaumaa testattiin Mooren testillä (Buiten ja van Putten, 1997). Nollahypoteesi on että residuaalivektorit ovat tasajakautuneita. Taulukon A.2 sarake MT ilmaisee testin tulokset. Sarakkeeseen on merkitty ne kuvat, joiden osalta nollahypoteesi on hylätty. Symboli "+" tarkoittaa hylkäyksen merkitsevyystasoa α siten että yksi symboli tarkoittaa α=10%, kaksi α=5% ja kolme α=1%. Symboli "x" tarkoittaa että oikaisupisteiden lukumäärä on ollut niin pieni että testiä ei ole voinut tehdä. Merkitsevyystaso α tarkoittaa todennäköisyyttä että hylätty nollahypoteesi pitääkin paikkansa (Milton ja Arnold, 1990). Eli mitä pienempi α, sitä luotettavampi on nollahypoteesin hylkäys. Testin mukaan kymmenen kuvan oikaisupisteiden residuaalien jakaumat poikkeavat enemmän tai vähemmän tasajakaumasta. Yllättävää on että kun testi tehdään kaikille pisteille, tulokseksi saadaan että pisteet ovat ei tasajakautuneet. Visuaalisesti tarkastellen, joillain kuvilla kuten 186/17 (kuva A.1) ja 193/12 (kuva A.4) nollahypoteesin hylkäyksen näkee varsin hyvin. On myös kuvia kuten 186/16 ja 187/18 (kuva A.1) joilla nollahypoteesi hyväksytään mutta visuaalinen tarkastelu antaa vaikutelman ei tasajakautuneisuudesta. Kun nollahypoteesi hylätään visuaalisen tarkastelun antaessa vaikutelman tasajakaumasta, tämä johtuu siitä että residuaalivektorit ovat lyhyitä jolloin näiden ei tasajakaumaa on vaikea havaita visuaalisesti. Residuaalivektorien komponenttien välistä riippumattomuutta testattiin Spearmanin järjestyskorrelaatiotestillä (Spearman Rank Correlation Test) (Buiten ja van Putten, 1997). testin nollahypoteesi on että residuaalivektorin komponentit ovat jakautuneet toisistaan riippumattomasti joten ne eivät korreloi keskenään. Taulukon A.2 sarake SRCT ilmaisee testin tulokset. Hylkäyksen merkitsevyystaso α ilmaistaan siten että positiivista korrelaatiota merkitään symbolilla "+", negatiivista symbolilla " " ja yksi symboli tarkoittaa α=10%, kaksi α=5% ja kolme α=1%. Symboli "x" tarkoittaa että oikaisupisteiden lukumäärä on ollut niin pieni että testiä ei ole voinut tehdä. Testin mukaan kuudella kuvalla residuaalien komponentit korreloivat enemmän tai vähemmän, kolmella kuvalla korrelaatio on positiivista ja kolmella negatiivista. Kahden kuvan residuaaleista (189/16 ja 191/16) tätä korrelaatiota on vaikea havaita visuaalisesti. Tämä johtuu residuaalivektorien lyhyydestä ja vektorien suuresta määrästä. Muissa tapauksissa korrelaatio on myös visuaalisesti havaittavissa, sitä paremmin mitä pidempiä residuaalivektorit ovat. 9

11 3. CLC2000 TEMAATTISEN TARKKUUDEN ARVIOINTI Paikkatiedon temaattisella osalla tarkoitetaan kohteen ominaisuuden kuvausta tai esittämistä. Mikäli kohteen ominaisuus ilmaistaan kohdetta kuvaavan jatkuvan muuttujan avulla, tarkkuuden arvioinnissa määritetään tarkkuutta kuvaavia tunnuslukuja. Kun kohdetta kuvaava muuttuja on diskreetti luokka, tarkkuuden arvioinnin tunnuslukua kutsutaan luokittelutarkkuudeksi tai oikeinluokituksen todennäköisyydeksi. Luokiteltaessa satelliittikuvia luokittelutarkkuus saadaan määrittämällä kuinka usein luokittelutulos ja valitut maastokohteet vastaavat toisiaan. Maastokohteiden luokka määritetään käymällä tarkistamassa paikka maastossa tai epäsuorasti muun paikkatiedon avulla. Käytännössä temaattisen tarkkuuden arvioinnin myötä syntyneet tarkkuutta kuvaavat estimaatit voivat olla pessimistisesti harhaisia muun muassa seuraavista syistä (Verbyla ja Hammond, 1995, Congalton ja Green, 1993): Sijaintivirhe: Referenssimateriaalin ja tulkintatuloksen oletetaan sopivan toisiinsa sijainnin osalta virheettömästi. Käytännössä tämä on hyvin harvoin mahdollista. Sijaintivirheen vaikutus kasvaa mikäli luokkien lukumäärä kasvaa tai tulkittu alue on hyvin heterogeeninen. Pienin kartoitettava yksikkö: Referenssimateriaalin pienin kartoitettava yksikkö voi olla kooltaan suurempi kuin tulkittavan satelliittikuvan pikseli. Ajalliset eroavaisuudet: Alue on ehtinyt muuttua satelliittikuvan ottamisen ja referenssimateriaalin hankinnan välillä. Referenssimateriaalin tulkintavirheet: Maastokohde on tulkittu väärin maastossa, on sattunut kirjoitusvirhe tietojen käsittelyssä tai maastokohteen luokan määritykseen käytetty paikkatieto ei ole ollut ajantasaista. Temaattisen tarkkuuden arviointi on jaettu seuraaviin osiin: Euroopan ympäristöviraston suorittama visuaalinen arviointi (luku 3.2). Tällöin tulkinnan ja yleistyksen lopputuloksena syntyvää tulkinnan eurooppalaista versiota (minimikuviokoko 25 hehtaaria) verrataan satelliittikuvaan. Kriteerinä on että tekisikö kuvaa tulkitseva ihminen vastaavat kuviot kun nyt on syntynyt tietokonepohjaisen tulkinnan ja yleistyksen myötä. Tulkinnan välivaiheiden eli puusto ja kasvillisuusmuuttujien estimoinnin tarkkuuden arviointi (luku 3.3). Estimoituja muuttujia on verrattu tulkintatyötä tehtäessä testikuvioiden keskiarvoihin ja Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealoihin. Lisäksi käytössä on ollut jonkin verran Suomen ympäristökeskuksen henkilöstön inventoimia maastokohteita. Tulkinnan lopputuloksen luokittelutarkkuuden arviointi (luku 3.4) kansalliselle ja eurooppalaiselle versiolle. Luokittelutarkkuutta on arvioitu tulkinnan yhteydessä testikuvioiden, Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealojen, itse määritettyjen maastokohteiden sekä muun paikkatiedon avulla. Tulkinnan luokkien pinta alojen vertailu (luku 3.5) kansalliselle ja eurooppalaiselle versiolle. Tässä kohden on vertailtu yleistyksen vaikutusta luokkiin, sekä vertailtu sekä kansallista että eurooppalaista versiota SLICES luokittelun maankäyttöelementtiin ja Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealojen osuuksiin. 10

12 3.1 Temaattisen tarkkuuden arvioinnin menetelmät Temaattisen tarkkuuden osalta määritettiin muuttujien estimoinnin onnistumista kuvaavia tunnuslukuja sekä luokittelun osalta määritettiin virhematriisit suhteessa referenssimateriaaleihin ja määritettiin erilaisia tunnuslukuja kuten luokittelun keskimääräinen tarkkuus Jatkuvat muuttujat Jatkuvien muuttujien estimaattien ja referenssimateriaalin vertailu suoritettiin laskemalla estimoinnin absoluuttinen ja suhteellinen harha, absoluuttinen ja suhteellinen keskineliövirheen neliöjuuri, Pearsonin korrelaatiokerroin ja selitysaste. Estimaatin absoluuttinen harha BIAS on määritelty (Katila ja Tomppo, 2001) BIAS = n i= 1 xi yi, n jossa n on näytteiden lukumäärä, y estimoidut muuttujat ja x referenssiarvot. Suhteellinen harha BIAS% saadaan 100* BIAS BIAS% =. n y i= 1 n i Absoluuttinen keskineliövirheen neliöjuuri RMSE on määritelty (Katila ja Tomppo, 2001) RMSE = n i= 1 ( x i y ) n i 2, ja suhteellinen keskineliövirheen neliöjuuri RMSE% on 100* RMSE RMSE% =. n y n Pearsonin korrelaatiokerroin on määritelty (Milton ja Arnold, 1990) i= 1 i R xy = Cov( x, y), Var( x) Var( y) 11

13 jossa Cov(x,y) tarkoittaa muuttujien x ja y välistä kovarianssia ja Var(x) muuttujan x varianssia. Selitysaste R 2 on korrelaatiokertoimen neliö. Harhan tilastollinen merkitsevyys on määritetty harhan keskivirheen avulla, eli harha on tilastollisesti merkitsevä mikäli se on suurempi kuin kaksi kertaa harhan keskivirhe. Harhan keskivirhe on (Katila ja Tomppo, 2001) Luokittelu std( x y) s( bias) = n Luokittelun ja referenssimateriaalin vertailu suoritettiin muodostamalla luokittelun virhematriisi ja laskemalla tästä luokittelun onnistumista kuvaavia tunnuslukuja. Virhematriisin alkio a ij ilmaisee kuinka monta pikseliä tai näytettä jotka kuuluvat luokkaan j referenssimateriaalissa on luokiteltu luokkaan i luokittelutuloksessa. Eli matriisin sarakkeet vastaavat referenssimateriaalia ja rivit luokittelutulosta. Matriisin diagonaalialkiot ilmaisevat kuinka paljon näytteitä on luokiteltu oikein ja ei diagonaalialkiot virheluokituksia. (Lillesand ja Kiefer, 2000). Tarkkuudella tarkoitetaan siis luokittelun ja referenssimateriaalin välistä vastaavuutta. Virhematriisista määritettiin seuraavat tunnusluvut (Lark, 1995, Kuittinen et.al., 1991): Luokittelun kokonaistarkkuus: Todennäköisyys sille että luokittelutuloksesta otettu näyte on luokiteltu oikein sekä sille että satunnainen maastokohta on luokiteltu oikein luokittelutuloksessa. Todennäköisyys saadaan summaamalla virhematriisin diagonaalialkiot ja jakamalla näytteiden lukumäärällä: OA ii = i= 1 n n i= 1 n jossa n on luokkien lukumäärä. Luokkien tulkintatarkkuudet (tuottajan tarkkuus): Todennäköisyys sille että satunnaisesti valittu luokkaan x kuuluva näyte todella kuuluu luokkaan x, eli todennäköisyys että referenssimateriaalissa luokkaan x kuuluva näyte kuuluu luokkaan x myös luokittelutuloksessa: a j= 1 a ij. IA x = n a i= 1 xx a ix. Luokkien kohdetarkkuudet (käyttäjän tarkkuus): Todennäköisyys sille että luokkaan x luokiteltu näyte on luokiteltu oikein: TA x = n a i= 1 xx a xi 12

14 Kappa kerroin: Kerroin pyrkii määrittämään kuinka suuri osa kokonaistarkkuudesta johtuu todellisesta vastaavuudesta luokittelun ja referenssimateriaalin välillä, eikä sattumasta. Kappa kertoimen lähestyessä arvoa 1 todellinen vastaavuus lähenee arvoa 1 ja satunnainen vastaavuus 0. Kertoimen ollessa 0, luokittelu on yhtä hyvä kuin täysin satunnainen luokittelu (Lillesand ja Kiefer, 2000): Kappa N n a ii i+ + i i= 1 i= 1 = n 2 N ai+ a+ i i= 1 jossa N on näytteiden lukumäärä, a i+ virhematriisin rivin i summa ja a +i virhematriisin sarakkeen i summa. Luokkien Kappa kerroin: Kappa kerroin luokalle x on määritelty (Rosenfield ja Fitzpatric Lins, 1986): n a a, Kappa x = Na Na ii i+ a a i+ i+ a a + i + i. Tau kerroin: Kappa kerroin yliestimoi satunnaisen vastaavuuden luokittelutuloksen ja referenssimateriaalin välillä. Tau kertoimen pitäisi antaa luotettavampi estimaatti (Ma ja Redmond, 1995) jossa Pi on luokan i a'priori todennäköisyys. Tässä dokumentissa luokkien a'priori todennäköisyydet ovat olleet yhtä suuria. Estimaattien luottamusvälit määritetään yleensä normaalijakaumaoletuksen avulla. Tässä on kuitenkin ongelmana että näytejoukon ollessa pieni tai tunnusluvun ollessa lähellä 0 tai 1, luottamusväli ei ole symmetrinen keskiarvon ympärillä. Tästä syystä tässä dokumentissa luottamusvälit on laskettu käyttäen binomi ja F jakaumia (Morisette ja Khorram, 1998). Kuvassa 3.1 on esitetty 95% luottamusvälit näytejoukkojen koolle 20, 50, 100, 200 ja 500 näytettä. Vaakasuora akseli esittää estimoitua tarkkuutta prosentteina ja pystysuora akseli luottamusväliä prosentteina. 3.2 Visuaalinen arviointi Tau n a ii i= 1 i= 1 = n N Euroopan ympäristöviraston edustajat vierailivat kahdesti ( ja ) Suomen ympäristökeskuksessa arvioimassa CLC2000 tulkinnan lopputulosta. Näiden vierailujen tarkoitus on i= 1 opastaa kansallisia tekijöitä tietokannan tuottamisessa ja varmistaa lopputuloksen homogeenisuus eri puolilla Eurooppaa, n a a i+ i+ P i P i, 13

15 Kuva 3.1: 95% luottamusvälit näytejoukkojen koolle 20, 50, 100, 200 ja 500 näytettä. Vaakasuora akseli esittää estimoitua tarkkuutta prosentteina ja pystysuora akseli luottamusväliä prosentteina. Esimerkiksi, mikäli estimoitu luokittelutarkkuus on 80%, niin sen 95% luottamusväli on 67 90% kun näytejoukon koko on 50 näytettä ja kun käytössä on 500 näytettä. keskustella tuotantoon liittyvistä ongelmista, hankkia tietoa lopputuloksen laadusta maittain Euroopan ympäristövirastolle, sekä 2. käynnillä lisäksi tarkastaa ensimmäisen vierailun aikana korjattavaksi annetut asiat. Arviointi perustuu satelliittikuvan ja tulkinnan vierailuun. Apuna käytetään alueelta saatavissa olevaa muuta karttamateriaalia. Arvioinnin työkalu on ArcView ohjelman ominaisuuksia hyödyntävä InterCheck ohjelma, joka näyttää satelliittikuvan yhdessä tulkittujen polygonien kanssa. Tutkittavia asioita ovat luokkakoodien oikeellisuus ja varmistetaan että naapuripolygonit ovat eri luokkia polygonien minimikoko suurempi kuin 25 ha etsitään ei relevantit luokkakoodit, sekä tutkitaan vastaako satelliittikuva ja tulkintatulos toisiaan visuaalisesti. Ensimmäinen vierailu tapahtui jolloin tarkasteltiin viiden testialueen (8% maaalasta) tulkinnan onnistumista. Testialueilta valittiin 22 aluetta kooltaan 10 km x 10 km tarkempaa tarkastelua varten. Arviointi tuotti seuraavanlaisia kommentteja (Büttner ja Mari, 2003): 14

16 Tietokannan geometrinen laatu on hyvä. Tärkeimmät luokkiin liittyvät asiat olivat että tiiviisti rakennettuja asuinalueita (1.1.1) on liikaa eli näiden pitäisi olla väljästi rakennettuja asuinalueita (1.1.2) sekä luokka taajamien viheralueet ja puistot (1.4.1) puuttuu. Suositeltiin hieman alle 25 ha polygonien kasvattamista jotta ne olisivat suurempia kuin 25 ha, etenkin luokka 3xx luokan 5xx sisässä (säästetään pienet järvet), luokka 4xx luokan 3xx sisässä (säästetään pienet kosteikot harvapuustoisten alueiden sisässä), sekä luokka 324 luokan 31x sisässä (säästetään pienet hakkuuaukeat metsässä). Yleistettäessä pitäisi pyrkiä säilyttämää maa / vesi raja. Toinen vierailu tapahtui jolloin tarkastelun kohteena oli koko maa. Tarkempaa tarkastelua varten valittiin 114 aluetta kooltaan 10 km x 10 km. Tällä kertaa tärkeimmät kommentit olivat (Feranec ja Jaffrain, 2004): Luokkaa Pienipiirteinen maatalousmosaiikki pitäisi olla enemmän ja sen polygonien rajaukseen pitäisi kiinnittää huomiota. Jokien rajaukseen pitäisi kiinnittää huomiota, eli käytännössä joki voi olla kapeampi kuin 100m. Hakkuualueita puuttuu jonkin verran. Kokonaisuutena arvioijat olivat tyytyväisiä sekä tulkinnan lopputulokseen että käytettyihin menetelmiin. 3.3 Jatkuvat muuttujat Estimoidut puustoa ja kasvillisuutta kuvaavat jatkuvat muuttujat ovat tulkinnan välivaiheita. Etenkin metsien ja muiden luonnontilaisten alueiden luokittelu perustuu näihin muuttujiin, joista saadaan lopulliset CLC2000 luokat kynnystämällä. Estimoituja muuttujia on verrattu tulkintatyötä tehtäessä testikuvioiden keskiarvoihin, Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealoihin, sekä Miska Luodon (SYKE) Ylä Lapissa mittaamiin maastokoealoihin. Tulkinnan testikuvioiden estimaattien tarkkuus käsitellään kahdessa luvussa koska Ylä Lapissa (kasvillisuusvyöhykkeet 4c ja 4d) on käytetty erilaista opetusaineistoa ja kuvakorjausta kuin muualla Suomessa. Ylä Lapin opetusaineistona käytettiin Metsähallituksen tuottamaa biotooppikartoitusta kun muualla käytettiin Metsähallituksen ja UPM Kymmenen tuottamaa kuvioittaista metsäninventointitietoa. Kuvan radiometrisista korjauksista Ylä Lapissa suoritettiin ilmakehä ja topografiakorjaus kun muualla Suomessa pelkkä ilmakehäkorjaus katsottiin riittäväksi. Jatkuvien muuttujien estimaattien ja referenssimateriaalin vertailu suoritettiin laskemalla estimoinnin absoluuttinen ja suhteellinen harha, absoluuttinen ja suhteellinen keskineliövirheen neliöjuuri, Pearsonin korrelaatiokerroin ja selitysaste. Lisäksi tutkittiin harhan tilastollinen merkitsevyys. 15

17 3.3.1 Tulkinnan testikuviot Suurimmassa osassa Suomea tulkinnan opetusaineistona käytettiin Metsähallituksen ja UPM Kymmenen tuottamaa kuvioittaista metsäninventointitietoa. Näiltä alueilta määritettiin puuston pituuden, latvuspeiton, tilavuuden ja lehtipuuston tilavuuden tarkkuudet. Kuviot jaettiin kahteen ryhmään joista toista käytettiin tulkinnassa ja toista tulkintatuloksen testaamiseen. Eli tulkinnan jälkeen kuvioille laskettiin estimoidun muuttujan keskiarvo jota verrattiin metsäninventoinnin antamaan arvoon. Kuvioiden lukumäärät kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turv le on esitetty taulukossa B.1 ja kuvassa B.1. Kuvioiden kokoluokat olivat: 1. Kaikki kuviot 2. Alle hehtaari hehtaari hehtaari hehtaari hehtaari 7. Yli 100 hehtaari Estimoinnin tunnusluvut sekä harhan tilastollinen merkitsevyys määritettiin seuraaville muuttujille: 1. Puuston pituus 2. Puuston latvuspeitto 3. Puuston tilavuus 4. Lehtipuuston tilavuus Taulukot ja kuvaajat tuloksista on liitteessä B. Tulokset puuston pituuden osalta on esitetty taulukoissa B.2 B.7 ja kuvassa B.2, puuston latvuspeiton osalta taulukoissa B.8 B.13 ja kuvassa B.3, puuston tilavuuden osalta taulukoissa B.14 B.19 ja kuvassa B.4, ja lehtipuuston tilavuuden osalta taulukoissa B.20 B.25 ja kuvassa B.5. Tunnusluvut on laskettu kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turvemaiden kuvioille. Taulukkojen merkinnät tarkoittavat TR: opetusjoukko, TE: testijoukko, min: mineraalimaa, ja suo: turvemaa. Kuvissa sinisellä värillä esitetään opetusjoukon ja punaisella testijoukon tunnusluvut. Yhtenäinen viiva tarkoittaa että tunnusluvut on laskettu käyttäen kaikkia kuvioita, katkoviiva mineraalimaan kuvioita ja katkopisteviiva turvemaan kuvioita. Puuston pituuden osalta absoluuttinen harha on yleensä alle metri (taulukko B.2) ja suhteellinen harha alle 10 % yksikköä (taulukko B.3). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 4 metriä (taulukko B.4) ja suhteellinen alle 40 % yksikköä (taulukko B.5). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.7 (taulukko B.6) ja selitysaste 50 (taulukko B.7). Samat asiat on havaittavissa kuvassa B.2, kuvasta huomataan että opetus ja testijoukon tunnusluvut ovat hyvin samanlaiset, joissain tapauksissa kuten keskineliövirheen neliöjuuren suhteen testijoukon tulokset ovat parempia. Mineraalimaan tulokset ovat hieman parempia kuin turvemaan. Kuviokoon kasvattaminen parantaa tuloksia, paraneminen tasaantuu kun kuviokoko ylittää 10 hehtaaria. On huomattava että suurimmassa kokoluokassa (koko yli 100 hehtaaria) näytejoukon koko on varsin pieni joten sen tuloksiin kannattaa suhtautua hieman varauksella. 16

18 Puuston latvuspeiton osalta absoluuttinen harha on yleensä alle 5 % yksikköä (taulukko B.8) ja suhteellinen harha alle 10 % yksikköä (taulukko B.9). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 15 % yksikköä (taulukko B.10) ja suhteellinen alle 40 % yksikköä (taulukko B.11). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.7 (taulukko B.12) ja selitysaste 50 (taulukko B.13). Kuviokoolla ei ole juuri vaikutusta harhan suuruuteen (kuva B.3) mutta absoluuttinen keskineliövirheen neliöjuuri pienenee kuviokoon kasvaessa. Mineraalimaan tulokset ovat yleensä hieman parempia kuin turvemaan, sekä testijoukko yhtä hyvä tai hieman parempi kuin opetusjoukko. Puuston tilavuuden osalta absoluuttinen harha on yleensä alle 10 m 3 /ha (taulukko B.14) ja suhteellinen harha alle 10 % yksikköä (taulukko B.15). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 60 m 3 /ha (taulukko B.16) ja suhteellinen alle 50 % yksikköä (taulukko B.17). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.7 (taulukko B.18) ja selitysaste 50 (taulukko B.19). Jälleen, kuviokoon kasvattaminen parantaa tuloksia (kuva B.4) ja testijoukon tunnusluvut ovat yhtä hyviä tai parempia kuin opetusjoukon. Lehtipuuston tilavuuden osalta absoluuttinen harha on yleensä alle 5 m 3 /ha (taulukko B.20) ja suhteellinen harha alle 30 % yksikköä (taulukko B.21). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 30 m 3 /ha (taulukko B.22) mutta suhteellinen huomattavan suuri ollen yleensä yli 100 % yksikköä (taulukko B.23). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.4 (taulukko B.24) ja selitysaste 20 (taulukko B.25), eli korrelaatio on varsin vaatimatonta luokkaa. Estimaatin absoluuttinen harha on pienimmillään kuviokoolla 5 50 ha. Opetusjoukon absoluuttinen harha on pienempi kuin testijoukon ja mineraalimaiden harha pienempi kuin turvemaiden. Suhteellisen harhan osalta tilanne muuttuu, tällöin kuviokoolla 1 50 hehtaaria turvemaalla harha on pienempi kuin mineraalimaalla ja testijoukolla pienempi kuin opetusjoukolla. Absoluuttisen harhan suuruus on yleensä tilastollisesti merkitsevä. Puuston osalta tähän vaikuttaa muun muassa laskentatarkkuus, tulokset talletetaan tasametrein. Puuston latvuspeiton osalta vaikuttaa latvuspeiton määritys, etenkin harvalla latvuspeitolla maastoinventoinnin arvio ilmaistaan useamman prosenttiyksikön välein. Mineraalimaalla olevien testikuvioiden avulla tutkittiin muuttujien estimoinnin onnistumista muuttujien erilaisilla lukualueilla. Tarkoituksena oli tarkastella harhan käyttäytymistä. Edellä esitettyjen tunnuslukujen lisäksi määritettiin lineaarisen regression kertoimet estimaatin ja referenssin välille (ts. ref = a0 + a1 * est). Näiden kertoimien avulla voi yrittää kalibroida estimaatteja tarkemmiksi halutulla lukualueella. Tulokset on esitetty taulukoissa B.26 B.29 ja kuvissa B.6 B.13. Taulukoissa esitetään eri lukualueiden tunnusluvut, regressiosuoran kertoimet ja kuvioiden lukumäärä ja kuvissa estimaatin ja referenssiarvon suhde on esitetty kahdella eri tavalla. Harhan osalta tummennettu luku tarkoittaa että harhan suuruus ei ole tilastollisesti merkitsevä. Taulukoista havaitaan että paras korrelaatio estimaatin ja referenssin välillä saavutetaan käytettäessä koko lukualuetta. Niissä harvoissa tapauksissa kun harhan suuruus ei ole tilastollisesti merkitsevä, estimaatin lukualue on nollasta hieman ylöspäin. Esimerkiksi puuston pituuden osalta lukualue 0 7 metriä on estimoitu siten että harhan suuruus on tilastollisesti ei merkitsevä, samoin tilavuuden osalta lukualue m 3 /ha. Tosin näissä tapauksissa korrelaatio on varsin vaatimaton ja keskineliövirheen neliöjuuri suurehko. 17

19 3.3.2 Tulkinnan testikuviot, Ylä Lappi Ylä Lapissa (kasvillisuusvyöhykkeet 4c ja 4d) tulkinnan opetusaineistona käytettiin Metsähallituksen tuottamaa biotooppikartoitusta. Johtuen erilaisesta opetusaineistosta, kuvakorjauksista (kuville suoritettiin topografiakorjaus) sekä luonnontilaisten vähäpuustoisten alueiden suuresta osuudesta tulkinta suoritettiin eri lailla kuin muualla Suomessa. Ylä Lapin alueelta määritettiin puuston pituuden, puuston tilavuuden, puuston latvuspeiton, männyn, kuusen ja lehtipuuston latvuspeiton tarkkuudet. Kuviot jaettiin kahteen ryhmään joista toista käytettiin tulkinnassa ja toista tulkintatuloksen testaamiseen. Eli tulkinnan jälkeen biotooppikartan kuvioille laskettiin estimoidun muuttujan keskiarvo jota verrattiin biotooppikartan arvoon. Kuvioiden lukumäärät kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turv le on esitetty taulukossa C.1 ja kuvassa C.1. Kuvioiden kokoluokat olivat: 1. Kaikki kuviot 2. Alle hehtaari hehtaari hehtaari hehtaari hehtaari 7. Yli 100 hehtaari Estimoinnin tunnusluvut sekä harhan tilastollinen merkitsevyys määritettiin seuraaville muuttujille: 1. Puuston pituus 2. Puuston tilavuus 3. Puuston latvuspeitto 4. Männyn latvuspeitto 5. Kuusen latvuspeitto 6. Lehtipuuston latvuspeitto Tulokset taulukoin ja kuvin esitettynä ovat liitteessä C. Tulokset puuston pituuden osalta on esitetty taulukoissa C.2 C.7 ja kuvassa C.2, puuston tilavuuden osalta on esitetty taulukoissa C.8 C.13 ja kuvassa C.3, puuston latvuspeiton osalta on esitetty taulukoissa C.14 C.19 ja kuvassa C.4, männyn latvuspeiton osalta on esitetty taulukoissa C.20 C.25 ja kuvassa C.5, kuusen latvuspeiton osalta on esitetty taulukoissa C.26 C.31 ja kuvassa C.6, ja lehtipuuston latvuspeiton osalta on esitetty taulukoissa C.32 C.37 ja kuvassa C.7. Tunnusluvut on laskettu kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turvemaiden kuvioille. Taulukkojen merkinnät tarkoittavat TR: opetusjoukko, TE: testijoukko, min: mineraalimaa, ja suo: turvemaa. Kuvissa sinisellä värillä esitetään opetusjoukon ja punaisella testijoukon tunnusluvut. Yhtenäinen viiva tarkoittaa että tunnusluvut on laskettu käyttäen kaikkia kuvioita, katkoviiva mineraalimaan kuvioita ja katkopisteviiva turvemaan kuvioita. On huomattava että kuvioiden lukumäärä joissain maaperä ja kokoluokissa on ollut varsin pieni (taulukko C.1), esimerkiksi alle hehtaarin tai yli 100 hehtaarin kuviot turvemaalla, jolloin näiden kokoluokkien tuloksiin kannattaa suhtautua varauksella. Puuston pituuden osalta absoluuttinen harha on yleensä alle metri mineraalimailla ja kaksi metriä turv la (taulukko C.2), ja suhteellinen harha alle 20 ja 50 % yksikköä (taulukko C.3). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 4 metriä (taulukko C.4) ja suhteellinen alle 70 ja 100 % yksikköä mineraali ja turv le (taulukko C.5). Pearsonin 18

20 korrelaatiokerroin on yleensä parempi kuin 0.6 (taulukko C.6) ja selitysaste 40 (taulukko C.7) mineraalimailla. Turv la näiden tunnusten arvot ovat erittäin vaatimattomat, eli turvemaat on tulkittu todella huonosti. Lopullisessa tulkinnassa virheellisimpien alueiden eli kosteiden avointen soiden alueella käytettiin PerusCD:stä muodostettua avosuomaskia. Samat asiat on havaittavissa kuvassa C.2, kuvasta huomataan että turvemaiden tunnusluvut ovat huonompia kuin kaikkien kuvioiden tai mineraalimaiden tunnusluvut. Kuviokoon kasvattaminen parantaa tuloksia, paitsi kaikkein suurimpien kuvioiden ryhmässä. Verrattaessa eteläiseen Suomeen, absoluuttinen harha ja keskineliövirheen neliöjuuri ovat samaa luokkaa, mutta vastaavat suhteelliset luvut ovat varsin paljon huonompia. Tämä johtuu siitä että puusto on pienikokoisempaa Ylä Lapissa. Samoin korrelaatio on huonompi Ylä Lapissa. Puuston tilavuuden osalta absoluuttinen harha on yleensä alle 5 m 3 /ha mineraalimailla ja noin 10 m 3 /ha turv la (taulukko C.8). Suhteellinen harha mineraalimaalla on alle 60 % yksikköä, turvemaalla tämä on huomattavan suuri, yli 150 % yksikköä (taulukko C.9). Absoluuttinen keskineliövirheen neliöjuuri on yleensä m 3 /ha (taulukko C.10) ja suhteellinen yli 100 ja 300 % yksikköä mineraali ja turv le (taulukko C.11). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.5 (taulukko C.12) ja selitysaste 30 (taulukko C.13) mineraalimailla. Turv la näiden tunnusten arvot ovat jälleen erittäin vaatimattomat. Kuviokoon kasvattaminen parantaa yleisesti tuloksia (kuva C.3), huonoimmat tulokset saadaan pienimmällä ja suurimmalla kokoluokalla. Verrattaessa eteläiseen Suomeen, absoluuttinen harha mineraalimaiden testikuvioilla on samaa luokkaa, muissa tapauksissa huonompi. Absoluuttinen keskineliövirheen neliöjuuri on parempi, eron pienentyessä kuvioiden koon kasvaessa. Toisaalta suhteelliset virheet ovat varsin paljon huonompia kuten myös korrelaatio. Puuston latvuspeiton osalta absoluuttinen harha on yleensä alle 3 % yksikköä mineraalimailla ja alle 10 % yksikköä turv la (taulukko C.14). Suhteellinen harha mineraalimaalla on alle 40 % yksikköä, turvemaalla tämä on huomattavan suuri, yli 100 % yksikköä (taulukko C.15). Absoluuttinen keskineliövirheen neliöjuuri on yleensä % yksikköä (taulukko C.16) ja suhteellinen yli 100 ja 200 % yksikköä mineraali ja turv le (taulukko C.17). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.5 (taulukko C.18) ja selitysaste 30 (taulukko C.19) mineraalimailla. Turv la näiden tunnusten arvot ovat jälleen erittäin vaatimattomat. Kuviokoon kasvattaminen parantaa yleisesti tuloksia (kuva C.4), huonoimmat tulokset saadaan pienimmällä ja suurimmalla kokoluokalla. Verrattaessa eteläiseen Suomeen, absoluuttiset virheet ovat suunnilleen samaa luokkaa, mutta suhteelliset virheet ovat huonompia, kuten myös korrelaatio. Ylä Lapin alueella mäntyjä oli varsin vähän. Männyn latvuspeiton osalta absoluuttinen harha on yleensä alle 2 % yksikköä mineraalimailla ja alle 4 % yksikköä turv la (taulukko C.20). Suhteellinen harha mineraalimaalla on alle 60 % yksikköä, turvemaalla tämä on huomattavan suuri, yleensä yli 250 % yksikköä (taulukko C.21). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 5 % yksikköä (taulukko C.22) ja suhteellinen yli 150 ja 500 % yksikköä mineraali ja turv le (taulukko C.23). Pearsonin korrelaatiokerroin on parempi kuin 0.5 (taulukko C.24) ja selitysaste 30 (taulukko C.25) mineraalimailla. Turv la näiden tunnusten arvot ovat jälleen erittäin vaatimattomat. Kuviokoon kasvattamisella ei ole juurikaan vaikutusta tuloksiin (kuva C.5). Kuusia oli Ylä Lapin alueella erittäin vähän, tästä syystä kuusien estimointitulokset ovat erittäin huonoja. Kuusen latvuspeiton osalta absoluuttinen harha on alle 1 % yksikköä ja keskineliövirheen neliöjuuri yleensä alle 2 % yksikköä (taulukot C.26 ja C.28). Suhteelliset virheet ovat huomattavasti suurempia (taulukot C.27 ja C.29), tällöin harha on yli 100% ja kes 19

21 kineliövirheen neliöjuuri yli 500%. Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.4 (taulukko C.30) ja selitysaste 20 (taulukko C.30) mineraalimailla. Kuviokoon kasvattaminen näyttäisi hieman heikentävän tuloksia (kuva C.6), ainakin tarkasteltaessa absoluuttisia virheitä. Lehtipuuston latvuspeiton osalta absoluuttinen harha on yleensä alle 2 % yksikköä mineraalimailla ja 6 % yksikköä turv la (taulukko C.32). Absoluttinen keskineliövirheen neliöjuuri on yleensä noin 10 % yksikköä mineraalimailla ja hieman huonompi turv la (taulukko C.34). Suhteelliset virheet ovat harhan osalta yleensä % yksikköä mineraalimailla ja yli 100 % yksikköä turv la (taulukko C.33), sekä keskineliövirheen neliöjuuren osalta yli 100 % yksikköä (taulukko C.35). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.4 (taulukko C.36) ja selitysaste 20 (taulukko C.37) mineraalimailla. Kuviokoon kasvattaminen näyttäisi hieman parantavan tuloksia (kuva C.7). Myös Ylä Lapissa tutkittiin mineraalimaalla olevien testikuvioiden avulla muuttujien estimoinnin onnistumista muuttujien erilaisilla lukualueilla. Tulokset on esitetty taulukoissa C.38 C.43 ja kuvissa C.8 C.19. Taulukoissa esitetään eri lukualueiden tunnusluvut, regressiosuoran kertoimet ja kuvioiden lukumäärä. Kuvissa estimaatin ja referenssiarvon suhde on esitetty kahdella eri tavalla. Harhan osalta tummennettu luku tarkoittaa että harhan suuruus ei ole tilastollisesti merkitsevä. Yleensä harhan suuruus on tilastollisesti merkittävä, tähän löytyy vain muutama poikkeus kuusen latvuspeiton estimoinnissa. Taulukoista havaitaan että paras korrelaatio estimaatin ja referenssin välillä saavutetaan käytettäessä koko lukualuetta. Yleisesti ottaen, absoluuttinen harha ja keskineliövirheen neliöjuuri ovat pienimpiä lukualueen alkupäässä, mutta suhteelliset tarkkuusluvut huonoimpia Vertailu VMI koeloihin 1 Metsäntutkimuslaitos/VMI teki luotettavuustarkasteluja Suomen ympäristökeskuksen (SY KE) toimittamille CORINE hankkeessa tuotetuille teemakartoille perustuen VMI9 koealaaineistoon. Luotettavuustarkasteluja tehtiin metsäteemoille ja CORINE peitteisyysluokille. SYKE toimitti kuuden alueen tulkinnan valituista teemoista ja lopullisesta CLC2000 luokittelusta rasterikuvina. Alueet vastasivat yksittäisiä Landsat ETM kuvia paitsi Ylä Lapin alue vastasi kasvillisuusvyöhykkeitä 4c ja 4d. Yleensä tulkinta oli tehty käyttäen useamman Landsat ETM kuvan mosaikkia. Kahden kuvan alueelta toimitettiin myös toinen tulkintaversio, jossa tulkinta oli tehty käyttäen yhtä Landsat ETM kuvaa. Testialueet valittiin siten, että VMI maastotyöt oli tehty mahdollisimman samanaikaisesti satelliittikuvien kuvausajankohdan kanssa. Kuvassa 3.2 on esitetty alueet ja taulukossa 3.1 mitä Landsat kuvaa alue vastaa ja mitkä ovat VMI koealojen mittausvuodet. Kuvauspäivämäärää aiemmin mitatuista koealoista poistettiin monilähdeinventoinnissa käytettyjen Landsat kuvien avulla hakatuiksi tunnistettuja koealoja (lähinnä selvät päätehakkuut). Kuvauspäivämäärän jälkeen mitatuista VMI koeloista poistettiin kuvauksen jälkeen hakatuiksi koodatut koealat. Koealatason validointiin käytettiin siis koko kuvapeittoa pienempää osajoukkoa. 1 Tämä kappale perustuu Matti Katilan (METLA, Valtakunnan metsien inventointi, Metsävaratietopalvelu) tekemään raporttiin "CORINE metsäteemojen validointi VMI9 koealamittauksilla". 20

22 Kuva 3.2: VMI validoinnin alueet. Validoitavat karttateemat (muuttujat) olivat puuston pituus (m), (vain koealatasolla), latvuspeitto (%), (vain koealatasolla), kokonaistilavuus (m3/ha) lehtipuuston määrä (m3/ha). Tulokset esitettiin erikseen kivennäismaalle ja turvemaalle. Tämä ositus perustuu maastokoealan kasvupaikkatietoihin. Latvuspeiton osalta on huomattava, että VMI9:ssä sitä on mitattu kolmessa luokassa: 0 10 %, % ja %. Latvuspeittävyyttä on arvioitu vuodesta 1998 lähtien eli metsäkeskusten 0, 1b, 7, 8 ja 9 alueelta ei ole lainkaan latvuspeittävyysmittausta. Taulukko 3.1: VMI validoinnissa käytetyt alueet ja näiden VMI koealojen mittausvuodet. Alue Tulkinta VMI koealojen mittausvuodet Ylä Lappi: kasvillisuusvyöhykkeet mosaiikki c ja 4d Posio: Landsat 190/13 mosaiikki 2002, 2003 Oulujärvi: Landsat 188/15 mosaiikki ja yksittäinen kuva Pyhäjärvi: Landsat 190/15 mosaiikki 2001, 2002 Puulavesi: Landsat 187/17 mosaiikki ja yksittäinen kuva Rannikko: Landsat 191/16 ja 17 mosaiikki 1998,

23 Puuston keskipituus on mitattu kaikista kehitysluokista koealakuviolta vain Kainuun, Pohjois Pohjanmaan ja Lapin metsäkeskusten alueelta. Taimikkokehitysluokissa keskipituudella tarkoitetaan valta ja lisävaltapuiden keskipituutta. Varttuneemman metsän kehitysluokissa keskipituus on jakson elävien puiden pohjapinta alan mediaanipuun pituus (vrt. keskiläpimitta). Kitumaalla keskipituudeksi merkitään valtapituus. Aukealla keskipituus on 0. On huomattava että keskipituus on kirjattu desimetrin tarkkuudella kun taas puuston pituus on estimoitu satelliittikuvasta metrin tarkkuudella. Muissa metsäkeskuksissa käytettiin varttuneissa kehitysluokissa koealan kuviotiedoista mallilla johdettua keskipituutta. Luotettavuustarkasteluja tehtiin koealatasolla ja suuraluetasolla. Koealatason luotettavuustarkasteluissa lasketaan puuston pituudelle, puuston tilavuudelle sekä lehtipuuston tilavuudelle, seuraavat tunnusluvut yli kunkin luokituskuvan: absoluuttinen ja suhteellinen keskineliövirheen neliöjuuri (RMSE,RMSE %) yli testiaineiston, absoluuttinen ja suhteellinen harha (estimoitu havaittu), (BIAS, BIAS %) yli testiaineiston, harhan tilastollinen merkitsevyys (2* harhan keskivirhe) VMI koealojen keskiarvo ja keskihajonta selitysaste R 2, määriteltynä: R 2 = 1 MSE/std(y). Latvuspeiton luokituksen onnistumista tarkastellaan ristiintaulukoimalla VMIlatvuspeitteisyyttä ja CORINEn antamaa latvuspeittoprosenttia ja määrittämällä tästä oikeinluokituksen todennäköisyys. Suuraluetason luotettavuustarkastelut toteutettiin käyttäen VMIkoealoja ja VMI:n maastoinventoinnin estimointimenetelmiä. Puuston keski ja kokonaistilavuudet yhteensä sekä lehtipuustolle estimoitiin kaikilla tulkinta alueilla paitsi Ylä Lapissa. Suuraluetason luotettavuustarkastelut toteutettiin käyttäen VMI koealoja ja VMI:n maastoinventoinnin estimointimenetelmiä. Puuston keski ja kokonaistilavuudet yhteensä sekä lehtipuustolle estimoitiin kaikilla tulkinta alueilla paitsi Ylä Lapissa, minne tulokset saataneen elokuussa. Laskentamenetelmässä saadaan estimaateille keskivirheet, joista voidaan konstruoida luottamusvälit kyseisille muuttujille, suuralueelle. Jos CORINE tulkinnan tulos eroaa yli kahden keskivirheen verran VMI estimaatista, virhe on tilastollisesti merkitsevä. Tulokset on esitetty pistediagrammein (kuvat D.1 D.24), tarkkuuslukujen kuvaajin (kuvat D.25 D.29) ja taulukoin (taulukot D.1 D.12) eri alueille. Kuvat ja taulukot ovat liitteessä D. Tulokset esitetään yhteensä koko pinta alalle (kuvaajissa punainen yhtenäinen viiva) ja erikseen kivennäismaalle (punainen katkoviiva) ja turvemaalle (punainen katkopisteviiva). CORINEn puuston tilavuusestimaateissa oli systemaattista aliarvioita, etenkin Etelä Suomessa. Keskitilavuuden harha vaihteli 23 3 m3/ha (taulukot D.4 D.6 ja kuva D.26), lehtipuun tilavuuden 8 2 m3/ha (taulukot D.7 D.9 ja kuva D.27). Myös puuston keskipituus oli yleensä aliarvioitu (taulukot D.1 D.3 ja kuva D.25). Puuston tilavuuksien ja pituuksien harhat olivat useimmiten tilastollisesti merkitseviä. Aliarvio suuraluetasolla, yli koealapisteiden, pieneni selvästi tilavuuksien osalta kahdella alueella joiden muuttujat oli estimoitu satelliittikuvamosaiikin sijasta yhdeltä kuvalta (taulukko D.11 ja kuva D.29). RMSE:t ovat melko suuria % keskitilavuudelle ja lehtipuuston tilavuudelle %, keskipituuden RMSE sen sijaan jäi alle 50 % useassa tapauksessa. Monilähteisessä VMI:ssä (MVMI) koealatason ristiinvalidoinnissa RMSE:t ovat tyypillisesti suuria (esim. tilavuuden 22

CLC2012 maankäyttö/maanpeite (25m) paikkatietoaineiston alustava luokkakuvaus (4.taso) 10.3.2015

CLC2012 maankäyttö/maanpeite (25m) paikkatietoaineiston alustava luokkakuvaus (4.taso) 10.3.2015 CLC2012 maankäyttö/maanpeite (25m) paikkatietoaineiston alustava luokkakuvaus (4.taso) 10.3.2015 1. RAKENNETUT ALUEET 1.1.1.1 Kerrostaloalueet Luokka koostuu RHR:n asuinkerrostaloista ja asuntolarakennuksista.

Lisätiedot

Corine Land Cover 2012

Corine Land Cover 2012 Corine Land Cover 2012 Dokumentin päivityspvm: MK 11.11.2014 Sisältö 1. Spatiaaliset näkymät... 1 2. Ominaisuustietojen kuvaus... 1 3. Luokitus... 2 4. Lisätietoja... 3 5. UML-malli... 5 6. Luokkakuvaus

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Liito-oravan elinympäristöjen mallittaminen Tampereen seudulla

Liito-oravan elinympäristöjen mallittaminen Tampereen seudulla Liito-oravan elinympäristöjen mallittaminen Tampereen seudulla Ari Nikula Metsäntutkimuslaitos Rovaniemen toimintayksikkö Ari.Nikula@metla.fi / Metsäntutkimuslaitos Skogsforskningsinstitutet Finnish Forest

Lisätiedot

Lakikangas I tuulivoimapuisto, Karijoki

Lakikangas I tuulivoimapuisto, Karijoki CPC LAKIAKANGAS I OY Lakikangas I tuulivoimapuisto, Karijoki Näkymäalueanalyysi V6 x x HH37/HH47.3.6 P7 Näkymäalueanalyysi V6 x x HH37/HH47 7) Vadbäck Hans.3.6 Sisällysluettelo Lähtötiedot... Näkemäalueanalyysi...

Lisätiedot

Paikkatiedon hyödyntämismahdollisuudet pienvesien tilan ja kunnostustarpeen arvioinnissa

Paikkatiedon hyödyntämismahdollisuudet pienvesien tilan ja kunnostustarpeen arvioinnissa Paikkatiedon hyödyntämismahdollisuudet pienvesien tilan ja kunnostustarpeen arvioinnissa Teemu Ulvi, SYKE Metsätalouden vesiensuojelupäivät, Koli 22.9.2015 Sisältö Purojen tila arviointimenetelmien tarve

Lisätiedot

CLC2018 maankäyttö/maanpeite (20m) paikkatietoaineiston luokkakuvaus (4.taso) 11/2018

CLC2018 maankäyttö/maanpeite (20m) paikkatietoaineiston luokkakuvaus (4.taso) 11/2018 CLC2018 maankäyttö/maanpeite (20m) paikkatietoaineiston luokkakuvaus (4.taso) 11/2018 1. RAKENNETUT ALUEET 1.1.1.1 Kerrostaloalueet Luokka koostuu vuoden 2016 RHR:n asuinkerrostaloista ja asuntolarakennuksista

Lisätiedot

Kehittyvien satelliittiaineistojen mahdollisuudet

Kehittyvien satelliittiaineistojen mahdollisuudet VTT TECHNICAL RESEARCH CENTRE OF FINLAND LTD Kehittyvien satelliittiaineistojen mahdollisuudet Forest Big Data loppuseminaari, Heureka 8.3.2016 Tuomas Häme, Laura Sirro, Yrjö Rauste VTT VTT:n satelliittikuvatutkimusaiheet

Lisätiedot

Corine Land Cover 2000

Corine Land Cover 2000 Corine Land Cover 2000 Dokumentin päivityspvm: 31.12.2011 MK Sisältö 1. Spatiaaliset näkymät... 1 2. Ominaisuustietojen kuvaus... 1 3. Luokitus... 2 4. Lisätietoja... 2 5. UML-malli... 4 6. Luokkakuvaus

Lisätiedot

Corine Land Cover 2006

Corine Land Cover 2006 Corine Land Cover 2006 Dokumentin päivityspvm: MK 10.3.2014 Sisältö 1. Spatiaaliset näkymät... 1 2. Ominaisuustietojen kuvaus... 1 3. Luokitus... 2 4. Lisätietoja... 2 5. UML-malli... 4 6. Luokkakuvaus

Lisätiedot

Paikkatietoa metsäbiomassan määrästä tarvitaan

Paikkatietoa metsäbiomassan määrästä tarvitaan Biomassan estimointi laseraineiston, ilmakuvien ja maastomittausten perusteella Esitys Metsätieteen Päivän Taksaattorisessiossa 26.10.2011 Reija Haapanen, Sakari Tuominen ja Risto Viitala Paikkatietoa

Lisätiedot

Kaukokartoitusaineistot ja maanpeite

Kaukokartoitusaineistot ja maanpeite Kansallinen maastotietokanta hanke Maasto-työpaja 20.9.2016 Maanmittauslaitos Kaukokartoitusaineistot ja maanpeite Pekka Härmä Suomen Ympäristökeskus 1 Sisältö SYKE tietotarpeet / kokemukset maanpeiteseurannassa

Lisätiedot

Corine Land Cover 2018

Corine Land Cover 2018 Corine Land Cover 2018 Dokumentin päivityspvm: MK+SH 27.11.2018 Sisältö 1. Yleiskuvaus... 1 2. Ominaisuustietojen kuvaus... 1 3. Luokitus... 2 4. Luokkakuvaus Corine maanpeite 2018 (yleistetty 25 ha)...

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Metsien kaukokartoitus ja avoimet aineistot

Metsien kaukokartoitus ja avoimet aineistot Geoinformatiikan valtakunnallinen tutkimuspäivä 2013 Metsien kaukokartoitus ja avoimet aineistot Sakari Tuominen, MMT METLA Valtakunnan metsien inventointi Metsäntutkimuslaitos Skogsforskningsinstitutet

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Kaukokartoitusaineistot ja maanpeite

Kaukokartoitusaineistot ja maanpeite Kansallinen maastotietokanta hanke Maasto-työpaja 20.9.2016 Kaukokartoitusaineistot ja maanpeite Pekka Härmä Suomen Ympäristökeskus 1 Sisältö SYKE tietotarpeet Tietolähteet maanpeitetiedon tuottamisessa

Lisätiedot

Vantaan pienvaluma-alueiden luokittelu vettä läpäisemättömän pinnan osuuden perusteella

Vantaan pienvaluma-alueiden luokittelu vettä läpäisemättömän pinnan osuuden perusteella Vantaan pienvaluma-alueiden luokittelu vettä läpäisemättömän pinnan osuuden perusteella Hulevesiseminaari 25.11.2014 Hanna Tuominen Sisällys Diplomityön tavoitteet Läpäisemättömän pinnan malli CORINE Land

Lisätiedot

Vaihtoehtoisia malleja puuston kokojakauman muodostamiseen

Vaihtoehtoisia malleja puuston kokojakauman muodostamiseen Vaihtoehtoisia malleja puuston kokojakauman muodostamiseen Jouni Siipilehto, Harri Lindeman, Jori Uusitalo, Xiaowei Yu, Mikko Vastaranta Luonnonvarakeskus Geodeettinen laitos Helsingin yliopisto Vertailtavat

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

SELVITTÄJÄN KOMPETENSSISTA

SELVITTÄJÄN KOMPETENSSISTA OTM, KTM, Mikko Hakola, Vaasan yliopisto, Laskentatoimen ja rahoituksen laitos Helsinki 20.11.200, Helsingin kauppakorkeakoulu Projekti: Yrityksen maksukyky ja strateginen johtaminen SELVITTÄJÄN KOMPETENSSISTA

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus

Lisätiedot

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

Luke ja Syke ympäristötiedon tuottajina

Luke ja Syke ympäristötiedon tuottajina Luke ja Syke ympäristötiedon tuottajina YYT-C3001 Ympäristötiedon hallinta, erikoistutkija, Luonnonvarakeskus Kai Mäkisara, Katja Ikonen, Luonnonvarakeskus Kaisu Harju, Riitta Teiniranta, Suvi Hatunen,

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

WP1: Inventory of existing data sources for land cover and land use

WP1: Inventory of existing data sources for land cover and land use WP1: Inventory of existing data sources for land cover and land use GIS ja insitu aineistot maanpeitteestä ja maankäytöstä Minna Kallio, SYKE, Lucas-seminaari, 3.6.2015 Yleiskuvan saaminen aineistoista

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

VMI-koealatiedon ja laserkeilausaineiston yhdistäminen metsäsuunnittelua varten

VMI-koealatiedon ja laserkeilausaineiston yhdistäminen metsäsuunnittelua varten VMI-koealatiedon ja laserkeilausaineiston yhdistäminen metsäsuunnittelua varten Kuortaneen metsäsuunnitteluseminaari 10.09.2007 Aki Suvanto, Joensuun yliopisto Petteri Packalén, Joensuun yliopisto Matti

Lisätiedot

KUITUPUUN KESKUSKIINTOMITTAUKSEN FUNKTIOINTI

KUITUPUUN KESKUSKIINTOMITTAUKSEN FUNKTIOINTI KUITUPUUN KESKUSKIINTOMITTAUKSEN FUNKTIOINTI Asko Poikela Samuli Hujo TULOSKALVOSARJAN SISÄLTÖ I. Vanha mittauskäytäntö -s. 3-5 II. Keskusmuotolukujen funktiointi -s. 6-13 III.Uusi mittauskäytäntö -s.

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Kaukokartoitustiedon käyttö LUKE:ssa

Kaukokartoitustiedon käyttö LUKE:ssa Kaukokartoitustiedon käyttö LUKE:ssa Sakari Tuominen sakari.tuominen@luke.fi Metsien kartoitus: Valtakunnan metsien inventointi VMI VMI perustuu systemaattiseen ryvästettyyn koealaotantaan 5 vuoden inventointikierrolla

Lisätiedot

Monitasomallit koulututkimuksessa

Monitasomallit koulututkimuksessa Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1 Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen

Lisätiedot

Miten tunnistetaan maisemallisesti herkät talousmetsäalueet?

Miten tunnistetaan maisemallisesti herkät talousmetsäalueet? Miten tunnistetaan maisemallisesti herkät talousmetsäalueet? Metsämaiseman herkkyysluokitus Kainuun ja Kuusamon vaaramaan alueella Ron Store ja Eeva Karjalainen Metsäntutkimuslaitos Maisema, virkistyskäyttö

Lisätiedot

Tiheäpulssinen ja monikanavainen laserkeilausaineisto puulajeittaisessa inventoinnissa

Tiheäpulssinen ja monikanavainen laserkeilausaineisto puulajeittaisessa inventoinnissa Metsätieto ja sähköiset palvelut -hankkeen lopputulosseminaari Helsinki, 22.1.2019 Tiheäpulssinen ja monikanavainen laserkeilausaineisto puulajeittaisessa inventoinnissa Petteri Packalen, Eetu Kotivuori,

Lisätiedot

Paikkatietopalveluita hyvällä Sykkeellä!

Paikkatietopalveluita hyvällä Sykkeellä! Paikkatietopalveluita hyvällä Sykkeellä! Poimintoja SYKEn paikkatieto- ja kaukokartoituspalveluista Kaisu Harju, Suomen ympäristökeskus SYKE SYKEn geoinformatiikkapäivät 3.12.2013 Sisältö Mitä tietoja

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus. Virhearviointi Fysiikassa on tärkeää tietää tulosten tarkkuus. Virhelajit A. Tilastolliset virheet= satunnaisvirheet, joita voi arvioida tilastollisin menetelmin B. Systemaattiset virheet = virheet, joita

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Laserkeilaus yksityismetsien inventoinnissa

Laserkeilaus yksityismetsien inventoinnissa Kuvat Arbonaut Oy Laserkeilaus yksityismetsien inventoinnissa Laserkeilaus ja korkeusmallit Maanmittauslaitoksen seminaari 9.10.2009 Juho Heikkilä Metsätalouden kehittämiskeskus Tapio Sisältö Kuva Metla

Lisätiedot

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012 Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Lounais-Suomen metsäkeskuksen alueen metsävarat ja niiden kehitys

Lounais-Suomen metsäkeskuksen alueen metsävarat ja niiden kehitys Lounais-Suomen metsäkeskuksen alueen metsävarat 2005 2006 ja niiden kehitys 1998-2006 Kari T. Korhonen Valtakunnan metsien inventointi/metla Kari.t.Korhonen@metla.fi VMI10/ 19.10.2007 1 VMI10 Maastotyöt

Lisätiedot

Puustotietojen keruun tekniset vaihtoehdot, kustannustehokkuus ja tarkkuus

Puustotietojen keruun tekniset vaihtoehdot, kustannustehokkuus ja tarkkuus Puustotietojen keruun tekniset vaihtoehdot, kustannustehokkuus ja tarkkuus Janne Uuttera Metsätehon seminaari 8.5.2007 Metsävaratietojärjestelmien tulevaisuus Tausta Tietojohtamisen välineissä, kuten metsävaratietojärjestelmissä,

Lisätiedot

NUMEERISET ILMAKUVAT TAIMIKON PERKAUSTARPEEN MÄÄRITTÄMISESSÄ

NUMEERISET ILMAKUVAT TAIMIKON PERKAUSTARPEEN MÄÄRITTÄMISESSÄ NUMEERISET ILMAKUVAT TAIMIKON PERKAUSTARPEEN MÄÄRITTÄMISESSÄ Selvitettiin numeeristen ilmakuva-aineistojen hyödyntämismahdollisuuksia taimikon puustotunnusten ja perkaustarpeen määrittämisessä. Tuukka

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Satelliittipaikannuksen tarkkuus hakkuukoneessa. Timo Melkas Mika Salmi Jarmo Hämäläinen

Satelliittipaikannuksen tarkkuus hakkuukoneessa. Timo Melkas Mika Salmi Jarmo Hämäläinen Satelliittipaikannuksen tarkkuus hakkuukoneessa Timo Melkas Mika Salmi Jarmo Hämäläinen Tavoite Tutkimuksen tavoite oli selvittää nykyisten hakkuukoneissa vakiovarusteena olevien satelliittivastaanottimien

Lisätiedot

Tilastolliset mallit hakkuukoneen katkonnan ohjauksessa. Tapio Nummi Tampereen yliopisto

Tilastolliset mallit hakkuukoneen katkonnan ohjauksessa. Tapio Nummi Tampereen yliopisto Tilastolliset mallit hakkuukoneen katkonnan ohjauksessa Tapio Nummi Tampereen yliopisto Runkokäyrän ennustaminen Jotta runko voitaisiin katkaista optimaalisesti pitäisi koko runko mitata etukäteen. Käytännössä

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

Metsän hinta Suomessa v kauppahintatutkimuksen tulokset. Maanmittauspäivät Esa Ärölä

Metsän hinta Suomessa v kauppahintatutkimuksen tulokset. Maanmittauspäivät Esa Ärölä 1 Metsän hinta Suomessa v. 2015 2016 kauppahintatutkimuksen tulokset Maanmittauspäivät 28.3.2019 Esa Ärölä Kauppahintatutkimuksen tavoitteet 2 Laserkeilaukseen perustuvalla kaukokartoitusmenetelmällä tuotetun

Lisätiedot

Kainuun metsäkeskuksen alueen metsävarat ja niiden kehitys

Kainuun metsäkeskuksen alueen metsävarat ja niiden kehitys Kainuun metsäkeskuksen alueen metsävarat 2004 2006 ja niiden kehitys 2001-2006 Kari T. Korhonen Valtakunnan metsien inventointi/metla Kari.t.Korhonen@metla.fi VMI10/ 9.8.2007 1 VMI10 Maastotyöt 2004 2008

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. 1/11 4 MITTAAMINEN Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. Mittausvirhettä johtuen mittarin tarkkuudesta tai häiriötekijöistä Mittarin

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa.

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa. Laskuharjoitus 1A Mallit Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa. 1. tehtävä %% 1. % (i) % Vektorit luodaan

Lisätiedot

Riittääkö puu VMI-tulokset

Riittääkö puu VMI-tulokset Riittääkö puu VMI-tulokset Lapin 61. Metsätalouspäivät 14.2.2019 Rovaniemi Kari T. Korhonen Metsävarat: Kari T. Korhonen, Antti Ihalainen, Mikael Strandström Hakkuumahdollisuudet: Olli Salminen, Hannu

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos Datan käsittely Helsingin yliopisto, Fysiikan laitos kevät 2013 3. Datan käsittely Luennon sisältö: Havaintovirheet tähtitieteessä Korrelaatio Funktion sovitus Aikasarja-analyysi 3.1 Havaintovirheet Satunnaiset

Lisätiedot

Corine2006-maankäyttöluokituksen mukaiset osuudet maakunnittain

Corine2006-maankäyttöluokituksen mukaiset osuudet maakunnittain Kohdentamiskeskustelun taustaksi JK Suomi on monessa mielessä hyvin heterogeeninen maa. Siksi yleiset, koko maata koskevat tilastot eivät kerro koko kuvaa Suomen tilanteesta. Verrattaessa Suomen maataloutta

Lisätiedot

Otantajakauman käyttö päättelyssä

Otantajakauman käyttö päättelyssä Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus

Lisätiedot

T Luonnollisten kielten tilastollinen käsittely

T Luonnollisten kielten tilastollinen käsittely T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 3, ti 11.2.2003, 16:15-18:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

110. 111. 112. 113. 114. 4. Matriisit ja vektorit. 4.1. Matriisin käsite. 4.2. Matriisialgebra. Olkoon A = , B = Laske A + B, 5 14 9, 1 3 3

110. 111. 112. 113. 114. 4. Matriisit ja vektorit. 4.1. Matriisin käsite. 4.2. Matriisialgebra. Olkoon A = , B = Laske A + B, 5 14 9, 1 3 3 4 Matriisit ja vektorit 4 Matriisin käsite 42 Matriisialgebra 0 2 2 0, B = 2 2 4 6 2 Laske A + B, 2 A + B, AB ja BA A + B = 2 4 6 5, 2 A + B = 5 9 6 5 4 9, 4 7 6 AB = 0 0 0 6 0 0 0, B 22 2 2 0 0 0 6 5

Lisätiedot

Eurooppalainen maanpeiteseuranta

Eurooppalainen maanpeiteseuranta Eurooppalainen maanpeiteseuranta Miksi maanpeite seurantaa? EU:n tietotarpeet EU:n visio maanpeiteseurannasta Land Monitoring core services Projektit CORINE Land Cover 2006 CLC2006 FP7 geoland2 Miksi mukana?

Lisätiedot

Johdatus tn-laskentaan perjantai 17.2.2012

Johdatus tn-laskentaan perjantai 17.2.2012 Johdatus tn-laskentaan perjantai 17.2.2012 Kahden diskreetin muuttujan yhteisjakauma On olemassa myös monen muuttujan yhteisjakauma, ja jatkuvien muuttujien yhteisjakauma (jota ei käsitellä tällä kurssilla;

Lisätiedot