SUOMEN IMAGE2000 JA CORINE LAND COVER 2000 TARKKUUDEN ARVIOINTI



Samankaltaiset tiedostot
CLC2012 maankäyttö/maanpeite (25m) paikkatietoaineiston alustava luokkakuvaus (4.taso)

Corine Land Cover 2012

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Liito-oravan elinympäristöjen mallittaminen Tampereen seudulla

Lakikangas I tuulivoimapuisto, Karijoki

Paikkatiedon hyödyntämismahdollisuudet pienvesien tilan ja kunnostustarpeen arvioinnissa

CLC2018 maankäyttö/maanpeite (20m) paikkatietoaineiston luokkakuvaus (4.taso) 11/2018

Kehittyvien satelliittiaineistojen mahdollisuudet

Corine Land Cover 2000

Corine Land Cover 2006

Paikkatietoa metsäbiomassan määrästä tarvitaan

Kaukokartoitusaineistot ja maanpeite

Corine Land Cover 2018

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Metsien kaukokartoitus ja avoimet aineistot

Otoskoko 107 kpl. a) 27 b) 2654

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Regressioanalyysi. Vilkkumaa / Kuusinen 1

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

HAVAITUT JA ODOTETUT FREKVENSSIT

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Kaukokartoitusaineistot ja maanpeite

Vantaan pienvaluma-alueiden luokittelu vettä läpäisemättömän pinnan osuuden perusteella

Vaihtoehtoisia malleja puuston kokojakauman muodostamiseen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

SELVITTÄJÄN KOMPETENSSISTA

Regressioanalyysi. Kuusinen/Heliövaara 1

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Luke ja Syke ympäristötiedon tuottajina

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Mat Tilastollisen analyysin perusteet, kevät 2007

WP1: Inventory of existing data sources for land cover and land use

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

VMI-koealatiedon ja laserkeilausaineiston yhdistäminen metsäsuunnittelua varten

KUITUPUUN KESKUSKIINTOMITTAUKSEN FUNKTIOINTI

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

pitkittäisaineistoissa

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

7. laskuharjoituskierros, vko 10, ratkaisut

Kaukokartoitustiedon käyttö LUKE:ssa

Monitasomallit koulututkimuksessa

Miten tunnistetaan maisemallisesti herkät talousmetsäalueet?

Tiheäpulssinen ja monikanavainen laserkeilausaineisto puulajeittaisessa inventoinnissa

Paikkatietopalveluita hyvällä Sykkeellä!

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Laserkeilaus yksityismetsien inventoinnissa

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Testit järjestysasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Lounais-Suomen metsäkeskuksen alueen metsävarat ja niiden kehitys

Puustotietojen keruun tekniset vaihtoehdot, kustannustehokkuus ja tarkkuus

NUMEERISET ILMAKUVAT TAIMIKON PERKAUSTARPEEN MÄÄRITTÄMISESSÄ

Todennäköisyyden ominaisuuksia

Osa 2: Otokset, otosjakaumat ja estimointi

Satelliittipaikannuksen tarkkuus hakkuukoneessa. Timo Melkas Mika Salmi Jarmo Hämäläinen

Tilastolliset mallit hakkuukoneen katkonnan ohjauksessa. Tapio Nummi Tampereen yliopisto

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Väliestimointi (jatkoa) Heliövaara 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Teema 3: Tilastollisia kuvia ja tunnuslukuja

MONISTE 2 Kirjoittanut Elina Katainen

Metsän hinta Suomessa v kauppahintatutkimuksen tulokset. Maanmittauspäivät Esa Ärölä

Kainuun metsäkeskuksen alueen metsävarat ja niiden kehitys

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Estimointi. Vilkkumaa / Kuusinen 1

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa.

Riittääkö puu VMI-tulokset

Sovellettu todennäköisyyslaskenta B

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos

Corine2006-maankäyttöluokituksen mukaiset osuudet maakunnittain

Otantajakauman käyttö päättelyssä

T Luonnollisten kielten tilastollinen käsittely

Matriisit ja vektorit Matriisin käsite Matriisialgebra. Olkoon A = , B = Laske A + B, , 1 3 3

Eurooppalainen maanpeiteseuranta

Johdatus tn-laskentaan perjantai

Transkriptio:

SUOMEN IMAGE2000 JA CORINE LAND COVER 2000 TARKKUUDEN ARVIOINTI Markus Törmä Suomen ympäristökeskus Tietokeskus Geoinformatiikka ja alueidenkäyttöyksikkö 31.5.2005

SISÄLLYSLUETTELO 1. JOHDANTO...2 1.1 IMAGE2000 ja CORINE LAND COVER 2000...2 1.2 Tiedon tuottaminen Suomessa...2 1.2.1 IMAGE2000 kuvien prosessointi...3 1.2.2 CLC2000 tulkinnan suorittaminen...3 1.2.3 CLC2000 luokat...4 1.2.4 Euroopan ympäristöviraston ohjeet validoinnin suorittamiseksi...6 2 IMAGE2000 GEOMETRINEN TARKKUUS...7 2.1 Geometrisen tarkkuuden määrittäminen...7 2.2 IMAGE2000:n geometrinen tarkkuus...8 3. CLC2000 TEMAATTISEN TARKKUUDEN ARVIOINTI...10 3.1 Temaattisen tarkkuuden arvioinnin menetelmät...11 3.1.1 Jatkuvat muuttujat...11 3.1.2 Luokittelu...12 3.2 Visuaalinen arviointi...13 3.3 Jatkuvat muuttujat...15 3.3.1 Tulkinnan testikuviot...16 3.3.2 Tulkinnan testikuviot, Ylä Lappi...18 3.3.3 Vertailu VMI koeloihin...20 3.3.4 Kasvipeitteisyysestimaatin tarkkuudesta...24 3.4 Luokittelutarkkuus...26 3.4.1 VMI vertailu...28 3.4.2 SLICES vertailu...35 3.4.3 BIOPRESS vertailu...37 3.5 Pinta alojen vertailu...40 4. YHTEENVETO...42 1

1. JOHDANTO Paikkatiedon tarkkuuden voidaan määritellä olevan havaintojen, laskentatulosten tai estimaattien vastaavuutta tai läheisyyttä niiden todellisiin arvoihin tai arvoihin jota pidetään tosina (USGS, 1997). Paikkatieto koostuu kohteen sijaintitiedosta ja ominaisuustiedosta. Ensin mainittu vastaa kysymykseen missä ja jälkimmäinen kysymykseen mitä. Kaukokartoitusaineiston tulkinnan tai olemassa olevan paikkatiedon analyysin ja yhdistelyn tuloksen syntyneen uuden paikkatiedon tarkkuuden arviointi on tärkeä vaihe aineiston tuotannossa, koska sen avulla paikkatiedon käyttäjä saa käsityksen aineiston käyttökelpoisuudesta tarkoituksiinsa. Tämä dokumentti käsittelee IMAGE2000 ja Corine Land Cover 2000 luokittelun kansallisen ja eurooppalaisen version tarkkuuden arviointia. Luvussa 2 käsitellään IMAGE2000 satelliittikuvien oikaisun tarkkuutta. Luku 3 käsittelee tuotetun paikkatiedon sekä tulkinnan välivaiheiden temaattista tarkkuutta. Temaattisen tarkkuuden arviointi on jaettu lopputuloksen visuaaliseen arviointiin (luku 3.2), tulkinnan välivaiheiden eli puusto ja kasvillisuusmuuttujien estimoinnin tarkkuuden arviointiin (luku 3.3), tulkinnan lopputuloksen luokittelutarkkuuden (luku 3.4) sekä tulkinnan lopputuloksen pinta alojen tarkkuuden (luku 3.5) arviointiin. Luku 4 esittelee tarkkuuden arvioinnin johtopäätökset. 1.1 IMAGE2000 ja CORINE LAND COVER 2000 Euroopan komissio aloitti CORINE ohjelman 1980 luvun puolivälissä tarkoituksena hankkia ympäristöön liittyvään paikkatietoa Euroopan Unionin alueelta, joka olisi laadultaan homogeenista siirryttäessä valtiosta toiseen (Heymann et.al., 1994). CORINE maankäyttö / peiteluokittelu (CLC) perustuu satelliittikuvien visuaaliseen tulkintaan ja saatavilla olevaan karttamateriaaliin. Aluksi tulkinta tehtiin piirtämällä tulkinta satelliittikuvan filmikopion päälle kiinnitetylle muoville, myöhemmin käyttäen tietokonetta ja paikkatietojärjestelmiä (Bossard et.al., 2000). Kartoitusmittakaava on 1:100000, sijaintitarkkuus 100 metriä ja pienin kartoitettava alue kooltaan vähintään 25 hehtaaria. Luokkajärjestelmä on hierarkkinen ja sisältää 5 luokkaa ensimmäisellä, 15 toisella ja 44 kolmannella tasolla (Büttner et.al., 2002). CLC luokittelun päivittämiseksi Euroopan ympäristövirasto ja Euroopan unionin tutkimuskeskus aloittivat IMAGE2000 ja CLC2000 projektit. IMAGE2000 projekti käsittää Euroopan unionin kattavan satelliittikuvapeiton hankinnan ja kuvien oikaisun. Tätä kuvapeittoa käytetään CLC2000 projektissa CLC tietokannan päivittämiseen ja maanpeitteeseen liittyvien muutosten määrittämiseen vuosina 1990 2000. Päivitys perustuu visuaaliseen tulkintaan (Bossard et.al., 2000). 1.2 Tiedon tuottaminen Suomessa Suomen ympäristökeskus on ollut vastuussa Suomen IMAGE2000 ja CLC2000 projektien hallinnoimisesta sekä tiedon tuottamisesta. Valtion teknillinen tutkimuskeskus on tuottanut menetelmiä ja tietokoneohjelmia joilla on suoritettu satelliittikuvien ilmakehäkorjaukset sekä kuvien tulkinta. Metsähallitus ja UPM Kymmene ovat antaneet metsäninventointitietoja projektin käyttöön. Metsäntutkimuslaitos on osallistunut lopputuloksen tarkkuuden arviointiin. 2

1.2.1 IMAGE2000 kuvien prosessointi Metria Sweden suoritti satelliittikuvien oikaisun orto oikaisuna käyttäen satelliitin ratatietoja, maastotukipisteitä ja maastomallia. Pilvet ja näiden varjot poistettiin manuaalisen tulkinnan ja digitoinnin avulla. Ilmakehäkorjaus suoritettiin VTT:n kehittämän korjausohjelman avulla joka perustuu SMAC algoritmiin. Ohjelman ilmakehää kuvaavista parametreista AOD (Atmospheric Optical Density) määritettiin käyttäen kuvaan perustuvaa menetelmää kullekin kuvalle erikseen. Lapissa (kasvillisuusvyöhykkeet 4c ja 4d) suoritettiin topografiakorjaus käyttäen Ekstrandin menetelmää. Satelliittikuvat mosaikoitiin kasvillisuusvyöhykkeiden mukaisiksi kuvamosaiikeiksi. Tulkinta tehtiin sekä mosaiikeille että yksittäisille kuville. Estimoitujen tarkkuustunnusten perusteella tehtiin valinta kumpaa käytettiin lopullisen luokittelun tekemiseen. 1.2.2 CLC2000 tulkinnan suorittaminen Suomen CLC2000 luokittelu perustuu olemassaoleviin paikkatietoaineistoihin ja satelliittikuvista tulkittuun maanpeitetietoon (kuva 1.1). Paikkatietoaineistoja käytetään maankäytön määrittämiseen sekä apuna satelliittikuvien tulkinnassa. Satelliittikuvia käytetään maanpeitetiedon hankintaan sekä paikkatietoaineistojen päivittämiseen. Maanpeitetietojen estimoitiin käytettiin VTT:n kehittämää PROBA estimointimenetelmää. Maastokoealatietojen avulla kasvillisuutta kuvaaville muuttujille määritettiin estimaatit kullekin satelliittikuvan pikselille. Estimoituja muuttujia olivat mm.: Puuston pituus Puuston latvuspeitto Puuston latvuspeitto havupuille Puuston latvuspeitto lehtipuille Input Map Data Reference data Corine main classes 1. Artificial surface Topographic Database Satellite Images 2. Agricultural areas 3. Forest 4. Wetlands 5. Water bodies SLICES Semiautomatic Digitalisation Kuva 1.1: Suomen CLC2000 luokittelun pääluokat sekä näiden pääasialliset tietolähteet. 3

Tulkinta stratifioitiin suomaskin avulla siten että mineraalimaat ja turvemaat tulkittiin erikseen. Lisäksi Lapissa määritettiin aluskasvillisuutta ja maaperää kuvaavia muuttujia. Ylä Lapista ei ollut saatavilla suomaskia joten siellä tulkintaa ei stratifioitu. Rakennettujen ja maatalousmaiden osalta lopullinen CLC2000 luokitus perustuu paikkatietoaineistoihin, lähinnä SLICES maankäyttöelementtiin. Vesialueet on luokiteltu paikkatietoaineistojen perusteella täydentäen näitä satelliittikuvan tulkinnalla. Metsät sekä vähäpuustoiset kankaat ja kosteikot on tulkittu käyttäen estimoituja kasvillisuusmuuttujia ja sääntöpohjaista tulkintaa. Tulkinnan tuloksena syntyi CLC2000 luokittelun kansallinen versio joka on rasterimuodossa ja sen pienin alueellinen yksikkö on 25 m x 25 m kokoinen kuvapikseli. Kansallinen versio yleistettiin käyttäen Euroopan ympäristöviraston ohjeita (Heymann et.al., 1994) jolloin tulokseksi saatiin CLC2000 luokittelun eurooppalainen versio joka on vektorimuodossa ja pienin kartoitettava yksikkö 25 hehtaaria. 1.2.3 CLC2000 luokat CLC2000 luokittelun perustana on hierarkinen luokittelujärjestelmä, jossa on kaikenkaikkiaan 44 luokkaa tasolla 3. Näistä Suomessa on käytössä 31 luokkaa. Lisäksi Suomessa joitakin luokkia on tarkennettu neljännen tason luokilla. Luokkien nimet ja luokkahierarkia on esitetty taulukossa 1.1. Tarkemmat kuvaukset luokista löytyvät dokumentista xxx. Taulukko 1.1: CLC2000 luokkien nimet ja koodit luokittelutasoilla 1 4. Luokat joita ei käytetä Suomessa on merkitty merkinnällä "**". Taso 1 Taso 2 Taso 3 Taso 4 1 Rakennetut alueet 1.1 Asuinalueet 1.1.1 Tiiviisti rakennetut asuinalueet 1.1.2 Väljästi rakennetut asuinalueet 1.2 Teollisuuden, palveluiden ja liikenteen alueet 1.3 Maa aineisten ottoalueet, kaatopaikat ja rakennustyöalueet 1.4 Virkistys ja vapaaajan toiminta alueet 1.2.1 Teollisuuden ja palveluiden alueet 1.2.2 Liikennealueet 1.2.3 Satama alueet 1.2.4 Lentokenttäalueet 1.3.1 Maa aineisten ottoalueet 1.3.2 Kaatopaikat 1.3.3. Rakennustyöalueet 1.4.1 Taajamien viheralueet ja puistot 1.4.2 Urheilu ja vapaaajan toiminta alueet 1.4.2.1 Kesämökit 1.4.2.2 Muut urheilu ja vapaa ajan toiminta alueet 2 Maatalousalueet 2.1 Peltomaat 2.1.1 Pellot 2.1.1.1 Käytössä 2.1.1.1 Hylätty 2.1.2 Keinokastellut pellot** 2.1.3 Riisipellot** 2.2 Puu ja pensasviljelmät 2.2.1 Viinitarhat** 2.2.2 Hedelmäpuu ja 4

3. Metsät sekä avoimet kankaat ja kalliomaat 4. Kosteikot ja avoimet suot marjapensasviljelmät 2.2.3 Oliivipuuviljelmä**t 2.3 Laidunmaat 2.3.1 Laidunmaat 2.4 Heterogeeniset maatalousvaltaiset alueet 2.4.1 Yhdistelmäviljelmät** 2.4.2 Peltojen ja niittyjen muodostama mosaiikki 2.4.3 Pienipiirteinen maatalousmosaiikki 2.4.4 Puustoiset pelto ja laidunmaat** 3.1 Sulkeutuneet metsät 3.1.1 Lehtimetsät 3.1.1.1 Lehtimetsä mineraalimaalla 3.1.1.2.Lehtimetsä turvemaalla 3.1.1.3 Lehtimetsä kalliomaalla 3.1.2 Havumetsät 3.1.2.1 Havumetsä mineraalimaalla 3.1.2.2 Havumetsä turvemaalla 3.1.2.3 Havumetsä kalliomaalla 3.1.3 Sekametsät 3.1.3.1 Sekametsä mineraalimaalla 3.1.3.2 Sekametsä turvemaalla 3.1.3.3 Sekametsä kalliomaalla 3.2 Harvapuustoiset metsät, pensastot sekä avoimet kankaat 3.3 Avoimet kankaat ja kalliomaat 4.1 Sisämaan kosteikot ja avosuot 3.2.1 Luonnonniityt 3.2.2 Varvikot ja nummet 3.2.3 Nahkealehtisen kasvillisuuden alueet** 3.2.4 Harvapuustoiset alueet 3.3.1 Rantahietikot ja dyynialueet 3.3.2 Kalliomaat 3.3.3 Niukkakasvustoiset kangasmaat 3.3.4 Paloalueet** 3.3.5 Jäätiköt ja pysyvän lumen alueet** 3.2.4.1 Harvapuustoinen alue mineraalimaalla 3.2.4.2 Harvapuustoinen alue turvemaalla 3.2.4.3 Harvapuustoinen alue kalliomaalla 3.2.4.4 Erittäin harvapuustoiset alueet mineraalimaalla 3.2.4.5 Harvapuustoinen alue tunturissa 3.2.4.6 Harvapuustoinen alue, sähkölinja 4.1.1 Sisämaan kosteikot 4.1.1.1 Kosteikko maalla 4.1.1.2 Kosteikko vedessä 5

4.1.2 Avosuot 4.1.2.1 Luontainen avosuo 4.1.2.2 Turvetuotantoalue 4.2 Rannikon kosteikot 4.2.1 Merenrantakosteikot 4.2.1.1 Kosteikko maalla 4.2.1.2 Kosteikko vedessä 4.2.2 Merenrannan suolamaat** 4.2.3 Vuorovesialueet 5. Vesialueet 5.1 Sisävedet 5.1.1 Joet 5.1.2 Järvet 5.2 Merivedet 5.2.1 Rannikon laguunit** 5.2.2 Jokisuistot** 5.2.3 Meri 1.2.4 Euroopan ympäristöviraston ohjeet validoinnin suorittamiseksi Euroopan ympäristöviraston ohjeet validoinnin suorittamiseksi löytyvät julkaisusta Bossard et.al. (2000). Menetelmässä valitaan ositetulla satunnaisotannalla testipisteitä joiden ympäristö tulkitaan samalla menetelmällä kuin tehtäessä varsinainen CLC2000 tulkinta. Osittaminen voi perustua alueeseen tai CLC2000 tulkinnan luokkaan. Tulokseksi saadaan oikein tulkittujen alueiden osuudet ositteille ja koko alueelle. Esitetyn menetelmän hyvänä puolena on että vertailu tulkinnan ja referenssin välillä tehdään huomioiden vertailukohdan ympäristö, eikä verrata CLC2000 tulkinnan polygonia pistemäiseen referenssiin. Heikkoutena on että menetelmä on erittäin työläs toteuttaa ja siten kallis, sekä perustuu samaan tulkintamenetelmään ja saman tulkintamateriaalin käyttämiseen kuin tehtäessä CLC2000 tulkintaa joten vertailtavia kahta tulkintaa ei voi pitää täysin toisistaan riippumattomina. 6

2 IMAGE2000 GEOMETRINEN TARKKUUS Suomen IMAGE2000 käsittää 37 Landsat ETM kuvaa. Kuvat muodostavat melkein pilvettömän peiton Suomen alueesta, vain noin 0.55% (1700 km 2 ) Suomen maa alueesta jää pilvien peittoon. Metria Sweden suoritti maastomallin avulla kuvien orto oikaisun Suomen yhtenäiskoordinaatistoon (YKJ). Oikaisun tukipisteinä käytettiin järvien painopisteitä. Satelliittikuvasta vesialueet tulkittiin kynnystämällä lähi infrakanava. Referenssimateriaalina käytettiin vesistöjen rantaviiva tietokantaa. Tämän avulla järville määritettiin painopisteiden koordinaatit ja etsittiin vastinpisteet kuvilta tulkituista järvistä. Osa tukipisteistä käytettiin varsinaiseen ortooikaisuun ja osa jätettiin oikaisun testipisteiksi. Oikaisussa apuna käytetyn digitaalisen karttadatan on tuottanut Maanmittauslaitos ja se tarkkuudeksi on arvioitu järvien rantaviivojen paikannuksen osalta 5 20 metriä ja maastomallin korkeuden osalta parempi kuin 2 metriä (CLC2000). 2.1 Geometrisen tarkkuuden määrittäminen Metria toimitti kunkin kuvan osalta tiedoston jossa oli testipisteiden tunnusten lisäksi kuvalta ja referenssimateriaalista määritetyt YKJ koordinaatit, näistä lasketut residuaalit sekä keskimääräiset RMSE virheet. Nämä tiedot olivat 32 kuvalle (taulukko A.1), kuvasta 192/11 ne puuttuivat. Geometrisen tarkkuuden määrittämiseen liittyvät kuvat ja taulukot ovat liitteessä A. Testipisteiden koordinaateista laskettiin residuaalit kummallekin koordinaatille kaavoilla: ja δ δ E N = R E = R N I I E, N, joissa R tarkoittaa referenssimateriaalista ja I kuvalta määritettyä koordinaattia. Testipisteiden residuaaleista laskettiin laskettiin seuraavat oikaisun onnistumista kuvaavat arvot koko alueelle ja kuvittain (taulukot A.1 ja A.2): Keskimääräinen residuaali, ts. E ja N koordinaatin residuaalin keskiarvo: Ere, Nre Residuaalien hajonta: Estd, Nstd Suurimmat residuaalit: Emax, Nmax Keskimääräinen residuaalivektorin pituus: VLME Residuaalivektorin hajonta: VLSTD Suurin residuaalivektorin pituus: VLMAX RMSE virheet (Root Mean Square Error) laskettiin kaavoilla RMSE E = n i= 1 δ n 2 Ei, 7

ja RMSE N = n i= 1 δ n 2 Ni. Planimetrinen RMSE virhe laskettiin kaavalla: 2 E RMSE = RMSE + RMSE P 2 N. 2.2 IMAGE2000:n geometrinen tarkkuus Oikaisun testipisteitä oli yhteensä 339 kappaletta (taulukko A.1). Kuvittain testipisteiden määrä vaihteli 2 (kuva 189/12) ja 38 (kuva 189/16) välillä, keskiarvon ollessa 11, mediaanin 9 ja hajonnan 7 testipistettä. Testipisteiden residuaalivektorit on kuvattu ETM kuvittain kuvissa A.1 A.4. Negatiivinen residuaali tarkoittaa että oikaistu kuva on koordinaatista riippuen liikaa idässä tai pohjoisessa. Oikaisun onnistumista kuvaavat arvot ovat taulukoissa A.1 ja A.2 sekä kuvissa A.5 A.8. Testipisteiden perusteella IMAGE2000 kuvat on oikaistu varsin hyvin. Kummankin koordinaatin residuaalien keskiarvot (taulukko A.1: sarakkeet ERE ja NRE sekä kuva A.5) ovat lähellä nollaa jolloin negatiiviset ja positiiviset residuaalit kumoavat toisensa. Suurin osa testipisteistä on lähempänä kuin 10 metriä oikeasta kohdastaan. Yksittäisistä kuvista pienimmät keskimääräiset residuaalit ovat alle 0.1 metriä kuvilla 188/15 (E koordinaatti) ja 188/16 (Nkoordinaatti). Suurimmat residuaalit olivat kuvilla 191/15 (E koordinaatti, 7.0 metriä) ja 186/17 (N koordinaatti 5.9 metriä). Residuaalit olivat suuria, ts. keskiarvot olivat suurempia kuin 5 metriä yhteensä 9 kuvalla. Suuri residuaalien keskiarvo viittaa siihen että residuaalit eivät ole jakautuneet satunnaisesti vaan ne ovat suuntautuneet systemaattisesti johonkin suuntaan. Residuaalien suuri hajonta (taulukko A.1, sarakkeet Estd ja Nstd) viittaa siihen että osa kuvasta on onnistuttu oikaisemaan hyvin ja osa huonosti. Hajontojen osalta parhaita kuvia ovat 195/12 ja 189/16, huonoimpia 192/13 ja 189/12. Suurimmat yksittäisten testipisteiden residuaalit (taulukko A.1, sarakkeet Emax ja Nmax) ovat 32.5 metriä E koordinaatin (kuva 191/15) ja 26.6 metriä N koordinaatin osalta (kuva 194/12). E koordinaatin osalta muita suuria maksimiresiduaaleja, ts. suurempia kuin 25 metriä, oli kuvilla 192/13, 194/12, 190/15 ja 191/17. Residuaalivektorien pituudet ovat keskimäärin 11 metriä (taulukko A.2, kuva A.7) ja suurin osa on pituudeltaan alle 20m. Pienimmillään kuvan keskimääräinen residuaalivektorien pituus on 5.7 metriä kuvalla 189/16. Kuvia joilla tämä arvo on pienempi kuin 10 metriä on 9 kappaletta. Tarkasteltaessa kuvien residuaalivektorien keskimääräisiä pituuksia ja hajontoja huonoimmat kuvat ovat 189/12, 189/13 ja 191/15. Suurin yksittäinen residuaalivektorin pituus on kuvalla 191/15 35.8 metriä eli noin 1.5 pikseliä. Koordinaattien suuntaiset RMSE virheet ovat hieman alle 10 metriä (taulukko A.2: sarakkeet ERMSE ja NRMSE, sekä kuva A.8), yhdistelmä eli planimetrinen RMSE hieman yli 10 metriä (taulukko A.2: sarake PRMSE sekä kuva A.8) eli noin puoli pikseliä. RMSE on residuaalien neliöiden keskiarvon neliöjuuri eli se on suurempi kuin residuaalien absoluuttisten arvojen 8

keskiarvo koska neliöinti painottaa suuria residuaaleja. Residuaalien absoluuttisten arvojen keskiarvo kaikille testipisteille on 7.1 metriä E koordinaatille ja 6.6 metriä N koordinaatille. Planimetrisen RMSE:n mukaan paras kuva on 189/16 ja huonoimmat 189/12, 189/13 ja 191/15. Oikaisupisteiden residuaalien jakaumaa testattiin Mooren testillä (Buiten ja van Putten, 1997). Nollahypoteesi on että residuaalivektorit ovat tasajakautuneita. Taulukon A.2 sarake MT ilmaisee testin tulokset. Sarakkeeseen on merkitty ne kuvat, joiden osalta nollahypoteesi on hylätty. Symboli "+" tarkoittaa hylkäyksen merkitsevyystasoa α siten että yksi symboli tarkoittaa α=10%, kaksi α=5% ja kolme α=1%. Symboli "x" tarkoittaa että oikaisupisteiden lukumäärä on ollut niin pieni että testiä ei ole voinut tehdä. Merkitsevyystaso α tarkoittaa todennäköisyyttä että hylätty nollahypoteesi pitääkin paikkansa (Milton ja Arnold, 1990). Eli mitä pienempi α, sitä luotettavampi on nollahypoteesin hylkäys. Testin mukaan kymmenen kuvan oikaisupisteiden residuaalien jakaumat poikkeavat enemmän tai vähemmän tasajakaumasta. Yllättävää on että kun testi tehdään kaikille pisteille, tulokseksi saadaan että pisteet ovat ei tasajakautuneet. Visuaalisesti tarkastellen, joillain kuvilla kuten 186/17 (kuva A.1) ja 193/12 (kuva A.4) nollahypoteesin hylkäyksen näkee varsin hyvin. On myös kuvia kuten 186/16 ja 187/18 (kuva A.1) joilla nollahypoteesi hyväksytään mutta visuaalinen tarkastelu antaa vaikutelman ei tasajakautuneisuudesta. Kun nollahypoteesi hylätään visuaalisen tarkastelun antaessa vaikutelman tasajakaumasta, tämä johtuu siitä että residuaalivektorit ovat lyhyitä jolloin näiden ei tasajakaumaa on vaikea havaita visuaalisesti. Residuaalivektorien komponenttien välistä riippumattomuutta testattiin Spearmanin järjestyskorrelaatiotestillä (Spearman Rank Correlation Test) (Buiten ja van Putten, 1997). testin nollahypoteesi on että residuaalivektorin komponentit ovat jakautuneet toisistaan riippumattomasti joten ne eivät korreloi keskenään. Taulukon A.2 sarake SRCT ilmaisee testin tulokset. Hylkäyksen merkitsevyystaso α ilmaistaan siten että positiivista korrelaatiota merkitään symbolilla "+", negatiivista symbolilla " " ja yksi symboli tarkoittaa α=10%, kaksi α=5% ja kolme α=1%. Symboli "x" tarkoittaa että oikaisupisteiden lukumäärä on ollut niin pieni että testiä ei ole voinut tehdä. Testin mukaan kuudella kuvalla residuaalien komponentit korreloivat enemmän tai vähemmän, kolmella kuvalla korrelaatio on positiivista ja kolmella negatiivista. Kahden kuvan residuaaleista (189/16 ja 191/16) tätä korrelaatiota on vaikea havaita visuaalisesti. Tämä johtuu residuaalivektorien lyhyydestä ja vektorien suuresta määrästä. Muissa tapauksissa korrelaatio on myös visuaalisesti havaittavissa, sitä paremmin mitä pidempiä residuaalivektorit ovat. 9

3. CLC2000 TEMAATTISEN TARKKUUDEN ARVIOINTI Paikkatiedon temaattisella osalla tarkoitetaan kohteen ominaisuuden kuvausta tai esittämistä. Mikäli kohteen ominaisuus ilmaistaan kohdetta kuvaavan jatkuvan muuttujan avulla, tarkkuuden arvioinnissa määritetään tarkkuutta kuvaavia tunnuslukuja. Kun kohdetta kuvaava muuttuja on diskreetti luokka, tarkkuuden arvioinnin tunnuslukua kutsutaan luokittelutarkkuudeksi tai oikeinluokituksen todennäköisyydeksi. Luokiteltaessa satelliittikuvia luokittelutarkkuus saadaan määrittämällä kuinka usein luokittelutulos ja valitut maastokohteet vastaavat toisiaan. Maastokohteiden luokka määritetään käymällä tarkistamassa paikka maastossa tai epäsuorasti muun paikkatiedon avulla. Käytännössä temaattisen tarkkuuden arvioinnin myötä syntyneet tarkkuutta kuvaavat estimaatit voivat olla pessimistisesti harhaisia muun muassa seuraavista syistä (Verbyla ja Hammond, 1995, Congalton ja Green, 1993): Sijaintivirhe: Referenssimateriaalin ja tulkintatuloksen oletetaan sopivan toisiinsa sijainnin osalta virheettömästi. Käytännössä tämä on hyvin harvoin mahdollista. Sijaintivirheen vaikutus kasvaa mikäli luokkien lukumäärä kasvaa tai tulkittu alue on hyvin heterogeeninen. Pienin kartoitettava yksikkö: Referenssimateriaalin pienin kartoitettava yksikkö voi olla kooltaan suurempi kuin tulkittavan satelliittikuvan pikseli. Ajalliset eroavaisuudet: Alue on ehtinyt muuttua satelliittikuvan ottamisen ja referenssimateriaalin hankinnan välillä. Referenssimateriaalin tulkintavirheet: Maastokohde on tulkittu väärin maastossa, on sattunut kirjoitusvirhe tietojen käsittelyssä tai maastokohteen luokan määritykseen käytetty paikkatieto ei ole ollut ajantasaista. Temaattisen tarkkuuden arviointi on jaettu seuraaviin osiin: Euroopan ympäristöviraston suorittama visuaalinen arviointi (luku 3.2). Tällöin tulkinnan ja yleistyksen lopputuloksena syntyvää tulkinnan eurooppalaista versiota (minimikuviokoko 25 hehtaaria) verrataan satelliittikuvaan. Kriteerinä on että tekisikö kuvaa tulkitseva ihminen vastaavat kuviot kun nyt on syntynyt tietokonepohjaisen tulkinnan ja yleistyksen myötä. Tulkinnan välivaiheiden eli puusto ja kasvillisuusmuuttujien estimoinnin tarkkuuden arviointi (luku 3.3). Estimoituja muuttujia on verrattu tulkintatyötä tehtäessä testikuvioiden keskiarvoihin ja Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealoihin. Lisäksi käytössä on ollut jonkin verran Suomen ympäristökeskuksen henkilöstön inventoimia maastokohteita. Tulkinnan lopputuloksen luokittelutarkkuuden arviointi (luku 3.4) kansalliselle ja eurooppalaiselle versiolle. Luokittelutarkkuutta on arvioitu tulkinnan yhteydessä testikuvioiden, Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealojen, itse määritettyjen maastokohteiden sekä muun paikkatiedon avulla. Tulkinnan luokkien pinta alojen vertailu (luku 3.5) kansalliselle ja eurooppalaiselle versiolle. Tässä kohden on vertailtu yleistyksen vaikutusta luokkiin, sekä vertailtu sekä kansallista että eurooppalaista versiota SLICES luokittelun maankäyttöelementtiin ja Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealojen osuuksiin. 10

3.1 Temaattisen tarkkuuden arvioinnin menetelmät Temaattisen tarkkuuden osalta määritettiin muuttujien estimoinnin onnistumista kuvaavia tunnuslukuja sekä luokittelun osalta määritettiin virhematriisit suhteessa referenssimateriaaleihin ja määritettiin erilaisia tunnuslukuja kuten luokittelun keskimääräinen tarkkuus. 3.1.1 Jatkuvat muuttujat Jatkuvien muuttujien estimaattien ja referenssimateriaalin vertailu suoritettiin laskemalla estimoinnin absoluuttinen ja suhteellinen harha, absoluuttinen ja suhteellinen keskineliövirheen neliöjuuri, Pearsonin korrelaatiokerroin ja selitysaste. Estimaatin absoluuttinen harha BIAS on määritelty (Katila ja Tomppo, 2001) BIAS = n i= 1 xi yi, n jossa n on näytteiden lukumäärä, y estimoidut muuttujat ja x referenssiarvot. Suhteellinen harha BIAS% saadaan 100* BIAS BIAS% =. n y i= 1 n i Absoluuttinen keskineliövirheen neliöjuuri RMSE on määritelty (Katila ja Tomppo, 2001) RMSE = n i= 1 ( x i y ) n i 2, ja suhteellinen keskineliövirheen neliöjuuri RMSE% on 100* RMSE RMSE% =. n y n Pearsonin korrelaatiokerroin on määritelty (Milton ja Arnold, 1990) i= 1 i R xy = Cov( x, y), Var( x) Var( y) 11

jossa Cov(x,y) tarkoittaa muuttujien x ja y välistä kovarianssia ja Var(x) muuttujan x varianssia. Selitysaste R 2 on korrelaatiokertoimen neliö. Harhan tilastollinen merkitsevyys on määritetty harhan keskivirheen avulla, eli harha on tilastollisesti merkitsevä mikäli se on suurempi kuin kaksi kertaa harhan keskivirhe. Harhan keskivirhe on (Katila ja Tomppo, 2001) 3.1.2 Luokittelu std( x y) s( bias) = n Luokittelun ja referenssimateriaalin vertailu suoritettiin muodostamalla luokittelun virhematriisi ja laskemalla tästä luokittelun onnistumista kuvaavia tunnuslukuja. Virhematriisin alkio a ij ilmaisee kuinka monta pikseliä tai näytettä jotka kuuluvat luokkaan j referenssimateriaalissa on luokiteltu luokkaan i luokittelutuloksessa. Eli matriisin sarakkeet vastaavat referenssimateriaalia ja rivit luokittelutulosta. Matriisin diagonaalialkiot ilmaisevat kuinka paljon näytteitä on luokiteltu oikein ja ei diagonaalialkiot virheluokituksia. (Lillesand ja Kiefer, 2000). Tarkkuudella tarkoitetaan siis luokittelun ja referenssimateriaalin välistä vastaavuutta. Virhematriisista määritettiin seuraavat tunnusluvut (Lark, 1995, Kuittinen et.al., 1991): Luokittelun kokonaistarkkuus: Todennäköisyys sille että luokittelutuloksesta otettu näyte on luokiteltu oikein sekä sille että satunnainen maastokohta on luokiteltu oikein luokittelutuloksessa. Todennäköisyys saadaan summaamalla virhematriisin diagonaalialkiot ja jakamalla näytteiden lukumäärällä: OA ii = i= 1 n n i= 1 n jossa n on luokkien lukumäärä. Luokkien tulkintatarkkuudet (tuottajan tarkkuus): Todennäköisyys sille että satunnaisesti valittu luokkaan x kuuluva näyte todella kuuluu luokkaan x, eli todennäköisyys että referenssimateriaalissa luokkaan x kuuluva näyte kuuluu luokkaan x myös luokittelutuloksessa: a j= 1 a ij. IA x = n a i= 1 xx a ix. Luokkien kohdetarkkuudet (käyttäjän tarkkuus): Todennäköisyys sille että luokkaan x luokiteltu näyte on luokiteltu oikein: TA x = n a i= 1 xx a xi 12

Kappa kerroin: Kerroin pyrkii määrittämään kuinka suuri osa kokonaistarkkuudesta johtuu todellisesta vastaavuudesta luokittelun ja referenssimateriaalin välillä, eikä sattumasta. Kappa kertoimen lähestyessä arvoa 1 todellinen vastaavuus lähenee arvoa 1 ja satunnainen vastaavuus 0. Kertoimen ollessa 0, luokittelu on yhtä hyvä kuin täysin satunnainen luokittelu (Lillesand ja Kiefer, 2000): Kappa N n a ii i+ + i i= 1 i= 1 = n 2 N ai+ a+ i i= 1 jossa N on näytteiden lukumäärä, a i+ virhematriisin rivin i summa ja a +i virhematriisin sarakkeen i summa. Luokkien Kappa kerroin: Kappa kerroin luokalle x on määritelty (Rosenfield ja Fitzpatric Lins, 1986): n a a, Kappa x = Na Na ii i+ a a i+ i+ a a + i + i. Tau kerroin: Kappa kerroin yliestimoi satunnaisen vastaavuuden luokittelutuloksen ja referenssimateriaalin välillä. Tau kertoimen pitäisi antaa luotettavampi estimaatti (Ma ja Redmond, 1995) jossa Pi on luokan i a'priori todennäköisyys. Tässä dokumentissa luokkien a'priori todennäköisyydet ovat olleet yhtä suuria. Estimaattien luottamusvälit määritetään yleensä normaalijakaumaoletuksen avulla. Tässä on kuitenkin ongelmana että näytejoukon ollessa pieni tai tunnusluvun ollessa lähellä 0 tai 1, luottamusväli ei ole symmetrinen keskiarvon ympärillä. Tästä syystä tässä dokumentissa luottamusvälit on laskettu käyttäen binomi ja F jakaumia (Morisette ja Khorram, 1998). Kuvassa 3.1 on esitetty 95% luottamusvälit näytejoukkojen koolle 20, 50, 100, 200 ja 500 näytettä. Vaakasuora akseli esittää estimoitua tarkkuutta prosentteina ja pystysuora akseli luottamusväliä prosentteina. 3.2 Visuaalinen arviointi Tau n a ii i= 1 i= 1 = n N Euroopan ympäristöviraston edustajat vierailivat kahdesti (28. 29.8.2003 ja 24. 28.5.2004) Suomen ympäristökeskuksessa arvioimassa CLC2000 tulkinnan lopputulosta. Näiden vierailujen tarkoitus on i= 1 opastaa kansallisia tekijöitä tietokannan tuottamisessa ja varmistaa lopputuloksen homogeenisuus eri puolilla Eurooppaa, n a a i+ i+ P i P i, 13

Kuva 3.1: 95% luottamusvälit näytejoukkojen koolle 20, 50, 100, 200 ja 500 näytettä. Vaakasuora akseli esittää estimoitua tarkkuutta prosentteina ja pystysuora akseli luottamusväliä prosentteina. Esimerkiksi, mikäli estimoitu luokittelutarkkuus on 80%, niin sen 95% luottamusväli on 67 90% kun näytejoukon koko on 50 näytettä ja 76 84 kun käytössä on 500 näytettä. keskustella tuotantoon liittyvistä ongelmista, hankkia tietoa lopputuloksen laadusta maittain Euroopan ympäristövirastolle, sekä 2. käynnillä lisäksi tarkastaa ensimmäisen vierailun aikana korjattavaksi annetut asiat. Arviointi perustuu satelliittikuvan ja tulkinnan vierailuun. Apuna käytetään alueelta saatavissa olevaa muuta karttamateriaalia. Arvioinnin työkalu on ArcView ohjelman ominaisuuksia hyödyntävä InterCheck ohjelma, joka näyttää satelliittikuvan yhdessä tulkittujen polygonien kanssa. Tutkittavia asioita ovat luokkakoodien oikeellisuus ja varmistetaan että naapuripolygonit ovat eri luokkia polygonien minimikoko suurempi kuin 25 ha etsitään ei relevantit luokkakoodit, sekä tutkitaan vastaako satelliittikuva ja tulkintatulos toisiaan visuaalisesti. Ensimmäinen vierailu tapahtui 28. 29.8.2003 jolloin tarkasteltiin viiden testialueen (8% maaalasta) tulkinnan onnistumista. Testialueilta valittiin 22 aluetta kooltaan 10 km x 10 km tarkempaa tarkastelua varten. Arviointi tuotti seuraavanlaisia kommentteja (Büttner ja Mari, 2003): 14

Tietokannan geometrinen laatu on hyvä. Tärkeimmät luokkiin liittyvät asiat olivat että tiiviisti rakennettuja asuinalueita (1.1.1) on liikaa eli näiden pitäisi olla väljästi rakennettuja asuinalueita (1.1.2) sekä luokka taajamien viheralueet ja puistot (1.4.1) puuttuu. Suositeltiin hieman alle 25 ha polygonien kasvattamista jotta ne olisivat suurempia kuin 25 ha, etenkin luokka 3xx luokan 5xx sisässä (säästetään pienet järvet), luokka 4xx luokan 3xx sisässä (säästetään pienet kosteikot harvapuustoisten alueiden sisässä), sekä luokka 324 luokan 31x sisässä (säästetään pienet hakkuuaukeat metsässä). Yleistettäessä pitäisi pyrkiä säilyttämää maa / vesi raja. Toinen vierailu tapahtui 24. 28.5.2004 jolloin tarkastelun kohteena oli koko maa. Tarkempaa tarkastelua varten valittiin 114 aluetta kooltaan 10 km x 10 km. Tällä kertaa tärkeimmät kommentit olivat (Feranec ja Jaffrain, 2004): Luokkaa Pienipiirteinen maatalousmosaiikki 2.4.3 pitäisi olla enemmän ja sen polygonien rajaukseen pitäisi kiinnittää huomiota. Jokien rajaukseen pitäisi kiinnittää huomiota, eli käytännössä joki voi olla kapeampi kuin 100m. Hakkuualueita puuttuu jonkin verran. Kokonaisuutena arvioijat olivat tyytyväisiä sekä tulkinnan lopputulokseen että käytettyihin menetelmiin. 3.3 Jatkuvat muuttujat Estimoidut puustoa ja kasvillisuutta kuvaavat jatkuvat muuttujat ovat tulkinnan välivaiheita. Etenkin metsien ja muiden luonnontilaisten alueiden luokittelu perustuu näihin muuttujiin, joista saadaan lopulliset CLC2000 luokat kynnystämällä. Estimoituja muuttujia on verrattu tulkintatyötä tehtäessä testikuvioiden keskiarvoihin, Metsäntutkimuslaitoksen valtakunnan metsien inventoinnin maastokoealoihin, sekä Miska Luodon (SYKE) Ylä Lapissa mittaamiin maastokoealoihin. Tulkinnan testikuvioiden estimaattien tarkkuus käsitellään kahdessa luvussa koska Ylä Lapissa (kasvillisuusvyöhykkeet 4c ja 4d) on käytetty erilaista opetusaineistoa ja kuvakorjausta kuin muualla Suomessa. Ylä Lapin opetusaineistona käytettiin Metsähallituksen tuottamaa biotooppikartoitusta kun muualla käytettiin Metsähallituksen ja UPM Kymmenen tuottamaa kuvioittaista metsäninventointitietoa. Kuvan radiometrisista korjauksista Ylä Lapissa suoritettiin ilmakehä ja topografiakorjaus kun muualla Suomessa pelkkä ilmakehäkorjaus katsottiin riittäväksi. Jatkuvien muuttujien estimaattien ja referenssimateriaalin vertailu suoritettiin laskemalla estimoinnin absoluuttinen ja suhteellinen harha, absoluuttinen ja suhteellinen keskineliövirheen neliöjuuri, Pearsonin korrelaatiokerroin ja selitysaste. Lisäksi tutkittiin harhan tilastollinen merkitsevyys. 15

3.3.1 Tulkinnan testikuviot Suurimmassa osassa Suomea tulkinnan opetusaineistona käytettiin Metsähallituksen ja UPM Kymmenen tuottamaa kuvioittaista metsäninventointitietoa. Näiltä alueilta määritettiin puuston pituuden, latvuspeiton, tilavuuden ja lehtipuuston tilavuuden tarkkuudet. Kuviot jaettiin kahteen ryhmään joista toista käytettiin tulkinnassa ja toista tulkintatuloksen testaamiseen. Eli tulkinnan jälkeen kuvioille laskettiin estimoidun muuttujan keskiarvo jota verrattiin metsäninventoinnin antamaan arvoon. Kuvioiden lukumäärät kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turvemaille on esitetty taulukossa B.1 ja kuvassa B.1. Kuvioiden kokoluokat olivat: 1. Kaikki kuviot 2. Alle hehtaari 3. 1 5 hehtaari 4. 5 10 hehtaari 5. 10 50 hehtaari 6. 50 100 hehtaari 7. Yli 100 hehtaari Estimoinnin tunnusluvut sekä harhan tilastollinen merkitsevyys määritettiin seuraaville muuttujille: 1. Puuston pituus 2. Puuston latvuspeitto 3. Puuston tilavuus 4. Lehtipuuston tilavuus Taulukot ja kuvaajat tuloksista on liitteessä B. Tulokset puuston pituuden osalta on esitetty taulukoissa B.2 B.7 ja kuvassa B.2, puuston latvuspeiton osalta taulukoissa B.8 B.13 ja kuvassa B.3, puuston tilavuuden osalta taulukoissa B.14 B.19 ja kuvassa B.4, ja lehtipuuston tilavuuden osalta taulukoissa B.20 B.25 ja kuvassa B.5. Tunnusluvut on laskettu kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turvemaiden kuvioille. Taulukkojen merkinnät tarkoittavat TR: opetusjoukko, TE: testijoukko, min: mineraalimaa, ja suo: turvemaa. Kuvissa sinisellä värillä esitetään opetusjoukon ja punaisella testijoukon tunnusluvut. Yhtenäinen viiva tarkoittaa että tunnusluvut on laskettu käyttäen kaikkia kuvioita, katkoviiva mineraalimaan kuvioita ja katkopisteviiva turvemaan kuvioita. Puuston pituuden osalta absoluuttinen harha on yleensä alle metri (taulukko B.2) ja suhteellinen harha alle 10 % yksikköä (taulukko B.3). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 4 metriä (taulukko B.4) ja suhteellinen alle 40 % yksikköä (taulukko B.5). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.7 (taulukko B.6) ja selitysaste 50 (taulukko B.7). Samat asiat on havaittavissa kuvassa B.2, kuvasta huomataan että opetus ja testijoukon tunnusluvut ovat hyvin samanlaiset, joissain tapauksissa kuten keskineliövirheen neliöjuuren suhteen testijoukon tulokset ovat parempia. Mineraalimaan tulokset ovat hieman parempia kuin turvemaan. Kuviokoon kasvattaminen parantaa tuloksia, paraneminen tasaantuu kun kuviokoko ylittää 10 hehtaaria. On huomattava että suurimmassa kokoluokassa (koko yli 100 hehtaaria) näytejoukon koko on varsin pieni joten sen tuloksiin kannattaa suhtautua hieman varauksella. 16

Puuston latvuspeiton osalta absoluuttinen harha on yleensä alle 5 % yksikköä (taulukko B.8) ja suhteellinen harha alle 10 % yksikköä (taulukko B.9). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 15 % yksikköä (taulukko B.10) ja suhteellinen alle 40 % yksikköä (taulukko B.11). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.7 (taulukko B.12) ja selitysaste 50 (taulukko B.13). Kuviokoolla ei ole juuri vaikutusta harhan suuruuteen (kuva B.3) mutta absoluuttinen keskineliövirheen neliöjuuri pienenee kuviokoon kasvaessa. Mineraalimaan tulokset ovat yleensä hieman parempia kuin turvemaan, sekä testijoukko yhtä hyvä tai hieman parempi kuin opetusjoukko. Puuston tilavuuden osalta absoluuttinen harha on yleensä alle 10 m 3 /ha (taulukko B.14) ja suhteellinen harha alle 10 % yksikköä (taulukko B.15). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 60 m 3 /ha (taulukko B.16) ja suhteellinen alle 50 % yksikköä (taulukko B.17). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.7 (taulukko B.18) ja selitysaste 50 (taulukko B.19). Jälleen, kuviokoon kasvattaminen parantaa tuloksia (kuva B.4) ja testijoukon tunnusluvut ovat yhtä hyviä tai parempia kuin opetusjoukon. Lehtipuuston tilavuuden osalta absoluuttinen harha on yleensä alle 5 m 3 /ha (taulukko B.20) ja suhteellinen harha alle 30 % yksikköä (taulukko B.21). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 30 m 3 /ha (taulukko B.22) mutta suhteellinen huomattavan suuri ollen yleensä yli 100 % yksikköä (taulukko B.23). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.4 (taulukko B.24) ja selitysaste 20 (taulukko B.25), eli korrelaatio on varsin vaatimatonta luokkaa. Estimaatin absoluuttinen harha on pienimmillään kuviokoolla 5 50 ha. Opetusjoukon absoluuttinen harha on pienempi kuin testijoukon ja mineraalimaiden harha pienempi kuin turvemaiden. Suhteellisen harhan osalta tilanne muuttuu, tällöin kuviokoolla 1 50 hehtaaria turvemaalla harha on pienempi kuin mineraalimaalla ja testijoukolla pienempi kuin opetusjoukolla. Absoluuttisen harhan suuruus on yleensä tilastollisesti merkitsevä. Puuston osalta tähän vaikuttaa muun muassa laskentatarkkuus, tulokset talletetaan tasametrein. Puuston latvuspeiton osalta vaikuttaa latvuspeiton määritys, etenkin harvalla latvuspeitolla maastoinventoinnin arvio ilmaistaan useamman prosenttiyksikön välein. Mineraalimaalla olevien testikuvioiden avulla tutkittiin muuttujien estimoinnin onnistumista muuttujien erilaisilla lukualueilla. Tarkoituksena oli tarkastella harhan käyttäytymistä. Edellä esitettyjen tunnuslukujen lisäksi määritettiin lineaarisen regression kertoimet estimaatin ja referenssin välille (ts. ref = a0 + a1 * est). Näiden kertoimien avulla voi yrittää kalibroida estimaatteja tarkemmiksi halutulla lukualueella. Tulokset on esitetty taulukoissa B.26 B.29 ja kuvissa B.6 B.13. Taulukoissa esitetään eri lukualueiden tunnusluvut, regressiosuoran kertoimet ja kuvioiden lukumäärä ja kuvissa estimaatin ja referenssiarvon suhde on esitetty kahdella eri tavalla. Harhan osalta tummennettu luku tarkoittaa että harhan suuruus ei ole tilastollisesti merkitsevä. Taulukoista havaitaan että paras korrelaatio estimaatin ja referenssin välillä saavutetaan käytettäessä koko lukualuetta. Niissä harvoissa tapauksissa kun harhan suuruus ei ole tilastollisesti merkitsevä, estimaatin lukualue on nollasta hieman ylöspäin. Esimerkiksi puuston pituuden osalta lukualue 0 7 metriä on estimoitu siten että harhan suuruus on tilastollisesti ei merkitsevä, samoin tilavuuden osalta lukualue 0 200 m 3 /ha. Tosin näissä tapauksissa korrelaatio on varsin vaatimaton ja keskineliövirheen neliöjuuri suurehko. 17

3.3.2 Tulkinnan testikuviot, Ylä Lappi Ylä Lapissa (kasvillisuusvyöhykkeet 4c ja 4d) tulkinnan opetusaineistona käytettiin Metsähallituksen tuottamaa biotooppikartoitusta. Johtuen erilaisesta opetusaineistosta, kuvakorjauksista (kuville suoritettiin topografiakorjaus) sekä luonnontilaisten vähäpuustoisten alueiden suuresta osuudesta tulkinta suoritettiin eri lailla kuin muualla Suomessa. Ylä Lapin alueelta määritettiin puuston pituuden, puuston tilavuuden, puuston latvuspeiton, männyn, kuusen ja lehtipuuston latvuspeiton tarkkuudet. Kuviot jaettiin kahteen ryhmään joista toista käytettiin tulkinnassa ja toista tulkintatuloksen testaamiseen. Eli tulkinnan jälkeen biotooppikartan kuvioille laskettiin estimoidun muuttujan keskiarvo jota verrattiin biotooppikartan arvoon. Kuvioiden lukumäärät kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turvemaille on esitetty taulukossa C.1 ja kuvassa C.1. Kuvioiden kokoluokat olivat: 1. Kaikki kuviot 2. Alle hehtaari 3. 1 5 hehtaari 4. 5 10 hehtaari 5. 10 50 hehtaari 6. 50 100 hehtaari 7. Yli 100 hehtaari Estimoinnin tunnusluvut sekä harhan tilastollinen merkitsevyys määritettiin seuraaville muuttujille: 1. Puuston pituus 2. Puuston tilavuus 3. Puuston latvuspeitto 4. Männyn latvuspeitto 5. Kuusen latvuspeitto 6. Lehtipuuston latvuspeitto Tulokset taulukoin ja kuvin esitettynä ovat liitteessä C. Tulokset puuston pituuden osalta on esitetty taulukoissa C.2 C.7 ja kuvassa C.2, puuston tilavuuden osalta on esitetty taulukoissa C.8 C.13 ja kuvassa C.3, puuston latvuspeiton osalta on esitetty taulukoissa C.14 C.19 ja kuvassa C.4, männyn latvuspeiton osalta on esitetty taulukoissa C.20 C.25 ja kuvassa C.5, kuusen latvuspeiton osalta on esitetty taulukoissa C.26 C.31 ja kuvassa C.6, ja lehtipuuston latvuspeiton osalta on esitetty taulukoissa C.32 C.37 ja kuvassa C.7. Tunnusluvut on laskettu kokoluokittain opetus ja testikuvioiden kaikille kuvioille sekä mineraali ja turvemaiden kuvioille. Taulukkojen merkinnät tarkoittavat TR: opetusjoukko, TE: testijoukko, min: mineraalimaa, ja suo: turvemaa. Kuvissa sinisellä värillä esitetään opetusjoukon ja punaisella testijoukon tunnusluvut. Yhtenäinen viiva tarkoittaa että tunnusluvut on laskettu käyttäen kaikkia kuvioita, katkoviiva mineraalimaan kuvioita ja katkopisteviiva turvemaan kuvioita. On huomattava että kuvioiden lukumäärä joissain maaperä ja kokoluokissa on ollut varsin pieni (taulukko C.1), esimerkiksi alle hehtaarin tai yli 100 hehtaarin kuviot turvemaalla, jolloin näiden kokoluokkien tuloksiin kannattaa suhtautua varauksella. Puuston pituuden osalta absoluuttinen harha on yleensä alle metri mineraalimailla ja kaksi metriä turvemailla (taulukko C.2), ja suhteellinen harha alle 20 ja 50 % yksikköä (taulukko C.3). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 4 metriä (taulukko C.4) ja suhteellinen alle 70 ja 100 % yksikköä mineraali ja turvemaille (taulukko C.5). Pearsonin 18

korrelaatiokerroin on yleensä parempi kuin 0.6 (taulukko C.6) ja selitysaste 40 (taulukko C.7) mineraalimailla. Turvemailla näiden tunnusten arvot ovat erittäin vaatimattomat, eli turvemaat on tulkittu todella huonosti. Lopullisessa tulkinnassa virheellisimpien alueiden eli kosteiden avointen soiden alueella käytettiin PerusCD:stä muodostettua avosuomaskia. Samat asiat on havaittavissa kuvassa C.2, kuvasta huomataan että turvemaiden tunnusluvut ovat huonompia kuin kaikkien kuvioiden tai mineraalimaiden tunnusluvut. Kuviokoon kasvattaminen parantaa tuloksia, paitsi kaikkein suurimpien kuvioiden ryhmässä. Verrattaessa eteläiseen Suomeen, absoluuttinen harha ja keskineliövirheen neliöjuuri ovat samaa luokkaa, mutta vastaavat suhteelliset luvut ovat varsin paljon huonompia. Tämä johtuu siitä että puusto on pienikokoisempaa Ylä Lapissa. Samoin korrelaatio on huonompi Ylä Lapissa. Puuston tilavuuden osalta absoluuttinen harha on yleensä alle 5 m 3 /ha mineraalimailla ja noin 10 m 3 /ha turvemailla (taulukko C.8). Suhteellinen harha mineraalimaalla on alle 60 % yksikköä, turvemaalla tämä on huomattavan suuri, yli 150 % yksikköä (taulukko C.9). Absoluuttinen keskineliövirheen neliöjuuri on yleensä 10 20 m 3 /ha (taulukko C.10) ja suhteellinen yli 100 ja 300 % yksikköä mineraali ja turvemaille (taulukko C.11). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.5 (taulukko C.12) ja selitysaste 30 (taulukko C.13) mineraalimailla. Turvemailla näiden tunnusten arvot ovat jälleen erittäin vaatimattomat. Kuviokoon kasvattaminen parantaa yleisesti tuloksia (kuva C.3), huonoimmat tulokset saadaan pienimmällä ja suurimmalla kokoluokalla. Verrattaessa eteläiseen Suomeen, absoluuttinen harha mineraalimaiden testikuvioilla on samaa luokkaa, muissa tapauksissa huonompi. Absoluuttinen keskineliövirheen neliöjuuri on parempi, eron pienentyessä kuvioiden koon kasvaessa. Toisaalta suhteelliset virheet ovat varsin paljon huonompia kuten myös korrelaatio. Puuston latvuspeiton osalta absoluuttinen harha on yleensä alle 3 % yksikköä mineraalimailla ja alle 10 % yksikköä turvemailla (taulukko C.14). Suhteellinen harha mineraalimaalla on alle 40 % yksikköä, turvemaalla tämä on huomattavan suuri, yli 100 % yksikköä (taulukko C.15). Absoluuttinen keskineliövirheen neliöjuuri on yleensä 10 15 % yksikköä (taulukko C.16) ja suhteellinen yli 100 ja 200 % yksikköä mineraali ja turvemaille (taulukko C.17). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.5 (taulukko C.18) ja selitysaste 30 (taulukko C.19) mineraalimailla. Turvemailla näiden tunnusten arvot ovat jälleen erittäin vaatimattomat. Kuviokoon kasvattaminen parantaa yleisesti tuloksia (kuva C.4), huonoimmat tulokset saadaan pienimmällä ja suurimmalla kokoluokalla. Verrattaessa eteläiseen Suomeen, absoluuttiset virheet ovat suunnilleen samaa luokkaa, mutta suhteelliset virheet ovat huonompia, kuten myös korrelaatio. Ylä Lapin alueella mäntyjä oli varsin vähän. Männyn latvuspeiton osalta absoluuttinen harha on yleensä alle 2 % yksikköä mineraalimailla ja alle 4 % yksikköä turvemailla (taulukko C.20). Suhteellinen harha mineraalimaalla on alle 60 % yksikköä, turvemaalla tämä on huomattavan suuri, yleensä yli 250 % yksikköä (taulukko C.21). Absoluuttinen keskineliövirheen neliöjuuri on yleensä alle 5 % yksikköä (taulukko C.22) ja suhteellinen yli 150 ja 500 % yksikköä mineraali ja turvemaille (taulukko C.23). Pearsonin korrelaatiokerroin on parempi kuin 0.5 (taulukko C.24) ja selitysaste 30 (taulukko C.25) mineraalimailla. Turvemailla näiden tunnusten arvot ovat jälleen erittäin vaatimattomat. Kuviokoon kasvattamisella ei ole juurikaan vaikutusta tuloksiin (kuva C.5). Kuusia oli Ylä Lapin alueella erittäin vähän, tästä syystä kuusien estimointitulokset ovat erittäin huonoja. Kuusen latvuspeiton osalta absoluuttinen harha on alle 1 % yksikköä ja keskineliövirheen neliöjuuri yleensä alle 2 % yksikköä (taulukot C.26 ja C.28). Suhteelliset virheet ovat huomattavasti suurempia (taulukot C.27 ja C.29), tällöin harha on yli 100% ja kes 19

kineliövirheen neliöjuuri yli 500%. Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.4 (taulukko C.30) ja selitysaste 20 (taulukko C.30) mineraalimailla. Kuviokoon kasvattaminen näyttäisi hieman heikentävän tuloksia (kuva C.6), ainakin tarkasteltaessa absoluuttisia virheitä. Lehtipuuston latvuspeiton osalta absoluuttinen harha on yleensä alle 2 % yksikköä mineraalimailla ja 6 % yksikköä turvemailla (taulukko C.32). Absoluttinen keskineliövirheen neliöjuuri on yleensä noin 10 % yksikköä mineraalimailla ja hieman huonompi turvemailla (taulukko C.34). Suhteelliset virheet ovat harhan osalta yleensä 10 30 % yksikköä mineraalimailla ja yli 100 % yksikköä turvemailla (taulukko C.33), sekä keskineliövirheen neliöjuuren osalta yli 100 % yksikköä (taulukko C.35). Pearsonin korrelaatiokerroin on yleensä parempi kuin 0.4 (taulukko C.36) ja selitysaste 20 (taulukko C.37) mineraalimailla. Kuviokoon kasvattaminen näyttäisi hieman parantavan tuloksia (kuva C.7). Myös Ylä Lapissa tutkittiin mineraalimaalla olevien testikuvioiden avulla muuttujien estimoinnin onnistumista muuttujien erilaisilla lukualueilla. Tulokset on esitetty taulukoissa C.38 C.43 ja kuvissa C.8 C.19. Taulukoissa esitetään eri lukualueiden tunnusluvut, regressiosuoran kertoimet ja kuvioiden lukumäärä. Kuvissa estimaatin ja referenssiarvon suhde on esitetty kahdella eri tavalla. Harhan osalta tummennettu luku tarkoittaa että harhan suuruus ei ole tilastollisesti merkitsevä. Yleensä harhan suuruus on tilastollisesti merkittävä, tähän löytyy vain muutama poikkeus kuusen latvuspeiton estimoinnissa. Taulukoista havaitaan että paras korrelaatio estimaatin ja referenssin välillä saavutetaan käytettäessä koko lukualuetta. Yleisesti ottaen, absoluuttinen harha ja keskineliövirheen neliöjuuri ovat pienimpiä lukualueen alkupäässä, mutta suhteelliset tarkkuusluvut huonoimpia. 3.3.3 Vertailu VMI koeloihin 1 Metsäntutkimuslaitos/VMI teki luotettavuustarkasteluja Suomen ympäristökeskuksen (SY KE) toimittamille CORINE hankkeessa tuotetuille teemakartoille perustuen VMI9 koealaaineistoon. Luotettavuustarkasteluja tehtiin metsäteemoille ja CORINE peitteisyysluokille. SYKE toimitti kuuden alueen tulkinnan valituista teemoista ja lopullisesta CLC2000 luokittelusta rasterikuvina. Alueet vastasivat yksittäisiä Landsat ETM kuvia paitsi Ylä Lapin alue vastasi kasvillisuusvyöhykkeitä 4c ja 4d. Yleensä tulkinta oli tehty käyttäen useamman Landsat ETM kuvan mosaikkia. Kahden kuvan alueelta toimitettiin myös toinen tulkintaversio, jossa tulkinta oli tehty käyttäen yhtä Landsat ETM kuvaa. Testialueet valittiin siten, että VMI maastotyöt oli tehty mahdollisimman samanaikaisesti satelliittikuvien kuvausajankohdan kanssa. Kuvassa 3.2 on esitetty alueet ja taulukossa 3.1 mitä Landsat kuvaa alue vastaa ja mitkä ovat VMI koealojen mittausvuodet. Kuvauspäivämäärää aiemmin mitatuista koealoista poistettiin monilähdeinventoinnissa käytettyjen Landsat kuvien avulla hakatuiksi tunnistettuja koealoja (lähinnä selvät päätehakkuut). Kuvauspäivämäärän jälkeen mitatuista VMI koeloista poistettiin kuvauksen jälkeen hakatuiksi koodatut koealat. Koealatason validointiin käytettiin siis koko kuvapeittoa pienempää osajoukkoa. 1 Tämä kappale perustuu Matti Katilan (METLA, Valtakunnan metsien inventointi, Metsävaratietopalvelu) tekemään raporttiin "CORINE metsäteemojen validointi VMI9 koealamittauksilla". 20

Kuva 3.2: VMI validoinnin alueet. Validoitavat karttateemat (muuttujat) olivat puuston pituus (m), (vain koealatasolla), latvuspeitto (%), (vain koealatasolla), kokonaistilavuus (m3/ha) lehtipuuston määrä (m3/ha). Tulokset esitettiin erikseen kivennäismaalle ja turvemaalle. Tämä ositus perustuu maastokoealan kasvupaikkatietoihin. Latvuspeiton osalta on huomattava, että VMI9:ssä sitä on mitattu kolmessa luokassa: 0 10 %, 10 30 % ja 30 100 %. Latvuspeittävyyttä on arvioitu vuodesta 1998 lähtien eli metsäkeskusten 0, 1b, 7, 8 ja 9 alueelta ei ole lainkaan latvuspeittävyysmittausta. Taulukko 3.1: VMI validoinnissa käytetyt alueet ja näiden VMI koealojen mittausvuodet. Alue Tulkinta VMI koealojen mittausvuodet Ylä Lappi: kasvillisuusvyöhykkeet mosaiikki 2003 4c ja 4d Posio: Landsat 190/13 mosaiikki 2002, 2003 Oulujärvi: Landsat 188/15 mosaiikki ja yksittäinen kuva 2000 2002 Pyhäjärvi: Landsat 190/15 mosaiikki 2001, 2002 Puulavesi: Landsat 187/17 mosaiikki ja yksittäinen kuva 1997 2000 Rannikko: Landsat 191/16 ja 17 mosaiikki 1998, 1999 21

Puuston keskipituus on mitattu kaikista kehitysluokista koealakuviolta vain Kainuun, Pohjois Pohjanmaan ja Lapin metsäkeskusten alueelta. Taimikkokehitysluokissa keskipituudella tarkoitetaan valta ja lisävaltapuiden keskipituutta. Varttuneemman metsän kehitysluokissa keskipituus on jakson elävien puiden pohjapinta alan mediaanipuun pituus (vrt. keskiläpimitta). Kitumaalla keskipituudeksi merkitään valtapituus. Aukealla keskipituus on 0. On huomattava että keskipituus on kirjattu desimetrin tarkkuudella kun taas puuston pituus on estimoitu satelliittikuvasta metrin tarkkuudella. Muissa metsäkeskuksissa käytettiin varttuneissa kehitysluokissa koealan kuviotiedoista mallilla johdettua keskipituutta. Luotettavuustarkasteluja tehtiin koealatasolla ja suuraluetasolla. Koealatason luotettavuustarkasteluissa lasketaan puuston pituudelle, puuston tilavuudelle sekä lehtipuuston tilavuudelle, seuraavat tunnusluvut yli kunkin luokituskuvan: absoluuttinen ja suhteellinen keskineliövirheen neliöjuuri (RMSE,RMSE %) yli testiaineiston, absoluuttinen ja suhteellinen harha (estimoitu havaittu), (BIAS, BIAS %) yli testiaineiston, harhan tilastollinen merkitsevyys (2* harhan keskivirhe) VMI koealojen keskiarvo ja keskihajonta selitysaste R 2, määriteltynä: R 2 = 1 MSE/std(y). Latvuspeiton luokituksen onnistumista tarkastellaan ristiintaulukoimalla VMIlatvuspeitteisyyttä ja CORINEn antamaa latvuspeittoprosenttia ja määrittämällä tästä oikeinluokituksen todennäköisyys. Suuraluetason luotettavuustarkastelut toteutettiin käyttäen VMIkoealoja ja VMI:n maastoinventoinnin estimointimenetelmiä. Puuston keski ja kokonaistilavuudet yhteensä sekä lehtipuustolle estimoitiin kaikilla tulkinta alueilla paitsi Ylä Lapissa. Suuraluetason luotettavuustarkastelut toteutettiin käyttäen VMI koealoja ja VMI:n maastoinventoinnin estimointimenetelmiä. Puuston keski ja kokonaistilavuudet yhteensä sekä lehtipuustolle estimoitiin kaikilla tulkinta alueilla paitsi Ylä Lapissa, minne tulokset saataneen elokuussa. Laskentamenetelmässä saadaan estimaateille keskivirheet, joista voidaan konstruoida luottamusvälit kyseisille muuttujille, suuralueelle. Jos CORINE tulkinnan tulos eroaa yli kahden keskivirheen verran VMI estimaatista, virhe on tilastollisesti merkitsevä. Tulokset on esitetty pistediagrammein (kuvat D.1 D.24), tarkkuuslukujen kuvaajin (kuvat D.25 D.29) ja taulukoin (taulukot D.1 D.12) eri alueille. Kuvat ja taulukot ovat liitteessä D. Tulokset esitetään yhteensä koko pinta alalle (kuvaajissa punainen yhtenäinen viiva) ja erikseen kivennäismaalle (punainen katkoviiva) ja turvemaalle (punainen katkopisteviiva). CORINEn puuston tilavuusestimaateissa oli systemaattista aliarvioita, etenkin Etelä Suomessa. Keskitilavuuden harha vaihteli 23 3 m3/ha (taulukot D.4 D.6 ja kuva D.26), lehtipuun tilavuuden 8 2 m3/ha (taulukot D.7 D.9 ja kuva D.27). Myös puuston keskipituus oli yleensä aliarvioitu (taulukot D.1 D.3 ja kuva D.25). Puuston tilavuuksien ja pituuksien harhat olivat useimmiten tilastollisesti merkitseviä. Aliarvio suuraluetasolla, yli koealapisteiden, pieneni selvästi tilavuuksien osalta kahdella alueella joiden muuttujat oli estimoitu satelliittikuvamosaiikin sijasta yhdeltä kuvalta (taulukko D.11 ja kuva D.29). RMSE:t ovat melko suuria 72 93 % keskitilavuudelle ja lehtipuuston tilavuudelle 146 195 %, keskipituuden RMSE sen sijaan jäi alle 50 % useassa tapauksessa. Monilähteisessä VMI:ssä (MVMI) koealatason ristiinvalidoinnissa RMSE:t ovat tyypillisesti suuria (esim. tilavuuden 22