Lectio praecursoria Matti Katila, 6.2.2004



Samankaltaiset tiedostot
Kant Arvostelmia. Informaatioajan Filosofian kurssin essee. Otto Opiskelija 65041E

pitkittäisaineistoissa

Otannasta ja mittaamisesta

Osa 2: Otokset, otosjakaumat ja estimointi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

Harjoitus 7: NCSS - Tilastollinen analyysi

MONISTE 2 Kirjoittanut Elina Katainen

Tilastollisten aineistojen kerääminen ja mittaaminen

Matemaatikot ja tilastotieteilijät

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Puustotietojen keruun tekniset vaihtoehdot, kustannustehokkuus ja tarkkuus

Metsäkoneiden sensoritekniikka kehittyy. Heikki Hyyti, Aalto-yliopisto

Tilastollinen aineisto Luottamusväli

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

pitkittäisaineistoissa

ASUINKERROSTALON ÄÄNITEKNISEN LAADUN ARVIOINTI. Mikko Kylliäinen

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Trestima Oy Puuston mittauksia

LATVUSMASSAN KOSTEUDEN MÄÄRITYS METSÄKULJETUKSEN YHTEYDESSÄ

Kvantitatiivisen aineiston analyysi

Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

Mittausjärjestelmän kalibrointi ja mittausepävarmuus

Tiedonkeruun miljoonat pisteet

ELEMENTTIMENETELMÄN PERUSTEET SESSIO 01: Johdanto. Elementtiverkko. Solmusuureet.

Mittaustulosten tilastollinen käsittely

Trestima Oy Puuston mittauksia

Mittaamisen maailmasta muutamia asioita. Heli Valkeinen, erikoistutkija, TtT TOIMIA-verkoston koordinaattori

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Suomen metsäkeskus. SMK:n ja VMI:n inventointien yhteistyömahdollisuuksia. Taksaattoriklubin kevätseminaari Helsinki, 20.3.

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Paikkatietoa metsäbiomassan määrästä tarvitaan

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Vanhankaupunginkosken ultraäänikuvaukset Simsonar Oy Pertti Paakkolanvaara

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Testit laatueroasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

VMI kasvututkimuksen haasteita

Parametrin estimointi ja bootstrap-otanta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Drone-kuvausten käyttökelpoisuudesta metsäkeskuksen toiminnassa Maaseutu 2.0 loppuseminaari

No millaista metsätietoa jj tarvitaan?


1. Tilastollinen malli??

Väliestimointi (jatkoa) Heliövaara 1

Luento 5 Mittakuva. fotogrammetriaan ja kaukokartoitukseen

Avoin paikkatieto tutkimuksessa ja opetuksessa

1) Maan muodon selvittäminen. 2) Leveys- ja pituuspiirit. 3) Mittaaminen

Logiikka 1/5 Sisältö ESITIEDOT:

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

Energiatehokkuutta parantavien materiaalien tutkimus. Antti Karttunen Nuorten Akatemiaklubi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

Käsitteistä. Reliabiliteetti, validiteetti ja yleistäminen. Reliabiliteetti. Reliabiliteetti ja validiteetti

Sovellettu todennäköisyyslaskenta B

Ellei tutkijalla ole käsitystä mittauksensa validiteetista ja reliabiliteetista, ei johtopäätöksillä

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

TASAVIRTAPIIRI - VASTAUSLOMAKE

Pihtipudas Niemenharju Kunnalliskoti kivik. asuinpaikan ympäristön kartoitus 2006

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

kymmenjärjestelmä-käsitteen varmentaminen, tutustuminen 60-järjestelmään kellonaikojen avulla

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Metsien kaukokartoitus ja avoimet aineistot

Harjoitus 9: Excel - Tilastollinen analyysi

Testit järjestysasteikollisille muuttujille

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MATEMATIIKKA. MAA Matematiikan pitkä oppimäärä

EHDOTUS. EHDOTUS Matematiikan opetussuunnitelmien perusteiden oppiainekohtaiset osat

ABHELSINKI UNIVERSITY OF TECHNOLOGY

KUORTANE Kirkonseudun ranta-alueen muinaisjäännöskartoitus korttelissa

Mitä on laadullinen tutkimus? Pertti Alasuutari Tampereen yliopisto

Kojemeteorologia. Sami Haapanala syksy Fysiikan laitos, Ilmakehätieteiden osasto

Normaalijakaumasta johdettuja jakaumia

S5-S9 L1, L2, L4, L5, L6, L7 havaintojensa pohjalta kannustaa oppilasta esittämään ratkaisujaan ja päätelmiään muille

Korvausvastuun ennustejakauma bootstrap-menetelmän avulla

3.6 Su-estimaattorien asymptotiikka

Laadullinen tutkimus. KTT Riku Oksman

Transkriptio:

Lectio praecursoria Matti Katila, 6.2.2004 Arvoisa vastaväittäjä, arvoisa kustos, hyvä yleisö, Erään sanomalehden tiedesivuilla todettiin, että ihmiset ja kehittyneet eläimet, kuten esimerkiksi harakat, pystyvät laskematta hahmottamaan enintään kuuden alkion suuruisia joukkoja. Laskemisen taidon on oletettu saaneen alkunsa käytännön tarpeista, tai vaihtoehtoisesti primitiivisten uskonnollisten rituaalien yhteydessä. Ensimmäiset kirjoitetut dokumentit lukujärjestelmistä ja aritmetiikasta ovat sumerilaisten nuolenpääkirjoituksissa, neljänneltä vuosituhannelta ennen ajanlaskumme alkua. Historioitsija Herodotos esittää geometrian syntyneen seuraavasti: "Sesostris jakoi Egyptin maan asukkaiden kesken. Jos joki vei osan jonkin alueesta, kuningas lähetti miehensä tutkimaan ja mittauksella määrittämään menetyksen täsmällisen koon. Uskon, että geometria tuli Egyptissä tunnetuksi tämän käytännön seurauksena ja sieltä se siirtyi Kreikkaan." Maatalouskulttuurien yhdistyessä hierarkisiksi yhteiskunniksi kirjoitus- ja laskentataito olivat välttämättömiä hallinnon apuvälineitä. Uusiutuvien luonnonvarojen hallinta vaati kirjanpidon ja mittaamisen kehittämistä. Matematiikka irtaantui alkulähtökohdistaan abstraktiin ja formaaliin muotoonsa ja jatkoi kehitystään samoin kuin myöhemmin muutkin perustieteet. Geometrian ongelmia tutkittiin paljon antiikin Kreikkalaisen ja Hellenistisen kulttuurin aikaan. Kuuluisin aikakauden kirja on Eukleides Aleksandrialaisen matematiikan oppikirja Elementa, jonka XI luku käsittelee avaruusgeometriaa ja kappaleiden tilavuuksia. Kuitenkin, vasta Fermat n ja Descartes n aikakaudella kehitetty analyyttinen geometria antoi perustyökalut kolmiulotteisten kappaleiden tilavuuksien laskentaan.

2 Kerättäessä tietoa laajoilta alueilta ei kappaleiden täydellinen lukumääräinen laskenta tullut kysymykseen käytännön syistä. Kartoittamalla kiinnostuksen kohteena oleva alue se voitiin nopeasti jakaa karkeisiin luokkiin. Egyptiläisten köydenpingoittajien eli maanmittareiden työssä karttaprojektiot ja maapallon muoto eivät liene olleet merkittävä ongelma. Löytöretket laajensivat maailmaa ja loivat parempien karttojen tarpeen suunnistamiseen ja luonnonvarojen haltuunottoon. Flaamilainen Gerhardus Mercator esitti vuonna 1569 nimeään kantavan karttaprojektion, josta tuli perusta kartanpiirtämiselle meidän päiviimme saakka. Siinä päästiin irti Antiikin Ptolemaioksen perinteistä kartanpiirtämisessä. Tieteellinen kartografia levisi Ruotsi-Suomeenkin 1600-1700-luvulla. Kartan laatimisesta tuli korostetusti tarkkoihin mittavälineisiin ja matematiikkaan perustuvaa toimintaa. Sovelletut tieteet, kuten metsätieteet ovat ottaneet käyttöönsä uusia tutkimuksen metodeja perustieteiltä ja toisaalta antaneet sysäyksiä teorian kehitykseen perustieteissä ja toisissa soveltavissa tieteissä. Metsänmittausoppi, jossa hankitaan tietoja metsäekosysteemistä, voidaan jakaa mittaussysteemiin ja laskentasysteemiin. Ensinnämainitussa sovelletaan insinööritieteitä tarkoissa mittauksissa ja jälkimmäisessä matematiikan, tilastotieteen ja tietojen käsittelyn menetelmiä. Varsin monia asioita voidaan nykyään kvantifioida ja mitata metsäekosysteemistä, kiitos mittaustekniikan nopean kehityksen. Metsänmittauksen kannalta tärkeintä teknologiaa ovat ehkä maastomittausvälineet ja kaukokartoitustekniikka. Ensimmäiset ilmavalokuvat otettiin 1850-luvulla, fotogrammetria kehittyi moderniin muotoonsa 1920-luvulla. NASAn Landsat-luonnonvarasatelliittiohjelma alkoi 1970-luvulla. Ensimmäistä kertaa alettiin saada systemaattista ja toistuvaa satelliittikuvatietoa koko maapallolta. Rutiininomaisesti saatava monikanavainen satelliittikuvamateriaali antoi voimakkaan sysäyksen numeerisen kuvatulkinnan kehittymiselle. Kuvatulkinnan monimutkaisuus konkretisoitui, kun ihmisen tekemää tulkintaa yritettiin imitoida tietokonepohjaisilla algoritmeilla. Ihmiset kun pystyvät tulkitsemaan visuaalisesti monimutkaisiakin kuvia käyttäen hyväkseen kuvan sävyjä, tekstuuria, varjoja, hahmoja ja muotoja. Mittauksiin ja mittalaitteisiin liittyy olennaisesti niiden luotettavuus, eli tarkkuus ja

3 harhattomuus. Mittausvirheet jaetaan usein systemaattiseen ja satunnaiseen komponenttiin. Tieteellisten kokeiden virhelähteille on esitetty epistemologista jakoa käsittäen: 1) taustalla olevan teorian paikkansa pitävyyden, 2) olettamukset mittausvälineen rakenteesta ja toiminnasta, 3) havaintovirheet ja 4) teoreettiset virheet päätelmissä. Mittauksiin liittyvää epävarmuutta voidaan arvioida todennäköisyyslaskennan ja tilastotieteen keinoin. Alan pioneereja oli Carl Friedrich Gauss, joka tutki 1800-luvun alkupuolella Göttingenin observatorion instrumentteja ja niiden tuottamaa havaintoaineistoa. Hän kehitti virheteoriaa instrumenteistä ja mittauksista johtuvien sekä teknisten virheiden luonteista. Mittausten automatisointi ja kaupallistuminen ovat kasvattaneet luonnonvarojen seurantaan sopivan mittausaineiston määrää ja valikoimaa. Mittausten validiteetti, ymmärrettynä mittausaineiston käyttökelpoisuutena kiinnostavan ilmiön selittämiseksi nousee tällöin yhä tärkeämmäksi kysymykseksi; mittaammeko niitä muuttujia, joista todella olemme kiinnostuneita? Usein on edullisempaa tai helpompaa mitata muuttujia, joista voidaan johtaa varsinaisesti kiinnostavat tunnukset. Esimerkiksi metsikön pohjapinta-ala, ei välttämättä ole kiinnostava tunnus sinänsä vaan siitä johdetut tunnukset, kuten puuston runkotilavuus. Mittauksiakin voidaan suorittaa suoraan tai epäsuorasti. Edellämainittua metsikön pohjapinta-alaa mitataan epäsuorasti relaskoopilla, kun taas puun läpimittaa mitataan suoraan kaulaimella. Satelliittien sensorit mittaavat suoraan heijastusarvoja, tosin ilmakehän läpi, maastokohteesta. Tässäkään tapauksessa mittaustulos ei metsäisissä sovelluksissa ole varsinainen kiinnostava muuttuja, vaan pikemminkin havaittujen heijastusarvojen tai muiden kuvan piirteiden kovariaatio maastossa mitattujen puustotunnusten kanssa.

4 Ekologisessa tutkimuksessa tavoitteena on kerätä mittausten avulla aineisto, joka toimii välineenä etukäteen määritellyn ongelman ratkaisemiseksi. Havainto vaatii tuekseen teorian ja ymmärryksen, jotta se muuntuu aineistoksi. Metsienmittauksessa, kuten ekologisessa tutkimuksessa, tehdään etukäteen tiettyjä rajauksia ja teoreettisia oletuksia mittauksen kohteesta, populaatiosta. Metsäsekosysteemin osa, jota mitataan oletetaan (kohtuullisen) stabiiliksi mittausajanjaksolla (ja lähitulevaisuudessa). Ekologisessa tutkimuksessa korostetaan usein tutkimusongelmaa. Kysyessäni kerran eräältä kollegalta, mikä on Valtakunnan metsien inventoinnin nollahypoteesi, sain vastaukseksi kysymyksen, onko metsissä tai metsävaroissa tapahtunut merkittävää muutosta edellisestä mittauskerrasta? Tätä nykyä tilastolliset menetelmät ovat yleisesti metsäntutkijoiden käytännön työkaluja. Niiden voidaan ajatella käsittävän empiirisen aineiston keräämiseen, prosessointiin, analysointiin ja tulosten tulkintaan liittyvät menetelmät. Käytetyt tilastolliset mallit, deterministiset tai stokastiset, perustuvat usein laajaan aineistoon ja jonkintyyppiseen regressioanalyysiin. Metsätieteisiin liittyviä tilastollisia menetelmiä on ruvettu kutsumaan metsäbiometriaksi. Matemaattisten mallien ja numeerisen analyysin käytön hyvänä puolena voidaan nähdä se, että tutkija joutuu formuloimaan ajatuksensa yksityiskohtaisesti (ja selkeästi). Metsänarvioimistieteen ja tilastotieteen välillä on aina ollut kiinteä vuorovaikutus. Monet metsänmittauksen ongelmat palautuvat geometrisiksi todennäköisyysongelmiksi, stereologian tai spatiaalisen tilastotieteen alueelle. Arvioidaan viivojen pituuksia, arvioidaan pinta-aloja 1-ulotteisilla tai 0-ulotteisilla havainnoilla eli viivoilla ja pisteillä, kuvataan 3-ulotteisia kappaleita poikkileikkauksilla, havainnoidaan 2- ja 3-ulotteisia mittoja Bitterlichin kulma-arvioinnilla ja mitataan puuston tilajärjestystä. Otantateoria on tilastollisista menetelmistä keskeisellä sijalla metsänarvionnissa. Metsävarojen tiedonkeruun perusvaihtoehtoja ovat 1) Census eli populaation täydellinen lukeminen, 2) kartoitus, 3) subjektiivinen otanta ja 4) tilastollinen otanta. Metsiköiden kartoitukseen ja silmävaraiseen arviointiin perustuva metsien inventointi oli

5 pitkään vallitseva tiedonkeruu- ja hallintamenetelmä etenkin Keski-Euroopassa. 1800-luvulla metsien mittaustekniikka kehittyi voimakkaasti ja ensimmäisiä linja-arvionteja tehtiin laajojen metsäalueiden inventoimiseksi. Student in t-jakauma, suurten lukujen lait ja keskeinen raja-arvolause antoivat perusteita normaalisuusoletuksen käytölle useissa käytännön tilanteissa, sekä satunnaisotannalle. Jerzy Neyman esitti satunnaisiin otoksiin ja luottamusväleihin perustuvan tilastollinen päättelyn periaatteet vuonna 1934. Satunnaisotantaan perustuvat estimaatit ovat useimmiten konsistentteja riippumatta kohdepopulaation jakaumasta. Pian tämän jälkeen otannan menetelmiksi tulivat myös ositus, ryvästys ja monivaiheinen otanta. Yates in mukaan kaksi tärkeintä periaatetta otannan suunnittelussa ovat harhan välttäminen ja luotettavan estimaattorin esittäminen otantavirheelle. Pohjoismaissa ensimmäiset tilastollisiin menetelmiin pohjautuvat suuralueinventoinnit aloitettiin 1920-luvulla. J. W. Lindebergin esittämä keskivirheen laskentamenetelmä linja-arvioinnille ja Maternin tutkimukset systemaatisen ryväsotannan virhe-estimaattoreiden parissa olivat merkittäviä edistysaskeleita tilastollisen otannan ja spatiaalisen tilastotieteen saralla. Suomessa siirryttiin puuston tilavuuden silmävaraisesta arvioinnista koealamittauksiin 4:ssä valtakunnan metsien inventoinnissa. Relaskooppi otettiin käyttöön koealan rajaamisessa 5:ssä inventoinnissa. Tietojenkäsittelykapasiteetin myötä numeerisen aineiston, karttatiedon ja kaukokartoitustiedon yhdistäminen maastossa mitattuun aineistoon on tullut helpommaksi ja houkuttelevaksi vaihtoehdoksi lisätä maastoaineiston antamien tulosten tarkkuutta tai tulosten yksityiskohtaisuutta. Hahmontunnistuksen saralla on kehitetty kuvamateriaalin tulkintaan erikoistuneita menetelmiä. Monia spatiaalisen tilastotieteen menetelmiä sovelletaan paikkatietojärjestelmissä havaintojen yleistämiseen. Mallinnuksessa ei-parametriset yleistysmenetelmät ovat saavuttaneet laajaa suosiota tietokoneiden laskentakapasiteetin kasvaessa. Metsien inventoinneista halutaan tuloksia pienalueille, ja paikkansidottuna karttatietona. Perinteiset otannan menetelmät ja niiden virhe-estimaattorit eivät enää sovellu suoraan esimerkiksi monilähdeinventointeihin. Uutena haasteena on nyt kehittää joustavia

6 estimointimenetelmiä paikkatietoa käyttäville luonnonvarojen seurantajärjestelmille. Uusien menetelmien pitäisi tuottaa estimaateille myös virhearvioita, vaihtelevan kokoisille alueille. Perustieteet, soveltavat ja insinööritieteet ovat kehittyneet vuorovaikutuksessa toistensa kanssa. Innovaatiot muilla tieteen saroilla ovat heijastuneet metsänarviomistieteeseen ja päinvastoinkin. Emme ehkä koskaan saa tietää, syntyikö geometria maanmittauksen käytännön tarpeista vai Egyptin joutilaan pappisluokan harrastuksena. Mutta tutkijoina voimme kuitenkin tiedostaa oman työskentelymme liikkeelle panevat voimat ja taustalla olevat psyykkiset prosessit.