Mat Sovelletun matematiikan erikoistyöt Spatiaalinen autokorrelaatio viljelykokeiden havainnoissa

Samankaltaiset tiedostot
Mat Sovelletun matematiikan erikoistyö Spatiaalisen autokorrelaation testaaminen. Esa-Pekka Horttanainen 41867M

Timo Tarvainen PUROSEDIMENTIIANALYYSIEN HAVAINNOLLISTAMINEN GEOSTATISTIIKAN KEINOIN. Outokumpu Oy Atk-osasto

3.5 Generoivat funktiot ja momentit

1. Luvut 1, 10 on laitettu ympyrän kehälle. Osoita, että löytyy kolme vierekkäistä

Mat Tilastollisen analyysin perusteet, kevät 2007

Monte Carlo -menetelmä

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt

FYSA220/2 (FYS222/2) VALON POLARISAATIO

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä.

Kuluttajahintojen muutokset

3. Datan käsittely lyhyt katsaus

Mat Tilastollinen päättely 7. harjoitukset / Tehtävät. Hypoteesien testaus. Avainsanat:

MTTTP1 SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

r i m i v i = L i = vakio, (2)

Mittausvirhe. Mittaustekniikan perusteet / luento 6. Mittausvirhe. Mittausepävarmuus ja siihen liittyvää terminologiaa

Uuden eläkelaitoslain vaikutus allokaatiovalintaan

Mittausepävarmuus. Mittaustekniikan perusteet / luento 7. Mittausepävarmuus. Mittausepävarmuuden laskeminen. Epävarmuuslaskelma vai virhearvio?

Mat Tilastollisen analyysin perusteet, kevät 2007

Tchebycheff-menetelmä ja STEM

Suoran sovittaminen pistejoukkoon

Jaksolliset ja toistuvat suoritukset

5. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Työssä tutustutaan harmonisen mekaanisen värähdysliikkeen ominaisuuksiin seuraavissa

Työllistääkö aktivointi?

LIITE 2 SUORAN SOVITTAMINEN HAVAINTOPISTEISIIN

Mittaustulosten käsittely

Markov-prosessit (Jatkuva-aikaiset Markov-ketjut)

Luento 6 Luotettavuus Koherentit järjestelmät

1 0 2 x 1 a. x 1 2x c b 2a c a. Alimmalta riviltä nähdään että yhtälöyhmällä on ratkaisu jos ja vain jos b 3a + c = 0.

Mat Koesuunnittelu ja tilastolliset mallit. Yhden selittäjän lineaarinen regressiomalli. Avainsanat:

1, x < 0 tai x > 2a.

Yksikköoperaatiot ja teolliset prosessit

Mat /Mat Matematiikan peruskurssi C3/KP3-I Harjoitus 2, esimerkkiratkaisut

COULOMBIN VOIMA JA SÄHKÖKENTTÄ, PISTEVARAUKSET, JATKUVAT VARAUSJAKAUMAT

Puupintaisen sandwichkattoelementin. lujuuslaskelmat. Sisältö:

3.3 Hajontaluvuista. MAB5: Tunnusluvut

5. Datan käsittely lyhyt katsaus

Taustaa. Sekventiaalinen vaikutuskaavio. Päätöspuista ja vaikutuskaavioista. Esimerkki: Reaktoriongelma. Johdantoa sekventiaalikaavioon

Maanhintojen vikasietoisesta mallintamisesta

KUVIEN LAADUN ANALYSOINTI

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt

OUTOKUMPU OY 0 K MALMINETSINTA. talta.

Johdatus tekoälyn taustalla olevaan matematiikkaan

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Moderni portfolioteoria

Sähkökiukaan kivimassan vaikutus saunan energiankulutukseen

Yrityksen teoria ja sopimukset

Ilmari Juva. Jalkapallo-ottelun lopputuloksen stokastinen mallintaminen

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2

Tilastollisen fysiikan luennot

Mat Sovellettu todennäköisyyslasku A

3 Tilayhtälöiden numeerinen integrointi

Hallin ilmiö. Laatija - Pasi Vähämartti. Vuosikurssi - IST4SE. Tekopäivä Palautuspäivä

Aamukatsaus

BL20A0600 Sähkönsiirtotekniikka

Sähkön- ja lämmöntuotannon kustannussimulointi ja herkkyysanalyysi

ER-kaaviot. Ohjelmien analysointi. Tilakaaviot. UML-kaaviot (luokkakaavio) Tietohakemisto. UML-kaaviot (sekvenssikaavio) Kirjasto

Segmentointimenetelmien käyttökelpoisuus

d L q i = V = mc 2 q i 1 γ = = p i. = V = γm q i + QA i. ṗ i + Q A i + Q da i t + j + V + Q φ

Mat Lineaarinen ohjelmointi

JYVÄSKYLÄN YLIOPISTO Taloustieteiden tiedekunta

Galerkin in menetelmä

6. Stokastiset prosessit (2)

Painotetun metriikan ja NBI menetelmä

JÄNNITETTYJEN ONTELOLAATTOJEN CE-MERKINNÄN MUKAINEN SUUNNITTELU EUROKOODIEN MUKAAN

Tchebycheff-menetelmä ja STEM

ABTEKNILLINEN KORKEAKOULU

Esitä koherentin QAM-ilmaisimen lohkokaavio, ja osoita matemaattisesti, että ilmaisimen lähdöstä saadaan kantataajuiset I- ja Q-signaalit ulos.

HASSEN-WEILIN LAUSE. Kertausta

Kuntoilijan juoksumalli

Eräs Vaikutuskaavioiden ratkaisumenetelmä

Kollektiivinen korvausvastuu

A250A0100 Finanssi-investoinnit Harjoitukset

LIITE 2 SUORAN SOVITTAMINEN HAVAINTOPISTEISIIN

LAPPEENRANNAN TEKNILLINEN YLIOPISTO Kauppatieteiden tiedekunta Rahoitus VALUUTTAKURSSIRISKIN VAIKUTUS ARGENTIINAN OSAKEMARKKINOILLA

Geneettiset algoritmit ja luonnossa tapahtuva mikroevoluutio

AB TEKNILLINEN KORKEAKOULU

A = B = T = Merkkijonon A osamerkkijono A[i..j]: n merkkiä pitkä merkkijono A:

S , FYSIIKKA III (ES), Syksy 2002, LH 4, Loppuviikko 39. Partitiofunktiota käyttäen keskiarvo voidaan kirjoittaa muotoon

FYSIIKAN LABORATORIOTYÖT P

Saatteeksi. Vantaalla vuoden 2000 syyskuussa. Hannu Kyttälä Tietopalvelupäällikkö

Jäykän kappaleen liike

Tavoitteet skaalaavan funktion lähestymistapa eli referenssipiste menetelmä

13. Lineaariset ensimmäisen kertaluvun differentiaalisysteemit

Valmistelut INSTALLATION INFORMATION

1. (Monisteen teht. 5.16) Eräiden kuulalaakereiden kestoa (miljoonaa kierrosta) on totuttu kuvaamaan Weibull-jakaumalla, jonka tiheysfunktio on

Usean muuttujan funktioiden integraalilaskentaa

38C. MEKAANISEN VÄRÄHTELYN TUTKIMINEN

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

Hanna-Kaisa Hurme Teräksen tilastollinen rakenneanalyysi Diplomityö

7. Modulit Modulit ja lineaarikuvaukset.

Kansainvälisen konsernin verosuunnittelu ja tuloksenjärjestely

3D-mallintaminen konvergenttikuvilta

TIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta. Yliassistentti Jussi Hakanen syksy 2010

. g = 0,42g. Moolimassat ovat vastaavasti N 2 :lle 28, 02g/ mol ja typpiatomille puolet tästä 14, 01g/ mol.

Tarkastellaan kuvan 8.1 (a) lineaarista nelitahoista elementtiä, jonka solmut sijaitsevat elementin kärkipisteissä ja niiden koordinaatit ovat ( xi

TEKNILLINEN KORKEAKOULU Systeemianalyysin laboratorio Mat Sovelletun matematiikan erikoistyö. Ei-normaalisten tuottojakaumien mallintaminen

Transkriptio:

Mat-.108 Sovelletun matematkan erkostyöt Spataalnen autokorrelaato vljelykokeden havannossa 5.5.004 Emla Suomalanen emla.suomalanen@hut.f 54755U

Ssällys 1 Johdanto 1 Vljelykokeden satodata 3 Spataalsen autokorrelaaton mttaamnen 3 3.1 Posson-jakauma 3 3. Manteln autokorrelaatotest 3 3.3 Varogramm 4 3.3.1 Varogrammn johto 4 3.3. Teoreettnen varogramm 6 3.3.3 Emprnen varogramm 8 4 Spataalnen autokorrelaato vehnän satodatassa 9 5 Yhteenveto ja johtopäätökset 16 Lähdeluettelo 17 Lte 1. Satodata 18 Lte. Matlab-koodt 19

1 Johdanto Spataalnen tlastoanalyys on eräs tlastoteteen ertynen osa-alue, joka vodaan laajast määrtellä spataalsest korrelotuneen datan kästtelyyn soveltuven metoden joukoks. Spataalsen datan analysonta on kentes kästelty krjallsuudessa vähemmän kun usempa muta tlastoteteen haaroja ja sen soveltamnen vaatkn usen myös tavallsta enemmän tetokoneella suortettavaa smulonta. Spataalsen tlastoanalyysn sovelluskohteta ovat esmerkks kaupunksuunnttelu, ympärstöteteet, pakkatetojärjestelmät, terveydenhuolto ja jopa krmnologa (Messner et al. 1999). Spataalsen tlastoanalyysn avulla vodaan mm. tarkastella objekten sjanten muodostama kuvota, mtata spataalsta autokorrelaatota ja määrttää kahden er muuttujan välnen spataalnen korrelaato. Spataalsen autokorrelaaton kästteellä tarkotetaan maanteteellsest lähellä tosaan sjatseven alueden mustuttavan tosaan enemmän jonkn tutkttavan omnasuuden suhteen, kun kaukana tosstaan oleven. Tämän tutkmuksen pohjana on käytetty vehnän satomttauksa, jossa esntyy satunnasvahtelua. Satoarvojen vahtelu on lmasest korrelotunutta sten, että läheltä tosaan sjatsevlta koelohkolta saadaan tosaan mustuttava satunnaspokkeama, kun taas kaukana tosstaan sjatsevlla lohkolla e ole vastaavaa yhteyttä. Spataalnen korrelaato aheuttaa hankaluuksa koetulosten analysonnlle, esmerkks satomäären vertalulle. Tavallset vertalumenetelmät, kuten varanssanalyys, tomvat oletuksella, että datassa esntyvät satunnasvrheet ovat rppumattoma, ja sks näden menetelmen soveltamnen olskn kyseenalasta. Työ tärkempä tutkmuskohteta ovat satodatan spataalsen autokorrelaaton vomakkuus ja sen mahdollnen vakutusalue. Spataalsen autokorrelaaton tutkmseks estetäänkn kolme erlasta tapaa: Posson-jakauman omnasuuksn perustuva testsuure, Manteln autokorrelaatotest ja varogrammmenetelmä. Työn kuluessa kutenkn lmenee, ette spataalsen autokorrelaaton testaamnen ana ole täysn ongelmatonta. 1

Vljelykokeden satodata Tutkmuksen pohjana on käytetty vehnän satodataa Aberdeenstä, Idahosta vuodelta 197. Tutkmuskohteena olleeseen peltoon kylvettn vehnää 15 jalkaa (non 4,57 m) ptkn rvehn, jotka olvat tosstaan 1 tuuman (non 30,5 m) etäsyydellä. Alkuperästä dataa löyty yhteensä 1500 rvltä. Tässä työssä rajotutaan kutenkn tarkastelemaan satodataa van 150 rvltä. Valttuja rvä ol ptuussuunnassa rnnakkan vs kappaletta ja pystysuunnassa allekkan 30. Koejärjestelyt ja valttujen rven sjant suhteessa tosnsa näkyvät kuvassa 1. Vehnäsato mtattn rvettän ja saadut jyvämäärät on estetty ltteessä 1. Laskettujen vljamäären tarkkuudesta e alkuperäsessä lähteessä estetty vttetä; välllä tulokset ol merktty mustn vden jyvän tarkkuudella, välllä avan ykstyskohtasest. (Andrews & Herzberg 1985.) Kuva 1. Vljelykokeen koejärjestely. Vehnän satodataa tutkttaessa on knnostavaa selvttää, löytyykö datasta spataalsta rppuvuutta, kuten vos olettaa. Spataalnen rppuvuus vo lmetä esmerkks sten, että suuret jyvämäärät ovat keskttyneet ryppäsn lähelle tosaan (lusterng) ta että ne ovat levttäytyneet tasasest koko alueen yl (unformty). Vastaavast tarkastelussa vodaan keskttyä penn jyvämäärn. Nollahypoteesna on, että satodatan mtatut arvot ovat jakautuneet tutkttavalle alueelle satunnasest. Käytännön kannalta ols tetyst myös knnostavaa selvttää, mstä datassa mahdollsest esntyvät spataalset kuvot aheutuvat.

3 Spataalsen autokorrelaaton mttaamnen Spataalsta autokorrelaatota lukumäärädatassa vodaan mtata kolmella er kenolla. Lukumäärädatalla tarkotetaan, että tarkasteltava alue on jaettu ruutuhn ja havannot ovat tarkasteltaven objekten lukumäärä ruudussa. Ensmmänen tapa tutka spataalsta korrelaatota on testata, noudattavatko havantojen lukumäärät Posson-jakaumaa. Tonen tapa on Mantel-test, joka vertaa datan autokorrelaatota randomsaatotestn antamn tuloksn. Kolmas keno on varogramm-lähestymstapa, jossa tutkttavaan anestoon sovtetaan spataalsen korrelaaton käyttäytymsestä kertova varogrammkäyrä. 3.1 Posson-jakauma Eräs satodataa koskeva hypotees, jota vomme testata, on, onko jokasella satoarvolla yhtä suur mahdollsuus joutua mnne tahansa mttausalueelle rppumatta tossta tulokssta. Jos tämä ptää pakkansa, mtatut satomäärät x noudattavat Posson-jakaumaa mssä x e P( x), (1) x! on jyven lukumäärän odotusarvo. Eräs Posson-jakauman omnasuukssta on, että varanss on yhtä suur kun odotusarvo. Sten jos x ja s ovat otoskeskarvo ja -varanss, suhteen s R () x tuls olla non yks. Jos R:n arvot ovat paljon ykköstä suurempa, mtatut arvot ovat jakautuneet alueelle paljon tasasemmn, kun Posson-jakauman perusteella on oletettua. Jos puolestaan R:n arvot ovat paljon ykköstä penempä, esntyy datassa arvojen keskttymstä ryppäsn. Standardtest R:n vertaamseks ykköseen saadaan tutkmalla, noudattaako testsuure T R1 (3) n1 t-jakaumaa vapausastella df = n 1. n on tässä vljeltyjen rven kokonasmäärä. (Manly 001.) 3. Manteln autokorrelaatotest Vakka mtatut satomäärät evät noudattaskaan Posson-jakaumaa, ne vovat slt olla spataalsest satunnasest jakautuneta snä melessä, että ne ovat jakautuneet rvelle tosstaan rppumatta, efektvsest satunnasest. Datassa e sten esnny samankaltasten arvojen keskttymstä yhteen, ekä myöskään nden tasasta jakautumsta koko mttausalueelle. Tällasen hypoteesn testaukseen vodaan käyttää Manteln matrsmuotosta satunnasuustestä. (Manly 001.) Jos otantaykskötä on yhteensä n kappaletta, kuvaa yksköden ja j välstä etäsyyttä arvo d j. Etäsyydet vodaan laskea kaklle otantaykskölle ja järjestää matrsks 3

0 d D d n d,1 1,1 n,1 d d 1, 0 n, d d d 1,3,3 n1, n d 0 n, n1 d d d 1, n, n n1, n 0. (4) Tämä maanteteellsä etäsyyksä kuvaava matrs D on symmetrnen, d j = d j, ja sen dagonaal muodostuu nollsta. (Manly 001.) Mtatulle satomäärlle x vodaan myös muodostaa matrs 0 C n,1 1,1 n,1 1, 0 n, 1,3,3 n1, n 0 n, n1 1, n, n n1, n 0, (5) jossa elementt j kuvaa otantayksköden ja j satomäären välsen erotuksen tsesarvoa j x x. (6) j Myös matrs C on symmetrnen. (Manly 001.) Matrsen C ja D avulla spataalsta korrelaatota vodaan tarkastella tutkmalla Pearsonn korrelaatokertomen arvoja parelle (d,1,,1 ), (d 3,1, 3,1 ), (d 3,, 3, ),..., (d n,n-1, n,n-1 ). Postvnen autokorrelaato vttaa tosaan lähellä oleven havantojen saavan samankaltasa arvoja. Korrelaatokerronta vastaava P-arvo vodaan arvoda randomsaatotestn avulla: parelle saadun korrelaaton suuruutta verrataan vastaavaan arvoon, joka on laskettu otantayksköhn satunnasest jakautunelle satoarvolle. Tavallnen korrelaatokertomen merktsevyyden T-test e ole mahdollnen, sllä havantopart evät ole rppumattoma havantoja d:n ja :n yhtesjakaumasta. (Manly 001.) Tarkastelussa vodaan myös käyttää etäsyyksen d j sjasta nden käänteslukuja 1/d j ja määrttää, onko nden ja arvojen j välllä merkttävää negatvsta korrelaatota. Tätä muunnosta käytetään sks, että jos spataalsta rppuvuutta esntyy, samankaltaset arvot ovat yleensä lähellä tosaan sen sjaan, että erlaset arvot olsvat tosstaan kaukana. (Manly 001.) 3.3 Varogramm 3.3.1 Varogrammn johto Kun X ja X j ovat satunnasmuuttujen er kohdssa mtattuja arvoja, nden erotuksen puolkkaan nelön odotusarvo on E 0,5( X X ) 0,5 ( X ) ( X )( X ) ( X ) 0,5Var ( X j ) Cov( X, X j ) 0,5Var ( X Jos varanss on molemmssa kohdssa sama, saadaan edelleen E 0,5( X X ) ( Cov( X, X )) j j 4. (8) ). j j (7)

Satunnasmuuttujen X ja X j välnen korrelaato on jollon saadaan Cov( X, X j ) X, X j, (9) E 0,5( X X ) (1 ( X, X )). (10) j Jos X :n ja X j :n välsen korrelaaton vodaan olettaa rppuvan anoastaan nden välsestä etäsyydestä h, yhtälö (10) vodaan krjottaa muotoon j ( h) (1 ( h)). (11) Yhtälöä (11) kutsutaan muuttujan X varogrammks. Stä kutsutaan joskus myös semvarogrammks, sllä yhtälö (10) on usen kerrottu kahdella. (Manly 001.) Heman erlanen määrtelmä (sem)varogrammlle löytyy esmerkks Hanngn (1990, 68) teoksesta. Edellsä kaavoja muodostettaessa on tehty kaks oletusta. Ensmmänen on, että suureen X odotusarvo on koko tarkastelualueessa on vako (frst order statonarty). Toseks oletetaan, että varanss on koko tarkastelualueessa vako ja että spataalsen korrelaaton arvo psteden välllä rppuu anoastaan nden välsestä etäsyydestä (seond order statonarty). Tonen oletus vodaan myös muotolla tosn vaatmalla, että X :n ja X j :n kovaranss on koko alueessa anoastaan psteden välsen etäsyyden funkto. (Hanng 1990, Manly 001.) Varogrammn (11) avulla vodaan tarkastella korrelaaton käyttäytymstä etäsyyden funktona. Varogrammn käyttäytymsellä on eräs tärkeä omnasuus. Kun etäsyys kasvaa, spataalnen korrelaato penenee ja kun etäsyys h on tarpeeks suur, korrelaato lähestyy nollaa ( h) 0. (1) h Tällön puolestaan varogramm lähestyy varanssn arvoa el ( h ) h. (13) Varogramm (h) on funkto, jonka avulla vodaan mtata mttaustulosten kasvava eroja mttausparen muuttuessa yhä kaukasemmks. Tätä omnasuutta vodaan myös tutka prtämällä mtatulle satodatan arvolle x ja x j laskettu varanssestmaatt D,5x x (14) j 0 j rven välsen etäsyyden funktona (kuva ). Vljelydatalle prretyn kuvan perusteella on kutenkn hukan vakea sanoa, kasvavatko D j :n arvot todella otantayksköden el rven välsen etäsyyden kasvaessa. (Hanng 1990, Manly 001.) 5

Kuva. Varogrammplv el varanssestmaatt (14) etäsyyden funktona. Kuvaa kutsutaan tavallsest varogrammplveks, sllä tse varogramm on datan läp kulkeva käyrä, joka kertoo D j :n keskarvon otantayksköden etäsyyden funktona. Varogramm vodaan määrttää joko emprsest ta teoreettsest. Kokeellnen varogramm määrtetään tasottamalla dataa trn esntuomseks. Teoreettnen varogramm puolestaan saadaan sovttamalla dataan sopva matemaattnen funkto tavallsest tettyjen standardfunktoden joukosta. (Manly 001.) 3.3. Teoreettnen varogramm Varogrammlle tyypllsä prtetä ovat vakoterm (sll), kynnysarvo (nugget effet) ja vakutusalue (range of nfluene). Kynnysarvon olemassaolo johtuu stä, että vakka mttauspsteet ja j olsvatkn hyvn lähellä tosaan, saadut arvot x ja x j eroavat tavallsest tosstaan, sllä suureen 0,5(x x j ) odotusarvo on suuremp kun nolla. Varogrammkäyrän saavuttama maksmarvo el vakoterm vastaa varanssn arvoa. Vakutusalue kuvaa puolestaan etäsyyttä, jolla kahden mttauspsteen saama arvoja vodaan ptää rppumattomna. Vakutusalue vodaan määrtellä esmerkks etäsyytenä, jossa varogrammkäyrän arvo on 95 % vakoarvon ja kynnysarvon välsestä erosta. Kuvassa 3 on estetty tyypllnen mallvarogramm. (Manly 001.) 6

7 Kuva 3. Gaussnen varogrammmall. Varogrammlle h on olemassa useta matemaattsa malleja. Eräs nästä on gaussnen mall (Manly 001) 3 1 ) ( ) ( a h e S h, (15) mssä on kynnysarvo, S vakoarvo ja a vakutusalue. Kun h = 0, eksponentaalterm saa arvon yks ja varogramm puolestaan arvon. Kun h on hyvn suur, eksponentaalterm lähestyy nollaa ja () = S. Kun h = a, eksponentaalterm saa arvon e -3 0,050 ja varogrammn yhtälöks tulee ) 0,95( ) ( S h. (16) Muta usen käytettyjä malleja ovat pallofunktomall,,, 0.5 1.5 ) ( ) ( 3 muuten a h a h a h S h (17) eksponenttfunktomall a h e S h 3 1 ) ( ) ( (18) ja potenssmall

w. (19) ( h) Ah Lsää varogrammmalleja löytyy esmerkks Hanngn (1990, 97) teoksesta. Kakssa nässä mallessa kuvaa kynnysarvoa. Pallo- ja eksponenttfunktomallessa on myös vakoarvo S, kun taas potenssmalln arvot kasvavat rajatta h:n kasvaessa. Pallofunktomall saavuttaa vakoarvon, kun h = a, eksponenttmalllle vakutusalue on (a) = + 0,95(S ) ja potenssmalllle vakutusalue on ääretön. (Manly 001.) 3.3.3 Emprnen varogramm Havantoaneston varogramm määrtetään yleensä emprsest tasottamalla anesto sopvalla tavalla, esmerkks jakamalla se etäsyysluokkn, ja laskemalla varogrammestmaatt kaavalla j, j! N( h) ( x x ) ˆ ( h) (0) D h jokaselle luokalle. Kaavassa (0) h on luokkakeskus, D h dskretontväl ja N(h) luokkaan kuuluven havantojen lukumäärä. Summassa käydään läp kakk luokkaan kuuluvat pstepart. Kaavassa (0) estetty estmaatt on kutenkn harhanen. Harhaton, ns. Cresse Hawkns-estmaatt saadaan kaavalla (Hanng 1990, 4) mssä N( h) 1 1 f ˆ ( h) x x j, (1) N( h), j! D h 1 0,494 0,045 f N( h) 0,457 ( ) ( ). () N h N h Dskretontväl D h vodaan valta kahdella er tavalla. Se, kump strategosta on sovelaamp, rppuu tehtävästä. Vahtoehdot ovat (Manly, 001): 1. D h :n ptuus vodaan asettaa knteäks, jollon havantojen määrä er dskretontvälellä vahtelee.. Havantojen määrä N(h) asetetaan knteäks, jollon D h :n ptuus muuttuu välettän. Kun paras vahtoehto dskretonnlle on valttu, sovtetaan saatuun estmaattn sopva teoreettnen varogrammmall. Mallvarogrammn parametrt a, ja S vodaan määrttää esmerkks valtsemalla yhden arvo ja estmomalla loput termt PNS-menetelmällä. PNS-menetelmässä tosn oletetaan, että varanss on sama jokasella dskretontvälllä, mkä e pdä pakkaansa, jos dskretontpsteden määrä välettän e ole vako. 4 8

4 Spataalnen autokorrelaato vehnän satodatassa Vljelydatan otoskeskarvoks ja -varanssks saadaan non x = 53,17 ja s = 5061,77. Satoarvojen Posson-jakautumsta testattaessa testsuureen T (kaava 3) arvo on sten n. 73,466. t-jakaumasta testsuuretta vastaavaks P-arvoks vapausastella 149 saadaan 0,000, joten satomäären jakautumnen pellon vakohn e ole Posson-jakauman mukanen. Tämän jälkeen tutkttn Mantel-testn avulla satomttausten erotusten tsesarvojen korrelaatota otantayksköden etäsyyksen kanssa (kuva 4). Kuvassa on ehkä havattavssa levää postvsta korrelaatota. Matrselle D ja C (kaavat 4 ja 5) lasketuks Pearsonn korrelaatokertomeks saadaan 0,03. Kun satomäärät jaetaan rvehn täysn satunnasest, suurmman korrelaatokertomen arvoks saadaan 1000 smulaaton jälkeen 0,009. Tämän perusteella spataalnen korrelaato on suuremp kun nolla rsktasolla 0,000. Rsktaso saadaan määrtettyä stä, että sekottamalla satomatrs 1000 kertaa e saada yhtään yl arvon 0,03 olevaa korrelaatota matrsen C ja D vällle (kuva 5). Testssä jouduttn tyytymään 1000 smulaatoon, jotte Matlabn laskenta-aka kasvas kohtuuttomaks. Käyttämän Matlab-kood löytyy ltteestä. Kuva 4. Satomttausten erotuksen tsesarvo etäsyyden funktona. 9

Kuva 5. Hstogrammt matrselle C, D ja D saadulle korrelaatokertomlle. D -matrs ssältää etäsyyksen kääntesluvut 1/d j. Spataalsen korrelaaton olemassaolosta todstaa myös etäsyyksen kääntesluvulle 1/d j tehty Mantel-test (kuva 6). Kuvan perusteella korrelaaton vos arvata olevan leväst negatvnen. C:n ja D :n (etäsyyksen kääntesluvut ssältävä matrs) korrelaatoks saadaan 0,079. Kun randomsaatotest suortetaan 1000 kertaa, penmmäks korrelaatokertomeks saadaan 0,065. Korrelaatota 0,079 vastaava P-arvo on sten 0,000 ja korrelaato on tlastollsest merktseväst negatvnen. Korrelaatokerronten jakauma näkyy kuvassa 5. 10

Kuva 6. Satomttausten erotuksen tsesarvo etäsyyden kääntesluvun funktona. Vos olettaa, ette varogrammn estmont käyttäen knteää dskretontvälä (Matlabkood ltteessä ) ole vljelydatalle tomva ratkasu, sllä otantayksköden välsten etäsyyksen jakauma on hyvn epätasanen (kuva 7). Osalle dskretontvälestä tulee sten hyvn suur määrä pstetä ja toslle puolestaan hyvn vähän. Kuva 8 estmodusta varogrammesta, kun dskretontvälejä on 10, 11, 14 ta 16 kappaletta, osottaakn, ette lähestymstapa kakssa tapauksssa tom. Varogrammkuvaajan onnstumnen rppuu kutenkn suurest valtusta dskretontvälen lukumäärästä ts. dskretontväln ptuudesta; esmerkks kun välejä on 10, varogrammkuvaajan arvojen varanss on hyvn suurta, kun taas 11 välllä emprsen varogrammn pstesn vos jo sovttaa teoreettsen varogrammmalln. Jos dskretontvälejä on yl 16 kappaletta, osalle nstä e osu enää yhtään dskretontpstettä. Varogrammen estmont on suortettu Cresse Hawknsestmaatn (1) avulla. 11

Kuva 7. Hstogramm otantayksköden välslle etäsyykslle. Kuva 8. Estmodut varogrammt, kun dskretontvälejä ol 10, 11, 14 ta 16 kappaletta. 1

Koska 11 dskretontvälllä (D h = 1,8465 m) prretty emprnen varogramm vakutt arvojen varanssn kannalta parhammalta, se valttn teoreettsen varogrammn sovtuksen perustaks. Varogrammn kuvan perusteella eksponettfunktomall ta gaussnen mall vakuttas sopvmmalta. PNS-sovtuksessa gaussnen mall (kuva 9) osottautu eksponenttfunktomalla paremmaks. Kynnysarvon oletettn sovtuksessa olevan nolla. Tämä e mahdollsest pdä avan tarkast pakkaansa, mutta vakutusalueen ta vakotermn (varanssn) estmont ol ollut velä vakeampaa. Vakutusalueeks saatn PNS-menetelmällä a = 4,0959 ja varanssks S = 5639,145; varogrammn yhtälö tulee sten muotoon 3h 4,0959 ( h) 5639,145 1 e. (3) Kuva 9. Emprnen varogramm (D h = 1,8465 m) ja shen sovtettu gaussnen varogrammkäyrä ( = 0, S 5640 ja a 4,03). Teoreettsen varogrammn (h) avulla spataalnen korrelaato (h) saadaan määrtettyä kaavalla ( h) ( h) 1. (4) Kuvasta 10 vodaankn todeta spataalsen korrelaaton hekkenevän melko nopeast ja katoavan lähes kokonaan, kun vljeltyjen alueden välnen etäsyys on suuremp kun vs meträ. Koska vljeltyjen rven välnen etäsyys ol tä läns-suunnassa n. 4,57 m, e rnnakkasten rven välnen korrelaato sten ole kovn vomakasta. Sen sjaan pohjos etelä-suunnassa vakojen välnen etäsyys ol van n. 30,5 m, joten spataalsta korrelaatota esntyy jopa 16 rvn matkalla. 13

Kuva 10. Spataalnen korrelaato etäsyyden funktona. Varogrammn estmonnn vos olettaa onnstuvan paremmn, kun dskretontpsteden sjasta vakona pdetäänkn dskretontvällle osuven psteden lukumäärää (käyttämän Matlab-kood ltteessä ). Tämä lähestymstapa osottautu kutenkn ongelmallseks, kuten kuvasta 11 vodaan todeta. Emprnen varogramm e muodostanut kasvavaa funktota mllään kokellulla dskretontpsteden määrällä, vaan varogrammn arvojen varanss ol hyvn suurta. Teoreettsen varogrammkäyrän sovttamnen saatuhn pstesn e vakuttanutkaan melekkäältä. 14

Kuva 11. Estmodut varogrammt dskretontpsteden lukumäärllä N(h) = 1500, 1875, 50 ja 500. 15

5 Yhteenveto ja johtopäätökset Vehnän satodatassa havattn Mantel-testn perusteella selvä postvnen maanteteellnen autokorrelaato el tosaan lähellä olevat mttaukset myös tuottvat samankaltasa havantoja. Tähän tulokseen päädyttn tarkastelemalla korrelaatotestessä sekä havantoyksköden välsä etäsyyksä että nden käänteslukuja. Satomttaukset evät kutenkaan olleet jakautuneet havantoyksköhn Posson-jakaumaa noudattaen. Emprsen varogrammn muodostamnen osottautu sen sjaan hukan ongelmallseks. Vljelykokeden tuloksn koetettn sovttaa sekä varogramma, jonka dskretontväln ptuus ol vako, että käyrää, jossa dskretontvällle osuven psteden määrä ol knteä. Parhaaseen tulokseen päädyttn hukan yllättäen käyttämällä varogramma, jonka dskretontväln ptuus ol vako (D h 1,85 m) ja tähän dataan sovtettn myös gaussnen varogrammmall. Kun kynnysarvo oletettn nollaks, varogrammn vakutusalueeks saatn sovtuksessa a 4,03 m ja varanssks S 5640. Suurn osa spataalsesta autokorrelaatosta hävää sten jo non neljän metrn matkalla. Emprsen varogrammn määrttämsen onnstumnen dskretontvälltään vakoptuselle varogrammlle rppu huomattavast valtun dskretontväln ptuudesta. Ongelmat vo osttan selttää sllä, että välelle osuneden dskretontpsteden määrä vahtel huomattavast ja vält, jolla havantoja ol van vähän, väärstvät mahdollsest tlannetta. On kutenkn vakeampaa selttää ongelma varogrammssa, jossa dskretontpsteden määrä jokasella välllä ol sama; ehkäpä permmäsenä syynä vakeuksn olkn käytetyn datan rakenne. Ongelman ols vonut yrttää ratkasta esm. ottamalla käyttöön suuremman osa alkuperäsestä datasta ta valtsemalla havannot er kohdasta alkuperästä tutkmusaluetta. Eräs syy vakeuksn olvat ehkä myös tutkmusalueden er dmensoden suuret kokoerot (ks. esm. Hanng 1990, 47 49). Vljeltyjen vakojen välset etäsyyden olvat pohjos etelä-suunnassa hyvn penä, kun taas vakojen muodostamen sarakkeden välset etäsyydet olvat yl kymmenen kertaa suuremmat. Tässä työssä saatuja tuloksa vos käyttää hyödyks esmerkks suunnteltaessa pellon lannotusta ta kalktusta. Tulosten avulla vodaan myös tutka er maalajen ta vljan kasvuun kohdstuven uhken, kuten varjosuuden, epäonnstuneen salaojtuksen ta puutteellsen lannotuksen, vakutusta vehnäsatoon. Kaken kakkaan spataalnen tlastoanalyys onkn käytännön vakeukssta huolmatta hyödyllnen työkalu tutkttaessa maanteteellseen pakkaan sdotun datan omnasuuksa. 16

Lähdeluettelo Andrews, D. F. & Herzberg, A. M. (1985) Data A Colleton of Problems from Many Felds for the Student and Reseah Worker. Sprnger-Verlag. Hanng, R. (1990) Spatal Data Analyss n the Soal and Envronmental Senes. Cambrdge Unversty Press. Manly, B. J. (001) Statsts for Envronmental Sene and Management. Chapman and Hall/CRC. Messner, S., Anseln L., Baller R., Hawkns D., Deane G. & Tolnay S. (1999) The Spatal Patternng of County Homde Rates: An Applaton of Exploratory Spatal Data Analyss. Journal of Quanttatve Crmnology 15: 43 450. 17

Lte 1. Satodata Rvettän mtatut satomäärät. Rv/Sarake 1 3 4 5 1 515 557 665 560 61 585 550 574 511 618 3 640 665 705 644 705 4 50 553 616 573 570 5 55 495 565 599 61 6 545 538 587 600 664 7 505 530 536 611 578 8 450 40 461 531 559 9 530 498 538 453 600 10 535 534 593 616 638 11 550 613 607 74 657 1 515 369 493 635 567 13 460 455 503 519 555 14 510 507 561 581 537 15 45 476 648 53 55 16 405 4 516 458 559 17 465 419 591 545 537 18 470 47 545 56 58 19 460 513 599 595 675 0 40 460 54 474 563 1 430 455 485 461 533 450 516 570 553 63 3 435 466 454 458 503 4 40 393 48 46 446 5 450 437 541 55 514 6 445 508 508 517 533 7 550 494 591 594 597 8 470 465 51 454 537 9 455 48 484 505 578 30 465 497 596 563 634 18

Lte. Matlab-koodt Mantel-test funton [korrelaato,maksm,korrelaatot,korrelaato,mnm,... korrelaatot]=mantel funton [korrelaato,maksm,korrelaatot,korrelaato,manm, korrelaatot]=mantel Emla Suomalanen 4/004 Matlab-funkto, joka suorttaa Manteln autokorrelaatotestn satodatalle. Output: korrelaato = satodatalle laskettu korrelaato maksm = Mantel-testn suurn korrelaato korrelaatot = kakk Mantel-testn korrelaatot korrelaato = satodatalle ja etäsyyden kääntesluvulle laskettu korrelaato mnm = Mantel-testn suurn korrelaato (etäsyyden kääntesluvulle) korrelaatot = kakk Mantel-testn korrelaatot (etäsyyden kääntesluvulle) Tarvttavat tedostot: satodata.txt = satodata 500 x 1 vektorssa sato=load('satodata.txt'); tuuma=1*.54/100; rven välnen etäsyys metressä jalka=15*30.48/100; sarakkeden välnen etäsyys metressä n=1; C- ja D-matrsen muodostus for =1:150 for j=1:150 r1=1; m=1; whle /5/m > 1 r1=r1+1; m=m+1; r=1; m=1; whle j/5/m > 1 r=r+1; m=m+1; 1=rem(,5); =rem(j,5); ero1=abs(r1-r); ero=abs(1-); f (rem(j,5)==0) (rem(,5)==0) ero=5-rem(j,5)-rem(,5); f (rem(j,5)==0) & (rem(,5)==0) ero=0; D(,j)=sqrt((tuuma*ero1)^+(jalka*ero)^); C(,j)=abs(sato()-sato(j)); f ==j D(,j)=0; else D(,j)=1/D(,j); 19

C(n)=C(,j); satodatan erotusvektor n=n+1; k=orroef(c,d); korrelaato=k(1,); k=orroef(c,d); korrelaato=k(1,); satunnastest: for m=1:1000 satuvektor=randperm(150*150); n=1; for o=1:150 for p=1:150 rand_c(o,p)=c(satuvektor(n)); n=n+1; k1=orroef(rand_c,d); k=orroef(rand_c,d); rand_korrelaato(m)=k1(1,); rand_korrelaato(m)=k(1,); korrelaatot=sort(rand_korrelaato); korrelaatot=sort(rand_korrelaato); maksm=max(rand_korrelaato); mnm=mn(rand_korrelaato); 0

Varogramm (dskretontväln ptuus vako) funton [vg,x,n,d]=varogramm(max_h) funton [vg,x,n,d]=varogramm(max_h) Emla Suomalanen 4/004 Matlab-funkto, joka laskee varogrammn, kun maksmaalnen etäsyys on jaettu dskretontvälehn, jota on max_h kpl. Input: max_h = dskretontväln ptuus Output: vg = varogrammvektor x = etäsyysvektor N = dskretontpsteden määrä per väl d = dskretontväln ptuus (vako) Tarvttavat tedostot: satodata.txt = satodata 500 x 1 vektorssa etasyydet.txt = etäsyysdata 500 x 1 vektorssa D.txt = etäsyysdata 150 x 150 matrsssa sato=load('satodata.txt'); etasyydet=load('etasyydet.txt'); et=sort(etasyydet); D=load('D.txt'); for h=1:max_h N(h)=0; d=0.31/max_h; for =1:500 f et()<d*h & et()>=d*(h-1) N(h)=N(h)+1; =+1; f(h)=1/(0.457+0.494/n(h)+0.045/n(h)^); summa=0; for =1:150 for j=1:150 f D(,j)<=d*h & D(,j)>d*(h-1) summa=summa+sqrt(abs(sato()-sato(j))); vg(h)=0.5*f(h)*(summa/n(h))^4; x=d:d:(0.31); 1

Varogramm (dskretontpsteden määrä vako) funton [vg,d]=varogramm(n) funton [vg,d]=varogramm(n) Emla Suomalanen 4/004 Matlab-funkto, joka laskee varogrammn, kun jokasen väln dskretontpsteden määrä on N. Input: N = dskretontpsteden määrä (vako) Output: vg = varogrammvektor d = etäsyysvektor Tarvttavat tedostot: satodata.txt = satodata 500 x 1 vektorssa etasyydet.txt = etäsyysdata 500 x 1 vektorssa D.txt = etäsyysdata 150 x 150 matrsssa sato=load('satodata.txt'); etasyydet=load('etasyydet.txt'); et=sort(etasyydet); D=load('D.txt'); max_h=150*150/n for h=1:max_h d(h)=et(n*h); f(h)=1/(0.457+0.494/n+0.045/n^); summa=0; for =1:150 for j=1:150 f h==1 & D(,j)<=d(h) summa=summa+sqrt(abs(sato()-sato(j))); elsef D(,j)<=d(h) & D(,j)>d(h-1) summa=summa+sqrt(abs(sato()-sato(j))); vg(h)=0.5*f(h)*(summa/n)^4; fgure; ttle(['dskretontpsteden määrä: ' ntstr(n)]); hold on; grd; plot(d,vg,'ob');