GIS-jatkokurssi. Viikko 4: Spatiaalinen statistiikka. Harri Antikainen
|
|
- Paavo Niemi
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 GIS-jatkokurssi Viikko 4: Spatiaalinen statistiikka Harri Antikainen
2 Spatiaalinen statistiikka Spatiaalinen tilastotiede (spatial statistics) Maantieteessä ollaan usein kiinnostuttu siitä, onko jossain ilmiössä spatiaalista (alueellista) vaihtelua Spatiaalisella statistiikalla voidaan esimerkiksi pyrkiä: tunnistamaan jonkin ilmiön alueellisia tihentymiä tai ilmiön puuttumista jostakin ennustamaan ilmiön alueellista jakautumista (geostatistinen interpolointi) 2
3 Spatiaalinen statistiikka Tarkastellaan pelkästään kohteiden sijaintia toisiinsa nähden Pistejoukkojen tarkastelu Average Nearest Neighbor Multi-Distance Spatial Cluster Analysis (Ripleys K Function) Tarkastellaan kohteiden ominaisuustietoa sekä sitä miten tämä muuttuu etäisyyden funktiona Spatiaalinen autokorrelaatio Spatial Autocorrelation (Morans I) Incremental Spatial Autocorrelation Klusteroitumisen tutkiminen Hot Spot Analysis (Getis-Ord Gi*) Cluster and Outlier Analysis (Anselin Local Morans I) 3
4 Pistejoukkojen tarkastelu visuaalisesti Pistejoukon jakautumisen visuaalinen tarkastelu auttaa havaitsemaan mahdollisia tihentymiä (tiheyspinnat, ks. tarkemmin 2. viikon luento!) Pelkkä visuaalinen tarkastelu voi kuitenkin olla epävarmaa 4
5 Pistejoukkojen tarkastelu tilastollisesti Pyritään selvittämään, sijaitsevatko pisteet satunnaisesti (random), klustereina (clustered) vai toisistaan erillään (dispersed) dispersed - inhibition - repulsion - regular pattern complete spatial randomness (CSR) clustered - aggregated - attraction 5
6 Average Nearest Neighbor (ANN) Lasketaan pistejoukon jokaiselle pisteelle etäisyys lähimpään naapuriin Lasketaan etäisyyksistä keskiarvo Verrataan tätä odotettuun keskiarvoon, jos pisteet olisivat jakautuneet satunnaisesti Havaittu keskimääräinen etäisyys kohteen ja sen lähimmän naapurin välillä Odotettu keskimääräinen etäisyys kohteen ja sen lähimmän naapurin välillä, olettaen että pisteet jakautuneet alueelle satunnaisesti 6 ANN = 1 satunnainen jakauma ANN < 1 klusteroitumista todettavissa ANN > 1 jakauma on hajautunut
7 Average Nearest Neighbor Esimerkiksi viereiset 3 pistettä kehyksen alueella ( m): D O = ( ) / 3 = 150 D E = 0.5 / 3/ = ANN = 150 / = Päätelmä: indeksin arvon perusteella pisteet osoittavat klusteroitumista tosin pisteitä on niin vähän ettei tilastollisia johtopäätöksiä pysty tekemään m
8 Average Nearest Neighbor Sen sijaan jos samojen pisteiden sijaintia tutkitaan suppeammalla, m kokoisella alueella: D O = ( ) / 3 = 150 D E = 0.5 / 3/90000 = ANN = 150 / = Päätelmä: nyt pistejoukko näyttäytyykin hajautuneena tosin tilastolliset päätelmät eivät edelleenkään ole mahdollisia 300 m 8
9 Pistejoukkojen tarkastelu Sama pistejoukko voi siis näyttäytyä klusteroituneena, satunnaisena tai hajautuneena riippuen siitä, minkä kokoista aluetta vasten sitä tarkastellaan! - Alueen muodolla ei tosin ole sinällään mitään väliä. Satunnainen / hajautunut Klusteroitunut 9
10 Average Nearest Neighbor Spatial Statistics Tools Analyzing Patterns Average Nearest Neighbor Tarkasteltava pistejoukko Etäisyyden tarkastelutapa Euclidean: suora viiva Manhattan: x- ja y-akseleita pitkin Tuotetaan raportti Tarkasteltavan alueen laajuus Oletuksena pisteet sisälleen sulkeva suorakaide 10
11 Average Nearest Neighbor Tulokset saa parhaiten näkyviin tuplaklikkaamalla Report File kohtaa Results-näkymässä Jos Results-näkymää ei näy, valitse valikoista Geoprocessing Results Raportti avautuu nettiselaimessa 11
12 Tulosraportti Esittää z-scoren arvon sijainnin standardinormaalijakaumalla Tässä tapauksessa tulos sijoittuu jakauman vasempaan häntään viitaten merkittävään klusteroitumiseen Average Nearest Neighbor analyysin perusluvut nähtävissä kuvion alla Havaittu keskietäisyys Odotettu keskietäisyys Laskettu ANN-indeksiluku 12
13 Tulosraportin tulkinnasta tarkemmin... Jos pistejoukolle arvottaisiin sattumanvaraisesti ääretön määrä erilaisia sijainteja ja laskettaisiin niille ANN-indeksi, niin indeksin pitäisi periaatteessa noudattaa normaalijakaumaa Tutkittavalle pistejoukolle laskettua ANNindeksiä verrataan tähän jakaumaan Näin selviää, kuinka todennäköistä on että pisteiden havaittu jakautuminen olisi pelkän sattuman tulosta 1 13 Esim. tässä olisi vain muutaman prosentin todennäköisyys sille että havaittu jakauma olisi syntynyt pelkän sattuman tuloksena
14 Multi-Distance Spatial Cluster Analysis (Ripleys K Function) Voidaan tarkastella pisteiden klusteroitumisen skaalaa ANN:sta poiketen ei katsota vain etäisyyttä lähimpään pisteeseen, vaan muodostetaan sarja vyöhykkeitä joilta lasketaan muiden pisteiden määrä Verrataan eri etäisyysvyöhykkeillä havaittua pistetiheyttä CRS:n mukaiseen odotettuun tiheyteen 14
15 Multi-Distance Spatial Cluster Analysis (Ripleys K Function) Spatial Statistics Tools Analyzing Patterns Multi-Distance Spatial... Etäisyysvyöhykkeiden määrä Näytä tulos graafisesti Ensimmäisen etäisyysvyöhykkeen mitta Loppujen etäisyysvyöhykkeiden mitta Reunakorjausmenetelmä: Method to use to correct for underestimates in the number of neighbors for features near the edges of the study area. 15
16 Multi-Distance Spatial Cluster Analysis (Ripleys K Function) Plotataan havaittu (observed) ja odotettu (expected) K-indeksiluku etäisyyden mukaan Esim. kuva oikealla: n metrin etäisyyteen asti klusteroitumista, sen jälkeen hajautumista 16
17 Spatiaalinen autokorrelaatio Toblerin laki ( Maantieteen ensimmäinen laki ): "everything is related to everything else, but near things are more related than distant things (Waldo Tobler 1970) auto-korrelaatio = itsensä kanssa korreloiminen Spatiaalinen autokorrelaatio siis kuvaa sitä, kuinka jokin mitattavissa oleva ilmiö korreloi itsensä kanssa tilassa, etäisyyden funktiona 17
18 Voimakas autokorrelaatio Autokorrelaation voimakkuus Spatiaalinen autokorrelaatio Esimerkkinä alue, jolla on sademittausasemia ja niiltä mittaustuloksia Tyypillisesti toisiaan lähellä olevilla asemilla mittaustulokset samansuuntaisia 29 mm 33 mm 23 mm 30 mm Korrelogrammi 14 mm 10 mm 8 mm Heikko autokorrelaatio Etäisyys pisteiden välillä 18 Lyhyt etäisyys Pitkä etäisyys
19 Spatiaalinen autokorrelaatio Positiivinen SA on silloin, kun keskenään samankaltaiset mittausarvot esiintyvät lähellä toisiaan Negatiivinen SA on silloin, kun samankaltaiset arvot ovat kaukana toisistaan (tästä on tosin vaikea keksiä reaalimaailman esimerkkiä) Nolla SA on silloin kun mittausarvot eivät mitenkään riipu sijainnista 19 Positiivinen SA Ei spatiaalista autokorrelaatiota Negatiivinen SA
20 Spatiaalinen autokorrelaatio Voi olla ongelmallinen tai kertoa ongelmasta Klassiset tilastotieteen menetelmät edellyttävät havaintoyksiköiltä keskinäistä riippumattomuutta Korkea SA voi indikoida tutkittavan ilmiön kannalta virheellisesti valittuja alueyksiköitä Toisaalta toimii perustana mallinnuksille Spatiaalinen interpolointi Alueiden pilkkominen tuo lisää havaintoyksiköitä ja siten näennäisesti lisää tilastollista selitysvoimaa, mutta tosiallisesti yksi ja sama ilmiö vain hajotetaan keskenään samankaltaisiin palasiin. Tilanne ilmenee voimakkaana SA:na. Ilman spatiaalista autokorrelaatiota ei olisi maantiedettä! 20
21 Spatiaalisen autokorrelaation testaaminen Nollahypoteesi: Ilmiö on jakautunut satunnaisesti Havaintoarvo jossakin pisteessä ei riipu havaintoarvoista läheisissä pisteissä Havaittu arvojen jakautuminen on yhtä todennäköinen kuin mikä tahansa muu jakautuminen Spatiaalista autokorrelaatiota testataan jotta tiedetään ovatko lähellä toisiaan olevat kohteet keskenään samanlaisia: tämän vuoksi on ensin päätettävä, mitä lähellä tarkoittaa Määritetään joku läheisyyskriteeri (esim. tietty etäisyyssäde tai toisiaan koskettavat alueet) sekä mahdollinen etäisyyspainotus 21
22 painotus painotus painotus Tapoja määrittää naapurusto/etäisyys Fixed distance band Kiinteä etäisyys jonka sisällä kaikki kohteet saavat saman painotuksen etäisyys Inverse distance Kohteen painotus laskee etäisyyden kasvaessa Zone of indifference Yhdistelmä edellisistä. Määritetään kriittinen etäisyys (sisempi ympyrä) jonka ulkopuolella painotus vähenee etäisyys 22 etäisyys
23 Menetelmiä SA:n testaamiseen (ArcGIS) Morans I Moranin I-indeksi on perinteinen menetelmä, antaa arvon välillä -1 ja 1 Incremental Spatial Autocorrelation Sama kuin yllä, mutta testi tehdään sarjalle kasvavia (incremental) etäisyyksiä Tavoitteena löytää SA:n vaikutusetäisyys High/Low Clustering (Getis-Ord General G) Testataan, ovatko pienet tai suuret havaintoarvot keskittyneet lähelle toisiaan aineistossa 23
24 Esimerkki Kunnittainen sairastavuusindeksi Visuaalisen tarkastelun perusteella voidaan odottaa, että tarkasteltavassa ilmiössä on spatiaalista autokorreloitumista: korkean indeksin kunnat ovat usein naapureita keskenään ja samoin myös matalan indeksin kunnat Testataan seuraavaksi sairastavuusindeksiä eri menetelmillä 24
25 Morans I Spatial Statistics Tools Analyzing Patterns Spatial Autocorrelation (Morans I) Aineisto Tarkasteltava muuttuja Tuotetaan raportti Etäisyyspainotuksen tapa Standardointi, suositellaan tekemään polygoniaineistoille Etäisyys, jolla SA:ta testataan. HUOM: kuten aina, etäisyys on annettava koordinaattijärjestelmän mukaisissa yksiköissä! Eli tässä tarkoittaa metriä, vastaten siis 100 km. 25
26 Morans I - tulos Tulos saadaan siis auki Results-näkymän kautta Indeksin arvo 0, eli vahvasti positiivinen SA Z-score sijoittuneena jakauman oikeaan häntään joten SA on tilastollisesti merkitsevää 26
27 Morans I - tulos HUOM: Esimerkissä saatu tulos on siis vastaus kysymykseen: Onko sairastavuusindeksi spatiaalisesti autokorreloitunut 100 km etäisyydellä kun kohteita (kuntia) painotetaan etäisyyden suhteen käänteisesti? Tässä tapauksessa 100 km etäisyys valittu siksi että jokaisella kunnalla olisi kyseisellä etäisyydellä vähintään yksi naapuri (matka kunnan keskipisteestä toiseen) Analyysi voidaan lisäksi tehdä sarjana, jossa testataan SA:ta erilaisilla etäisyyksillä Incremental Spatial Autocorrelation 27
28 Incremental Spatial Autocorrelation Spatial Statistics Tools Analyzing Patterns Incremental Spatial Autocorrelation Aineisto Tarkasteltava muuttuja Montako vyöhykettä? Sisimmän vyöhykkeen säde Inkrementtien mitta HUOM! Tässä EI OLE valittavissa etäisyyspainotuksen (Conceptualization of Spatial Relationships) tapaa, vaan käytössä on aina FIXED_DISTANCE_BAND 28 Aiemmasta poiketen raportti tulee tässä pdf:nä, jonka nimen ja paikan voi määrittää itse
29 Incremental Spatial Autocorrelation - tulos Testataan Moranin indeksin tilastollinen merkitsevyys eri etäisyyksillä Huippukohdan tulisi ArcGISdokumentaation mukaan osoittaa SA:n vaikutusetäisyyttä 29
30 Incremental Spatial Autocorrelation omaa tulkintaa Jos plotataan Moranin I-indeksin arvot sellaisenaan, käyrä laskee tasaisesti etäisyyden mukaan Laajempi säde kattaa aina enemmän alueita ja siten testin tulos on herkemmin merkittävä Onko tilastolliseen merkitsevyyteen perustuva arviointi järkevää? Vai olisiko parempi katsoa pelkkiä indeksin arvoja sellaisenaan? 30
31 Moranin I:n rajoitteet Moranin I on globaali mittari, eli kertoo vain sen, kuinka voimakasta SA on aineistossa keskimäärin SA:n voimakkuus ja muoto voi kuitenkin vaihdella tarkasteltavan alueen eri osissa Ylipäätään Moranin I ei kerro, missä päin aluetta korkeat tai matalat arvot ovat keskittyneet Klusterien etsimiseen on ArcGIS:ssä omat menetelmänsä: Hot Spot Analysis (Getis-Ord Gi*) Cluster and Outlier Analysis (Anselin Local Morans I) 31
32 Hot Spot Analysis (Getis-Ord Gi*) Spatial Statistics Tools Mapping Clusters Hot Spot Analysis (Getis-Ord Gi*) Etsitään korkeiden ( hot ) ja matalien ( cold ) havaintoarvojen keskittymiä Valinnat pääosin vastaavia kuin edellä Self Potential Field: kohteen etäisyys itseensä. Jos tätä ei ole määritetty, käytetään jokaisella kohteella oletuksena arvoa 1 32
33 Hot Spot - tulos Korkeiden arvot tilastollisesti merkitsevät spotit punaisella Matalien arvojen vastaavat sinisellä Tässäkin tulos riippuu vahvasti valitusta tarkasteluetäisyydestä sekä etäisyys-painotuksesta! 33
34 Hot Spot kartta vs. ilmiö sellaisenaan 34
35 Optimized Hot Spot Analysis Automatisoitu hot spot analyysi, jossa ArcGIS määrittää parametrit objektiivisesti aineiston perusteella Esimerkiksi tarkasteluetäisyyden määrittämiseen Optimized Hot Spot Analysis käyttää Incremental Spatial Autocorrelation proseduuria Muiden määrittelyjen osalta ks. ArcGIS:n dokumentaatio: How Optimized Hot Spot Analysis Works 35
36 Cluster and Outlier Analysis Spatial Statistics Tools Mapping Clusters Cluster and Outlier Analysis (Anselin Local Morans I) Periaatteessa vastaava kuin hotspotanalyysi, mutta osoittaa myös outlierit Analyysin tulos tulee uudelle tasolle, ei siis tule raporttia Permutaatioiden määrä. Permutaatiossa dataa sekoitetaan, eli tässä tuotetaan erilaisia satunnaisia versioita datasta. Tämän perusteella voidaan mitata, kuinka todennäköisesti datassa esiintyvä klusteroituminen voi olla puhtaasti satunnaista. Mitä enemän permutaatioita, sitä luotettavampi tämä arvio on, mutta samalla laskenta-aika kasvaa. 36
37 Cluster and Outlier Analysis tulos High-High Cluster: Korkeiden havaintoarvojen keskittymä Low-Low Cluster: Pienien havaintoarvojen keskittymä High-Low Outlier: Yksittäinen korkea arvo matalien arvojen keskittymässä Low-High Outlier: Yksittäinen matala arvo korkeiden arvojen keskitytmässä Not Significant: Ei klusteroitumista HUOM: Saatu tulos riippuu voimakkaasti siitä, mikä tarkasteluetäisyys on valittu (tässä 100 km). Etäisyyden vaikutusta tuloksiin voidaan kokeilla harjoituksissa. 37
38 Geostatistiikka Spatiaalinen ennustamismenetelmä, jossa hyödynnetään tietoa SA:sta Spatiaalinen ennustaminen spatiaalinen interpolointi Spatiaalinen interpolointi: yhtenäisen karttapinnan muodostaminen havaintopisteiden perusteella, eli estimoidaan arvo niihin kohtiin mistä mitattua arvoa ei ole Käsittelee spatiaalisesti jatkuvia prosesseja, eli muuttujia, joiden arvo on ainakin periaatteessa määritettävissä missä tahansa tutkimusalueen pisteessä esim. lämpötila, lumen syvyys, topografia 38
39 painotukset Geostatistinen vs. tavallinen interpolointi Tyypillisimmin interpolointi toteutetaan inverse distance weighting (IDW) menetelmällä, missä arvo estimoidaan lähimpien tunnettujen mittauspisteiden perusteella painottaen niitä etäisyyden mukaan Etäisyyspainotus valitaan yleensä ilman sen kummempia perusteluja 39
40 Geostatistinen vs. tavallinen interpolointi Geostatistisen interpoloinnin tavoitteena on määrittää painotusfunktio empiirisesti, jotta interpolointi vastaisi paremmin mallinnettavaa ilmiötä Painotusfunktion muodon määrittäminen perustuu SA:n analysoimiseen Geostatistiseen mallinnukseen liittyy tosin muutakin, siitä kohta lisää... Perus -IDW:ssä painotusfunktio voisi olla esim. tällainen...kun taas empiirisesti (geostatistisesti) mallinnettuna painotus voi olla tällainen 40
41 Geostatistiikan historiaa Taustat geologiassa ja kaivosteollisuudessa Perusajatuksen takana Daniel G. Krige, idean jatkokehittäjiä monia muitakin, erityisesti Georges Matheron Geostatistiikkaan perustuva interpolointi = kriging Alueellistettujen muuttujien teoria (Regionalized Variable Theory) Kiinnitetään huomiota muuttujan kolmeen ominaispiirteeseen: Muuttujasta yritetään selvittää mahdollisimman paljon 1) rakenteellisen piirteen ominaisuuksia Sitten yritetään löytää muuttujan arvojen riippuvuuksia 2) autokorrelaation muodossa ja erottaa siitä puhdas satunnainen elementti eli ns. 3) kohina 41
42 Muuttujan arvo, esim. maaston korkeus Muuttujan peruskomponenttien tunnistaminen Rakenteellinen komponentti (trendi) Spatiaalisesti autokorreloitunut komponentti Sijainti Autokorreloimattoman satunnaisvaihtelun komponentti (kohina) 42
43 Rakenteellinen komponentti (trendi) Mallinnetaan yleensä polynomifunktion avulla suositeltavaa on käyttää mahdollisimman alhaisen asteen polynomia Rakenteellisen komponentin mallinnus ei ole itsetarkoitus, vaan se mallinnetaan vain mikäli sellainen on datassa nähtävissä (aina ei suinkaan ole) Mallinnuksen tarkoituksena on eristää muuttujasta pois rakenteellinen komponentti, jotta spatiaalinen autokorrelaatio voidaan mallintaa ilman rakenteellisen komponentin häiritsevää vaikutusta 43
44 Spatiaalinen autokorrelaatio / semivariogrammi Spatiaalisen autokorrelaation funktio pyritään löytämään semivariogrammi-tekniikalla Lähtökohtana havaintoaineiston kaikkien pisteiden yhdistäminen pistepareiksi: Muodostuu n(n-1) / 2 kpl pistepareja (n = havaintopisteiden lukumäärä) Jokaisen pisteparin osalta lasketaan: Pisteiden välinen maantieteellinen etäisyys Ero tarkasteltavan muuttujan suhteen 44
45 Spatiaalinen autokorrelaatio / semivariogrammi Semivarianssi (tai vaihtoehtoisesti kovarianssi) esitetään koordinaatistossa etäisyyden suhteen hajontakuviona Hajontakuvioon sovitetaan siihen parhaiten sopiva matemaattinen funktio, jonka siten katsotaan olevan SA:ta kuvaava funktio Semivarianssi (vaihtelun voimakkuus) Sill Range = etäisyys jolla kuvaaja tasoittuu = etäisyys jolla SA:n katsotaan loppuvan vaikuttamasta Nugget Etäisyysluokka (Lag)
46 Spatiaalinen autokorrelaatio / semivariogrammi Erilaisia teoreettisia funktioita: 46
47 Spatiaalinen autokorrelaatio / semivariogrammi Esimerkkejä erilaisista semivariogrammeista: nugget Ei spatiaalista autokorrelaatiota (pelkkä nugget-efekti) Spatiaalista autokorrelaatiota sekä satunnaisvaihtelua Vahva spatiaalinen autokorrelaatio ilman satunnaisvaihtelua 47
48 Kriging Krigingin perusmallina on Z(s) = µ(s) + ε(s), missä Z on tarkasteltava muuttuja, koostuen trendistä µ ja spatiaalisesti autokorreloituneista virhetermeistä ε (s viittaa sijaintiin) On erilaisia kriging-variaatioita, jotka soveltuvat eri tilanteisiin, mm.: 48 Kriging-menetelmä Simple kriging Ordinary kriging Universal kriging Cokriging Tilanne jossa käytetään Trendi on tunnettu vakio. Trendi on tuntematon vakio. Trendi on jokin deterministinen funktio. Kriging-interpolointi tehdään yhden tai useamman muun muuttujan avustuksella. Hyödyllinen silloin jos varsinaisesta interpoloitavasta muuttujasta on vähän mittauspisteitä, mutta se korreloi jonkin toisen muuttujan kanssa, josta on saatavilla paremmin mittaustietoa.
49 Geostatistical Analyst Customize Toolbars Geostatistical Analyst Työkalupalkki, jonka avulla on mahdollista suorittaa spatiaalinen interpolointi sekä geostatistiikalla että perinteisin (deterministisin) menetelmin 49
50 Geostatistical Analyst esimerkki Interpoloidaan mittauspisteistä koostuva lumensyvyys-aineisto käyttäen Geostatistical Analystiä 50
51 Geostatistical Analyst Aluksi on syytä suorittaa aineiston eksploratiivinen tarkastelu Onko muuttuja normaalijakautunut? Onko muuttuja alueellista rakennetekijää (trendiä)? Semivarianssin/kovarianssin tarkastelu etäisyyden mukaan 51
52 Trend Analysis Kolmiulotteinen hajontakuvio tarkasteltavasta muuttujasta Data-arvot projisoitu x- ja y- akselien suuntaisesti ja niihin kumpaankin on istutettu kuvaaja Nämä kuvaajat osoittavat rakenteellisen komponentin muotoa kummankin sijaintikoordinaatin suunnassa 52
53 Geostatistical Wizard Valitaan Geostatistical Analyst palkista Geostatistical Wizard Tällöin avautuu wizardtyyppinen näkymä Valitaan menetelmäksi Kriging/CoKriging Varmistetaan myös että valittuna on oikea data (Source Dataset) sekä muuttuja (Data Field) 53
54 Geostatistical Wizard Transformation type: mahdollisuus tehdä muuttujamuunnoksia Order of trend removal: jos datassa on trendi, määritetään se huomioitavaksi tässä HUOM: Muuttujamuunnos tai trendin poisto on aiheellista tehdä vain jos sille on oikea tarve! 54
55 Geostatistical Wizard Jos edellisessä vaiheessa valittiin trendin poisto, näkyy poistettava trendi tässä näkymässä Trendin voisi sovittaa paikallisemmaksikin (Exploratory Trend Surface Analysis liukupalkki), mutta pääsääntöisesti trendikomponentti kannattaa mallintaa mahdollisimman yksinkertaisena Jotta ei vahingossa mallinneta samalla pois SA-komponettia 55
56 Geostatistical Wizard Kovarianssikuvio Tästä kovarianssikuvion tilalle voi vaihtaa semivariogrammin (ei sinänsä muuta homman ideaa) Hajontakuvioon asetettava funktio Liittyy anisotropian eli SA:n suuntautuneisuuden tarkasteluun Etäisyysluokkien koko ja lukumäärä 56
57 Geostatistical Wizard Tässä näkymässä voi säätää interpolaation asetuksia Kun klikkaa mihin tahansa kohtaan kartalla, näkee, minkä pisteiden perusteella kyseisen kohdan interpolointi tapahtuisi ja millä painotuksilla 57
58 Geostatistical Wizard Mallin hyvyyden arviointi Hajontakuviossa mitatut vs. mallin ennustamat arvot Ihannetilanteessa sininen viiva ja harmaa 1:1- referenssiviivan päällekkäin Katso myös tunnusluvut kuvion alapuolelta (Prediction Errors) 58
59 Geostatistical Wizard Lopputuloksena on ennustekartta (Prediction Map), siis interpoloitu kartta Tässä tapauksessa kartta rajattu Suomen rajojen mukaan: View Data Frame Properties Data Frame Clip To Shape Specify Shape Outline of Features suomi Toisaalta täytetty koko Suomen alue: Prediction Map Layer Properties Extent Set the extent to: the rectangular extent of suomi 59
60 Geostatistical Wizard mitä sitten? Yleensä kannattaa tehdä useita malleja ja verrata mallien Prediction Error parametreja toisiinsa Geostatistista mallia on mahdollista säätää monin eri tavoin, erilaisia kombinaatioita on valtavasti! Kannattaa ainakin haarukoida tietyillä perusparametreilla (trendin poisto, SA:n funktio, lagien määrä ja koko) Anisotropia syytä mallintaa mikäli tarkasteltava muuttuja on selvästi suuntautunut (esim. topografia siellä missä on harjumuodostelmia) 60
Johdatus geospatiaaliseen tutkimukseen
LYY-menetelmä työpaja, 15.2.2012, Joensuu Johdatus geospatiaaliseen tutkimukseen Olli Lehtonen Historia- ja maantieteiden laitos Itä-Suomen yliopisto SISÄLLYS: Paikkatieto Spatiaalinen autokorrelaatio
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
Yleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
Tilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
Regressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
pitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
pitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
Harjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto
Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
Harjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
Vastepintamenetelmä. Kuusinen/Heliövaara 1
Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
Tekijä Pitkä matematiikka Pisteen (x, y) etäisyys pisteestä (0, 2) on ( x 0) Pisteen (x, y) etäisyys x-akselista, eli suorasta y = 0 on y.
Tekijä Pitkä matematiikka 5 7..017 37 Pisteen (x, y) etäisyys pisteestä (0, ) on ( x 0) + ( y ). Pisteen (x, y) etäisyys x-akselista, eli suorasta y = 0 on y. Merkitään etäisyydet yhtä suuriksi ja ratkaistaan
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
Identifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.
10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin
Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
tilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
4. Funktion arvioimisesta eli approksimoimisesta
4. Funktion arvioimisesta eli approksimoimisesta Vaikka nykyaikaiset laskimet osaavatkin melkein kaiken muun välttämättömän paitsi kahvinkeiton, niin joskus, milloin mistäkin syystä, löytää itsensä tilanteessa,
MONISTE 2 Kirjoittanut Elina Katainen
MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy
Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto
Kojemeteorologia Sami Haapanala syksy 2013 Fysiikan laitos, Ilmakehätieteiden osasto Mittalaitteiden staattiset ominaisuudet Mittalaitteita kuvaavat tunnusluvut voidaan jakaa kahteen luokkaan Staattisiin
Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
Aki Taanila YHDEN SELITTÄJÄN REGRESSIO
Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Regressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.
24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ
Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)
Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 017 Insinöörivalinnan matematiikan koe 30..017, Ratkaisut (Sarja A) 1. a) Lukujen 9, 0, 3 ja x keskiarvo on. Määritä x. (1 p.) b) Mitkä reaaliluvut
Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
Matemaatikot ja tilastotieteilijät
Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat
Esimerkki 1: auringonkukan kasvun kuvailu
GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin
Tampereen yliopisto Tietokonegrafiikka 2013 Tietojenkäsittelytiede Harjoitus
Tampereen yliopisto Tietokonegrafiikka 201 Tietojenkäsittelytiede Harjoitus 6 1..201 1. Tarkastellaan Gouraudin sävytysmallia. Olkoon annettuna kolmio ABC, missä A = (0,0,0), B = (2,0,0) ja C = (1,2,0)
5.6.3 Matematiikan lyhyt oppimäärä
5.6.3 Matematiikan lyhyt oppimäärä Matematiikan lyhyen oppimäärän opetuksen tehtävänä on tarjota valmiuksia hankkia, käsitellä ja ymmärtää matemaattista tietoa ja käyttää matematiikkaa elämän eri tilanteissa
Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty
Juuri 0 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 9..08 Kertaus K. a) Alapaineiden pienin arvo on ja suurin arvo 74, joten vaihteluväli on [, 74]. b) Alapaineiden keskiarvo on 6676870774
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
Väliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
Tutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
2 Pistejoukko koordinaatistossa
Pistejoukko koordinaatistossa Ennakkotehtävät 1. a) Esimerkiksi: b) Pisteet sijaitsevat pystysuoralla suoralla, joka leikkaa x-akselin kohdassa x =. c) Yhtälö on x =. d) Sijoitetaan joitain ehdon toteuttavia
3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö
3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö Yhtälön (tai funktion) y = a + b + c, missä a 0, kuvaaja ei ole suora, mutta ei ole yhtälökään ensimmäistä astetta. Funktioiden
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen
MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä
MS-C2128 Ennustaminen ja aikasarja-analyysi ARMA esimerkkejä Tehtävä 4.1. Ncss-ohjelmiston avulla on generoitu AR(1)-, AR(2)-, MA(1)- ja MA(2)-malleja vastaavia aikasarjoja erilaisilla parametrien arvoilla.
Tilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
GIS-jatkokurssi. Syksy 2016
GIS-jatkokurssi Syksy 2016 GIS-jatkokurssi Opettajat: Mikko Kesälä, Harri Antikainen Vastuuhenkilö: Jarmo Rusanen Suorittaminen: viikkotehtävät Materiaali: GIS-analyysimenetelmät ArcGIS 10.2.1 -ohjelmistolla
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
Tekijä Pitkä matematiikka
K1 Tekijä Pitkä matematiikka 5 7..017 a) 1 1 + 1 = 4 + 1 = 3 = 3 4 4 4 4 4 4 b) 1 1 1 = 4 6 3 = 5 = 5 3 4 1 1 1 1 1 K a) Koska 3 = 9 < 10, niin 3 10 < 0. 3 10 = (3 10 ) = 10 3 b) Koska π 3,14, niin π
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen
Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen 16.06.2014 Ohjaaja: Urho Honkanen Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston
2. TILASTOLLINEN TESTAAMINEN...
!" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...
MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
HAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...
JHS 160 Paikkatiedon laadunhallinta Liite III: Otanta-asetelmat Sisällysluettelo 1. Johdanto... 2 2. Todennäköisyysotanta... 2 2.1 Yksinkertainen satunnaisotanta... 3 2.2 Ositettu otanta... 3 2.3 Systemaattinen
Yhtälön oikealla puolella on säteen neliö, joten r. = 5 eli r = ± 5. Koska säde on positiivinen, niin r = 5.
Tekijä Pitkä matematiikka 5 7..017 31 Kirjoitetaan yhtälö keskipistemuotoon ( x x ) + ( y y ) = r. 0 0 a) ( x 4) + ( y 1) = 49 Yhtälön vasemmalta puolelta nähdään, että x 0 = 4 ja y 0 = 1, joten ympyrän
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
4. Tietokoneharjoitukset
4. Tietokoneharjoitukset Demotehtävät 4.1 Tarkastellaan seuraavia aikasarjoja. Tiedosto (.txt) Muuttuja Kuvaus Havaintoväli Aikasarjan pituus INTEL Intel_Close Intelin osakekurssi Pörssipäivä n = 20 Intel_Volume
Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely)
Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely) Viivi Halla-aho 30.9.2013 Ohjaaja: Dos. Johanna Tamminen Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa
edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾
ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos
SUOJAVYÖHYKKEET. Raakaversio
SUOJAVYÖHYKKEET Tämän raportin tarkoituksena on esitellä paikkatietoanalyysi jossa pyritään osoittamaan optimaalinen sijainti suojavyöhykkeille. Esitelty paikkatietoanalyysi on osa KOTOMA-hankkeessa tehtävää
Hämeenlinna 6.9.2012. Jari Lindblad Jukka Antikainen. Jukka.antikainen@metla.fi 040 801 5051
Puutavaran mittaus Hämeenlinna 6.9.2012 Jari Lindblad Jukka Antikainen Metsäntutkimuslaitos, Itä Suomen alueyksikkö, Joensuu Jukka.antikainen@metla.fi 040 801 5051 SISÄLTÖ 1. Puutavaran mittaustarkkuus
Preliminäärikoe Tehtävät A-osio Pitkä matematiikka kevät 2016 Sivu 1 / 4
Preliminäärikoe Tehtävät A-osio Pitkä matematiikka kevät 06 Sivu / 4 Laske yhteensä enintään 0 tehtävää. Kaikki tehtävät arvostellaan asteikolla 0-6 pistettä. Osiossa A EI SAA käyttää laskinta. Osiossa
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...
Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä
Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme
MAB3 - Harjoitustehtävien ratkaisut:
MAB3 - Harjoitustehtävien ratkaisut: 1 Funktio 1.1 Piirretään koordinaatistoakselit ja sijoitetaan pisteet: 1 1. a) Funktioiden nollakohdat löydetään etsimällä kuvaajien ja - akselin leikkauspisteitä.
Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)
1/10 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise
/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin
30.11.2017/1 MTTTP5, luento 30.11.2017 Kertausta H 0 : µ = µ 0 Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin = / ~ 0,1. Kaava 5.1 30.11.2017/2 Esim. Tutkija
GIS-jatkokurssi. Syksy 2016
GIS-jatkokurssi Syksy 2016 GIS-jatkokurssi Opettajat: Mikko Kesälä, Harri Antikainen Vastuuhenkilö: Jarmo Rusanen Suorittaminen: viikkotehtävät Materiaali: GIS-analyysimenetelmät ArcGIS 10.2.1 -ohjelmistolla
Matematiikan tukikurssi
Matematiikan tukikurssi Kurssikerta 8 Väliarvolause Oletetaan, että funktio f on jatkuva jollain reaalilukuvälillä [a, b] ja derivoituva avoimella välillä (a, b). Funktion muutos tällä välillä on luonnollisesti