Johdatus geospatiaaliseen tutkimukseen

Samankaltaiset tiedostot
Mainituimmat sanat paikkatietojulkaisujen tiivistelmissä Historia- ja maantieteiden laitos, Itä-Suomen yliopisto

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus regressioanalyysiin. Heliövaara 1

Harjoitus 9: Excel - Tilastollinen analyysi

Regressioanalyysi. Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Tilastotieteellisiä malleja välimatka- ja suhdeasteikollisten preferenssien mittaamiseen. Pekka Leskinen ja Tuomo Kainulainen Metla

Sovellettu todennäköisyyslaskenta B

Mitä löytyy faktojen takaa?

Yleistetyistä lineaarisista malleista

Dynaamiset regressiomallit

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

4.2 Useampi selittävä muuttuja (kertausta)

Tieto auttaa maaseutua menestymään. Olli Lehtonen, FT, Talousmaantieteen dos, Erikoistutkija, Luonnonvarakeskus Tutkijatohtori, Itä-Suomen yliopisto

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Aikuisväestön masennusta aiheuttavia paikallisia riskitekijöitä Suomessa

Soveltuuko vetovoimamalli seudullisuuden ja seudullisten vaikutusten arviointiin?

Geoinformatiikan maisteriohjelman (GIMP) toteutus Teknillisessä Korkeakoulussa. GIMP tiedotustilaisuus Ari Jolma, prof. (geoinformatiikka)

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

Pientalojen radonpitoisuuksien tilastollinen analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

TUKIMATERIAALI: Arvosanan kahdeksan alle jäävä osaaminen

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Harjoitukset 4 : Paneelidata (Palautus )

Tarkastusmuistio Poliisin toimintojen yhdistäminen ja liikennevalvonnan määrä

Alueellisen liikkuvuuden ja monipaikkaisuuden mahdollisuudet ja seuraukset

Kvantitatiiviset menetelmät

Spatiaalista mallinnusta pistedatalla: kyselypohjainen analyysi koetusta terveydestä ja turvattomuudesta Helsingin metropolialueella

Harjoitus 2: Matlab - Statistical Toolbox

Identifiointiprosessi

Monitasomallit koulututkimuksessa

Mat Operaatiotutkimuksen projektityöseminaari

GIS-jatkokurssi. Viikko 4: Spatiaalinen statistiikka. Harri Antikainen

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Luonnontieteellinen tiedekunta Sivuaineinfo. Katri Suorsa

Spatiaalinen autokorrelaatio maantieteellisessä mallintamisessa

Miten tukea luokanopettajaopiskelijoiden myönteistä suhtautumista yhdessä työskentelyyn?!

Johdatus tilastotieteeseen Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2004) 1

Miten tunnistetaan maisemallisesti herkät talousmetsäalueet?

Avoin paikkatieto tutkimuksessa ja opetuksessa

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

GIS hyvinvointitieteissä Case: MOPO-tutkimus

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Kokemuksia paikkatietotaitojen verkko-opetuksesta

Johdatus regressioanalyysiin

Sosiaalisen paikkatiedon keruu hyvinvointimatkailun kehittämisessä ja matkailijoiden kiinnostus luonnontuotteisiin liittyviin palveluihin

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Korrelaatiokertoinen määrittely 165

Harjoitus 3: Regressiomallit (Matlab)

1. Tilastollinen malli??

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Miten tehdä onnistunut projektisuunnitelma 10 vinkkiä

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

Sijainnin merkitys Itellassa GIS. Jakelun kehittämisen ajankohtaispäivä

Liite artikkeliin Intohimo tasa-arvoon

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen aihehakemisto

Tyypin 2 diabetes: omaseurannalla saavutettavat liikkumiskustannussäästöt

Maantieteellisen alueen huomioiminen vahinkovakuutustuotteiden hinnoittelussa

Toisen asteen koulutuksen läpäisy ja keskeyttäminen

Harjoitus 3: Regressiomallit (Matlab)

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

PD-indeksin päivitysraportti Erikoistutkija Oskari Harjunen Helsingin kaupungin tietokeskus

Habits of Mind- 16 taitavan ajattelijan toimintatapaa

Harjoitukset 5 : Differences-in-Differences - mallit (Palautus )

Usean selittävän muuttujan regressioanalyysi

HENKILÖAINEIS- TOT JA PAIKKATIETO

Metsän hinta Suomessa v kauppahintatutkimuksen tulokset. Maanmittauspäivät Esa Ärölä

Paikkatietoratkaisut markkinoinnin apuvälineenä. Käyttökohteet ja käytännön hyödyt Ilkka Suojanen

Verkostoanalyysi yritysten verkostoitumista tukevien EAKRhankkeiden arvioinnin menetelmänä. Tamás Lahdelma ja Seppo Laakso

Optimal Harvesting of Forest Stands

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Epävarmuuden hallinta bootstrap-menetelmillä

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiodiagnostiikka. TKK (c) Ilkka Mellin (2007) 1

Harjoitukset 6 :IV-mallit (Palautus )

Laboratorioanalyysit, vertailunäytteet ja tilastolliset menetelmät

805306A Johdatus monimuuttujamenetelmiin, 5 op

Yleinen lineaarinen malli

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Selittävätkö hyvinvointierot odotettua alhaisempaa poismuuttoa eräiltä korkean työttömyyden alueilta?

MTTTP1, luento KERTAUSTA

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiomallin valinta. TKK (c) Ilkka Mellin (2007) 1

MAANTIETEEN TUTKINTO-OHJELMA

Yhden selittäjän lineaarinen regressiomalli

Paikkatiedon opetuksen haasteita ja uusia ratkaisuja. PaikkaOppi-hanke. Helsinki Juha Riihelä.

Transkriptio:

LYY-menetelmä työpaja, 15.2.2012, Joensuu Johdatus geospatiaaliseen tutkimukseen Olli Lehtonen Historia- ja maantieteiden laitos Itä-Suomen yliopisto SISÄLLYS: Paikkatieto Spatiaalinen autokorrelaatio Geospatiaalinen mallintaminen Hyödyntäminen yhteiskuntatieteellisessä ympäristötutkimuksessa

Paikkatieto = tietoa kohteesta tai ilmiöstä, joka voidaan paikantaa, paikallistaa Paikannus voi tapahtua Koordinaatilla Postinumeroalueella Kuntakoodilla Maakuntakoodilla Ym.

Paikkatiedon erityispiirre Yksilötaso Yksilöt toisistaan riippumattomia -> perinteiset tilastolliset mallit Ryvästaso Mallintamisessa huomioitava, että ryhmät eivät välttämättä ole riippumattomia toisistaan -> satunnaistetut mallit Aluetaso (kuvassa ruudut) Mallintamisessa huomioitava, että alueet eivät välttämättä ole riippumattomia toisistaan -> geospatiaaliset mallit

Spatiaalinen autokorrelaatio Monet yhteiskuntatieteelliset muuttujat ovat spatiaalisesti autokorreloituneita, koska maantieteellisesti vuorovaikutteiset prosessit levittävät tutkittavaa ilmiötä läheisille alueille (Odland 1988: 13) Spatiaalinen autokorrelaatio jäsentää tietämystämme havaintoarvojen jakautumisesta maantieteellisessä tilassa (Odland 1988: 9). Spatiaalinen autokorrelaatio voidaan ymmärtää muuttujan korrelaationa itsensä kanssa maantieteellisessä tilassa (Griffith 2003). Korrelaatio Autokorrelaatio Spatiaalinen autokorrelaatio

Spatiaalisen autokorrelaation tunnistaminen Globaalisti Moran I Gearyn C Paikallisesti esim. LISA (Local Indicator of Spatial Association)

Muuttoliikkeen paikallisen spatiaalisen autokorrelaation keskittymät

Muuttoliikkeen paikallinen spatiaalinen autokorrelaatio Suomessa 1980-2006

Spatiaalisen autokorrelaation haasteet Havaintoyksiköt eivät ole toisistaan riippumattomia, joten ilmiöitä kuvaavien mallien estimaattorit joko harhaisia tai tehottomia (ks. Anselin & Bera 1998) vaikutukset mallintamiseen 1. hyväksytään spatiaalisen autokorrelaation olemassa olo 2. mallinnetaan vain osaa aineistosta (otos) 3. käytetään epäparametrisiä malleja 4. Käytetään monimutkaisempia malleja, jotka huomioivat spatiaalisen autokorrelaation

Käytetään epäparametrisia malleja Esimerkki yleistetystä additiivisesta mallista: Mitkä tekijät selittävät työttömyysasteen ja muuttoliikkeen epätasapainoa? Yleistetty additiivinen malli binomijakaumalle: Kvartiilikartta similariteetti-indeksin arvoista vuonna 2008

Yleistetyn additiivisen mallin tulokset

Mallin kahden muuttujan yhteisvaikutuksia:

Esimerkki epäparametrisesta regressioanalyysistä: Miten aluekehitys muuttuisi, jos työpaikkakehitys perustuisi vain luonnonresursseihin?

Käytetään spatiaalisia regressiomalleja Spatiaalinen virhemalli Spatiaalinen viivemalli (postinumeroalueen tulotaso = vakio + regressiokerroin * etäisyys Joensuun kauppatorille + virhe), (virhe = vakiokerroin*viereisten alueiden virhetermi +korreloimaton virhetermi) (postinumeroalueen tulotaso = postinumeroalueen viereisten alueiden tulotaso + vakio + regressiokerroin * etäisyys Joensuun kauppatorille + virhe)

Esimerkki spatiaalisesta virhemallista: Miten tulotaso muuttuu keskusetäisyyden suhteen?

Maantieteellisesti painotettu regressiomalli (GWR) Globaaliin malliin liittyvien ongelmien vuoksi tarvitaan aluetutkimuksissa menetelmiä, joissa keskitytään lokaalisiin eli paikallisiin eroavaisuuksiin (Fotheringham 1997). Yksi tällainen menetelmä on maantieteellisesti painotettu regressio (GWR, geographically weighted regression) (Fotheringham ym. 2002), jolla voidaan tutkia paikallista vaihtelua selittävien muuttujien yhdeydessä selitettävään muuttujaan.

Stationaarisuus vs. epästationaarisuus y i = 0 + 1 x 1i y i = i0 + i1 x 1i e1 e1 e2 e2 Stationaarinen prosessi Epästationaarinen prosesssi e3 e4 e3 e4 Realistisempi lähtökohta mallintamiselle

Stationaarinen prosessi -> Globaali malli Stationaarinen prosessi -> Maantieteellisesti painotettu regressiomalli y x

Epästationaarisuuden mallintaminen Vakioitu malli (fixed model) GWR-menetelmässä maantieteellisesti läheisiä alueita painotetaan enemmän kuin kauempana sijaitsevia alueita, joten menetelmässä käytetään käytännössä vain läheisiä alueita estimoitaessa paikallisia regressiokertoimia. Tämä painotus perustuu ajatukseen siitä, että läheiset alueet ovat hyödyllisiä estimoitaessa paikallisia regressiokertoimia (Tobler 1970).

Adaptiivinen malli (adaptive model)

Miksi GWR-malli? Paikalliset mallit ymmärtävät aineistoa yksityiskohtaisemmin GWR-malleilla paljon sovellusmahdollisuuksia Huomioi maantieteen ensimmäisen lain (lähellä sijaitsevat samankaltaisempia kuin kaukana sijaitsevat alueet) Mallien hyvyys: Parempi sopivuus aineistoon Residuaalit vähemmän autokorreloivia

GWR-mallien soveltaminen: Mitkä tekijät selittävät poliisin tietoon tulleita rattijuopumuksia kunnissa? Millaisia alueellisia vaikutuseroja selittävissä muuttujissa esiintyy?

Esimerkki jatkuu Paikallisten regressiokertoimien eroja havainnollistaa teoreettinen esimerkkilaskelma, jossa alkoholimyynniksi oletamme 10 litraa/asukas ja kunnan väkiluvuksi 10 000 asukasta. Jos tällainen kunta sijaitsisi Pohjanmaalla, kunnassa havaittaisiin vuosittain alimmillaan noin 8 rattijuopumusta, mutta jos kunta sijaitsisi Järvi- Suomessa, poliisin tietoon tulisi vuosittain noin 23 rattijuopumustapausta.

Keski-Pohjanmaalla, jossa yhteys on yli kaksi kertaa globaalin mallin ennustamaa vaikutusta korkeampi (ka 0,18: globaalimalli 0,08) 24 kunnassa työttömyysaste on keskimäärin 6,0, mikä on koko maan keskiarvo alempi Yhteys rattijuopumuksiin ei ole riippuvainen sosiaalisen ongelman laajuudesta!

Hyöty? GWR-mallin kuvaaman alueellisen vaihtelun paljastuminen lisännee tehokkuutta ennaltaehkäisevälle alkoholivalistukselle Mallin välittämällä tiedolla voidaan kohdistaa valistusta alueille, joissa alkoholimyynnin yhteys rattijuopumuksiin on voimakkain (optimointi sovellutukset) Alkoholimyynnin osalta globaali regressiomalli aliarvioisi sen vaikutusta rattijuopumuksiin lähes koko Suomessa mikä pahimmassa tapauksessa voisi olla peruste kanpanjoinnin käynnistämättä jättämiselle tai sen lopettamiselle tehottomuuden vuoksi

Mitä geospatiaalinen tutkimus tarjoaa yhteiskuntatieteelliselle ympäristötutkimukselle? Lisäinformaatiota tutkittavasta ilmiöstä Yksityiskohtaisempaa ymmärrystä tutkittavasti ilmiöstä Esim. Globaali vs. paikallinen regressiomalli Realistisempia malleja Estimaattorien harhattomuuden ja tehottomuuden vähentäminen Uusia ilmiöitä selittäviä tekijöitä Etäisyys, saavutettavuus, tiheys, keskittyminen, jne.

Mitä geospatiaalinen tutkimus tarjoaa yhteiskuntatieteelliselle ympäristötutkimukselle? Uusia menetelmäsovelluksia Uutta tietämystä tuntemattomista alueista business mahdollisuudet kun halutaan vaikuttaa erilaisiin haittoihin päätöksiin ihmisten mielipiteisiin ja suhtautumiseen käyttäytymisen ehkäisyyn ym.

LYY-menetelmä työpaja, 15.2.2012, Joensuu Kiitos! Geospatiaalisia opintoja voi opiskella myös historia- ja maantieteiden laitoksella! www.joensuu.fi/geo/gis/index.html Sähköposti: olli.lehtonen@uef.fi