LYY-menetelmä työpaja, 15.2.2012, Joensuu Johdatus geospatiaaliseen tutkimukseen Olli Lehtonen Historia- ja maantieteiden laitos Itä-Suomen yliopisto SISÄLLYS: Paikkatieto Spatiaalinen autokorrelaatio Geospatiaalinen mallintaminen Hyödyntäminen yhteiskuntatieteellisessä ympäristötutkimuksessa
Paikkatieto = tietoa kohteesta tai ilmiöstä, joka voidaan paikantaa, paikallistaa Paikannus voi tapahtua Koordinaatilla Postinumeroalueella Kuntakoodilla Maakuntakoodilla Ym.
Paikkatiedon erityispiirre Yksilötaso Yksilöt toisistaan riippumattomia -> perinteiset tilastolliset mallit Ryvästaso Mallintamisessa huomioitava, että ryhmät eivät välttämättä ole riippumattomia toisistaan -> satunnaistetut mallit Aluetaso (kuvassa ruudut) Mallintamisessa huomioitava, että alueet eivät välttämättä ole riippumattomia toisistaan -> geospatiaaliset mallit
Spatiaalinen autokorrelaatio Monet yhteiskuntatieteelliset muuttujat ovat spatiaalisesti autokorreloituneita, koska maantieteellisesti vuorovaikutteiset prosessit levittävät tutkittavaa ilmiötä läheisille alueille (Odland 1988: 13) Spatiaalinen autokorrelaatio jäsentää tietämystämme havaintoarvojen jakautumisesta maantieteellisessä tilassa (Odland 1988: 9). Spatiaalinen autokorrelaatio voidaan ymmärtää muuttujan korrelaationa itsensä kanssa maantieteellisessä tilassa (Griffith 2003). Korrelaatio Autokorrelaatio Spatiaalinen autokorrelaatio
Spatiaalisen autokorrelaation tunnistaminen Globaalisti Moran I Gearyn C Paikallisesti esim. LISA (Local Indicator of Spatial Association)
Muuttoliikkeen paikallisen spatiaalisen autokorrelaation keskittymät
Muuttoliikkeen paikallinen spatiaalinen autokorrelaatio Suomessa 1980-2006
Spatiaalisen autokorrelaation haasteet Havaintoyksiköt eivät ole toisistaan riippumattomia, joten ilmiöitä kuvaavien mallien estimaattorit joko harhaisia tai tehottomia (ks. Anselin & Bera 1998) vaikutukset mallintamiseen 1. hyväksytään spatiaalisen autokorrelaation olemassa olo 2. mallinnetaan vain osaa aineistosta (otos) 3. käytetään epäparametrisiä malleja 4. Käytetään monimutkaisempia malleja, jotka huomioivat spatiaalisen autokorrelaation
Käytetään epäparametrisia malleja Esimerkki yleistetystä additiivisesta mallista: Mitkä tekijät selittävät työttömyysasteen ja muuttoliikkeen epätasapainoa? Yleistetty additiivinen malli binomijakaumalle: Kvartiilikartta similariteetti-indeksin arvoista vuonna 2008
Yleistetyn additiivisen mallin tulokset
Mallin kahden muuttujan yhteisvaikutuksia:
Esimerkki epäparametrisesta regressioanalyysistä: Miten aluekehitys muuttuisi, jos työpaikkakehitys perustuisi vain luonnonresursseihin?
Käytetään spatiaalisia regressiomalleja Spatiaalinen virhemalli Spatiaalinen viivemalli (postinumeroalueen tulotaso = vakio + regressiokerroin * etäisyys Joensuun kauppatorille + virhe), (virhe = vakiokerroin*viereisten alueiden virhetermi +korreloimaton virhetermi) (postinumeroalueen tulotaso = postinumeroalueen viereisten alueiden tulotaso + vakio + regressiokerroin * etäisyys Joensuun kauppatorille + virhe)
Esimerkki spatiaalisesta virhemallista: Miten tulotaso muuttuu keskusetäisyyden suhteen?
Maantieteellisesti painotettu regressiomalli (GWR) Globaaliin malliin liittyvien ongelmien vuoksi tarvitaan aluetutkimuksissa menetelmiä, joissa keskitytään lokaalisiin eli paikallisiin eroavaisuuksiin (Fotheringham 1997). Yksi tällainen menetelmä on maantieteellisesti painotettu regressio (GWR, geographically weighted regression) (Fotheringham ym. 2002), jolla voidaan tutkia paikallista vaihtelua selittävien muuttujien yhdeydessä selitettävään muuttujaan.
Stationaarisuus vs. epästationaarisuus y i = 0 + 1 x 1i y i = i0 + i1 x 1i e1 e1 e2 e2 Stationaarinen prosessi Epästationaarinen prosesssi e3 e4 e3 e4 Realistisempi lähtökohta mallintamiselle
Stationaarinen prosessi -> Globaali malli Stationaarinen prosessi -> Maantieteellisesti painotettu regressiomalli y x
Epästationaarisuuden mallintaminen Vakioitu malli (fixed model) GWR-menetelmässä maantieteellisesti läheisiä alueita painotetaan enemmän kuin kauempana sijaitsevia alueita, joten menetelmässä käytetään käytännössä vain läheisiä alueita estimoitaessa paikallisia regressiokertoimia. Tämä painotus perustuu ajatukseen siitä, että läheiset alueet ovat hyödyllisiä estimoitaessa paikallisia regressiokertoimia (Tobler 1970).
Adaptiivinen malli (adaptive model)
Miksi GWR-malli? Paikalliset mallit ymmärtävät aineistoa yksityiskohtaisemmin GWR-malleilla paljon sovellusmahdollisuuksia Huomioi maantieteen ensimmäisen lain (lähellä sijaitsevat samankaltaisempia kuin kaukana sijaitsevat alueet) Mallien hyvyys: Parempi sopivuus aineistoon Residuaalit vähemmän autokorreloivia
GWR-mallien soveltaminen: Mitkä tekijät selittävät poliisin tietoon tulleita rattijuopumuksia kunnissa? Millaisia alueellisia vaikutuseroja selittävissä muuttujissa esiintyy?
Esimerkki jatkuu Paikallisten regressiokertoimien eroja havainnollistaa teoreettinen esimerkkilaskelma, jossa alkoholimyynniksi oletamme 10 litraa/asukas ja kunnan väkiluvuksi 10 000 asukasta. Jos tällainen kunta sijaitsisi Pohjanmaalla, kunnassa havaittaisiin vuosittain alimmillaan noin 8 rattijuopumusta, mutta jos kunta sijaitsisi Järvi- Suomessa, poliisin tietoon tulisi vuosittain noin 23 rattijuopumustapausta.
Keski-Pohjanmaalla, jossa yhteys on yli kaksi kertaa globaalin mallin ennustamaa vaikutusta korkeampi (ka 0,18: globaalimalli 0,08) 24 kunnassa työttömyysaste on keskimäärin 6,0, mikä on koko maan keskiarvo alempi Yhteys rattijuopumuksiin ei ole riippuvainen sosiaalisen ongelman laajuudesta!
Hyöty? GWR-mallin kuvaaman alueellisen vaihtelun paljastuminen lisännee tehokkuutta ennaltaehkäisevälle alkoholivalistukselle Mallin välittämällä tiedolla voidaan kohdistaa valistusta alueille, joissa alkoholimyynnin yhteys rattijuopumuksiin on voimakkain (optimointi sovellutukset) Alkoholimyynnin osalta globaali regressiomalli aliarvioisi sen vaikutusta rattijuopumuksiin lähes koko Suomessa mikä pahimmassa tapauksessa voisi olla peruste kanpanjoinnin käynnistämättä jättämiselle tai sen lopettamiselle tehottomuuden vuoksi
Mitä geospatiaalinen tutkimus tarjoaa yhteiskuntatieteelliselle ympäristötutkimukselle? Lisäinformaatiota tutkittavasta ilmiöstä Yksityiskohtaisempaa ymmärrystä tutkittavasti ilmiöstä Esim. Globaali vs. paikallinen regressiomalli Realistisempia malleja Estimaattorien harhattomuuden ja tehottomuuden vähentäminen Uusia ilmiöitä selittäviä tekijöitä Etäisyys, saavutettavuus, tiheys, keskittyminen, jne.
Mitä geospatiaalinen tutkimus tarjoaa yhteiskuntatieteelliselle ympäristötutkimukselle? Uusia menetelmäsovelluksia Uutta tietämystä tuntemattomista alueista business mahdollisuudet kun halutaan vaikuttaa erilaisiin haittoihin päätöksiin ihmisten mielipiteisiin ja suhtautumiseen käyttäytymisen ehkäisyyn ym.
LYY-menetelmä työpaja, 15.2.2012, Joensuu Kiitos! Geospatiaalisia opintoja voi opiskella myös historia- ja maantieteiden laitoksella! www.joensuu.fi/geo/gis/index.html Sähköposti: olli.lehtonen@uef.fi