Paikkatiedon käsittely 12. Yhteenveto

Samankaltaiset tiedostot
Paikkatiedon käsittely 6. Kyselyn käsittely

Paikkatiedon käsittely 10. Aluekohteiden yhteisesiintymät

Paikkatiedon käsittely 4. Diskreettiä geometriaa

Paikkatiedon käsittely 2. Relaatiomallin paikkatietolaajennokset

Paikkatiedon käsittely 11. Suuren mittakaavan

Paikkatiedon käsittely

Paikkatiedon hallinta ja analyysi

Paikkatiedon hallinta ja analyysi 2. Diskreettiä geometriaa

Paikkatiedon hallinta ja analyysi 5. Kyselyn käsittely

Paikkatiedon käsittely 5. Paikkatiedon indeksointi

Paikkatiedon hallinta ja analyysi 4. Paikkatiedon indeksointi

Paikkatiedon hallinta ja analyysi 3. Paikkatietomallit ja kyselyt

Paikkatiedon hallinta ja analyysi 4. Paikkatiedon indeksointi (jatkoa)

Relaatiotietokantojen perusteista. Harri Laine Helsingin yliopisto

Paikkatiedon käsittely 8. Spatiaalinen riippuvuus

Datatähti 2019 loppu

Vanhoja koetehtäviä. Analyyttinen geometria 2016

Algoritmit 2. Luento 6 Ke Timo Männikkö

Mitä murteita Suomessa onkaan?

Algoritmit 2. Luento 6 To Timo Männikkö

58131 Tietorakenteet (kevät 2009) Harjoitus 6, ratkaisuja (Antti Laaksonen)

ENY-C2005 Geoinformation in Environmental Modelling Suomenkielistä terminologiaa liittyen luentoihin 3 ja 6-8

GEOMETRIA MAA3 Geometrian perusobjekteja ja suureita

Kyselyt: Lähtökohtana joukko lukuja Laskukaava kertoo miten luvuista lasketaan tulos soveltamalla laskentaoperaatioita

! 7! = N! x 8. x x 4 x + 1 = 6.

Insinöörimatematiikka D

811120P Diskreetit rakenteet

2 Pistejoukko koordinaatistossa

D B. Tietokannan hallinta kertaus

PN-puu. Helsinki Seminaari: Tietokannat nyt HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Helsingin yliopisto/tktl Kyselykielet, s 2006 Optimointi Harri Laine 1. Kyselyn optimointi. Kyselyn optimointi

Projektinhallintaa paikkatiedon avulla

Relaatioalgebra. Kyselyt:

10. Esitys ja kuvaus

Tehtävä 8 : 1. Tehtävä 8 : 2

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

Ympyrän yhtälö

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tietokannan hallinta. Kevät 2004 Jan Lindström R&G Chapter 1

Monikulmiot 1/5 Sisältö ESITIEDOT: kolmio

Relaatioalgebra. Relaatioalgebra. Relaatioalgebra. Relaatioalgebra - erotus (set difference) Kyselyt:

TIEDONHALLINTA - SYKSY Luento 10. Hannu Markkanen /10/12 Helsinki Metropolia University of Applied Sciences

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

Tietorakenteet, laskuharjoitus 7, ratkaisuja

Tampereen yliopisto Tietokonegrafiikka 2013 Tietojenkäsittelytiede Harjoitus

= = = 1 3.

Valitsemalla sopivat alkiot joudutaan tämän määritelmän kanssa vaikeuksiin, jotka voidaan välttää rakentamalla joukko oppi aksiomaattisesti.

Tekijä Pitkä matematiikka

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

Algoritmit 2. Luento 2 To Timo Männikkö

805306A Johdatus monimuuttujamenetelmiin, 5 op

Opettajana Mika Sorsa, HAMK:n ammatillisen opettajakoulutuksen opetusharjoittelija

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)

Määrätty integraali. Markus Helén. Mäntän lukio

Ohjelmistojen mallintamisen ja tietokantojen perusteiden yhteys

Tasokuvioita. Monikulmio: Umpinainen eli suljettu, itseään leikkaamaton murtoviivan rajaama tason osa on monikulmio. B

T Vuorovaikutteinen tietokonegrafiikka Tentti

MATEMATIIKKA JA TAIDE I

Jokaisella tiedostolla on otsake (header), joka sisältää tiedostoon liittyvää hallintatietoa

Injektio. Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim.

Luento 6: Tulostusprimitiivien toteutus

I Geometrian rakentaminen pisteestä lähtien

Algoritmit 1. Luento 8 Ke Timo Männikkö

Luento 2: Tulostusprimitiivit

Yhtenäisyydestä. Johdanto. Lähipisteavaruus. Tuomas Korppi


CSE-A1200 Tietokannat

TIETOKANNAT JOHDANTO

1. a) b) Nollakohdat: 20 = c) a b a b = + ( a b)( a + b) Derivaatan kuvaajan numero. 1 f x x x g x x x x. 3. a)

y=-3x+2 y=2x-3 y=3x+2 x = = 6

1. Lineaarinen optimointi

Lieriö ja särmiö Tarkastellaan pintaa, joka syntyy, kun tasoa T leikkaava suora s liikkuu suuntansa

Helsingin yliopisto, Tietojenkäsittelytieteen laitos Tietokantojen perusteet, , H.Laine

Helsingin yliopisto/ tktl DO Tietokantojen perusteet, s 2000 Relaatioalgebra Harri Laine 1. Relaatioalgebra

MATEMATIIKKA JA TAIDE II

Kuva 1: Funktion f tasa-arvokäyriä. Ratkaisu. Suurin kasvunopeus on gradientin suuntaan. 6x 0,2

8 Joukoista. 8.1 Määritelmiä

Tietokantojen suunnittelu, relaatiokantojen perusteita

Kanta ja dimensio 1 / 23

Yhtälön oikealla puolella on säteen neliö, joten r. = 5 eli r = ± 5. Koska säde on positiivinen, niin r = 5.

Kenguru 2013 Student sivu 1 / 7 (lukion 2. ja 3. vuosi)

x 5 15 x 25 10x 40 11x x y 36 y sijoitus jompaankumpaan yhtälöön : b)

Paikkatietojärjestelmät

Ympyrä 1/6 Sisältö ESITIEDOT: käyrä, kulma, piste, suora

Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden kanssa, joiden lakina on tietyn ominaisuuden samuus.

yleisessä muodossa x y ax by c 0. 6p

v 1 v 2 v 3 v 4 d lapsisolmua d 1 avainta lapsen v i alipuun avaimet k i 1 ja k i k 0 =, k d = Sisäsolmuissa vähint. yksi avain vähint.

(1) refleksiivinen, (2) symmetrinen ja (3) transitiivinen.

Algoritmit 1. Luento 7 Ti Timo Männikkö

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Laudatur 4 MAA4 ratkaisut kertausharjoituksiin


Algoritmit 2. Luento 7 Ti Timo Männikkö

Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen

HELIA 1 (17) Outi Virkki Tiedonhallinta

massa vesi sokeri muu aine tuore luumu b 0,73 b 0,08 b = 0,28 a y kuivattu luumu a x 0,28 a y 0,08 = 0,28 0,08 = 3,5

5 Rationaalifunktion kulku

Dihedraalinen ryhmä Pro gradu Elisa Sonntag Matemaattisten tieteiden laitos Oulun yliopisto 2013

PRELIMINÄÄRIKOE PITKÄ MATEMATIIKKA

Transkriptio:

HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon käsittely 12. Yhteenveto Antti Leino antti.leino@cs.helsinki.fi 22.2.2007 Tietojenkäsittelytieteen laitos

Kurssin sisältö Tiedonhallinnan ja data-analyysin erityiskysymyksiä, kun käsiteltävä aineisto sisältää paikkaan liittyvää tietoa Paikkatiedon käsittely relaatiotietokannassa Relaatiomallin ja SQL-kielen laajennokset Paikkatiedon indeksointi tietokannassa Assosiaatio- ja yhteisesiintymäsääntöjen etsintä Suuren mittakaavan ilmiöt

Mitä paikkatieto on? Kaksi komponenttia Sijaintitieto Ominaisuustieto Erilaiset asteikot Erilaisia työkaluja Paikkatietojärjestelmä Paikkatietokanta

Paikkatiedon esittäminen Tilapohjainen esitys Ominaisuustieto liitetty suoraan (rasteri)avaruuden pisteisiin Maantieteellisesti jatkuva ominaisuustieto Erityisesti paikkatietojärjestelmien rasteritasoissa Oliopohjainen esitys Itsenäisiä olioita, joilla muoto, sijainti ja ominaisuuksia Operaatiot kohdistuvat olioihin Tietokantahenkinen lähestymistapa

Olioiden väliset suhteet Suuntasuhteet likimääräisiä laskennallisesti helppoja Etäisyyssuhteet tarkka etäisyys työläs laskea indeksirakenteet

Olioiden väliset suhteet Topologiset suhteet Määriteltävissä monikulmioiden reunan ( A, B) ja sisustan (A,B ) leikkausten avulla Erilliset Sivuavat Samat disjoint (A, B) touches (A, B) equals (A, B) Peittää Sisältää Leikkaavat contains (A, B) overlaps (A, B) within (B, A)

Tietokantasuunnittelun abstraktiotasot Käsitetaso Tietokannan käyttäjän näkökulma Tietokannan sisältö Rakennetaso Tietokannan ohjelmoijan näkökulma Tietokannan muoto Tallennustaso TKHJ:n ohjelmoijan näkökulma Tietokannan tehokas tallennus massamuistiin

Relaatiomalli Tieto esitetään relaatioina / tauluina sarakkeet / attribuutit rivit / monikot Relaatioalgebra yhdiste R S erotus R S ristitulo R S projektio π A1,...,A n (R) valinta σ ehto (R) leikkaus R S liitos R ehto S

Paikkatieto relaatiotietokannassa Paikkatieto-oliot Funktiot niiden käsittelyyn

Paikkafunktioita Perusasioita ulottuvuus / minimisuorakulmio / reuna tyhjä? / yksinkertainen? Topologiset suhteet Etäisyys Geometriset operaatiot leikkaus / yhdiste / erotus / symmetrinen erotus puskuri / konveksi verho Luokkakohtaiset ominaisuudet pisteen x- ja y-koordinaatti viivan pisteet, pituus alueen pinta-ala, keskipiste, reunat

SQL Kieli relaatiotietokannan tietosisällön määrittelyyn tietojen päivitykseen tietojen hakuun käyttäjien ja käyttöoikeuksien määrittelyyn Paikkatiedon käsittely suoraviivaista perus-sql:n lisäksi joukko funktioita, kuten edellä

Diskreettiä geometriaa: maailma Koko tarkasteltavan geometrian kuvaus äärellisresoluutioisen hilan avulla Laskennallisesti näppärä Suojaa laskentatarkkuuden rajallisuudelta Tietokantoihin vasta tulossa

Paikkatieto maailmassa Tietotyyppien toteuttaminen maailma-approksimaatiolla: tarvitaan 1. Hila ja sen geometriset primitiivit piste, jana 2. Hilaan määritelty maailma vaatimuksia: janojen päätepisteet maailman pisteitä, ei janojen sisäpisteitä, janat koskettavat korkeintaan päätepisteissään 3. Maailmaperusteiset rakenteet 2-ulotteiset kohteet: syklit, tahkot 1-ulotteiset: lohkot 4. Paikkatietotyypit määritellään pisteiden, lohkojen ja tahkojen avulla

Janan kuori Ongelma: sovitettava yhteen hilan äärellinen resoluutio ja janojen leikkauspisteet janan lähellä / janalla olevat pisteet Janan kuori: janalla sekä sitä lähinnä (ylä- tai alapuolella) olevat hilapisteet Aito kuori: kuori päätepisteet

Janan uudelleenpiirtäminen Jana voidaan piirtää uudelleen murtoviivaksi, mutta vain kuorensa sisällä Janojen leikkauspisteeksi valitaan lähin hilapiste janat piirretään uudelleen tämän kautta kulkeviksi murtoviivoiksi Janan kuoressa oleva maailman piste on janalla jana muutetaan tämän kautta kulkevaksi murtoviivaksi

Paikkatiedon indeksointi Päämäärä: tietokantahaun nopeuttaminen Tavanomaisen tietokannan ratkaisu: B-puu B-puun edellytyksenä täysin järjestetty arvoalue: on olemassa relaatio Paikkatiedolla näin ei ole

Paikkatiedon indeksointi Kaksi vaihtoehtoa Laaditaan paikkatiedolle 1-ulotteinen järjestys, joka voidaan indeksoida B-puuhun Tilan täyttävä käyrä: jatkuva käyrä, joka täyttää koko avaruuden Yleistetään B-puu sellaisen aineiston indeksointiin, joka ei ole täysin järjestetty R-puu, GiST-puu Tämä tyypillinen ratkaisu

Tilan täyttävät käyrät Hilbertin käyrä Z-käyrä Säilyttää etäisyyden melko hyvin Muunnos 2-ulotteisiin koordinaatteihin vaikea Muunnos 1- ja 2-ulotteisten koordinaattien välillä helppo Peräkkäiset käyrän pisteet voivat olla kaukana

R-puu

R-puu Tavoite: minimoitava todennäköisyys, että hakutilanteessa pitäisi tutkia molemmat alipuut Siksi minimoitava toisaalta solmujen suorakulmioiden yhteenlaskettu ala ja toisaalta niiden leikkauksen ala Tämän optimointi tärkeää solmujen halkaisussa Lisäysjärjestys vaikuttaa

R*-puu Erilainen halkaisualgoritmi Pakotettu uudelleenlisäys: ennen halkaisua poistetaan solmusta keskipisteestä kauimpana oleva 1 3 kohteista lisätään ne uudelleen puuhun Molemmat muutokset parantavat lopputuloksena saatavaa puuta Käytännössä vaikutus ei ole dramaattisen suuri, jos puuhun tehdään jatkuvasti muutoksia

GiST-puu Yleiskäyttöinen hakupuu: mm. B-puun toiminnallisuus R-puun toiminnallisuus Puun alemmalla tasolla ei tarvitse toistaa ylempänä olevia ehtoja Riittää, että ehto erottaa samasta solmusta haarautuvat alipuut toisistaan

Kyselyt indeksin avulla Indeksissä sijaintitiedon approksimaatio Indeksin osumista yleensä tarkistettava, täyttävätkö tarkan hakuehdon Topologiset kyselyt Etsitään indeksistä leikkaavat suorakulmiot Mahdollisesti käytettävä puskuria Suuntakyselyt Haetaan puusta solmut, joissa osumia voi olla Käydään läpi niiden alkiot Näissä askelissa voi olla hiukan eri ehdot

Naapuruuskyselyt Tehtävä: etsi kohteen k lähintä naapuria Hyödyllisiä mittoja: mindist(p, R): lyhin etäisyys pisteestä p suorakulmioon R minmaxdist(p, R): etäisyys, joka vähintään on p:stä kaukaisimpaan R:n sisältämän kohteen pisteeseen Näiden avulla mahdollista karsia tarkasteltavien alipuiden joukkoa

Paikkaliitokset Liitosoperaatio, jossa ehto liittyy sijaintitietoon Tyypillisesti leikkausehto R Rsijainti S sijainti S Ongelma: geometrisen leikkauksen epätyhjyys on vaikeampi testata kuin atomisten arvojen yhtäsuuruus Kaksiosainen operaatio Suodatus minimisuorakulmion perusteella Lopullinen valinta todellisen sijaintitiedon perusteella

Paikkatiedon louhinta Tiedon louhintaa Mielenkiintoisen uuden tiedon etsintää suurista tietoaineistoista Paikkatietoa Mukana sijaintitieto Nämä yhdessä Yhteisesiintymä- ja assosiaatiosääntöjä Autokorrelaatiota Suuren mittakaavan ilmiöitä

Erilaisia aineistoja Erilaisia tekniikoita erilaisille aineistoille Pisteaineistot Yksittäiset kohteet tarkastelumittakaavassa pieniä Kohteiden sijaintisuhteet kiinnostavia Jatkuvat aineistot Ilmiö jatkuva-arvoinen paikan suhteen Havainnot pistemäisiä Alueittaiset aineistot Ominaisuustieto joko liittyy suoraan alueeseen tai on luokiteltu alueellisesti

Spatiaalinen riippuvuus Lähekkäisten paikkojen havainnot yleensä samanlaisempia kuin kaukaisten paikkojen Tämmöinen spatiaalinen riippuvuus oikeastaan approksimaatio jostain ihan muusta Paljon taustamuuttujia, joita ei tunneta Monet näistä spatiaalisesti jatkuvia

Jako kahtia Ensimmäisen kertaluvun vaikutus: suuren mittakaavan ilmiöt Toisen kertaluvun vaikutus: läheisten paikkojen väliset riippuvuudet Näiden välinen raja on tutkijan päässä Eronteko analyysin jäsentämistä varten Rajan paikka riippuu tutkimuksen tavoitteista ja tarkastelumittakaavasta

R Tilasto-ohjelmisto Open Source Käytettävissä TKTL:n Linux-ympäristössä Kohtuullisen kattava valikoima kirjastopaketteja paikkatiedon tilastolliseen analyysiin Muitakin vaihtoehtoja silti tietysti on

Pistekohteet pienessä mittakaavassa Vertailukohta: Poisson-prosessi Vakiointensiteetti, tapahtumat riippumattomia Malli sille, miten käy jos ei spatiaalista korrelaatiota Kaksi peruslähestymistapaa Tarkastellaan kunkin kohteen etäisyyttä lähimpään naapuriinsa Tarkastellaan, mitä tapahtuu rajaetäisyyttä lähempänä kutakin pistettä

Lähimmän naapurin etäisyys F(h): tn, että etäisyys satunnaisesta paikasta lähimpään kuvion pisteeseen h G(h): tn, että etäisyys satunnaisesta kuvion pisteestä lähimpään naapuriin h Jos tapahtumat toisistaan riippumattomia, F(h) G(h)

K-funktio λk(h) = odotusarvo niiden pisteiden lukumäärälle, jotka ovat h-säteisen ympyrän sisällä satunnaisesti valitusta pisteestä Ryvästyminen etäisyydellä h: K(h) > πh 2

Naapurustoon osuvat pisteet Joukon B pisteiden frekvenssi säteellä r joukon A pisteestä koko alueella Assosiaatiosääntö A r B

Aluekohteet pienessä mittakaavassa Autokorrelaatio Moranin I-mitta Gearyn C-mitta Läheisyysmatriisi A B C D E F A 0 1 0 1 1 0 B 1 0 1 0 1 1 C 0 1 0 0 0 1 D 1 0 0 0 1 1 E 1 1 0 1 0 1 F 0 1 1 1 1 0

Aluekohteiden yhteisesiintymät Transaktiopohjaisesta tiedon louhinnasta tuttuja menetelmiä Ilmiön frekvenssin sijasta sen esiintymisalueen pinta-ala suhteessa koko alueeseen Säännöllinen aluejako mahdollista tulkita suoraan transaktioiksi Yhteisesiintymäsääntöjä {A,B} esiintyy n % alueesta Assosiaatiosääntöjä A B varmuudella m %

Pistekohteet suuressa mittakaavassa Intensiteetti: pisteiden tiheyden raja-arvo paikan naapurustossa, jonka pinta-ala 0 Pisteiden lukumäärä tasakokoisissa ruuduissa Ydinestimaatti

Aluekohteet suuressa mittakaavassa Liukuva keskiarvo Esitetään kukin alue naapureidensa keskiarvona Ydinestimointi Muunnetaan alueaineisto pistekuvioksi Median Polish Muodoltaan säännöllisille alueille

Laajan muuttujajoukon yleiskuva Satoja / tuhansia teemakarttoja? Ei kiitos

Dimensioiden karsiminen Pääkomponenttianalyysi Ei-negatiivinen matriisin faktorointi Ryvästys

Kiitos