Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely)

Samankaltaiset tiedostot
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko

Datatähti 2019 loppu

Tuulen viemää. Satelliitit ilmansaasteiden kulkeutumisen seurannassa. Anu-Maija Sundström

Johanna Tamminen, Iolanda Ialongo, Anu-Maija Sundström, Hanna-Kaisa Lindqvist, Ella Kivimäki, Janne Hakkarainen, Seppo Hassinen Ilmatieteen laitos

Polaarisatelliittidataan perustuva lumentunnistusalgoritmi (valmiin työn esittely)

Menetelmä Markowitzin mallin parametrien estimointiin (valmiin työn esittely)

Kirjallisuuskatsaus sisäpistemenetelmiin ja niiden soveltamiseen eri optimointiluokille (valmiin työn esittely)

Puhelintukiasema-antennin säteilykuvion mittaus multikopterilla (Valmiin työn esittely)

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

Trimmitysongelman LP-relaksaation ratkaiseminen sarakkeita generoivalla algoritmilla ja brute-force-menetelmällä

Implementation of Selected Metaheuristics to the Travelling Salesman Problem (valmiin työn esittely)

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen

Harjoitus 7: NCSS - Tilastollinen analyysi

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Seurantalaskimen simulointi- ja suorituskykymallien vertailu (valmiin työn esittely) Joona Karjalainen

Tuotantoprosessin optimaalinen aikataulutus (valmiin työn esittely)

Virheraportoijien virhemäärien jakaumat virhetietokannassa

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Venekilpailu! Esteiden väistely ja hahmon ohjaaminen

Lineaaristen monitavoiteoptimointitehtävien

How to Support Decision Analysis with Software Case Förbifart Stockholm

DIGIBONUSTEHTÄVÄ: MPKJ NCC INDUSTRY OY LOPPURAPORTTI

Vedonlyöntistrategioiden simulointi ja evaluointi

Lisäinformaation arvo monikriteerisessä projektiportfoliovalinnassa (valmiin työn esittely)

Optimaaliset riskinalentamisportfoliot vikapuuanalyysissä (valmiin työn esittely)

Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Työvuorosuunnittelun optimointi (valmiin työn esittely)

Search space traversal using metaheuristics

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9.

Verkko-optimointiin perustuva torjuntatasan laskenta mellakkapoliisin resurssien kohdentamisessa (valmiin työn esittely) Paavo Kivistö

Ohjelmoinnin perusteet Y Python

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

metsämatikkaa Sata käpyä Lukuja metsästä Laskutarina Mittaaminen punaisella narulla Päin mäntyä (metsän yleisin puu)

LUKUKORTIT Lukukorteista on moneksi Toiminnallista matematiikkaa luokille. Riikka Lyytikäinen Liikkuva koulu Helsinki 2016

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lausekielinen ohjelmointi II Ensimmäinen harjoitustyö

Lentotiedustelutietoon perustuva tykistön tulenkäytön optimointi (valmiin työn esittely)

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

RAPORTTI 062/ A/MK/ Martti Kokkola/tk MOREENITUTKIMUS KULLAA SILKUSSUO Tutkimusalueen sijainti

Harjoitus 7 : Aikasarja-analyysi (Palautus )

Taustaa. Opinnäytetyön materiaali kesältä 2017 Mustialan opetusmaatilalta Materiaalit on myös viety internettiin. Hämeen ammattikorkeakoulu

Energiankulutusseuranta Kulutustietojen kerääminen, analysointi ja hyödyntäminen Laatijat: Antti Mäkinen, TAMK

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Vesivoimaketjun optimointi mehiläisalgoritmilla (Valmiin työn esittely)

Hoitotyön henkilöstövoimavarojen hallinnan mallintaminen kansallisesti yhtenäisillä tunnusluvuilla

Kaksintaistelun approksimatiivinen mallintaminen (valmiin työn esittely)

PMS 3298 C. (Sanomalehdessä. 100c, 0m, 50y, 5k) PMS 288 C (Sanomalehdessä 95c, 50m, 10y, 5k)

1 Rajoittamaton optimointi

Kustannustehokkaat riskienhallintatoimenpiteet kuljetusverkostossa (Valmiin työn esittely)

Polkuriippuvuus trade-off-painotuksessa (valmiin työn esittely)

Monte Carlo -menetelmä optioiden hinnoittelussa (valmiin työn esittely)

Taulukkolaskenta (30 pistettä)

Mitä murteita Suomessa onkaan?

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Testit järjestysasteikollisille muuttujille

Tekstuurintunnistuksen lyhyt oppimäärä. Ts. pari tapaa erottaa tiiliseinä pensaasta.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Optimization of Duties in Railway Traffic (valmiin työn esittely)

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

voidaan hylätä, pienempi vai suurempi kuin 1 %?

L9: Rayleigh testi. Laskuharjoitus

Harjoitus 5. Esimerkki ohjelman toiminnasta: Lausekielinen ohjelmointi I Kesä 2018 Avoin yliopisto 1 / 5

Algoritmit 2. Luento 4 To Timo Männikkö

luontopolkuja punaisilla naruilla

Pyhäjoen kunta ja Raahen kaupunki Maanahkiaisen merituulivoimapuiston osayleiskaava

805306A Johdatus monimuuttujamenetelmiin, 5 op

PIKAOPAS 1. Kellotaulun kulma säädetään sijainnin leveys- asteen mukaiseksi.

SELECT-lauseen perusmuoto

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

Tieteellinen laskenta 2 Törmäykset

Ohjelmoinnin peruskurssi Y1

Matematiikan tukikurssi

Todellinen vuosikorko. Efektiivinen/sisäinen korkokanta. Huomioitavaa

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

805306A Johdatus monimuuttujamenetelmiin, 5 op

Asiakaspalautteen monikanavainen keräys ja analyysi (valmiin työn esittely)

Tässä tehtävässä käsittelet metodeja, listoja sekä alkulukuja (englanniksi prime ).

6.6. Tasoitus ja terävöinti

Tutkimuksellinen vai toiminnallinen opinnäytetyö

Ohjelmassa on käytettävä funktiota laskeparkkimaksu laskemaan kunkin asiakkaan maksu. Funktio floor pyöristää luvun lähimmäksi kokonaisluvuksi.

Sovellettu todennäköisyyslaskenta B

Ilmastonmuutos ja ilmastomallit

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Cubature Integration Methods in Non-Linear Kalman Filtering and Smoothing (valmiin työn esittely)

1. Projektin status. 1.1 Tavoitteiden päivitys. 1.2 Tulokset Mallinnus

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 4: Ketjusäännöt ja lineaarinen approksimointi

Transkriptio:

Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely) Viivi Halla-aho 30.9.2013 Ohjaaja: Dos. Johanna Tamminen Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeudet pidätetään.

Sisältö Tausta Tavoitteet ja rajaukset Käytetyt menetelmät Hierarkkinen ryhmittely Reunojen tunnistus Sobel-operaattorilla Autokorrelaatioiden analysointi Tulokset Tuloksien yhteenveto ja päätelmiä Lopuksi

Tausta OMI (Ozone Monitoring Instrument) on Aura-satelliitin instrumentti, josta saadaan pääasiassa otsonituotteita, mutta myös tietoa mm. NO 2 - ja SO 2 -kaasuista, pilvistä, aerosoleista ja UV-valosta. Aerosolituotteessa vuodenaikojen mukaan paikkaa vaihtava anomalia etelässä tai pohjoisessa, joita ei ole poistettu Level 2 -tasoisista tuotteista. Ongelma johtuu vaikeista mittausolosuhteista, joissa auringon tulokulma (atsimuuttikulma) kasvaa liian suureksi.

Tausta Esimerkkikuva anomaliasta. Kuvassa on esitetty aerosolimittaukset päivältä 12.6.2013. Kuvan lähde: temis.nl

Tavoitteet ja rajaukset Poistaa jälkikäteen selkeät virheet niin, että mahdollisimman vähän oikeaa dataa menee hukkaan. Aerosolituotteiden lisäksi muiden tuotteiden (kuten SO 2 ) vastaavien ongelmien korjaus. Menetelmän tulee siis sopia monenlaisen datan käsittelyyn. Tutkitaan erilaisia mahdollisia menetelmiä ja kokeillaan niitä aineistoon. Tarkoituksena on nimenomaan poistaa anomalia jo valmiista kuvasta, eikä puuttua satelliitti-instrumentin antamien mittausten käsittelyyn. Riittää, että kuvasta saadaan vähemmän harhaanjohtava.

Testatut menetelmät Hierarkkinen ryhmittelyanalyysi Reunojen tunnistus (edge detection) Sobel-operaattorilla Autokorrelaatioiden analysointi

Hierarkkinen ryhmittely Etsitään havaintojen ominaisuuksien perusteella ryhmät ja jaetaan havainnot niihin. Tavoite: samassa ryhmässä olevat havainnot mahdollisimman samanlaisia keskenään ja vastaavasti eri ryhmissä olevat havainnot mahdollisimman erilaisia keskenään. Erilaisuutta kuvataan etäisyysmitalla. Ryhmittelyn vaiheet Aluksi kaikki havainnot omia ryhmiään Lähimmät havainnot yhdistetään Toistetaan kunnes kaikki samaa ryhmää Katkaistaan ryhmittely vaiheessa, jolloin ryhmiä on haluttu määrä Voidaan tehdä myös toisin päin, eli ensin kaikki samaa ryhmää ja lopuksi kaikki erillään Hyvän ryhmittelyn tunnistaa siitä, että klusterit erottuvat selvästi toisistaan ja niille voidaan keksiä mielekäs tulkinta.

Reunojen tunnistus Sobel-operaattorilla Yritetään löytää kuvasta reunoja, eli intensiteetin epäjatkuvuuskohtia. Sobel-operaattori pohjautuu gradientin approksimaatioiden laskemiseen kullekin pisteelle. Kynnysarvon ylittävät gradientin magnitudin arvot tulkitaan reunoiksi.

Autokorrelaatioiden analysointi 1/2 Autokorrelaatioita käytetään usein aikasarja-analyysissä kuvaamaan havaintojen riippuvuutta toisistaan havaintojen välisen aikaeron funktiona. Kuinka soveltaa ajatusta satelliittidataan? Ajatellaan dataa leveysasteiden suuntaisina riveinä Anomalia toistuu joka orbitilla tietyssä kohtaa riviä Voidaan laskea autokorrelaatiot rivin havainnoille. Aikaeron sijaan käytetään havaintopikselien indeksien erotusta muuttujana.

Autokorrelaatioiden analysointi 2/2 Mitä autokorrelaatiot kertovat? Autokorrelaatio kertoo, kuinka rivin havainnot riippuvat toisistaan indeksien erotuksen funktiona. Mikäli autokorrelaatiot ovat vahvimmillaan aina orbitin leveyden välein, on kyse etsitystä anomaliasta. Merkitään virheellisiksi rivit jotka täyttävät seuraavat ehdot: Rivillä on tarpeeksi suuria, kynnysarvon ylittäviä autokorrelaatioita tarpeeksi monta kappaletta Autokorrelaatioiden tulee ilmetä indeksin arvoilla, jotka ovat jaollisia orbitin leveydellä (60 pikseliä)

Tulokset: hierarkkinen ryhmittely 1/2 Ryhmitellään OMAERUV-tuotetta päivältä 15.4.2013. Valitaan testihavainnoiksi pieni otos (noin 8300 havaintoa) Ryhmittely tehdään seuraavien ominaisuuksien perusteella: Aerosoli-indeksi Auringon atsimuuttikulma Latitudi Havainnon rivi-indeksi Käytetään R-ohjelmiston fastcluster-paketin hclust-funktiota ryhmittelyyn. Havaintoarvot standardoidaan ennen toimitusta vääristymien välttämiseksi. Valitaan ryhmien lukumääräksi 5.

Tulokset: hierarkkinen ryhmittely 2/2 Saadaan 5 klusteria, jotka on esitetty kartalla omilla väreillään. Punainen vastaa klusteria 1, oranssi klusteria 2, vihreä klusteria 3, turkoosi klusteria 4 ja vaaleansininen klusteria 5. Vain kolme ensimmäistä erottuvat kuvassa. Graafien lisäksi tutkittiin klustereiden ominaisuuksia tilastollisin tunnusluvuin. Klusteri 1: Suuret aerosoli-indeksin arvot, suurehko auringon atsimuuttikulma, mahdollinen virheryhmä? Klusterit 2 ja 3: Pienet tai puuttuvat aerosoli-indeksit, hieman pienemmät auringon atsimuuttikulmat. Klusterit 4 ja 5: Kaikki aerosoli-indeksit puuttuvat, suuret auringon atsimuuttikulmat. Menetelmä vaatii kuitenkin aina jonkun tekemään tulkinnat ryhmille ja tekemään päätöksiä, eikä tee tätä itsenäisesti. Kattava päätöksentekoanalyysi, joka toimisi kaikenlaiselle datalle voisi olla haastavaa tehdä.

Tulokset: reunojen tunnistus 1/2 Aineistona päivän 22.5.2011 aerosolidata Etsitään kuvasta tulivuorenpurkauksen aiheuttama tuhkapilvi. Valitaan kynnysarvoksi T=8 Liian pieni kynnysarvo päästää läpi pienetkin havainnot Liian suuri kynnysarvo hävittää kaiken Testien perusteella T=8 aika hyvä tähän tarkoitukseen

Tulokset: reunojen tunnistus 2/2 Kuvassa esitetty löydetyt aerosoli-indeksin reunat. Menetelmä ei ota kantaa siihen, onko löydetty alue anomalia vai ei. Ei tuo ratkaisua ongelmaan.

Tulokset: autokorrelaatioanalyysi 1/2 Analysoidaan autokorrelaatioita päivän 14.5.2013 UV aerosoli-indeksidatalle. Vaaditaan vähintään 4 kynnysarvon 0,4 ylittävää autokorrelaation arvoa anomaliaa sisältävältä riviltä.

Tulokset: autokorrelaatioanalyysi Autokorreloituneet rivit poistettu kuvasta. Tulos ei ole täydellinen eli menetelmä ei löydä kaikkia selkeitä virheitä. Menetelmä on herkkä epäsäännöllisyydelle.

Tuloksien yhteenveto ja päätelmiä Hierarkkinen ryhmittely Liian hidas! Vaatii paljon raskaita laskentaoperaatioita. Tuloksien hyödyntäminen vaatii päätöksenteon automatisointia. Reunojen etsintä Ei tee sitä mitä halutaan, voi toki olla muuten hyödyllinen. Autokorrelaatioiden analysointi Tulokset ovat lupaavia! Täyttää useimmat vaatimuksista. Ei vielä kovin hienovarainen keino käyttää ak:ta hyväksi.

Lopuksi Kysymyksiä, kommentteja?