Paikkatiedon käsittely 11. Suuren mittakaavan
|
|
- Kaarlo Hämäläinen
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon käsittely 11. Suuren mittakaavan ilmiöt Antti Leino Tietojenkäsittelytieteen laitos
2 Suuren mittakaavan ilmiöt Tässä kolmenlaisia Pistekohteiden 1. kertaluvun vaihtelu pisteiden intensiteetin alueellinen vaihtelu Aluekohteiden 1. kertaluvun vaihtelu yhden alueellisesti esitetyn ilmiön vaihtelu Suuren muuttujajoukon kokonaiskuva varsinaisesti aluekohteille pistekohteet muunnettava alueittaiseksi
3 Pistekuvion 1. kertaluvun vaihtelu Kuvattavissa intensiteettifunktiona E ( Y(ds) ) λ(s) = lim ds 0 ds Y(ds) ds pisteiden tiheys s:n ympäristössä Intensiteetti on tämän odotusarvon raja-arvo, kun ympäristön pinta-ala 0
4 Tiheyden estimointi Jaetaan tutkittava alue tasakokoisiin ruutuihin Lasketaan pisteiden määrä kussakin ruudussa > library(spatstat) > data(swedishpines) > plot(swedishpines$window, + Lukumäärät ruuduittain, + cex.main=2, xlim=c(-30,100)) > xbreaks=seq(0, 96, length=5) > ybreaks=seq(0, 100, length=5) > counts=table(cut(swedishpines$x, + breaks=xbreaks), cut(swedishpines$y, + breaks=ybreaks)) > image(xbreaks, ybreaks, counts, + col=gray((8:1)/8), zlim=c(0,7), + add=t) > plot(swedishpines, add=t, pch=16, col=2) > plot(swedishpines$window, add=t) > legend(-30, 100, 0:7, fill=gray((8:1)/8))
5 Ruuduittaiset lukumäärät Tässä muunnetaan pisteaineisto alueittaiseksi Jatkokäsittely alueaineiston tapaan Osa paikkatiedosta hävitetään Resoluutio valittavissa ruudun kokoa säätämällä Ruutukoon pienentäminen lisää kohinaa
6 Ydinestimaatti Kunkin pisteen ympärille ydinfunktio: kaksiulotteinen normaalijakauma (tai muu tiheysfunktio) Estimoidaan intensiteetti pisteiden välillä näiden summana ˆλ τ (s) = 1 n 1 ( s δ τ (s) τ 2 k si ) τ i=1 s 1,...,s n pisteiden paikat k ydinfunktio τ > 0 siloitusparametri δ τ (s) reunakorjaus
7 Ydinestimaatin siloitusparametri Vaikuttaa tarkastelumittakaavaan > plot(swedishpines, pch=16, col=2) > plot(swedishpines$window, add=t) > library(splancs) > poly=as.points(swedishpines$window$xrange[c(1,2,2,1)], + swedishpines$window$yrange[c(2,2,1,1)]) > plot(swedishpines$window, ) > image(kernel2d(as.points(swedishpines), poly, 5, 200, 200), + col=gray(10:3/10), add=t) > plot(swedishpines$window, add=t) > image(kernel2d(as.points(swedishpines), poly, 10, 200, + 200), col=gray(10:3/10), add=t) > image(kernel2d(as.points(swedishpines), poly, 15, 200, + 200), col=gray(10:3/10), add=t)
8 Alueittaisen aineiston 1. kertaluvun vaihtelu Muutama erilainen menetelmä Liukuva keskiarvo Esitetään kukin alue naapureidensa keskiarvona Ydinestimointi Muunnetaan alueaineisto pistekuvioksi Median Polish Muodoltaan säännöllisille alueille
9 Liukuva keskiarvo Käytetään alueen oman arvon sijasta sen naapurien (etäisyydellä painotettua) keskiarvoa n j=1 w ijy j ˆµ i = n j=1 w ij Lähtökohtana läheisyysmatriisi, kuten I- ja C- mitoissa Jos läheisyysmatriisina on normalisoitu vierusmatriisi, jakaja = 1 Yksinkertainen laskea, jo tietokantaoperaatioilla
10 Alueaineiston ydinestimointi Ydinestimointi sinänsä pistemuotoisen datan analysointimenetelmä Siispä muutetaan alueet pisteiksi Esitetään kukin alue keskipisteenään Lasketaan tälle aineistolle ydinestimaatti Vaihtoehtoisesti myös muut pisteaineiston käsittelymenetelmät käytössä
11 Median Polish»mediaanin kiillotus» Soveltuu säännölliselle ruudukolle Sietää kohinaa paremmin kuin liukuva keskiarvo Esitetään kukin ruutu hajotelmana y ij = µ +r i +c j + ε ij µ globaali keskiarvo r i, c j rivi- ja saraketrendit ε ij satunnaisvirhe
12 Laajan muuttujajoukon yleiskuva Tähänastiset menetelmät tarkastelleet vain yhtä aineistoa (ominaisuustietoa) kerrallaan Tiedon louhinnassa usein suuri joskus hyvinkin suuri määrä muuttujia
13 Dimensionaalisuuden kirous Satojen tai tuhansien teemakarttojen tarkastelu ylivoimaisen työlästä Tehtävä: tiivistä olennainen muutamaan karttaan
14 Yleiskuvan laatiminen Aluekohteille suhteellisen suoraviivaista Käytetään tilastollisia monimuuttujamenetelmiä Tässä vaiheessa sijaintitieto ei käytössä Esitetään tulokset kartalla Pisteaineistot muutettava alueellisiksi Olemassa oleva aluejako Säännöllinen hila Kunkin joukon pisteiden esiintymät alueilla
15 Pisteaineiston muuntaminen alueiksi Valmis aluejako vai hila? Hila on säännöllinen koko ei vaikuta Valmis aluejako ehkä merkityksellinen ei hävitä tietoa ehkä yhtä paljon kuin hila Mitä pisteistä otetaan mukaan? Pisteiden merkit tyypillisesti luokittelevia Erityyppisten pisteiden lukumäärä kullakin alueella? Erityyppisten pisteiden esiintymisfrekvenssi? Binäärinen esiintyy / ei -tieto kustakin tyypistä? Valinta riippuu sovelluksesta
16 Dimensioiden karsiminen Lähtökohta: esitetään data matriisina alueet muuttujat Tavoite: matriisi alueet taustatekijät Taustatekijöitä olennaisesti vähemmän kuin alkuperäisiä muuttujia Kertovat jotakin mielenkiintoista Tyypillinen menetelmä: lineaarimuunnos Kussakin taustatekijässä on mukana jokainen alkuperäinen muuttuja omalla painokertoimellaan Lukuisa määrä erilaisia vaihtoehtoja
17 Pääkomponenttianalyysi Principal Component Analysis (PCA) Lähtökohta: matriisi, jossa n muuttujaa ja m havaintoa Tässä tapauksessa esim. n eri pistejoukkoa ja pisteiden esiintymät m ruudussa Tavoite: lineaarimuunnoksella n komponenttia Komponentit keskenään korreloimattomia 1. komponentti sisältää mahdollisimman suuren osan kokonaisvarianssista Kukin seuraava sisältää mahdollisimman suuren osan jäljellä olevasta varianssista
18 Pääkomponenttianalyysi Lineaarimuunnos: kukin komponentti muotoa c i = a i1 x 1 + +a in x n Tehtävänä siis määrittää kaikki n n painokerrointa a ij Komponentit eivät korreloi keskenään Havainnot voidaan tulkita pisteiksi n-ulotteisessa avaruudessa Pääkomponenttianalyysi tämän tulkinnan mukaan koordinaatiston kierto
19 Pääkomponenttianalyysi havaintoavaruudessa Tulkitaan kukin muuttuja n-ulotteisen havaintoavaruuden ulottuvuudeksi Koordinaatiston kierto 1. komponentti / akseli se suunta, jossa ääripisteet kauimpana kukin myöhemmistä se aiempien kanssa kohtisuora suunta, jossa jäljellä pisin vaihteluväli
20 Pääkomponenttianalyysin rajoituksia Jokainen komponentti esittää vaihtelun kahden ääripään välillä Ei siis välttämättä vain yhden tekijän vaikutusta Aiempiin komponentteihin eristettyä vaihtelua ei toisteta Komponentit eivät korreloi keskenään Todelliset taustalla vaikuttavat ilmiöt voivat korreloida Oletus, että havainnot jatkuva-arvoisia Käytännössä myös 1/0-esiintymäaineiston analysointi onnistuu
21 1. komponentti kunnan keruuaste, loput murrevaihtelua Melko pian komponenteille ei enää luontevaa tulkintaa Pääkomponenttianalyysi: esimerkki Aineisto: murresanan esiintymät eri kunnissa
22 Ei-negatiivinen matriisin faktorointi Non-negative Matrix Factorisation (NMF) Lähtökohta edelleen n m havaintomatriisi Tavoite: k komponenttia, missä k n Rajoite: kaikki matriisit ei-negatiivisia Tämä erotuksena perinteiseen faktorianalyysiin Pätee monelle ominaisuustiedolle, erityisesti binääriselle esiintymätiedolle
23 Ei-negatiivinen matriisin faktorointi Aineisto: Suomen paikannimet, n eri nimeä, 40 40km ruudut Faktorit helpommin tulkittavissa kuin pääkomponentit Lukumäärä tiedettävä / arvattava ennalta
24 Klusterointi Ryvästys Jaetaan aineisto rypäisiin niin, että Samaan rypääseen kuuluvat alkiot mahdollisimman samanlaisia Eri rypäisiin kuuluvat mahdollisimman erilaisia Lukuisa määrä erilaisia tekniikoita Tässä lähtökohtana jälleen alueet ilmiöt -matriisi
25 Klusterointi: K-means Lähtötietoina havaintomatriisi ja haluttu ryväslukumäärä k Rypäiden keskipisteiksi arvotaan k satunnaista havaintoavaruuden pistettä Sijoitetaan kukin havainto siihen rypääseen, jonka keskipiste lähimpänä Lasketaan ryväskeskipisteet uudelleen rypään pisteiden perusteella Toistetaan kahta edellistä askelta, kunnes ryvästys ei muutu
26 Esimerkki: K-means Lähtökohta: murresanojen esiintymät Esiprosessointi: pääkomponenttianalyysi 1. komponentti häiriötekijä pois Loppupään komponentit kohinaa pois Nyrkkisääntö: yhtä paljon komponentteja kuin rypäitä
27 Muutakin voi tehdä Tässä oli joukko työkaluja Paljon lisääkin on tarjolla Erilaisia variantteja näistä Vielä muuta Tämmöisillä pääsee alkuun Tulosten visualisointi tärkeää Analyysin tulokset (takaisin) paikkatietojärjestelmään
Paikkatiedon käsittely 10. Aluekohteiden yhteisesiintymät
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon käsittely 10. Aluekohteiden yhteisesiintymät Antti Leino antti.leino@cs.helsinki.fi 15.2.2007 Tietojenkäsittelytieteen laitos
LisätiedotMitä murteita Suomessa onkaan?
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Mitä murteita Suomessa onkaan? Antti Leino antti.leino@cs.helsinki.fi 9. syyskuuta 2006 Tietojenkäsittelytieteen laitos Kotimaisten kielten
LisätiedotPaikkatiedon käsittely 12. Yhteenveto
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon käsittely 12. Yhteenveto Antti Leino antti.leino@cs.helsinki.fi 22.2.2007 Tietojenkäsittelytieteen laitos Kurssin sisältö
LisätiedotLaskennallinen data-analyysi II
Laskennallinen data-analyysi II Ella Bingham, ella.bingham@cs.helsinki.fi Kevät 2008 Muuttujien valinta Kalvot perustuvat Saara Hyvösen kalvoihin 2007 Laskennallinen data-analyysi II, kevät 2008, Helsingin
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotVisualisointi kansanedustajista neljässä eri ulottuvuudessa
Visualisointi kansanedustajista neljässä eri ulottuvuudessa Jaakko Talonen talonen.dm@gmail.com Johdanto Helsingin Sanomat julkaisi eduskuntavaalien 2011 vaalikoneensa avoimena tietona. Vaalikoneen tietojen
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Faktorianalyysi (Factor analysis) Faktorianalyysi jaetaan perinteisesti kahteen osaan Eksploratiiviseen (explorative factor analysis)
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotA = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:
11 Determinantti Neliömatriisille voidaan laskea luku, joka kertoo muun muassa, onko matriisi kääntyvä vai ei Tätä lukua kutsutaan matriisin determinantiksi Determinantilla on muitakin sovelluksia, mutta
LisätiedotLaskennallinen data-analyysi II
Laskennallinen data-analyysi II Saara Hyvönen, Saara.Hyvonen@cs.helsinki.fi Kevät 2007 Muuttujien valinta Laskennallinen data-analyysi II, kevät 2007, Helsingin yliopisto Korkeiden ulottuvuuksien kirous
LisätiedotLaskennallinen data-analyysi II
Laskennallinen data-analyysi II Saara Hyvönen, Saara.Hyvonen@cs.helsinki.fi Kevät 2007 Ulottuvuuksien vähentäminen, SVD, PCA Laskennallinen data-analyysi II, kevät 2007, Helsingin yliopisto visualisointi
LisätiedotLatinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt
TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,
Lisätiedot9. Tila-avaruusmallit
9. Tila-avaruusmallit Aikasarjan stokastinen malli ja aikasarjasta tehdyt havainnot voidaan esittää joustavassa ja monipuolisessa muodossa ns. tila-avaruusmallina. Useat aikasarjat edustavat dynaamisia
LisätiedotSovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi
Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi 28.4.2013 Annemari Auvinen (annauvi@st.jyu.fi) Anu Niemi (anniemi@st.jyu.fi) 1 Sisällysluettelo 1 JOHDANTO... 2 2 KÄYTETYT MENETELMÄT...
LisätiedotTalousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu
Talousmatematiikan perusteet: Luento 14 Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu Luennolla 6 Tarkastelimme yhden muuttujan funktion f(x) rajoittamatonta optimointia
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 21. syyskuuta 2007 Antti Rasila () TodB 21. syyskuuta 2007 1 / 19 1 Satunnaismuuttujien riippumattomuus 2 Jakauman tunnusluvut Odotusarvo Odotusarvon ominaisuuksia
LisätiedotKatsaus suomalaisen henkilönimistön maantieteelliseen vaihteluun
Kotimaisten kielten tutkimuskeskus Forskningscentralen för de inhemska språken Research Institute for the Languages of Finland Katsaus suomalaisen henkilönimistön maantieteelliseen vaihteluun Antti Leino
LisätiedotTalousmatematiikan perusteet: Luento 13. Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu
Talousmatematiikan perusteet: Luento 13 Rajoittamaton optimointi Hessen matriisi Ominaisarvot ja vektorit Ääriarvon laadun tarkastelu Viime luennolla Aloimme tarkastella yleisiä, usean muuttujan funktioita
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotPaikkatiedon käsittely 6. Kyselyn käsittely
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon käsittely 6. Kyselyn käsittely Antti Leino antti.leino@cs.helsinki.fi 1.2.2007 Tietojenkäsittelytieteen laitos Kysely indeksin
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotMoniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotIlkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotKeskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)
Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
Lisätiedot3 Suorat ja tasot. 3.1 Suora. Tässä luvussa käsitellään avaruuksien R 2 ja R 3 suoria ja tasoja vektoreiden näkökulmasta.
3 Suorat ja tasot Tässä luvussa käsitellään avaruuksien R 2 ja R 3 suoria ja tasoja vektoreiden näkökulmasta. 3.1 Suora Havaitsimme skalaarikertolaskun tulkinnan yhteydessä, että jos on mikä tahansa nollasta
LisätiedotOtannasta ja mittaamisesta
Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
LisätiedotYhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.
2. MS-A4/A6 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 5.9.25 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x + x 2
LisätiedotVastepintamenetelmä. Kuusinen/Heliövaara 1
Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,
LisätiedotMS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 1: Moniulotteiset integraalit
MS-A35 ifferentiaali- ja integraalilaskenta 3 Luento : Moniulotteiset integraalit Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Syksy 26 Antti Rasila (Aalto-yliopisto) MS-A35 Syksy
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
LisätiedotNeuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotBatch means -menetelmä
S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 1(9) Batch means -menetelmä Batch means -menetelmää käytetään hyvin yleisesti Simulointi suoritetaan tässä yhtenä pitkänä ajona olkoon simuloinnin
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
LisätiedotSallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,
Todennäköisyyslaskenta, 2. kurssikoe 7.2.22 Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu.. Satunnaismuuttujien X ja Y yhteistiheysfunktio on
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
LisätiedotEsimerkki: Tietoliikennekytkin
Esimerkki: Tietoliikennekytkin Tämä Mathematica - notebook sisältää luennolla 2A (2..26) käsitellyn esimerkin laskut. Esimerkin kuvailu Tarkastellaan yksinkertaista mallia tietoliikennekytkimelle. Kytkimeen
LisätiedotMatriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41
MS-A0004/MS-A0006 Matriisilaskenta, I/06 Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 4 Tehtävä 5 (L): a) Oletetaan, että λ 0 on kääntyvän matriisin A ominaisarvo. Osoita, että /λ on matriisin A
LisätiedotPaikkatiedon käsittely 4. Diskreettiä geometriaa
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon käsittely 4. Diskreettiä geometriaa Antti Leino antti.leino@cs.helsinki.fi 25.1.2007 Tietojenkäsittelytieteen laitos Laskentatarkkuuden
LisätiedotKaksisuuntainen varianssianalyysi. Heliövaara 1
Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotDynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
LisätiedotTeema 3: Tilastollisia kuvia ja tunnuslukuja
Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin
LisätiedotMallipohjainen klusterointi
Mallipohjainen klusterointi Marko Salmenkivi Johdatus koneoppimiseen, syksy 2008 Luentorunko perjantaille 5.12.2008 Johdattelua mallipohjaiseen klusterointiin, erityisesti gaussisiin sekoitemalleihin Uskottavuusfunktio
LisätiedotMiten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?
21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä
LisätiedotJäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä
Jäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä Hypermedian jatko-opintoseminaari 2008-2009 20.3.2009 Jaakko Salonen TTY / Hypermedialaboratorio jaakko.salonen@tut.fi
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
Lisätiedot3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä
1 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Johdatus monimuuttujamenetelmiin Luennot 30.10.13.12.-18 Tiistaina klo 12-14 (30.10., BF119-1) Keskiviikkoisin klo 10-12 (MA101,
LisätiedotDatatähti 2019 loppu
Datatähti 2019 loppu task type time limit memory limit A Summa standard 1.00 s 512 MB B Bittijono standard 1.00 s 512 MB C Auringonlasku standard 1.00 s 512 MB D Binääripuu standard 1.00 s 512 MB E Funktio
LisätiedotPaikkatiedon käsittely 8. Spatiaalinen riippuvuus
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon käsittely 8. Spatiaalinen riippuvuus Antti Leino antti.leino@cs.helsinki.fi 8.2.2007 Tietojenkäsittelytieteen laitos Mistä
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
LisätiedotTässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:
4. Tyhjentyvyys Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä: Voidaanko päätelmät perustaa johonkin tunnuslukuun t = t(y) koko aineiston y sijasta? Mitä
LisätiedotParetoratkaisujen visualisointi
Paretoratkaisujen visualisointi Optimointiopin seminaari - Kevät 2000 / 1 Esityksen sisältö Vaihtoehtoisten kohdevektorien visualisointi Arvopolut Palkkikaaviot Tähtikoordinaatit Hämähäkinverkkokaavio
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotTilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.
Kertaus Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Luokiteltu aineisto. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo. Hajontaluvut luokittelemattomalle
LisätiedotJohdatus verkkoteoriaan 4. luento
Johdatus verkkoteoriaan 4. luento 28.11.17 Viikolla 46 läpikäydyt käsitteet Viikolla 47 läpikäydyt käsitteet Verkko eli graafi, tasoverkko, solmut, välit, alueet, suunnatut verkot, isomorfiset verkot,
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotLuku 4. Vektoridatan tiivistäminen
1 / 35 Luku 4. Vektoridatan tiivistäminen T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 7.11.2011 2 / 35 Tämän luennon sisältö 1 Vektoridatan
LisätiedotPaikkatiedon hallinta ja analyysi
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon hallinta ja analyysi Antti Leino Marko Salmenkivi 15.3.29.4.2005
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
Lisätiedot1 Määrittelyjä ja aputuloksia
1 Määrittelyjä ja aputuloksia 1.1 Supremum ja infimum Aluksi kerrataan pienimmän ylärajan (supremum) ja suurimman alarajan (infimum) perusominaisuuksia ja esitetään muutamia myöhemmissä todistuksissa tarvittavia
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotMatematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
LisätiedotKuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t
Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Valkoinen kohina ε t 2 1 0 1 2 Voimme tehdä saman laskun myös yleiselle välille [ a, a], missä 0 < a
LisätiedotYhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.
2. MS-A000 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2..205 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x x 2 =
LisätiedotLohkoasetelmat. Vilkkumaa / Kuusinen 1
Lohkoasetelmat Vilkkumaa / Kuusinen 1 Motivointi 1/3 Kaksisuuntaisella varianssianalyysilla voidaan tutkia kahden tekijän A ja B vaikutusta sekä niiden yhdysvaikutusta tutkimuksen kohteeseen Kaksisuuntaisessa
Lisätiedot2 k -faktorikokeet. Vilkkumaa / Kuusinen 1
2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta
LisätiedotOletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen
Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä
LisätiedotYhteenlaskun ja skalaarilla kertomisen ominaisuuksia
Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia Voidaan osoittaa, että avaruuden R n vektoreilla voidaan laskea tuttujen laskusääntöjen mukaan. Huom. Lause tarkoittaa väitettä, joka voidaan perustella
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.04 Tilastollisen analsin perusteet, kevät 007. luento: Kaksisuuntainen varianssianalsi Kai Virtanen Kaksisuuntaisen varianssianalsin perusasetelma Jaetaan perusjoukko rhmiin kahden tekän A ja B suhteen
Lisätiedot30A02000 Tilastotieteen perusteet
30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi
Lisätiedot5.7 Uskottavuusfunktioon perustuvia testejä II
5.7 Uskottavuusfunktioon perustuvia testejä II Tässä pykälässä pohditaan edellä tarkasteltujen kolmen testisuureen yleistystä malleihin, joiden parametri on useampiulotteinen, ja testausasetelmiin, joissa
LisätiedotMS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48
MS-A3/A5 Matriisilaskenta Malliratkaisut 5 / vko 48 Tehtävä (L): a) Onko 4 3 sitä vastaava ominaisarvo? b) Onko λ = 3 matriisin matriisin 2 2 3 2 3 7 9 4 5 2 4 4 ominaisvektori? Jos on, mikä on ominaisarvo?
LisätiedotLineaariset luokittelumallit: regressio ja erotteluanalyysi
Lineaariset luokittelumallit: regressio ja erotteluanalyysi Aira Hast Johdanto Tarkastellaan menetelmiä, joissa luokittelu tehdään lineaaristen menetelmien avulla. Avaruus jaetaan päätösrajojen avulla
LisätiedotLineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila
Lineaarialgebra ja matriisilaskenta II Syksy 29 Laskuharjoitus (9. - 3..29) Ratkaisuehdotuksia Vesa Ala-Mattila Tehtävä. Olkoon V vektoriavaruus. Todistettava: jos U V ja W V ovat V :n aliavaruuksia, niin
LisätiedotMäärätty integraali. Markus Helén. Mäntän lukio
Määrätty integraali Markus Helén Pinta-ala Monikulmio on tasokuvio, jota rajoittaa suljettu, itseään leikkaamaton murtoviiva. Monikulmio voidaan aina jakaa kolmioiksi. Alueen pinta-ala on näiden kolmioiden
LisätiedotOtanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
LisätiedotMS-A0003/A0005 Matriisilaskenta Malliratkaisut 4 / vko 47
MS-A3/A5 Matriisilaskenta Malliratkaisut 4 / vko 47 Tehtävä 1 (L): Oletetaan, että AB = AC, kun B ja C ovat m n-matriiseja. a) Näytä, että jos A on kääntyvä, niin B = C. b) Seuraako yhtälöstä AB = AC yhtälö
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Pääkomponenttianalyysi (PCA, Principle component analysis) Tarkastellaan n havaintoyksikön havaintoaineistoa, joka pitää sisällään
LisätiedotMS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 1: Moniulotteiset integraalit
MS-A35 ifferentiaali- ja integraalilaskenta 3 Luento 1: Moniulotteiset integraalit Antti Rasila Aalto-yliopisto Syksy 215 Antti Rasila (Aalto-yliopisto) MS-A35 Syksy 215 1 / 24 Skalaarikenttä Olkoon R
Lisätiedot