DOB valmennus Data-analyysi. Esiprosessointi Jyrki Rasku cc by by/4.0/deed.
|
|
- Sakari Tikkanen
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 DOB valmennus Data-analyysi Esiprosessointi Jyrki Rasku cc by by/4.0/deed.fi
2 Data ja informaatio Data liittyy johonkin asiayhteyteen ja se saattaa sisältää informaatiota Datan sisältämä informaatio ei ole yksikäsitteistä, vaan sillä on erilainen merkitys informaation käyttäjälle Dataan liittyvä oivallus on sen sisältämän itselle hyödyllisen informaation löytämisessä ja sen hyödyntämisessä
3 Esimerkkidatoja ja joitain tulkintoja Konekirjoitettu tekstidokumentti (asia) Käsinkirjoitettu tekstidokumentti (tunne) Ääni (varoitus, assosiaatio) Haju (varoitus, assosiaatio) Valokuva (kohde, kuvausmenetelmä)
4 Data-analyysin vaiheet Datan kerääminen->aihealueen kattava data Datan esiprosessointi->havaintomatriisi Tutkiva data-analyysi->mitä datasta voi löytyä? Mallien valinta ja muodostaminen Mallin hyvyyden tarkastelu Mallin käyttö ja tilastotiedon ylläpito
5 Datan kerääminen Ennen datan keräämistä mieti tarkkaan, mihin kysymykseen etsit datan avulla vastausta Selvitä onko dataa saatavilla valmiina Missä muodossa data on? (Vanhat levyt ja tiedostomuodot voivat aiheuttaa lisäkuluja) Tarvitseeko kaikkea dataa tallettaa? (Big Data) Miten saatat datan sellaiseen muotoon, että sitä voi tutkia
6 Datan luonne Riippumattomat havaintoyksiköt Riippuvat havaintoyksiköt Aikariippuvuus Tilariippuvuus
7 Havaintoyksikkö Yksittäistä havaintoa kuvataan havaintoavaruudessa vektorilla, joka lähtee havaintoavaruuden origosta ja päättyy johonkin havaintoavaruuden pisteeseen p=(x,y)
8 Havaintomatriisi Havaintomatriisi sisältää riveinään kaikki tarkasteltavat havintoyksiköt Havaintomatriisin sarakkeet sisältävät tarkasteltavan ilmiön muuttujat NxP matriisissa on N havaintoa ja jokaisen havainnon dimensio on P Eheä havaintomatriisi saadaan datan esiprosessointivaiheen tuloksena Havaintomatriisin avulla tehdään kaikki analyysit
9 Muuttujien tyypit (1/2) Muuttujan tyyppi kertoo, mitä laskutoimituksia muuttujalla voidaan tehdä Nominaaliasteikko nimeää muuttujat. Yhtäsuuruus/erisuuruus ja moodi Järjestysasteikko järjestää muuttujat jonkin ominaisuuden mukaan. Suurempi, pienempi, lyhyempi jne...
10 Muuttujien tyypit (2/2) Intervalliasteikko antaa järjestyksen lisäksi myös täsmällisen välimatkan muuttujien arvoille. Lämpötila Celsiusasteina Suhdeasteikko antaa täsmällisen välimatkan lisäksi myös tulkinnan sille, että jokin ominaisuus häviää kokonaan. Esim pisteeseen vaikuttava voima
11 Diskreetti ja jatkuva Diskreetti data saa arvoja vain tietyissä kohdissa ja Sen arvoalue on rajoitettu. Digitaaliset järjestelmät ovat tyypillisesti diskreettejä. Jatkuva data voi saada mielivaltaisen tarkkoja arvoja missä tahansa kohdassa. Analogiset järjestelmät ovat tyypillisesti jatkuvia.
12 Mittausvirheet (1/6) Lähes kaikessa mittaamisessa on mukana virhettä, jota ei voida täysin poistaa Mittausvirhe on joko systemaattista tai satunnaista Systemaattinen virhe on hallittavissa, mutta satunnaisvirhettä voidaan hallita vain johonkin rajaan saakka. (Parempi mittalaite)
13 Mittausvirheet (2/6) Satunnaisvirhe levittää havaintoja oikean mittauspisteen ympäristöön Systemaattinen virhe siirtää Satunnaisvirheen muodostamaa kuvaajaa oikean mittauspisteen suhteen
14 Mittausvirheet (3/6) Yksittäinen mittaus liittyy aina johonkin ajanhetkeen Analysoitava data voi vaihdella sellaisten olosuhteiden vaikutuksesta, joita ei datasta saa suoraan selville
15 Mittausvirheet (4/6) Ajalliset ympäristön muutokset voivat vaikuttaa mittaustuloksiin. Esimerkiksi metallin työstökoneen ympäristön lämpeneminen
16 Mittausvirheet (5/6) Rinnakkaiset havainnot samasta ilmiöstä sisältävät ajallisen ja paikallisen muutoksen aiheuttaman virheen. Esim. säähavaintoasemat
17 Mittausvirheet (6/6) Yksittäinen mittaus koostuu kahdesta osasta z ja ẑ. Tässä z on teoreettinen oikea mittausarvo ja ẑ on mittausarvon estimaatti Nyt mittausvirhe v=e(ẑ)-z Näin ollen täsmällisen mittausvirheen määrittäminen on teoreettinen käsite ja sitä hallitaan valitsemalla tilanteeseen parhaiten sopiva mittalaite
18 Kirjallisuudessa lähdetään usein liikkeelle valmiista datasta Data-analyysin vaiheet Esikäsittely
19 Datan esikäsittely Puuttuvat arvot Poikkeavat havainnot Metriikat ja skaalaus Suodatus Muunnokset Piirteiden irroitus Datapisteiden esitysavaruuden ulottuvuuksien vähentäminen
20 Puuttuvat arvot (1/3) Usein joistakin havaintoyksiköistä yksi tai useampi muuttuja puuttuu kokonaan Muuttujan puuttuminen voi olla satunnaista tai sillä on syy, joka pitää ottaa huomioon analyysiä tehdessä Jos dataa on runsaasti, sellaiset havaintoyksiköt poistetaan datasta, joista muuttujia puuttuu (listwise deletion)
21 Puuttuvat arvot (2/3) Jos dataa on niukasti, niin puuttuvia muuttujien arvoja pitää korvata. Tätä menettelyä sanotaan imputoinniksi Keinotekoinen datan imputointi tuottaa epävarmuutta, mutta se mahdollistaa analyysin tekemisen
22 Puuttuvat arvot (3/3) Puuttuva muuttujan arvo voidaan korvata muiden havaintoyksiköiden ko. muuttujan keskiarvolla Muodostamalla regressiomalli muista muuttujista ja ennustamalla mallilla puuttuvaa arvoa EM (Expectation Maximization) algoritmilla. R Amelia II paketti
23 Poikkeavat havainnot (1/5) Poikkeava havainto on sellainen, jossa yksi tai useampi muuttuja saa sellaisia arvoja, jotka poikkeavat paljon keskimääräisestä muuttujan arvosta (outliers) Poikeava havainto voi olla järkevä tai virheellinen. Esim pulssi 30 ja 0 Poikkeava havainto voi olla artefakti, eli keinotekoisesti mukana datassa
24 Poikkeavat havainnot (2/5)
25 Poikkeavat havainnot (3/5) >upper quartile+1.5iqr maximum Interquartile range IQR minimum <lower quartile-1.5iqr Laatikkokuvaaja (Box plot) on hyödyllinen poikkeavien havaintojen visualisoinnissa
26 Poikkeavat havainnot (4/5) Normaalisti jakautuneen datan yhteydessä käytetään poikkeavan havainnon rajana kahta tai kolmea keskihajonnan mittaa keskiarvosta
27 Poikkeavat havainnot (5/5) Artefakti Maksasolujen tumia kuvattu mikroskoopin läpi
28 Laskennan perusideoita (1/2) Datapisteiden x=(x 1,...,x n ) ja y=(y 1,...,y n ) vertaileminen on mahdollista vertailemalla niiden samankaltaisuutta tai erilaisuutta Yleisesti tunnettu samankaltaisuuden mitta on pisteiden x ja y välinen Euklidinen etäisyys Jos datapisteiden samanlaisuus on s(x,y), niin niiiden erilaisuus voidaan ilmaista vaikkapa muodossa ds=1-s(x,y)
29 Laskennan perusideoita (2/2) Samankaltaisuudesta voidaan käyttää myös nimitystä läheisyys (proximity) Metriikka on hyvin määritelty kahden tai useamman pisteen välisen etäisyyden käsite
30 Metriikka
31 Etäisyysmittoja (1/3) Minkowski Mahalanobis
32 Etäisyysmittoja (2/3) Korrelaatiokerroin r kuvaa vektoreihin x ja y sisältyvien yksittäisten muuttujien välistä lineaarista yhteisvaihtelua. (Ei mittaa riippuvuutta) Voi saada arvot [-1 1] r 1 r -1 r 0
33 Etäisyysmittoja (3/3) Kosinimittaa käytetään usein tekstidokumenttien vertailussa
34 Samankaltaisuusmittoja (1/2) Pällekkäisyys mitta Esimerkiksi vektorien X=(0,1,2) ja y=(1,0,0) päällekkäisyys on 0 Dice Jaccard Kosini
35 Samankaltaisuusmittoja (2/2) Gower similarity w k on 1, jos x k ja y k on olemassa ja 0, jos toinen puuttuu. Tämä pystyy siis käsittelemään puuttuvaa tietoa
36 Binaaridatan samankaltaisuus Binaariarvoisten havaintoyksiköiden samankaltaisuutta voidaan soveltaa, jos kaikki datan muuttujat ovat binaarisia v 1 v 2
37 Binaarimittoja (1/4) Hamming etäisyys kuvaa binaarivektoreiden komponenttien erilaisuuksien lukumäärää. Sokal ja Michener antaa täsmäävien kohtien suhteellisen osuuden
38 Binaarimittoja (2/4) Jaccardin täsmäyskerroin antaa täsmäävien ykkösten osuuden ja jättää täsmäävät nollat pois Dice Russel ja Rao Sokal ja Sneath
39 Binaarimittoja (3/4) Kulzinsky ja Rogers Tanimoto
40 Binaarimittoja (4/4) Yulen binaarikorrelaatio Binaarikorrelaatio
41 Sekatyyppisten datojen mittoja Heterogenous Euclidean overlap measure
42 Normalisointi ja skaalaus (1/3) Usein havaintoyksiköiden muuttujien arvoalueet poikkeavat huomattavasti toisistaan Autoa voidaan esimerkiksi kuvata vektorilla A=(paino,kulutus). Yksittäinen havainto voisi olla vaikkapa A=(1300,5) ja B=(1500,7) Jos autojen A ja B samankaltaisuutta mitataan niiden välisellä Euklidisella etäisyydellä, niin saadaan d(a,b)=sqrt((200) 2 +(2) 2 )
43 Normalisointi ja skaalaus (2/3) Etäisyyden d(a,b) laskennassa painojen erotus saa tyypillisesti paljon suurempia arvoja, kuin kulutusten erotus. Tällön kulutuksen vaikutus etäisyyteen on pieni. Painon suuri arvo dominoi etäisyyden laskennassa. Jotta jokaisella muuttujalla olisi yhtä suuri vaikutus etäisyyden laskennassa, on muuttujien arvoalueet saatava samansuuruisiksi
44 Normalisointi ja skaalaus (3/3) i:nnen havaintoyksikön k:s muuttuja skaalataan välille [0,1] Normalisoinnissa jokaisen havaintoyksikön i k:nnesta muuttujasta vähennetään ko. muuttujan keskiarvo ja erotus jaetaan ko. muuttujan keskihajonnalla. Normalisoitujen arvojen keskiarvo on 0 ja keskihajonta on 1.
45 Suodatus (1/2) Suodatus riippuu voimakkaasti sovellusalueesta, mutta perusajatuksena on poistaa, tai vähentää datassa olevaa häiritsevää ilmiötä Tekstidatan analyysissä voidaan poistaa tietyt sanat Digitaalisen signaalin käsittelyssä voidaan vaimentaa jotain signaalin ominaisuutta
46 Suodatus (2/2) Digitaalisen signaalin käsittelyssä helpoin suodatin on ns. liukuva keskiarvo Paremmin tilanteeseen sopivia suotimia voidaan suunitella joko aika- tai taajuustasossa Usein digitoitava analoginen signaali suodatetaan valmiiksi jollakin laitetason ratkaisulla
47 Muunnokset (1/3) Tilastollisissa menetelmissä dataan tehdään muunnoksia yleensä sen vuoksi, että datan jakauma saadaan halutuksi. Menetelmät olettavat yleensä jonkin jakauman, mutta monesti data ei sovi hyvin oletettuihin jakaumiin Toisaalta jokin muunnos voi tuoda datassa olevan mielenkiintoisen ominaisuuden paremmin esille
48 Muunnokset (2/3) Signaalinkäsittelyssä ja aikasarja-analyysissä yleisin muunnos lienee Fourier muunnos, jonka avulla pyritään selvittämään minkälaisia taajuuksia tarkasteltava signaali sisältää
49 Muunokset (3/3) Maksasolujen tumien reunat vieräkkäisten harmaasävyjen muutosten voimakkuuksien avulla
50 Piirteiden irroitus (1/3) Piirteiden irroitus tarkoittaa sitä, että havaintoyksiköistä valitaan sellaiset muuttujat, jotka ovat tehtävän analyysin kannalta oleellisia Valituille muuttujille voidaan edelleen tehdä tarvittavia muunnoksia Tässä vaiheessa on tärkeää kysyä neuvoa aihealueen asiantuntijalta. Toisaalta sovelluksen loppukäyttäjä voi tietää vielä paremmin
51 Piirteiden irroitus (2/3) Digikuvan esittäminen paikallisilla histogrammeilla
52 Piirteiden irroitus (3/3) Freemanin ketjukoodi kuvalle
53 Datapisteiden tarkasteluavaruuden ulottuvuuksien vähentäminen (1/5) Kaikille analyysimentelmille on yhteistä se, että havaintoyksiköiden (havantovektorien) määrä N on suuri ja ja niiden muuttujien lukumäärä P on pieni Sovelluksen kannalta on usein selvää, että jotkin muuttujista voidaan jättää pois, koska ne eivät sisällä analyysin kannalta oleellista informaatiota
54 Datapisteiden tarkasteluavaruuden ulottuvuuksien vähentäminen (2/5) Jos jollain muuttujalla on sama arvo (vakio) kaikilla havaintoyksiköillä, niin se jätetään pois Jos jonkin muuttujan hajonta on pieni, niin sen voi jättää pois Keskenään voimakkaasti korreloivista muuttujista voidaan osa jättää pois (mittaavat osittain samaa ilmiötä)
55 Datapisteiden tarkasteluavaruuden ulottuvuuksien vähentäminen (3/5) Pääkomponenttianalyysissä etsitään datalle uusi koordinaatisto siten, että ensimmäinen suunta on datan suurimman vaihtelun suunnassa
56 Datapisteiden tarkasteluavaruuden ulottuvuuksien vähentäminen (4/5)
57 Datapisteiden tarkasteluavaruuden ulottuvuuksien vähentäminen (5/5)
58 Tutkiva analytiikka (1/4) Havaintomatriisi on nyt valmis ja data korjattu Iteratiivinen prosessi on myös tässä kohdassa
59 Tutkiva analytiikka (2/4) Kun havaintomatriisi on valmis, dataa kannattaa visualisoida ja siitä voi laskea tyypillisimpiä tilastollisia tunnuslukuja. Keskiarvo, mediaani, moodi jne... Tutkivan analyysin tarkoituksena on miettiä mitä informaatiota datasta voi ylipäänsä löytää Tutkivan analyysin jälkeen tehdään varsinainen ennustava analyysi
60 Tutkiva analytiikka (3/4) Artefakti Saturaatio Maksasolutumien kuvan harmaasävyjen histogrammi
61 Tutkiva analytiikka (4/4) Pisteparvella voi havainnollistaa muuttujien sijoittumista piirreavaruudessa
62 Ennustava analytiikka (1/3) Ennustavassa analyysissä pyritään ennustamaan sellaisen havainnon arvoa tai luokkaa, jota ei olla aikaisemmin havaittu Regressioanalyysissä ennustetaan muuttujien arvoja (kts. mallintaminen ) Luokitteluanalyysissä ennustetaan havainnon luokkaa
63 Ennustava analytiikka (2/3) Nimestään huolimatta tarkoittaa usein sitä, että pyritään hakemaan oikea luokka jo tapahtuneelle ilmiölle. Esimerkiksi mikä on jokin käsin kirjoitettu kirjain skannatussa dokumentissa Ennustava malli luodaan opetusdatan avulla
64 Ennustava analytiikka (3/3) Yleisimmin käytettyjä menetelmiä ovat päätöspuut, tukivektorikoneet ja neuroverkot
65 Mallintaminen (1/9) Mallintaminen tarkoittaa sitä, että tutkittavalle ilmiölle pyritään muodostamaan sellainen matemaattinen malli, joka mahdollisimman hyvin kuvaa ilmiötä Ainoaa oikeata mallia ei ole olemassa, mutta voi olla monia riittävän hyviä malleja
66 Mallintaminen (2/9) U=RI U=RI+e Ideaalimalli Hieman todellisempi malli Mitä on e?
67 Mallintaminen (3/9) U=RI+e on yksinkertainen lineaarinen malli, jossa osa RI kuvaa determinististä osaa ja e sellaista osaa, jota ei pystytä mallintamaan Usein ennustamatona osaa e kuvataan satunnaismuuttujana, joka noudattaa normaalijakaumaa Entä kaaosteoria?
68 Mallintaminen (4/9) Ensimmäisen asteen yhtälö yhtälöryhmä Malli on parametrien a ja b suhteen lineaarinen. Tässä parit (x i,y i ) ovat tunnettuja. Tuntemattomia ovat parametrit a ja b.
69 Mallintaminen (5/9) Satunnaisuuden normaalisuusoletus tekee vaihtelualueesta symmetrisen. Toisaalta monet ilmiöt ovat useiden muuttujien summia ja tämä tekee jakaumasta melko normaalin.
70 Mallintaminen (6/9)
71 Mallintaminen (7/9)
72 Mallintaminen (8/9)
73 Mallintaminen (9/9)
74 Visualisointi ja raportointi Visualisointi ja raportointi kannattaa tehdä rinnakkain varsinaisen analyysin kanssa Tällöin raporttiin tulee kuvattua koko prosessi muuttujavalintoineen esiprossointimenetelmineen, analyysimenetelmineen ja tuloksineen. Vastaa alkuperäiseen tutkimuskysymykseen Kannattaa vaikkapa automatisoida Pitää huomioida raportin vastaanottaja
Kandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
Regressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Regressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
Harjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
Otannasta ja mittaamisesta
Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,
Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012
Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun
1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
Yleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
Kvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden
pitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
Luentorunko perjantaille
Luentorunko perjantaille 28.11.28 Eräitä ryvästyksen keskeisiä käsitteitä kustannusfunktio sisäinen vaihtelu edustajavektori etäisyysmitta/funktio Osittamiseen perustuva ryvästys (yleisesti) K:n keskiarvon
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
Spektri- ja signaalianalysaattorit
Spektri- ja signaalianalysaattorit Pyyhkäisevät spektrianalysaattorit Suora pyyhkäisevä Superheterodyne Reaaliaika-analysaattorit Suora analoginen analysaattori FFT-spektrianalysaattori DFT FFT Analysaattoreiden
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto
Kojemeteorologia Sami Haapanala syksy 2013 Fysiikan laitos, Ilmakehätieteiden osasto Mittalaitteiden staattiset ominaisuudet Mittalaitteita kuvaavat tunnusluvut voidaan jakaa kahteen luokkaan Staattisiin
Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.
1/11 4 MITTAAMINEN Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. Mittausvirhettä johtuen mittarin tarkkuudesta tai häiriötekijöistä Mittarin
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Johdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164
86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N
11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation
Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
Kojemeteorologia (53695) Laskuharjoitus 1
Kojemeteorologia (53695) Laskuharjoitus 1 Risto Taipale 20.9.2013 1 Tehtävä 1 Erään lämpömittarin vertailu kalibrointistandardiin antoi keskimääräiseksi eroksi standardista 0,98 C ja eron keskihajonnaksi
Teema 3: Tilastollisia kuvia ja tunnuslukuja
Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin
805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
Inversio-ongelmien laskennallinen peruskurssi Luento 2
Inversio-ongelmien laskennallinen peruskurssi Luento 2 Kevät 2012 1 Lineaarinen inversio-ongelma Määritelmä 1.1. Yleinen (reaaliarvoinen) lineaarinen inversio-ongelma voidaan esittää muodossa m = Ax +
Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:
Mat-.9 Sovellettu todennäköisyyslasku A Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Moniulotteiset jakaumat Diskreetti jakauma, Ehdollinen jakauma, Ehdollinen odotusarvo, Jatkuva
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
9. Tila-avaruusmallit
9. Tila-avaruusmallit Aikasarjan stokastinen malli ja aikasarjasta tehdyt havainnot voidaan esittää joustavassa ja monipuolisessa muodossa ns. tila-avaruusmallina. Useat aikasarjat edustavat dynaamisia
Poikkeavuuksien havainnointi (palvelinlokeista)
Poikkeavuuksien havainnointi (palvelinlokeista) TIES326 Tietoturva 2.11.2011 Antti Juvonen Sisältö IDS-järjestelmistä Datan kerääminen ja esiprosessointi Analysointi Esimerkki Lokidatan rakenne Esikäsittely,
Til.yks. x y z
Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)
Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
Harjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1
Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n
pitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
Datanäytteiden piirteiden skaalaus/normalisointi (1)
Datanäytteiden piirteiden skaalaus/normalisointi (1) Datamassat, jotka syötetään samankaltaisuuksia useamman kuin yhden piirteen pohjalta hyödyntäviin koneoppimismenetelmiin, voivat tarvita esikäsittelykseen
Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja
1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma
Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin
Dynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
MTTTP1, luento KERTAUSTA
26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
Talousmatematiikan perusteet: Luento 8. Vektoreista ja matriiseista Vektorien peruslaskutoimitukset Lineaarinen riippumattomuus Vektorien sisätulo
Talousmatematiikan perusteet: Luento 8 Vektoreista ja matriiseista Vektorien peruslaskutoimitukset Lineaarinen riippumattomuus Vektorien sisätulo Motivointi Esim. Herkkumatikka maksaa 50 /kg. Paljonko
Tilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Esimerkki 1: auringonkukan kasvun kuvailu
GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin
1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy
pisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
Dynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 6: 1 Kalmanin suodatin Aiemmin käsitellyt
5.6.3 Matematiikan lyhyt oppimäärä
5.6.3 Matematiikan lyhyt oppimäärä Matematiikan lyhyen oppimäärän opetuksen tehtävänä on tarjota valmiuksia hankkia, käsitellä ja ymmärtää matemaattista tietoa ja käyttää matematiikkaa elämän eri tilanteissa
Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.
2. MS-A4/A6 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 5.9.25 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x + x 2
Mittaustekniikka (3 op)
530143 (3 op) Yleistä Luennoitsija: Ilkka Lassila Ilkka.lassila@helsinki.fi, huone C319 Assistentti: Ville Kananen Ville.kananen@helsinki.fi Luennot: ti 9-10, pe 12-14 sali E207 30.10.-14.12.2006 (21 tuntia)
MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)
20.9.2018/1 MTTTP1, luento 20.9.2018 KERTAUSTA JA TÄYDENNYSTÄ Tunnusluvut 1) Sijainnin tunnuslukuja Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1) Muita sijainnin tunnuslukuja ala- ja yläkvartiili,
Logistinen regressio, separoivat hypertasot
Logistinen regressio, separoivat hypertasot Topi Sikanen Logistinen regressio Aineisto jakautunut K luokkaan K=2 tärkeä erikoistapaus Halutaan mallintaa luokkien vedonlyöntikertoimia (odds) havaintojen
Harjoittele tulkintoja
Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen
Jatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
031021P Tilastomatematiikka (5 op) kertausta 2. vk:een
031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
Vastepintamenetelmä. Kuusinen/Heliövaara 1
Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,
tilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät
Matematiikan peruskurssi K3/P3, syksy 25 Kenrick Bingham 825 Toisen välikokeen alueen ydinasioita Alla on lueteltu joitakin koealueen ydinkäsitteitä, joiden on hyvä olla ensiksi selvillä kokeeseen valmistauduttaessa
MONISTE 2 Kirjoittanut Elina Katainen
MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi
Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:
4. Tyhjentyvyys Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä: Voidaanko päätelmät perustaa johonkin tunnuslukuun t = t(y) koko aineiston y sijasta? Mitä
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
Identifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
Mittaustulosten tilastollinen käsittely
Mittaustulosten tilastollinen käsittely n kertaa toistetun mittauksen tulos lasketaan aritmeettisena keskiarvona n 1 x = x i n i= 1 Mittaustuloksen hajonnasta aiheutuvaa epävarmuutta kuvaa keskiarvon keskivirhe
Dynaamisten systeemien identifiointi 1/2
Dynaamisten systeemien identifiointi 1/2 Mallin rakentaminen mittausten avulla Epäparametriset menetelmät: tuloksena malli, joka ei perustu parametreille impulssi-, askel- tai taajusvaste siirtofunktion
3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä
3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a 21
Identifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
Tilastolliset toiminnot
-59- Tilastolliset toiminnot 6.1 Aineiston esittäminen graafisesti Tilastollisen aineiston tallentamisvälineiksi TI-84 Plus tarjoaa erityiset listamuuttujat L1,, L6, jotka löytyvät 2nd -toimintoina vastaavilta
Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.
2. MS-A000 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2..205 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x x 2 =
Numeeriset menetelmät
Numeeriset menetelmät Luento 5 Ti 20.9.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 5 Ti 20.9.2011 p. 1/40 p. 1/40 Choleskyn menetelmä Positiivisesti definiiteillä matriiseilla kolmiohajotelma
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos
Datan käsittely Helsingin yliopisto, Fysiikan laitos kevät 2013 3. Datan käsittely Luennon sisältö: Havaintovirheet tähtitieteessä Korrelaatio Funktion sovitus Aikasarja-analyysi 3.1 Havaintovirheet Satunnaiset
Tilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.
Virhearviointi Fysiikassa on tärkeää tietää tulosten tarkkuus. Virhelajit A. Tilastolliset virheet= satunnaisvirheet, joita voi arvioida tilastollisin menetelmin B. Systemaattiset virheet = virheet, joita
MTTTP1, luento KERTAUSTA
25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
Matemaattinen Analyysi, s2016, L2
Matemaattinen Analyysi, s2016, L2 riippumattomuus, 1 Esimerkkejä esimerkki Dieetti-välipala 1: Opiskelija Ken Obi on dieetillä. Lenkin jälkeen Ken pysähtyy välipalalle. Dieetin mukaan hänen pitäisi saada
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
Johdatus tekoälyn taustalla olevaan matematiikkaan
Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 2. luento 10.11.2017 Keinotekoiset neuroverkot Neuroverkko koostuu syöte- ja ulostulokerroksesta
TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas OTOSTAMISEEN LIITTYVIÄ ONGELMIA Otostamisen ongelmat liittyvä satunnaistamisen epäonnistumiseen Ongelmat otantakehyksen määrittämisessä Väärän otantamenetelmän
Signaalien generointi
Signaalinkäsittelyssä joudutaan usein generoimaan erilaisia signaaleja keinotekoisesti. Tyypillisimpiä generoitavia aaltomuotoja ovat eritaajuiset sinimuotoiset signaalit (modulointi) sekä normaalijakautunut
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään