Grafiikka, satunnaislukuja, jakaumia ja yleistettyjä lineaarisia malleja
|
|
- Hanna-Mari Halonen
- 8 vuotta sitten
- Katselukertoja:
Transkriptio
1 Grafiikka, satunnaislukuja, jakaumia ja yleistettyjä lineaarisia malleja Jari Oksanen Tiistai 13. syyskuuta 2005 Tiivistelmä Aluksi laajennettiin ja kerrattiin edellisen päivän grafiikan virittelyä kosekavaa osiota. Janiika Aaltosen kysymys vei meidät satunnaislukujen ihmeelliseen maailmaan ja siitä edelleen jakaumien tarkasteluun. Tämän jälkeen oli vuorossa päivän suunniteltu pääaihe, eli yleistetyt lineaariset mallit, jotka tosin jäivät melko lailla puolitiehen. Sisältö 1 Graafisen ympäristön virittäminen 1 2 Satunnaisluvut ja jakaumat Jakaumien graafinen tarkastelu Keskeinen raja-arvolause Yleistetty lineaarinen malli 5 1 Graafisen ympäristön virittäminen R:n perusgrafiikka on siistiä, karua. Se on suuniteltu printattavaksi tai artikkeliin liitettäväksi. Verkkosivuja tai esitelmiä varten voi olla tarvetta muuttaa grafiikan yleisilmettä. Tämä tapahtuu asettamalla graafisia parametreja. Näitä parametreja on erittäin paljon ja varmaankin on tarve katsoa manuaalisivuilta (?par) mitä kaikkea voi tai pitäisi muutttaa. Tässäkään osiossa ei ole kuvia: ne voi toteuttaa itse omalla koneellaan. Ehdottomasti ensimmäiseksi on tallennettava nykyisen istunnon parametrit, sillä toipuminen seikkailusta voi muuten olla liian työlästä: > oletuspar = par(no.readonly = T) Tämän jälkeen voi ruveta muuttamaan yksi kerrallaan grafiikan ilmettä: > par(bg = "darkblue") > par(fg = "white") > par(col.axis = "yellow") > par(col.lab = "yellow") > par(col.main = "hotpink") 1
2 > par(cex.lab = 1.3) > par(cex = 1.2) > par(lwd = 2) Tämän jälkeen voimme katsoa miltä kuvan uusi ilme näyttää: > load(url(" > attach(kurssi) > plot(ph, spno, main = "Otsikko") Mikäli kuva miellytti, voimme tallettaa tämänhetkiset asetukset samalla tavalla kuin oletusasetukset aikaisemmin ja tarpeen mukaan vaihtaa oletusasetusten ja uusien asetusten välillä > slaidi = par(no.readonly = T) > plot(ph, spno) > par(oletuspar) > plot(ph, spno, main = "Huuhaa!") Asetukset säilyvät työtilassa ja ne voi tallettaa istunnon loputtua. Halutessaan ne voi dumpata erilliseen tiedostoon ja myöhemmin sourcella ottaa jälleen istuntoonsa. Viritykset saa taas käyttönsä sanomalla > par(slaidi) 2 Satunnaisluvut ja jakaumat R:ssä voi tuottaa satunnaislukuja hyvin monesta erilaisesta jakaumasta. Yhden funktion olemme jo nähneet: sample poimii satunnaislukuja annetusta vektorista tai kokonaisluvuista. Seuraava noppa-funktio arpoo kolme numeroa luvuista niin että kukin luku voi esiintyä otoksessa monta kertaa: > sample(6, 3, rep = T) [1] Ilman rep=t määrettä kukin luku voisi esiintyä otoksessa vain kerran. Mikäli taas otoskokoa ei anneta, oletustoiminta on poimia kaikki luvut kerran otokseen eli järjestää vektori satunnaiseen järjestykseen, kuten teimme ristivalidoinnissa eilen: > sample(6) [1] Funktio voi saada vielä yhden määritteen: probs, joka antaa kunkin poimittavan alkion otostustodennäköisyyden. Edellä simuloimme reilua noppaa, mutta painotetun nopan saa aikaiseksi antamalle arvolle 6 suurempi paino: > sample(6, 20, rep = T, prob = c(1, 1, 1, 1, 1, 6)) [1] Funktio voi poimia havaintoja myös muista kuin numerovektoreista: 2
3 > sample(c("orvokki", "vuokko", "leinikki", "kastikka"), 5, rep = T) [1] "leinikki" "leinikki" "kastikka" "vuokko" "kastikka" R tuntee tärkeimmät tilastolliset jakaumat ja pystyy yleensä tuottamaan satunnaislukuja näistä jakaumista. Tällaisen satunnaislukufunktion nimi on tyyppiä rjakauma, ja se on yleensä dokumentoitu yhdessä muiden jakaumafunktioiden kanssa: esim. djakauma antaa todennäköisyystiheyden. Useimmin käytettyjä satunnaislukufunktioita on tasainen jakauma. Seuraavassa tuotetaan viisi satunnaislukua tasaisesta jakaumasta välillä ja sitten välillä : > runif(5) [1] > runif(5, -1, 3) [1] Normaalisti jakautuneita lukuja voidaan tuottaa näin: > rnorm(8) [1] > rnorm(8, mean = 5, sd = 2) [1] Muita funktioita ovat esim. rbinom, rpois, rgamma, rt, rcauchy, rexp... Nämä on dokumentoitu oman jakaumafunktionsa kanssa yhdessä, ja kukin odottaa omaa jakaumasta riippuvaista parametriaan. 2.1 Jakaumien graafinen tarkastelu Jakauman muotoa voi tarkastella sovitetun tiheysfunktion avulla. Tätä varten on R:ssä funktio density, jonka tuloksen voi suoraan piirtää. Funktio valitse tasoitusikkunan ( bandwidth ) leveyden automaattisesti. Kuinka normaaleilta näyttävät normaalisti jakautuneet satunnaisluvut: > x = rnorm(100, mean = 5, sd = 2) > den = density(x) > plot(den) Samaa funktiota voi käyttää myös havaittujen muuttujien jakauman tarkasteluun. Tämä ei ole kovin normaali: > plot(density(alkal)) Muita jakaumien tarkateluun sopivia funktioita ovat boxplot ja kvantiili-kvantiili-kuviot: > boxplot(alkal) > qqnorm(alkal) > qqline(alkal) 3
4 Jos muuttuja on jakautunut normaalisti, pisteiden pitäisi muodostaa suora viiva kvantiiliplotissa. Tällä kertaa jakauma on hyvinkin vino. Funktio qqline helpottaa suoruuden arviontia. Meidän ei kuitenkaan pidä odottaa, että pisteet ovat täysin suoralla viivalla. Etenkin pienissä aineistoissa sattuman merkitys on suuri: > qqnorm(rnorm(30)) Sen sijaan suurissa aineistoissa normaalisti jakautuneet pisteet myös näyttävät normaalisti jakautuneilta: > qqnorm(rnorm(3000)) 2.2 Keskeinen raja-arvolause Edellä esitety graafiset tarkastelut ovat yleensä riittäviä arvioimaan muuttujien jakauman normaalisuutta. Normaalisuustestit ovat vaarallisia: pienissä aineistoissa niiden voima ei riitä poikkeamien havaitsemiseen ja suurissa aineistoissa ne taas ovat herkkiä havaitsemaan mitättömiäkin eroja. Kuitenkin jakaumaoletuksilla on merkitystä nimenomaan pienissä aineistoissa ja suurissa meitä suojelee keskeinen raja-arvolause. Keskeinen raja-arvolause sanoo: summan jakauma lähestyy normaalijakaumaa summattavien määrän kasvaessa riippumatta alkuperäisten havaintojen jakaumasta. Keskiarvo pohjautuu summaan (summa jaettuna havaintomäärällä), joten myös keskiarvon jakauma lähestyy normaalijakaumaa kun aineiston koko kasvaa. Näin ollen voimme käyttää monia parametrisia testejä jakaumaoletuksia rikkomatta. Keskeinen raja-arvolause on varma äärettömille aineistoille, mutta onneksi normaalistuminen tapahtuu melko nopeasti jopa erittäin epänormaaleilla havainnoilla. Seuraavassa esimerkissä tarkastellan kurssi-aineistosta piilevälajia, jonka alkuperäiset jakaumat ovat hyvin vinot: > par(mfrow = c(2, 2)) > plot(density(asteform)) Tarkastelemme kuinka tästä lajista poimittujen otosten keskiarvojen jakaumaa. Ensin teemme vektorin, jossa on tilaa sadalle otoskeskiarvolle: > samp = rep(0, 100) Sitten käytämmä uudelleen otostuksesta tuttua toistoa (for) ja otostamme takaisinpanolla (sample) erikokoisia otoksia, laskemme niistä keskiarvon (mean), talletamme sen havainnoksi i ja sadan kierroksen jälkeen piirrämme jakauman tiheyskuvaajan: > for (i in 1:100) samp[i] = mean(sample(asteform, 4, repl = T)) > plot(density(samp), main = "N = 4") > for (i in 1:100) samp[i] = mean(sample(asteform, 16, repl = T)) > plot(density(samp), main = "N = 16") > for (i in 1:100) samp[i] = mean(sample(asteform, 64, repl = T)) > plot(density(samp), main = "N = 64") Normaalistuminen on häkellyttävn selvä. 4
5 3 Yleistetty lineaarinen malli Tässä kappaleessa tarkastellaan piileväaineistosta (kurssi) Asterionella formasan esiintymistodennäköisyyden enneustamista veden happamuuden perustteella. Kohdemuuttujamme on kaksiarvoinen: laji joko esiintyy tai puuttuu. Minkäänlainen muunnos ei voi normalisoida kaksiarvoista muuttujaa, joten meidän on valittava menetelmä, joka pystyy tällaisia muuttujia käsittelemään. Yleistetyt lineaariset mallit suoriutuvat helposti ja luonnollisella tavalla tällaisistakin muuttujista (yksityiskohtia seuraa myöhemmin). Alkuperäiset havainnot ovat lukumäärämuuttujia, joista suuri osa on nollia: > sort(asteform) [1] [19] [37] [55] [73] [91] [109] Lukumäärämuuttujan saa muutettua kaksiarvoiseksi loogisella vertailuoperaatiolla x > 0: > Asteform > 0 [1] FALSE FALSE FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE [13] FALSE FALSE FALSE TRUE TRUE TRUE TRUE FALSE FALSE FALSE TRUE TRUE [25] FALSE FALSE TRUE FALSE FALSE TRUE FALSE TRUE TRUE TRUE FALSE TRUE [37] FALSE FALSE FALSE FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE [49] TRUE TRUE FALSE TRUE TRUE TRUE FALSE FALSE TRUE FALSE FALSE FALSE [61] FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE [73] FALSE FALSE FALSE FALSE FALSE TRUE TRUE FALSE FALSE FALSE FALSE FALSE [85] FALSE FALSE TRUE TRUE FALSE TRUE TRUE TRUE TRUE FALSE FALSE FALSE [97] FALSE TRUE FALSE FALSE FALSE TRUE TRUE FALSE TRUE TRUE TRUE FALSE [109] FALSE FALSE > par(mfrow = c(1, 1)) > plot(ph, Asteform > 0) Voimme antaa tämän vertailun suoraan mallilausekkeessa. Seuraava komento sovittaa mallin kaksiarvoiselle muuttujalle, joka on TRUE silloin kun laji esiintyy järvessä: > tulos = glm(asteform > 0 ~ ph, data = kurssi, family = binomial) > tulos Call: glm(formula = Asteform > 0 ~ ph, family = binomial, data = kurssi) Coefficients: (Intercept) ph
6 Degrees of Freedom: 109 Total (i.e. Null); Null Deviance: 148 Residual Deviance: 135 AIC: Residual Komento on hyvin samantapainen kuin aiemmin käytetty lineaarinen malli lm: olemme vain lisänneet g-kirjaimen komentoon ja yhden uuden argumentin family = binomial. Yleistetty lineaarinen malli onkin yleistetty juuri siten, että sen virhejakauma voi olla muukin kuin normaali. Ekologit ja biologit tarvitsevat usein myös Ṕoisson- ja Gamma-jakaumia, ja muitakin on tarjolla. Lisää tietoja löytyy menetelmien ohjesivuilta (?glm,?family sekä R:n mukana tulevista oppaista ( An Introduction... ). Funktion tulostus on hyvin samantapainen kuin lm-malleissa: summary(tulos) > summary(tulos) Call: glm(formula = Asteform > 0 ~ ph, family = binomial, data = kurssi) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) *** ph *** --- Signif. codes: 0 *** ** 0.01 * (Dispersion parameter for binomial family taken to be 1) Null deviance: on 109 degrees of freedom Residual deviance: on 108 degrees of freedom AIC: Number of Fisher Scoring iterations: 4 Oleellisimpia eroja ovat: ˆ Kerrointaulukon kolmas sarake on nimeltään z eikä t. Sarake on laskettu samalla tavalla (kerroin / keskivirhe), mutta nyt se ei ole t-jakautunut vaan asymptoottisesti likipitäen normaalijakautunut. Myös P -arvot ovat normaalijakaumasta. ˆ Neliösumman sijaan raportoidaan devianssi. Devianssi on epänormaalille mallille sama kuin jäännösneliösumma normaalimallille. Itse asiassa normaalimallin devianssi on jäännösneliösumma. Mallin ennusteet sijoitetaan kuvaan normaaliin tapaan. Jotta pisteet yhdistettäisiin oikeassa järjestyksessä, talletamme jälleen muuttujan ph järjestykseen vektoriin i ja käytämme tätä järjestystä kuvan piirtämisessä: 6
7 > i = order(ph) > lines(ph[i], fitted(tulos)[i], col = "hotpink") Kuvassa oleva regressiosuora onkin käyrä! Tämä on toinen glm:n yleistys virhevaihtelun lisäksi: regressiosuoraa voidaan muuntaa ns. linkkifunktiolla sen sijaan että muunnettaisiin aineistoa. Ohjesivut (?family) kertovat, että oletus linkkifunktio binomimalleissa on logit eli vedonlyöntisuhteen logaritmi. Logitfunktion avulla alkujaan suora viiva muuttuu sigmoidiksi käyräksi välille Ennuste antaa meille suoraan todennäköisyyden vaikka regressio näyttää määrittelevän suoran. Logit-muunnos määrittää logistisen käyrän, minkä takia usein puhutaan logistisesta regressiosta. Regressiokertoimista suoraan määritettyä ennustetta sanotaan lineaariseksi prediktoriksi. Lineaarisen prediktorin η ja responssin µ suhde on µ = g 1 (η), missä g on linkkifunktio. Logistisen käyrän käänteisen linkkifunktion tarjoaa R:ssä funktio plogis. Seuraavassa näemme, kuinka mallin kertoimista saadaan lineaarinen prediktori ja responssi ph-arvoon 7.5: > tulos Call: glm(formula = Asteform > 0 ~ ph, family = binomial, data = kurssi) Coefficients: (Intercept) ph Degrees of Freedom: 109 Total (i.e. Null); Null Deviance: 148 Residual Deviance: 135 AIC: Residual > * 7.5 [1] 1.74 > plogis( * 7.5) [1] Aiemmin lineaarista malleista oppimamme funktiot toimivat täälläkin, mutta joissain on lisäargumentteja tai hieman erilaisia oletuksia. Niinpä varianssianalyysia varten meidän on myös annettava testin nimi, tai saamme vain taulukon deviansseista ja vapausasteista: > anova(tulos, test = "Chi") Analysis of Deviance Table Model: binomial, link: logit Response: Asteform > 0 Terms added sequentially (first to last) 7
8 Df Deviance Resid. Df Resid. Dev P(> Chi ) NULL ph Silloin kun sovitetun mallin dispersio on 1 (katso summary(tulos)), devianssi on jakautunut likipitäen Khi-neliö-jakauman mukaan, joten pyydämme tätä testiä. Funktio fitted tuottaa ennustetut arvot. Funktiossa predict sen sijaan on muitakin vaihtoehtoja: funktiossa on argumentti type, joka voi olla "link" tai "response". Jälkimmäinen on responssi ja edellinen lineaarinen prediktori. Luottamusvälejä ei saa automaattisesti vaan meidän on itse laskettava ne keskivirheistä. Piirrämme kuvan uudelleen, mutta lisäämme nyt käyrään arvion 95 % luottamusväleistä. Teemme myös uuden aineiston, jota käytämme ennustuksessa (tämä kaikki on periaattessa tuttua lineaarisista malleista viime viikolta). > range(ph) [1] > df = data.frame(ph = seq(4.52, 6.9, len = 21)) > tmp <- seq(4.52, 6.9, len = 21) > df = data.frame(ph = tmp) > pre = predict(tulos, newdata = df, se = TRUE, type = "link") > str(pre) List of 3 $ fit : Named num [1:21] attr(*, "names")= chr [1:21] "1" "2" "3" "4"... $ se.fit : Named num [1:21] attr(*, "names")= chr [1:21] "1" "2" "3" "4"... $ residual.scale: num 1 Tuloksena on nyt luettelo, jossa on erikseen ennustettujen arvojen vektori sekä keskiarvojen vektori. Meidän on laskettava luottamusvälit käsin ja tämä on ensin tehtävä lineaarisella prediktorilla ja sitten muutettava arvot responssin skaalalle käänteisellä linkkifunktiolla: > fv = pre$fit > lwr = pre$fit - 2 * pre$se > upr = pre$fit + 2 * pre$se > par(mfrow = c(1, 1)) > plot(ph, Asteform > 0, main = "Asterionella formosa") > lines(tmp, plogis(fv), lwd = 3) > lines(tmp, plogis(upr), lwd = 1, col = "peachpuff") > lines(tmp, plogis(lwr), lwd = 1, col = "peachpuff") Tämä vaati hieman enemmän käsityötä, mutta oli muuten melko yksinkertaista. Valitettavasti emme ole vieä ehdyttäneet yleistettyjä lineaarisia malleja, vaan jatkamme niistä ensi kerralla... 8
Load
Tampereen yliopisto Tilastollinen mallintaminen Mikko Alivuotila ja Anne Puustelli Lentokoneiden rakennuksessa käytettävien metallinkiinnittimien puristuskestävyys Matematiikan, tilastotieteen ja filosofian
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotRistivalidointia ja grafiikkaa
Ristivalidointia ja grafiikkaa Jari Oksanen Maanantai 12. syyskuuta 2005 Tiivistelmä Tässä monisteessa on maantain tapahtumien yhteenveto. Aloitimme Eija Hurmeen kurssipäiväkirjalla ja sen jälkeen päätiomme
LisätiedotResiduaalit. Residuaalit. UK Ger Fra US Austria. Maat
TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede
LisätiedotSuhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä
806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2011 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Eräässä suuressa yrityksessä
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
LisätiedotIlmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!
8069 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2013 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOLLA 9! Ilmoittaudu Weboodissa 4.3.2013 klo
Lisätiedot5 Osa 5: Ohjelmointikielen perusteita
5 Osa 5: Ohjelmointikielen perusteita 5.1 Omat funktiot R on lausekekieli: Kaikki komennot kuten funktiokutsut ja sijoitusoperaatiot ovat lausekkeita. Lausekkeet palauttavat jonkin arvon. Lausekkeita voidaan
LisätiedotOpiskelija viipymisaika pistemäärä
806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2012 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Jatkoa harjoituksen 5 tehtävään
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotTilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio
Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
LisätiedotJakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?
1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren
Lisätiedot1. Tietokoneharjoitukset
1. Tietokoneharjoitukset Aluksi Tällä kurssilla käytetään R-ohjelmistoa, jonka käyttämisestä lienee muutama sana paikallaan. R-ohjelmisto on laajasti käytetty vapaassa levityksessä oleva ammattimaiseen
LisätiedotTodennäköisyysjakaumia
8.9.26 Kimmo Vattulainen Todennäköisyysjakaumia Seuraavassa esitellään kurssilla MAT-25 Todennäköisyyslaskenta esille tulleita diskreettejä todennäköisyysjakaumia Diskreetti tasajakauma Bernoullijakauma
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
Lisätiedot2. Tietokoneharjoitukset
2. Tietokoneharjoitukset Demotehtävät 2.1 Jatkoa kotitehtävälle. a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. KULUTUS on selitettävä muuttuja. b) Määrää estimoidusta
LisätiedotATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011
LisätiedotMatematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
LisätiedotR: mikä, miksi ja miten?
R: mikä, miksi ja miten? Ilmari Ahonen Matematiikan ja tilastotieteen laitos, Turun yliopisto SSL R-Webinaari 2015 Vähän minusta Valmistuin maisteriksi Turun yliopistossa 2012 Teen neljättä vuotta väitöskirjaa
LisätiedotPylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.
Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien
LisätiedotYleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli
MS-C2128 Ennustaminen ja aikasarja-analyysi 1. harjoitukset / Tehtävät Kotitehtävät: 2 Aiheet: Aluksi Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli Tällä kurssilla käytetään
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotTodennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
Lisätiedot11. laskuharjoituskierros, vko 15, ratkaisut
11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
LisätiedotJos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan
17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten
Lisätiedot[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen
LisätiedotHarha mallin arvioinnissa
Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotKokeellisen datan käsittely ja analysointi R:llä
TEKNILLINEN TIEDEKUNTA Kokeellisen datan käsittely ja analysointi R:llä Teemu Pätsi Ympäristötekniikka Kandidaatintyö Huhtikuu 2018 TEKNILLINEN TIEDEKUNTA Kokeellisen datan käsittely ja analysointi R:llä
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
LisätiedotTehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset
JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset 12.05.2009 Tehtävä 1 (a) x
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
Lisätiedotedellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾
ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotTutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotKirjoita ohjelma jossa luetaan kokonaislukuja taulukkoon (saat itse päättää taulun koon, kunhan koko on vähintään 10)
Tehtävä 40. Kirjoita ohjelma, jossa luetaan 20 lukua, joiden arvot ovat välillä 10 100. Kun taulukko on täytetty, ohjelma tulostaa vain ne taulukon arvot, jotka esiintyvät taulukossa vain kerran. Tehtävä
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
LisätiedotA130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala
Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien
Lisätiedotχ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut
Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotTilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle
Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen
LisätiedotMTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
Lisätiedot2. TILASTOLLINEN TESTAAMINEN...
!" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotOtosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko
ÌÓÒÒĐĐÓ ÝÝ ÔÖÙ ØØ Naiiveja määritelmiä Suhteellinen frekvenssi kun ilmiö toistuu Jos tehdas on valmistanut 1000000 kpl erästä tuotetta, joista 5013 ovat viallisia, niin todennäköisyys, että tuote on viallinen
LisätiedotJohdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotHarjoitus 6 -- Ratkaisut
Harjoitus 6 -- Ratkaisut 1 Ei kommenttia. 2 Haetaan data tiedostosta. SetDirectory"homeofysjmattas" SetDirectory "c:documents and settingsmattasdesktopteachingatk2harjoitukseth06" netnfstuhome4ofysjmattas
Lisätiedot1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,
LisätiedotA250A0050 Ekonometrian perusteet Tentti
A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin
LisätiedotEstimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio
17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla
LisätiedotLumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I
Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori
LisätiedotEpävarmuuden hallinta bootstrap-menetelmillä
1/17 Epävarmuuden hallinta bootstrap-menetelmillä Esimerkkinä taloudellinen arviointi Jaakko Nevalainen Tampereen yliopisto Metodifestivaalit 2015 2/17 Sisältö 1 Johdanto 2 Tavanomainen bootstrap Bootstrap-menettelyn
LisätiedotIlkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
Lisätiedot6. laskuharjoitusten vastaukset (viikot 10 11)
6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
LisätiedotKoska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.
24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ
LisätiedotSisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 28. syyskuuta 2007 Antti Rasila () TodB 28. syyskuuta 2007 1 / 20 1 Jatkoa diskreeteille jakaumille Negatiivinen binomijakauma Poisson-jakauma Diskreettien
LisätiedotPelaisitko seuraavaa peliä?
Lisätehtävä 1 seuraavassa on esitetty eräs peli, joka voidaan mallintaa paramterisena tilastollisena mallina tehtävänä on selvittää, kuinka peli toimii ja näyttää mallin takana oleva apulause (Tehtävä
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotKaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:
Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
Lisätiedot3.6 Su-estimaattorien asymptotiikka
3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä
Lisätiedot5.6.3 Matematiikan lyhyt oppimäärä
5.6.3 Matematiikan lyhyt oppimäärä Matematiikan lyhyen oppimäärän opetuksen tehtävänä on tarjota valmiuksia hankkia, käsitellä ja ymmärtää matemaattista tietoa ja käyttää matematiikkaa elämän eri tilanteissa
LisätiedotTilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit
Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli
LisätiedotLisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia
Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma
LisätiedotTilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä
Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme
LisätiedotNormaalijakaumasta johdettuja jakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2007) 1 Normaalijakaumasta johdettuja jakaumia >> Johdanto χ 2 -jakauma F-jakauma
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotSEM1, työpaja 2 (12.10.2011)
SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
LisätiedotPienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto
Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
LisätiedotTodennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1
Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen
LisätiedotTutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
Lisätiedot(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa
Oulun yliopiston matemaattisten tieteiden tutkimusyksikkö/tilastotiede 805306A JOHDATUS MONIMUUTTUJAMENETELMIIN, sl 2017 (Jari Päkkilä) Harjoitus 3, viikko 47 (19.20.11.): kotitehtävät Ratkaisuja 1. Floridan
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
Lisätiedot