valikosta Data -> Import data -> from text file, clipboard or URL...
|
|
- Hanna Sala
- 5 vuotta sitten
- Katselukertoja:
Transkriptio
1 806118P JOHDATUS TILASTOTIETEESEEN Mikroluokkaharjoitus 3/3, kevät 2019, viikko 9 Käynnistä R-ohjelma valinnoilla Start -> All Programs -> R -> R x Käytämme tässä harjoituksessa R-ohjelmaa pääasiassa R-Commanderin kautta, joten lataa R-Commander käyttöön komennolla library(rcmdr) Tässä harjoituksessa käsitellään 1. luokkaharjoituksessa kerättyä aineistoa, joka on y-levyllä hakemistossa Y:/Yleiset/Mikroluokat/Matematiikka/johd_tilt_19. Luetaan aineisto R:n muistiin valitsemalla valikosta Data -> Import data -> from text file, clipboard or URL... anna Enter name for data set -osiossa aineiston nimeksi mittaus. Paina OK. etsi mittaus.txt niminen aineisto Y-levyn kansiosta johd_tilt_19 ja paina OPEN. Aineiston sisältöä voit katsoa R-commanderin päävalikon alapuolella sijaitsevan View data set -napin avulla. Montako tilastoyksikköä (eli riviä) aineistossa on? 1. Yhden muuttujan jakaumaa kuvaavia tunnuslukuja Yksi aineiston muuttujista on nimeltään kunnat_kartalle, joka kuvaa kunnat kartalle pelin lopputulosta (=virhekilometrien määrä kymmenen paikkakunnan sijoittamisessa kartalle). Lasketaan ko. muuttujan jakaumaa kuvaavien tunnuslukujen arvoja. Aritmeettisen keskiarvon, keskihajonnan, kvartiilivälin pituuden ja fraktiilit (oletuksena min, Q 1, Q 2, Q 3 ja max) saa laskettua valitsemalla valikosta Statistics -> Summaries -> Numerical Summaries... avautuvasta ikkunasta muuttuja (Variable) kunnat_kartalle ja paina OK. Mikäli tunnusluvut haluttaisiin laskea jonkin ominaisuuden mukaisesti ryhmittäin, tarvittava ryhmittelymuuttuja valittaisiin Summarize by groups... -napin alla. Edellä mainituilla valinnoilla saadaan seuraava tulostus Output-ikkunaan: numsummary(mittaus[,"kunnat_kartalle", drop=false], statistics=c("mean", + "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1)) mean sd IQR 0% 25% 50% 75% 100% n Aritmeettinen keskiarvo, mediaani ja keskihajonta voitaisiin laskea myös komennoilla attach(mittaus) # luetaan muuttujanimet R:n muistiin mean(kunnat_kartalle, na.rm=true) # keskiarvo median(kunnat_kartalle, na.rm=true) # mediaani sd(kunnat_kartalle, na.rm=true) # keskihajonta Määreellä na.rm=true suljetaan laskennassa pois mahdolliset puuttuvat havainnot. Minimi, maksimi ja kvartiilivälin pituus (IQR = Q 3 Q 1 ) saadaan laskettua komennoilla min(kunnat_kartalle, na.rm=true) max(kunnat_kartalle, na.rm=true) IQR(kunnat_kartalle, na.rm=true) 1
2 Keskihajonta s neliöitynä (= s 2 ) on varianssi ja se voidaan laskea komennolla var(kunnat_kartalle, na.rm=true) Vertaa äskeisten laskelmien perusteella jakauman sijaintia kuvaavien tunnuslukujen, aritmeettisen keskiarvon ja mediaanin, arvoja. Ovatko ne yhtä suuret? Jos ei, kumpi on suurempi? Piirrä seuraavaksi kunnat_kartalle -muuttujan histogrammi valitsemalla valikosta Graphs -> Histogram... avautuvasta ikkunasta muuttuja (Variable) kunnat_kartalle ja paina OK. Näyttääkö muuttujan jakauma symmetriseltä? Muuttujan jakauman vinoutta kuvaavan vinoustunnusluvun g 1 arvo saadaan laskettua toistamalla jo aiemmin tehdyt valinnat valitsemalla valikosta Statistics -> Summaries -> Numerical Summaries... avautuvasta ikkunasta muuttuja (Variable) kunnat_kartalle. Käy nyt rastittamassa Statistics-lehdellä valinta Skewness ja paina OK. Vinoustunnusluvun arvo on siis noin 0.29 ja jakauma tulkitaan siten likimäärin symmetriseksi. Tällöin muuttujan aritmeettinen keskiarvo ja mediaani ovat likimäärin yhtä suuret. Tehtävä 1. Laske edellä esitetyt tunnusluvut vielä erikseen miehille ja naisille. Laskentaa varten Statistics -> Summaries -> Numerical Summaries... -valintojen jälkeen tarvittava ryhmittelymuuttuja sukupuoli pitää valita Summarize by groups... -napin alla. Näyttäisikö miesten ja naisten välillä olevan eroa keskimääräisessä pelituloksessa? Piirrä vielä kunnat_kartalle -muuttujan sukupuolittainen laatikko-jana -kuvio valitsemalla: valikosta Graphs -> Boxplot... avautuvasta ikkunasta muuttuja (Variable) kunnat_kartalle Plot by groups -napin alla valitaan ryhmittelymuuttujaksi sukupuoli. Paina OK. Vertaile kuvion informaatiota laskemiesi tunnuslukujen arvoihin. 2. Todennäköisyyslaskentaa Tarkastellaan luokkaharjoituksen 5 tehtävää 3, jossa tikkatauluun heitetyn tikan pistemäärän (= X) todennäköisyysjakauma oli x i Yht. p i
3 Esitetään aluksi X:n todennäköisyysjakauma graafisesti (kirjoita komennot R-Commanderin R Script -osioon ja suorita komennot Submit-napilla): x <- c(0, 2, 5, 10) tn <- c(0.2145, , , ) plot(x,tn,type="h",main="x:n tn-jakauma",xlab="tikanheiton pistemäärä") Lisää seuraavaksi plot-komentoon lisämääreet las=1, xlim=c(-1,11), ylim=c(0,0.5) ja yaxs= i. Erota nämä lisämääreet pilkuilla muista määreistä, suorita plot-komento ja katso mitä määreillä saatiin aikaan. Satunnaismuuttujan X kertymäfunktio F(x) on Esitetään F (x) graafisesti: 0,, kun x < , kun 0 x < 2 F (x) = P (X x) = , kun 2 x < , kun 5 x < 10 1, kun x 10 kertyma <- cumsum(tn); kertyma x.uusi <- c(-1,x,11) # laajennetaan kuvaa varten x:n arvoalue välille (-1,11) kertyma <- c(0,kertyma,1) plot(x.uusi,kertyma,type="s",xlab="x",main="x:n kertymafunktio") X:n tn jakauma X:n kertymafunktio tn kertyma tikanheiton pistemäärä x X:n odotusarvo (= pistettä, laskettu harjoituksen 5 tehtävässä 3 c) saadaan laskettua kaavalla µ = E(X) = k = x i p i. Nyt vektorissa x on talletettuna X:n mahdolliset arvot x i ja i=1 vektorissa tn kyseisten arvojen todennäköisyydet eli odotusarvo on odotusarvo <- sum(x*tn) ; odotusarvo X:n varianssi D 2 (X) = k = x 2 i p i µ 2 saadaan puolestaan laskettua komennoilla i=1 varianssi <- sum(x^2*tn) - odotusarvo^2 varianssi ja X:n keskihajonta D(X) = D 2 (X) on puolestaan sqrt(varianssi) 3
4 A) Normaalijakauma N(µ, σ 2 ) Oletetaan, että satunnaismuuttuja X N(100, 24 2 ). Tämä tilanne on luentomonisteen älykkyysosamääräesimerkissä 5.4. I) Kyseinen jakauma voidaan esittää graafisesti valitsemalla valikosta Distributions -> Continuous distributions -> Normal distribution -> Plot normal distribution... määrittelemällä odotusarvo (tässä 100) Mean-osiossa (= µ) ja keskihajonta (tässä 24) Standard deviation -osiossa (= σ) valinnalla Plot density function saadaan piirrettyä jakauman tiheysfunktio ja valinnalla Plot distribution function jakauman kertymäfunktio Normal Distribution: Mean=100, Standard deviation= Normal Distribution: Mean=100, Standard deviation= Density Cumulative Probability x x II) Muotoa P (X k) todennäköisyys voidaan laskea valitsemalla valikosta Distributions -> Continuous distributions -> Normal distribution-> Normal Probabilities... määrittelemällä odotusarvo ja keskihajonta (tässä 100 ja 24) osioissa Mean ja Standard deviation ja yllä olevassa kaavassa esiintyvä k (esim. 110) osiossa Variable value(s) Valintojen jälkeen nähdään, että P (X 110) = Mikäli haluttaisiin laskea todennäköisyyttä P (X > 110) valittaisiin edellä olleiden valintojen lisäksi Upper tail, jolloin nähdään, että P (X > 110) = III) Jos tehtävänä on selvittää esim. se, millä X:n arvolla a pätee, että P (X a) = 0.10 (ts. mikä on jakauman 10 %:n fraktiili) voidaan valita valikosta Distributions -> Continuous distributions -> Normal distribution -> Normal quantiles... määrittelemällä jakauman odotusarvo ja keskihajonta (tässä 100 ja 24) osioissa Mean ja Standard deviation ja haettu todennäköisyyskertymä (tässä 0.10) osiossa Probabilities Valintojen jälkeen nähdään, että haettu arvo a on Mikäli haluttaisiin selvittää se, millä X:n arvolla a P (X a) = 0.10 valittaisiin edellä olleiden valintojen lisäksi Upper tail. 4
5 B) T-jakauma t(n) (t distribution) T-jakaumaan liittyvät funktiot ovat perusperiaatteiltaan täysin normaalijakauman vastaavien funktioiden (I III) kaltaisia. Ainoana erona on se, että tarkasteltavaa t-jakaumaa ei määritellä odotusarvon ja varianssin avulla. T-jakauman määrittelevät vapausasteet (degrees of freedom). 3. Lyhyesti R:n arvonta- ja satunnaislukufunktioista R:n arvontafunktioon sample tutustuttiin lyhyesti jo kurssin 1. R-harjoituksessa. Palautetaan aihe mieleen edellä käsitellyn tikkatauluesimerkin avulla. Sample-funktio tarjoaa mahdollisuuden poimia ko. jakaumasta satunnaisotoksia joko yksinkertaisella satunnaisotannalla palauttaen tai palauttamatta. Poimitaan tikan pistemäärää kuvaavasta X:n jakaumasta 1000 kappaleen satunnaisotos yksinkertaisella satunnaisotannalla palauttaen ja esitetään arvonnan lopputulos janadiagrammina. x i Yht. p i Arvontaan ja kuvan piirtoon tarvittavat komennot ovat x <- c(0, 2, 5, 10) tn <- c(0.2145, , , ) pisteet <- sample(x, 1000, tn, replace=true) frekvenssi <- table(pisteet) frekvenssi plot(frekvenssi) frekvenssi pisteet Lasketaan vielä arvottujen lukujen keskiarvo ja varianssi mean(pisteet) var(pisteet) Vertaa otoksesta laskettua otoskeskiarvoa ja otosvarianssia ko. jakauman odotusarvoon 2.82 ja varianssiin 6.86, jotka on laskettu tässä harjoituksessa jo aikaisemmin. Normaalijakaumasta voidaan poimia satunnaislukuja funktiolla rnorm, joka määritellään kolmella argumentilla: arvottavien lukujen lukumäärällä, jakauman odotusarvolla ja keskihajonnalla. Arvotaan seuraavaksi 1000 lukua N(100, 24 2 )-jakaumasta, esitetään arvottujen lukujen jakauma graafisesti sekä lasketaan arvotuista luvuista aritmeettinen keskiarvo ja varianssi. 5
6 . arvotut <- rnorm(1000,mean=100, sd=24) hist(arvotut) mean(arvotut) var(arvotut) Frequency Histogram of arvotut arvotut 4. Jakaumatulosten simulointia R:llä Luentomonisteen normaalijakaumaesimerkissä oletettiin, että henkilön älykkyyttä mittaavan äo-testin tulos (= X) noudattaa N(100, 24 2 )-jakaumaa. Arvotaan ko. jakaumasta 20 kpl seitsemän äo-tuloksen satunnaisotosta. Jokaisen arvonnan lopputuloksista lasketaan keskiarvo ja keskihajonta, joiden perusteella normaalijakauman odotusarvolle lasketaan 90 %:n luottamusväli. Tämän simulaation toteutukseen ja visualisointiin käytämme funktiota normotos.sim. Kyseisen funktion argumentteina tarvitaan yksittäisellä arvontakierroksella arvottavien havaintojen lukumäärä, arvontajakauman odotusarvo ja keskihajonta. Kirjoita ja suorita seuraavat komennot R-commanderin script-osiossa: options(digits=4) # säädetään tulostustarkkuutta source("y:/yleiset/mikroluokat/matematiikka/johd_tilt_19/normotos.txt") normotos.sim(7,100,24) a) Yllä olevien komentojen avulla R:n grafiikkaikkunaan piirretään ensin N(100, 24 2 )-jakauman tiheysfunktion kuvaaja. b) Siirrä seuraavaksi hiiri R:n grafiikkaikkunan päälle ja klikkaa kuvaa hiirellä, jolloin kuvaan lisätään ensimmäisellä arvontakierroksella arvotut luvut. c) Klikkaa kuvaa uudelleen, jolloin kuvaan lisätään arvotuista luvuista laskettu aritmeettinen keskiarvo ja keskihajonta. Samalla kuvaan lisätään havaintojen perustella laskettu 90 %:n luottamusväli parametrille µ. d) Jatka klikkaamista rauhalliseen tahtiin ja seuraa, kuinka otosarvot, tunnusluvut ja luottamusväli vaihtelevat otoksesta toiseen, kunnes kaikkien 20 otoksen tulokset ovat näkyvillä. e) Laske kuinka moni kuvan 20:stä luottamusvälistä ei sisällä parametrin µ todellista arvoa 100? Toistetaan edellä esitelty simulaatio vielä uudelleen, tällä kertaa ilman hiirellä klikkailua. Tätä simulaatiota varten grafiikkaikkuna jaetaan kahteen osaan: 1) Ylempään osaan simulaatio toteutetaan siten, että N(100, 24 2 )-jakaumasta arvotaan 10 kpl seitsemän äo-tuloksen otosta, joiden perusteella luottamusvälit lasketaan. 2) Alempaan osaan simulaatio toteutetaan siten, että N(100, 24 2 )-jakaumasta arvotaan 10 kpl viidenkymmenen äo-tuloksen otosta, joiden perusteella luottamusvälit lasketaan. 6
7 par(mfrow=c(2,1)) # jaetaan grafiikkaikkuna normotos.sim(7,100,24, nsim=10, loc=f) # 1. simulaatio normotos.sim(50,100,24, nsim=10, loc=f) # 2. simulaatio Miten otoskoon kasvattaminen seitsemästä viiteenkymmeneen vaikuttaa luottamusvälien leveyteen? Entä kummassa kuviossa otoskeskiarvot vaihtelevat enemmän odotusarvonsa 100 ympärillä? Palautetaan grafiikkaikkuna takaisin alkuperäisiin asetuksiin harjoituksen loppuosaa varten: par(mfrow=c(1,1)) # grafiikkaikkuna alkuperäiseksi 5. Merkitsevyystestaus ja luottamusvälilaskenta A) Luentomonisteen esimerkki: Viidestätoista satunnaisesti valitusta AB-merkkisestä tuoremehutölkistä mitattiin C-vitamiinipitoisuus ja saatiin seuraavat tulokset (mg/100ml): 17.3, 18.2, 16.8, 16.9, 17.0, 18.1, 19.5, 20.2, 19.8, 20.3, 18.6, 21.0, 17.9, 21.5, 16.9 Tuoremehun valmistaja ilmoittaa mehun sisältävän C-vitamiinia keskimäärin 20mg/100ml. Oletetaan normaalijakaumamalli ja tutki valmistajan väitettä sopivan merkitsevyystestin ja 95 %:n luottamusvälin avulla. Syötetään aluksi havaintoaineisto R:n muistiin: valitse valikosta Data -> New data set... ja määrittele avautuvassa ikkunassa syötettävälle aineistolle nimi (esim. tuoremehu) ja paina OK. Anna muuttujan nimeksi (oletusarvona V1) cvitamiini, syötä aineisto ensimmäiselle sarakkeelle ja sulje aineistoikkuna OK-nappilla. Yhden otoksen t-testi (keskiarvotesti) voidaan suorittaa valitsemalla valikosta Statistics -> Means -> Single-sample t-test... Variable-osiossa testattava muuttuja cvitamiini Null hyphotesis: mu= -osiossa nollahypoteesin mukainen odotusarvo 20 Confidence level -osiossa laskettavan luottamusvälin luottamustaso 0.95 One Sample t-test data: cvitamiini t = -3.2, df = 14, p-value = alternative hypothesis: true mean is not equal to percent confidence interval: sample estimates: mean of x
8 B) Luentoesimerkki: 1500:sta satunnaisesti valitusta henkilöstä 90 ilmoitti kannattavansa puoluetta A. Puolueen A puoluetoimistossa kannatusprosentin arvellaan olevan 8 %. Onko puoluetoimiston arvelu uskottava kerätyn aineiston perusteella? Vastaa kysymykseen tilanteeseen sopivan merkitsevyystestin perusteella. Laske lisäksi 95 %:n luottamusväli parametrille π. Tehtävän aineisto on talletettu y-levylle hakemistoon Y:/Yleiset/Mikroluokat/Matematiikka/johd_tilt_19 nimellä "kannatus.txt". Valitse valikosta Data -> Import data -> from text file, clipboard or URL... anna Enter name for data set -osiossa aineiston nimeksi kannatus. Paina OK. etsi kannatus.txt -niminen aineisto y-levyltä ja paina OPEN. Suhteellisen osuuden testi (yksi otos) voidaan suorittaa valitsemalla valikosta Statistics -> Proportions -> Single-sample proportion test... - Variable-osiossa testattava muuttuja (puolue_a), - Options-lehden Null hyphotesis: p= -osiossa H 0 :n mukainen suhteellinen osuus Confidence level -osiossa suhteelliselle osuudelle laskettavan luottamusvälin luottamustaso Frequency counts (test is for first level): puolue_a A:n kannattaja ei A:n kannattaja sample proportions test without continuity correction data: rbind(.table), null probability 0.08 X-squared = , df = 1, p-value = alternative hypothesis: true p is not equal to percent confidence interval: sample estimates: p 0.06 Huom. Kokeile tehdä edellinen tehtävä myös ilman valikon valintoja suorittamalla scriptikkunassa komento prop.test(90,1500, alternative="two.sided", p=.08, conf.level=.95, correct=false) Huom. R käyttää suhteellisen osuuden luottamusvälilaskennassa ja merkitsevyystestauksessa hieman eri kaavoja kuin luentomonisteessa esitetyt, mutta testaukseen liittyvä hypoteesen asettelu ja P-arvo ovat samat kuin mitkä luentomonisteen mukaisilla määrityksillä saataisiin. Samoin luottamusvälien tulkinta on yhteneväinen luentomonisteessa esitettyjen periaatteiden kanssa. 8
9 HARJOITUSTEHTÄVIÄ Vaihda mittausaineisto aktiiviseksi aineistoksi valikon valinnoilla Data -> Active data set -> Select active data set Mittausharjoituksessa yhtenä tehtävänä oli arvioida sadan irtokarkin yhteispainoa (g). Nämä painoarviot on talletettu muuttujaan sata_karkkia. a) Laske painoarvioiden keskiarvo, keskihajonta, mediaani ja kvartiiliväli. b) Sopivien tunnuslukujen valinta. b1) Vertaa a)-kohdassa laskemiasi keskiarvoa ja mediaania toisiinsa. Ovatko ne likimain samat? Kumpaan suuntaan jakauma on vino (jos se ylipäätänsä on vino)? b2) Muodosta painoarvioiden histogrammi. Näyttäisikö jakauma olevan piirretyn kuvion perusteella symmetrinen? b3) Millä tunnusluvulla kuvailisit ko. jakauman sijaintia (mediaani vai keskiarvo) ja hajontaa (kvartiiliväli vai keskihajonta)? 2. Ryhmien välistä vertailua. a) Vertaile tilanteeseen sopivan kuvion avulla painoarvioiden jakaumia a1) sukupuolten (muuttuja sukupuoli), a2) opintosuuntien (muuttuja opintosuunta) välillä. b) Laske eri opintosuuntien opiskelijoiden keskiarvot ja mediaanit muuttujalle sata_karkkia. 3. Satunnaismuuttuja X N(135, 15 2 ). a) Esitä jakauma graafisesti. b) Laske b1) P (X 130), b2) P (X > 150), b3) Määrää piste a siten, että P (X a) = Tässä tehtävässä yritetään arvioida mittausharjoituksessa kerättyjen neljän irtokarkin punnitustulosten keskimääräistä suuruutta. a) Arvotaan kaikkien punnitustulosten joukosta seitsemän punnitustulosta ja talletaan arvonnan tulos vektoriin painot. Kirjoita (ja suorita) seuraavat komennot R-commanderin script-ikkunaan: painot <- sample(nelja_karkkia, 7, replace=true) painot # tulostetaan arvonnan lopputulos Silmäile hetki arvottuja tuloksia. Minkä arvion antaisit tulosten perusteella keskimääräiselle neljän irtokarkin painolle perusjoukossa? 9
10 b) Lasketaan arvottujen punnitustulosten aritmeettinen keskiarvo: mean(painot) Minkä arvion antaisit nyt keskimääräiselle neljän irtokarkin painolle perusjoukossa? c) Arvotaan perusjoukosta seuraavaksi 500 kertaa seitsemän punnitustulosta, lasketaan jokaisen arvonnan arvontatuloksista aritmeettinen keskiarvo ja esitetään kyseisten keskiarvojen jakauma histogrammina. source("y:/yleiset/mikroluokat/matematiikka/johd_tilt_19/karkkiotanta.txt") karkkiotanta(500) # simuloidaan Minkä arvion antaisit saadun kuvan perusteella keskimääräiselle neljän irtokarkin painolle? d) Selvitetään lopuksi arvioitavan parametrin todellinen arvo laskemalla kaikkien punnitustulosten aritmeettinen keskiarvo. mean(nelja_karkkia, na.rm=true) 5. Luokkaharjoituksen 7 tehtävät 5 ja 6: Harjoituksen 1 mittausharjoituksessa yhtenä tehtävänä oli poimia sadan irtokarkin joukosta neljä irtokarkkia, joiden yhteispaino (= X, grammoissa) punnittiin. Tämän punnitustehtävän teki kaikkiaan 149 opiskelijaa. Oletetaan, että satunnaismuuttuja X N(µ, σ 2 )-jakaumaa. Tehtävänä on arvioida parametrin µ suuruutta. Punnitustulosten joukosta arvottiin seuraavat kuusi tulosta: 34, 34, 28, 35, 55, 43 a) Määrää a1) 95 %:n, a2) 90 %:n luottamusväli parametrille µ eli kaikkien punnitustulosten keskiarvolle. b) Voisiko neljän irtokarkin keskimääräinen punnitustulos perusjoukossa olla 50 grammaa? Suorita tilanteeseen sopiva merkitsevyystestaus. 6. Luokkaharjoituksen 7 tehtävät 7 ja 8: Harjoituksen 1 mittausharjoituksessa kysyttiin vastaajan kätisyydestä. Kysymykseen vastasi kaikkiaan 147 opiskelijaa, joista 10 ilmoitti olevansa vasenkätisiä. Oletetaan, että kysymykseen vastaajat ovat satunnaisotos kaikkien Oulun yliopiston opiskelijoiden joukosta ja tehtävänä on arvioida vasenkätisyyden yleisyyttä ko. perusjoukossa eli populaatiossa. a) Määrää piste-estimaatti vasenkätisten suhteelliselle osuulle perusjoukossa. b) Määrää b1) 95 %, b2) 90 % luottamusväli vasenkätisten suhteelliselle osuudelle perusjoukossa. c) Voisiko vasenkätisten prosentuaalinen osuus Oulun yliopiston opiskelijoiden keskuudessa olla 10 %? Suorita tilanteeseen sopiva tilastollinen merkitsevyystestaus. 10
pisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
LisätiedotThe decimal point is 1 digit(s) to the right of the
806118P JOHDATUS TILASTOTIETEESEEN Mikroluokkaharjoitus 2/3, kevät 2019, viikko 6 Käynnistä R-ohjelma valinnoilla Start -> Programs -> R -> R x64 3.4.2. Käytämme tässä harjoituksessa R-ohjelmaa pääasiassa
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotLuottamusvälit. Normaalijakauma johnkin kohtaan
Luottamusvälit Normaalijakauma johnkin kohtaan Perusjoukko ja otanta Jos halutaan tutkia esimerkiksi Suomessa elävien naarashirvien painoa, se voidaan (periaatteessa) tehdä kahdella tavalla: 1. tutkimalla
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
LisätiedotMat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
LisätiedotTeema 8: Parametrien estimointi ja luottamusvälit
Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
Lisätiedothttps://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014
1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014
Lisätiedot9. laskuharjoituskierros, vko 12-13, ratkaisut
9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
Lisätiedot/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2
LisätiedotEstimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio
17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla
LisätiedotMTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
LisätiedotTutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
LisätiedotMTTTP5, luento Luottamusväli, määritelmä
23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A
Lisätiedotriippumattomia ja noudattavat samaa jakaumaa.
12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta
LisätiedotTutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
LisätiedotAalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,
Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 017 Laskuharjoitus 4, Kotitehtävien palautus Mycourses:iin PDF-tiedostona
Lisätiedot/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotPylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.
Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien
LisätiedotTodennäköisyysjakaumia
8.9.26 Kimmo Vattulainen Todennäköisyysjakaumia Seuraavassa esitellään kurssilla MAT-25 Todennäköisyyslaskenta esille tulleita diskreettejä todennäköisyysjakaumia Diskreetti tasajakauma Bernoullijakauma
Lisätiedot7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025
26.3.2019/1 MTTTP1, luento 26.3.2019 7.4 Normaalijakauma (kertausta ja täydennystä) Z ~ N(0, 1), tiheysfunktion kuvaaja 0,5 0,4 0,3 0,2 0,1 Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96)
Lisätiedot/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla
17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
Lisätiedot/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla
16.11.2017/1 MTTTP5, luento 16.11.2017 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla ~,, ~,,. 16.11.2017/2 Esim. Tutkittiin uuden menetelmän käyttökelpoisuutta
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
Lisätiedot1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi
Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,
LisätiedotMTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)
MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
LisätiedotOtoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden
1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma
Lisätiedot4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:
Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15,
LisätiedotMatematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
LisätiedotJos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan
17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen
MTTTP5, kevät 2016 4.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen 1. Laitosneuvostoon valitaan 2 professoria, 4 muuta henkilökuntaan kuuluvaa jäsentä sekä 4 opiskelijaa. Laitosneuvostoon
LisätiedotTilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit
Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
Lisätiedotb6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.
806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta
Lisätiedot/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin
30.11.2017/1 MTTTP5, luento 30.11.2017 Kertausta H 0 : µ = µ 0 Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin = / ~ 0,1. Kaava 5.1 30.11.2017/2 Esim. Tutkija
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
LisätiedotTehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)
1/10 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
Lisätiedot¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.
10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
LisätiedotSPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö
SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin
LisätiedotParametrin estimointi ja bootstrap-otanta
Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
LisätiedotMiten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?
21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä
LisätiedotJohdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotLuentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012
Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
Lisätiedotedellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾
ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos
LisätiedotEsim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4
18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5
LisätiedotTodennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1
Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen
LisätiedotEstimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1
Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta
LisätiedotJohdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
LisätiedotJohdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
LisätiedotMatematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
Lisätiedot30A02000 Tilastotieteen perusteet
30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
LisätiedotEstimointi. Otantajakauma
Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa
Lisätiedot3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?
Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
LisätiedotLisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia
Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma
LisätiedotOngelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?
Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen
LisätiedotIlkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
Lisätiedot10. laskuharjoituskierros, vko 14, ratkaisut
10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset
LisätiedotTilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle
Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen
LisätiedotDiskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi
TOD.NÄK JA TILASTOT, MAA0 Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi Kuten tilastojakaumia voitiin esittää tunnuslukujen (keskiarvo, moodi, mediaani, jne.) avulla, niin vastaavasti
LisätiedotPOPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).
KÄSITTEITÄ POPULAATIO Joukko, jota tutkitaan (äärellinen, ääretön). Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut). Näiden välillä ei aina tehdä eroa, kun puhutaan
Lisätiedot