|
|
- Esa Hovinen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 810 Tilastolliste meetelmie perusteet II (TILTP3), Kevät Huom 1 Dokumeti lopussa o kirjallisuusluettelo, joka sisältäviä teoksia o käytetty tukea tämä luetorugo kirjoittamisessa Huom Kaikki erikoismerkit eivät välttämättä äy/tulostu koeellasi oikei Iformoitha tekijää (raijaleppala@utafi), jos tekisiä ogelmia esiityy Summary of Fit RSquare 0, Root Mea Square Error 16,58795 Mea of Respose 179,539 Observatios (or Sum Wgts) 60 Aalysis of Variace Source DF Sum of Squares Mea Square F Ratio Model , ,4 Error ,1 75 Prob>F C Total ,9 0,0000 Parameter Estimates Term Estimate Std Error t RatioProb> t Itercept 15, , ,34 0,0001 x 3, , ,77 0,087 x^ 10,6645 0, ,56 0,0000 Raija Leppälä puh , sähköposti raijaleppala@utafi Matematiika, tilastotietee ja filosofia laitos Tamperee yliopisto SISÄLLYSLUETTELO 3 1 JOHDANTO 4 sivu 1 JOHDANTO 4 11 JATKUVISTA JAKAUMISTA 5 1 SATUNNAISOTOS, OTOSSUURE, OTANTAJAKAUMA 7 13 ESTIMOINTI 8 14TILASTOLLINEN TESTAUS 9 VARIANSSIANALYYSI 19 1 YKSISUUNTAINEN VARIANSSIANALYYSI 19 KAKSISUUNTAINEN VARIANSSIANALYYSI8 3 œ -YHTEENSOPIVUUS- JA RIIPPUMATTOMUUSTESTIT œ -YHTEENSOPIVUUSTESTI 34 3 œ -RIIPPUMATTOMUUSTESTI 38 4 REGRESSIOANALYYSI YKSI SELITTÄVÄ MUUTTUJA 45 4 USEAMPI SELITTÄVÄ MUUTTUJA SELITTÄVIEN MUUTTUJIEN VALINNASTA JA MALLIN OLETUKSISTA VARIANSSIANALYYSIMALLI 61 5 EPÄPARAMETRISISTÄ MENETELMISTÄ 61 KIRJALLISUUTTA 66 Tilastolliste meetelmie perusteet I - opitojaksolla tutustuttii todeäköisyysjakaumii, otosjakaumii, parametrie estimoitii sekä hypoteesie testauksee Tällä kurssilla tutustutaa variassiaalyysii, regressioaalyysii sekä χ -yhteesopivuustestii ja χ - riippumattomuustestii sekä hyvi lyhyesti epäparametrisii testeihi Yksisuutaie variassiaalyysi o yleistys kahde riippumattoma otokse t-testistä Regressioaalyysi avulla mallitetaa muuttujie välistä riippuvuutta χ - yhteesopivuustesti avulla voidaa testata sitä, oko otos peräisi tietystä jakaumasta χ - riippumattomuustesti testaa kahde muuttuja välistä riippuvuutta perustaa ristiitaulukko Epäparametrisissä testeissä voidaa tikiä jakaumaoletuksista, joita parametrisissä testeissä joudutaa tekemää
2 Empiirisessä tutkimuksessa o käytössä satuaisotos, joka perusteella pyritää tekemää johtopäätelmiä populaatiosta Yksikertaisimmissa tilateissa johtopäätelmie teko voidaa perustaa otoksesta laskettuu sopivaa testisuureesee, joka todeäköisyysjakauma ollahypoteesi vallitessa tuetaa Tilastollie päättely sisältää aia tiettyä epävarmuutta, mutta sitä pyritää hallitsemaa juuri äide otossuureide todeäköisyysjakaumie avulla Seuraavassa lyhyesti kertauksea TILTP:lla esillä olleita asioita 11 JATKUVISTA JAKAUMISTA Normaalijakauma Jatkuva satuaismuuttuja X, joka voi saada kaikki reaalilukuarvot, saotaa oudattava ormaalijakaumaa parametrei µ ja σ (σ>0), jos se tiheysfuktio o f(x)= 1 σ π e 1 x µ σ 5 Merkitää X~ N(µ,σ ) Tällöi E(X)=µ ja Var(X)=σ Jos X~ N(0,1), ii kyse o k stadardoidusta ormaalijakaumasta Usei merkitää Z~ N(0,1), f(z)=φ(z) ja F(z)= Φ(z) Stadardoidu ormaalijakauma kertymäfuktio arvot o taulukoitu Näitä taulukoita voidaa käyttää hyväksi laskettaessa ormaalijakaumaa liittyviä todeäköisyyksiä Jos X~ N(µ,σ ), ii Z = (X-µ)/σ ~ N(0,1) Olkoo Z ~ N(0,1) Määritellää z α site, että P(Z z ) α = α Samoi z α/ site, että P(Z z ) α/ = α/ Esim 111 α= 01, z α =18, z α/ =165 Studeti t-jakauma Studeti t-jakauma, joka määritellää k vapausastei (df), o jatkuva, origo suhtee symmetrie jakauma Merkitää t df 6 Suurilla vapausasteilla t-jakauma lähestyy stadardoitua ormaalijakaumaa Studeti t-jakauma kertymäfuktio arvoja eri vapausastei o taulukoitu Olkoo t df Studeti t-jakaumaa oudattava satuaismuuttuja Määritellää tα;df site, että P(t df tα;df)=α ja P(t df tα/;df)=α/ Esim 11 α= 01, t α;3 =13, t α/;3 = 1714 α= 001, t α;10 = 358, t α/;10 =617 1 SATUNNAISOTOS, OTOSSUURE, OTANTAJAKAUMA Satuaismuuttujajooa X1, X,, X saotaa satuaisotokseksi, jos Xi :t ovat riippumattomia ja oudattavat samaa jakaumaa Saota: X 1, X,, X o satuaisotos N(µ,σ ):sta tarkoittaa sitä, että X i :t ovat 7 toisistaa riippumattomia ja jokaie X i ~N(µ,σ ) Satuaisotoksesta muodostetut fuktiot ovat satuaismuuttujia, joita kutsutaa otossuureiksi Otossuure todeäköisyysjakaumaa kutsutaa otatatai otosjakaumaksi 13 ESTIMOINTI Estimoiti o populaatio tutemattoma parametri arvioitia sopiva otossuuree avulla Tätä otossuuretta kutsutaa estimaattoriksi ja se arvoa estimaatiksi Näi tehtäessä puhutaa piste-estimoiista Esimerkiksi voidaa estimoida populaatio odotusarvoa otoskeskiarvolla, populaatio variassia otosvariassilla Estimaattori o harhato, jos se odotusarvo o estimoitava parametri Esim 131 Olkoo X 1, X,, X satuaisotos jakaumasta, joka odotusarvo o µ ja variassi σ Tällöi X o µ: 8
3 harhato estimaattori Estimaattori keskivirhe σ / Väliestimoii yhteydessä ilmoitetaa väli, jolle arvellaa tutemattoma parametri kuuluva Tämä k luottamusväli muodostetaa vastaava piste-estimaattori ja piste-estimaattori otatajakauma keskihajoa eli estimaattori keskivirhee avulla (kstiltp: kaavakokoelma) 14 TILASTOLLINEN TESTAUS Tilastollie hypoteesi o väittämä populaatiosta, se jakaumasta ja/tai jakauma parametrista Hypoteesi testaus tarkoittaa väittämä tutkimista otokse perusteella Testauksessa määritellää sopiva otossuure, jota kutsutaa testisuureeksi, ja lasketaa otoksesta sille arvo, joka perusteella väittämä hyväksytää tai hylätää Väittämä laaditaa site, että se ollessa tosi testisuuree todeäköisyysjakauma tuetaa Havaitu otokse perusteella lasketaa testisuurelle arvo, joka avulla päätellää sopiiko saatu arvo testisuuree jakaumaa 9 vai kuuluuko se harviaiste arvoje joukkoo Jos testisuuree arvo sopii väittämä jakaumaa hyväksytää väittämä Jos laskettu testisuuree arvo voidaa katsoa kovi harviaiseksi, ii väittämä hylätää ja hyväksytää k vaihtoehtoie hypoteesi Hypoteesi testauksessa asetetaaki siis kaksi väittämää, joista jompi kumpi o välttämättä voimassa: Nollahypoteesi, joka ollessa tosi testisuure jakauma tuetaa sekä vaihtoehtoie hypoteesi Testaukse vaiheet: 1) Asetetaa ja site, että jompi kumpi väittämä välttämättä voimassa ) Valitaa riskitaso (merkitsevyystaso) α eli oikea : hylkäämise todeäköisyys 3) Muodostetaa testisuuree otosjakauma, ku o tosi 4) Määrätää testisuuree harviaiste arvoje joukko eli testi kriittie alue, joka riippuu valitusta merkitsevyystasosta sekä vaihtoehtoisesta hypoteesista ) Lasketaa otoksesta testisuureelle arvo 6) Hylätää, jos saatu arvo kuuluu kriittiselle alueelle, muulloi hyväksytää Oletetaa, että X 1, X,, X satuaisotos N(µ,σ ):sta, missä σ tutemato Tällöi : ollessa tosi 1 Testaukse yhteydessä iformatiivista o myös ilmoittaa todeäköisyys, että : vallitessa saadaa havaittu tai sitä harviaisempi arvo testisuureelle Tämä todeäköisyys o piei riskitaso, jolla voidaa hylätä Tätä todeäköisyyttä merkitää p:llä ja puhutaa p -arvosta Testimeettelyssä voidaa yt laskea testisuuree arvoo liittyvä p -arvo ja hylätä mikäli p o pieempi kui valittu α Testisuureita (ks TILTP: kaavakokoelma): 1) : µ=µ 0 Olkoo X 1, X,, X satuaisotos N(µ,σ ):sta, missä σ tuettu Tällöi : ollessa tosi Z = X µ 0 ~N(0,1) σ / ) : µ=µ 0 t = X µ 0 s/ ~t( 1) Esim 141 Testataa hypoteesia, että populaatio odotusarvo o 50 Viide alkio otokse perusteella otoskeskiarvoksi saadaa 65 ja keskihajoaksi 116 Mikä o piei riskitaso, jolla ollahypoteesi voidaa hylätä yksisuutaisessa testissä? Etä kaksisuutaisessa? Vastaus: t = 89, p 005 (yksisuutaisessa testissä) 3) : π=π 0 Olkoo populaatiossa π % viallisia, josta X 1, X,, X satuaisotos Jos tosi, ii likimai p π Z = 0 ~ N(0,1), π 0 (100 π 0 )/ missä p o otoksessa vialliste %-osuus
4 Esim 14 Eräs puolue väittää, että suomalaisista 40 % kaattaa sitä Väittee tutkimiseksi teet kysely 5000 hekilölle, joista 1800 ilmoitti kaattavasa kyseistä puoluetta Oko puolue arvioiut kaatuksesa oikei? Vastaus: z = -577, joka o < -196, jote puolue o arvioiut kaatuksesa liia suureksi 4) : µ 1 =µ Olkoo X 1, X,, X satuaisotos N(µ 1,σ 1 ):sta ja olkoo Y 1, Y,, Y m satuaisotos N(µ,σ ):sta, missä σ 1 ja σ tuettuja sekä satuaisotokset toisistaa riippumattomia Jos tosi, ii Z = X Y σ 1 + σ m ~N(0,1) 5) : µ 1 =µ Olkoo X 1, X,, X satuaisotos N(µ 1,σ 1 ):sta ja olkoo Y 1, Y,, Y m satuaisotos N(µ,σ ):sta, missä σ 1 ja σ tutemattomia (mutta yhtä suuria) sekä 13 satuaisotokset toisistaa riippumattomia Jos tosi, ii t = X Y S m ~t(+ m ) missä s = ( 1)s + (m 1)s X Y + m Esim 143 Psykologi o kehittäyt testi, joka koostuu muutamasta yksikertaisesta käsi suoritettavista tehtävistä ja joka tarkoitus o paljastaa mahdollie lievä kehityshäiriö Hä o poimiut satuaisotokse sekä ormaaleista lapsista että kehityshäiriöisistä Suoritusajat ovat: Normaali: 04, 18, 197, 183, 7, 33, 191 Kehityshäiriö: 43, 8, 61, 0, 343, 4,0,39 Kelpaako testi tarkoituksee? Vastaus: t = -8, 001 < p < 005 6) : µ 1 =µ (vastiparitilae) : µ D = 0 : ollessa tosi testisuure D t = ~t( 1) s D / 14 Esim144 Halutaa tutkia erää meetelmä vaikutusta ihmise hegitystilavuutee Tehdää 5 alkio satuaisotos populaatiosta ja mitataa koehekilöide hegitystilavuudet ee meetelmä soveltamista sekä meetelmä soveltamise jälkee Tulokset ohessa Oko meetelmällä ollut vaikutusta? Hegitystilavuus ee jälkee Vastaus: t = 193, 005 < p < 01 Lähde: Liski & Putae, Tilastotietee peruskurssi II Suurte otoste tapauksessa edellä esitettyjä testejä voidaa käyttää myös muideki kui ormaalijakaumie yhteydessä 7) : π 1 =π Olkoo 1 populaatiossa π 1 % viallisia ja populaatiossa π % viallisia Olkoo otoksista lasketut vastaavat prosettiosuudet p 1 ja p otoskokoje ollessa ja m Ku o tosi, ii 15 Z = p 1 p p * (100 p * )( m ) ~ N(0,1),likimai missä p * = p 1 + mp + m Esim 145 Erää tilastotietee perusopitojakso teti tuloksesta saatii seuraava ristiitaulukko Mies Naie Hylätty ,56% 39,47% Hyväksytty ,44% 60,53% Voidaako tuloste perusteella päätellä, että miehet meestyvät aisia paremmi tilastotietee perusopioissa? Vastaus: z = -031, p = ================================== SPSS: Luottamusvälit: 1) Luottamusväli populaatio odotusarvolle Compare Meas > Oe-Samples t-test 16
5 17 ) Luottamusväli populaatio odotusarvoje erotukselle, riippumattomat otokset Compare Meas > Idepedet Samples t-test 3) Luottamusväli populaatio odotusarvoje erotukselle, riippuvat otokset (vastiparitilae) Compare Meas > Paired-Samples t-test Vastiparie arvot havaitomatriisissa oltava eri muuttujissa! 4) Luottamusvälit prosetuaalisille osuuksille: Ohjelmistolla lasketaa prosetuaaliset osuudet esim frekvessijakauma tai ristiitauluko avulla Summarize > Crosstabs Frequecies ja tämä jälkee itse kyseie luottamusväli Testisuureet: 1) : µ=µ 0 Compare Meas > Oe-Samples t-test ) : π=π 0 Lasketaa vastaava %-osuus otoksesta ja se avulla z-testisuurelle arvo Prosettiosuude saa selville muodostamalla frekvessijakauma muuttujasta (Eiparametrisistä testeistä löytyy mahdollisuus kyseise testi suorittamisee z-testisuurella, jolloi tulostuu vai p-arvo, tai käyttäe yhteesopivuustestiä) 3) : µ 1 =µ Compare Meas > Idepedet Samples t-test 4) : µ 1 =µ (vastiparitilae) Compare Meas > Paired-Samples t-test Vastiparie arvot havaitomatriisissa oltava eri muuttujissa! 18 VARIANSSIANALYYSI (ANOVA, Aalysis of Variace) 1YKSISUUNTAINEN VARIANSSIANALYYSI Esim 11 Tutkitaa Golf-palloje letoomiaisuuksia (mitataa letomatkaa, Distace) Tutkittavaa o kolme erimerkkise pallo (Brad A, B, C) omiaisuudet Tutkimukse tulokset graafisesti pisteparvea: Distace By Brad 80,0 19 Esimerki otoskeskiarvot poikkeavat ryhmittäi toisistaa joki verra atae viitteitä siitä, että populaatiossa odotusarvot saattaisivat olla eri suuret Nyt voidaaki, samalla tavalla kui kahde otokse t- testissä, testata poikkeavatko odotusarvot toisistaa Eroa t -testii o se, että kahde otokse sijaa voi olla useampia otoksia (tässä 3) Aalysoitimeetelmä o imeltää yksisuutaisesta variassiaalyysi, jossa 0 Distace 75,0 70,0 65,0 60,0 55,0 50,0 45,0 40,0 Brad A Brad B Brad C Brad Letomatka ehdolliset keskiarvot ovat: Brad A 51,8 Brad B 61,06 Brad C 69,95 : µ A = µ B = µ C : kaikki odotusarvot eivät ole samoja Testisuureea variassiaalyysissä o k F- testisuure, joka muodostetaa kahde eliösumma avulla ja jolla siis testataa odotusarvoje yhtä suuruutta Perusoletukse yksisuutaisessa variassiaalyysissä (1-VA) o se, että meillä o I kappaletta toisistaa riippumattomia satuaisotoksia
6 ormaalijakaumista, joide variassit ovat tutemattomia, mutta yhtä suuria Siis 1 = I Y ij = i ryhmä jhavaito, Y 11,Y 1,,Y 11 satuaisotos N(µ 1,σ ):sta, Y 1,Y,,Y satuaisotos N(µ,σ ):sta, Y I1,Y I,,Y II satuaisotos N(µ I,σ ):sta Halutaa tutkia ovatko jakaumie odotusarvot yhtä suuret, jolloi : µ 1 = µ = = µ I : kaikki odotusarvot eivät ole samoja Joitai merkitöjä testisuuree määritystä varte: i Y ij Y i = 1 i j=1 I i = i ryhmä keskiarvo, Y = 1 Y ij = yleiskeskiarvo eli i=1 j=1 kaikkie havaitoje keskiarvo, Kokoaiseliösumma SST I i = (Y ij Y) i=1 j=1 I = i (Y i Y) + (Y ij Y i ) i=1 Merk = SSB + SSW I i i=1 j=1 Y: kokoaisvaihtelua kuvaava SST voidaa jakaa kahtee osaa: Kokoaisvaihtelu (SST) =ryhmie välie vaihtelu (SSB) + ryhmie sisäie vaihtelu (SSW) SSB: yhteydessä puhutaa myös mallii liittyvästä eliösummasta ja SSW: yhteydessä jääöseliösummasta (SSE) Merkitää vielä MSB=SSB/(I-1) MSW=SSW/(-I), missä eliösummat o jaettu k vapausasteillaa, jolloi saadaa keskieliösummat Voidaa osoittaa, että MSW o σ : harhato estimaattori aia ja MSB o σ : harhato estimaattori, ku o tosi Lisäksi : ollessa tosi F=MSB/MSW oudattaa Fisheri F-jakaumaa vapausastei I-1 ja -I Merk F=MSB/MSW ~F(I-1,-I) F-jakauma määritellää siis kaksi vapausastei Olkoo F df1,df Fisheri F- jakaumaa oudattava satuaismuuttuja Määritellää Fα;df1,df site, että P(F df1,df Fα;df1,df)=α 3 Näitä o taulukoitua eri vapausastei muutamilla α: arvoilla Edellä variassiaalyysi testaukse yhteydessä estimoidaa σ :sta kahdella tavalla Jos ei ole tosi, ii MSB pyrkii yliestimoimaa variassia, joka seurauksea F-arvo tulee "liia suureksi" Nyt voidaa hylätä riskitasolla α, jos otokse perusteella laskettu F: arvo F havaittu >Fα;I-1,-I Variassiaalyysi-imitys o hiema harhaajohtava Variassiaalyysi yhteydessä testataa odotusarvoje yhtä suuruutta Toki variassieki yhtäsuuruude testaamie voidaa (ja pitääki) suorittaa, mutta se o oletuste paikkasa pitävuude selvittämistä, eikä varsiaisesti riippuvuustarkasteluje tekemistä (ks Esim 14, SPSS-tulostus) Nimitys tullee testisuureesta, joka perustuu kahtee variassi estimaattorii 4
7 Variassiaalyysi tulokset o tapaa esittää taulukkoa eliö vapa- keskisum- us- eliömat asteet sumvaihtelu (SS) (df) mat(ms) F-arvo p-arvo välie SSB I-1 MSB F= P(F F hav ) =SSB/(I-1) MSB sisäie SSW -I MSW MSW (jääös) =SSW/(-I) ~F(I-1,-I), ku H0 tosi kokoais SST -1 Esim 1 Neliösummat sekä testaus esimerki 11 tilateessa Aalysis of Variace Source DF Sum of Squares Mea Square F Ratio Model 1744, ,08 36,8864 Error 7 638,3450 3,64 Prob>F Total 9 38,5097 0,0000 Esim 13 Tutkitaa kolme eri valmeusmeetelmä vaikutusta urheilusuorituksee saatii aieisto: Meetelmä 1: Meetelmä : Meetelmä 3: Oko valmeusmeetelmie vaikutuksilla merkitsevää eroa? Vastaus: F = 9, F 001,, 9 = 80, jote o eroja Lähde: Liski & Putae, Tilastotietee peruskurssi II 5 Esim 14 Tutkitaa eri autotyyppie (A,B ja C) kulutusta O saatu aieisto, jossa kulutusarvot (miles per gallo) ovat: A-autot B-autot C-autot Vaikuttaako autotyyppi keskimääräisee kulutuksee? Vastaus: F = 15038, p = 0000 Ks jaettu moiste SPSS: tulostuksesta Lähde: Newbold (1995), Statistics for Busiess ad Ecoomics Jos yksisuutaisessa variassiaalyysissä hylätää ja täte hyväksytää, ii usei halutaa lisäksi selvittää mikä ryhmie välillä odostusarvot poikkeavat toisistaa Tämä voidaa tehdä parittaiste luottamusvälie avulla Muodostetaa tavaomaiset luottamusvälit (µ i - µ j ):lle 6 X X ± t s i j α / ; i+ j ij i, j 7 Esim 16 t-testi ja 1-VA, jaettu moiste 8 s ij ( 1) s + ( 1) s = + i i j j i j (luottamusväli odotusarvoje erotukselle, ks TILTP) Jos halutaa, että kaikki parittaiset luottamusvälit sisältävät todellise erotukse todeäköisyydellä, joka o vähitää 1 - α, ii voidaa käyttää esim k Boferroi luottamusväliä X s X ± t s i j α */ ; I i j SSW * α = I= MSW, α = I( I 1) Esim 15 Moivertailu esimerki 14 tilateessa (ks SPSS -tuloste) Yksisuutaie variassiaalyysi o kahde populaatio tilateessa idettie riippumattomie otoste t -testi kassa Tällöi t =F, Variassiaalyysi käyttö edellyttää siis selitettävältä muuttujalta vähitää itervalliasteikollista mittausta (ormaalijakaumaoletukset) Selittävälle muuttujalle ei aseteta mitta-asteiko suhtee vaatimuksia Jos selittävä muuttuja o umeerie o se tietysti esi luokiteltava sopivasti ================================== SPSS: Yksisuutaie variassiaalyysi Compare Meas > Oe-Way Aova KAKSISUUNTAINEN VARIANSSIANALYYSI Esim 1 Eräällä kurssilla lueot esitettii toiselle ryhmälle televisioituia ja toiselle ryhmälle tavallisee tapaa Osallistujille tehtii testi sekä ee että jälkee kurssi Näide testipistemäärie erotukset olivat:
8 Tavallie Naiset TV Tavallie Miehet TV Haluttaessa tutkia vaikuttaako opetustapa oppimisee, voidaa käyttää t-testiä tai yksisuutaista variassiaalyysiä Samoi jos tutkitaa oko sukupuolella vaikutusta oppimisee Mielekiitoisempaa lieee kuiteki se selvittämie, mite opetustapa ja sukupuoli yhdessä vaikuttavat oppimisee Tällöi selitetää umeerista muuttujaa kahdella luokittelutaso muuttujalla Aalysoiti voidaa suorittaa kaksisuutaisella variassiaalyysillä Usei variassiaalyysi yhteydessä selittäviä muuttujia kutsutaa faktoreiksi (A ja 9 B) ja iide luokkia tasoiksi Faktori B vaikutus selitettävää muuttujaa saattaa olla erilaista A: eri tasoilla Tällöi saotaa, että A:lla ja B:llä o yhdysvaikutusta eli iteraktiota Kaksisuutaise variassiaalyysi avulla pyritää selvittämää: 1) Oko A:lla B:stä riippumatota vaikutusta selitettävää eli oko A:lla omavaikutusta? ) Oko B:llä A:sta riippumatota vaikutusta selitettävää eli oko B:llä omavaikutusta? 3) Oko A:lla ja B:llä yhdysvaikutusta? Esim Oko opetustava vaikutus pistemäärää erilaista aisilla ja miehillä? Kohtii 1) - 3) liittyy jokaisee oma F- testisuureesa Mielekiitoisi tutkittava o tietysti yhdysvaikutus F-testisuureet määritellää samaa tapaa kui yksisuutaisessa variassiaalyysissä eliösummie avulla 30 Merkitää: SSA o A: omavaikutuksee liittyvä eliösumma,ssb o B: omavaikutuksee liittyvä eliösumma, SSAB o A: ja B: yhdysvaikutuksee liittyvä eliösumma ja SSE jääöseliösumma Näihi eliösummii perustue määritellää testisuureet Testaukset kaksisuutaisessa variassiaalyysissä: 1) : A:lla ei ole omavaikutusta : A:lla o omavaikutusta Jos tosi, ii FA =MSA/MSE~Fdf A,df SSE, missä MSA=SSA/df A, MSE=SSE/df SSE (MS-eliösummat saadaa siis, ku jaetaa eliösummat vapausasteillaa, joide määrittämie kute eliösummie laskuki jätetää ohjelmisto tehtäväksi!) Nyt hylätää riskitasolla α, jos otokse perusteella laskettu FA: arvo >Fα;df A,df SSE ) : B:lla ei ole omavaikutusta : B:lla o omavaikutusta Jos tosi, ii FB =MSB/MSE~Fdf B,df SSE, missä MSB=SSB/df B, MSE=SSE/df SSE 31 Nyt hylätää riskitasolla α, jos otokse perusteella laskettu FB: arvo >Fα;df B,df SSE 3) : A:lla ja B:llä ei yhdysvaikutusta : A:lla ja B:llä o yhdysvaikutusta Jos tosi,ii FAB=MSAB/MSE~Fdf AB,df SSE, missä MSAB=SSAB/df AB, MSE=SSE/df SSE Nyt hylätää riskitasolla α, jos otokse perusteella laskettu FAB: arvo>fα;df AB,df SSE Esim Esimerki 1 tilateessa kaksisuutaise variassiaalyysi, jaettu moiste Esim 3 Jaettu moiste ================================== SPSS: Kaksisuutaie variassiaalyysi Geeral Liear Model > Uivariate 3
9 3 χ -YHTEENSOPIVUUS- JA RIIPPUMATTOMUUSTESTIT Tutustutaa esi jakaumaa, jota oudattavaa testisuuretta yhteesopivuus- ja riippumattomuustestie yhteydessä tullaa käyttämää Olkoo Z 1, Z,, Z k riippumattomia satuaismuuttujia site, että kuki Z i ~ N(0,1) Tällöi Z 1 + Z + + Zk oudattaa k χ -jakaumaa vapausastei k Merkitää χ Voidaa osoittaa, että k E(χ k )=k, Var(χk ) = k χ -jakauma tiheysfuktio muoto määräytyy vapausasteide perusteella (ks jaettu moiste) Huomataa siis, että χ - jakauma ei ole symmetrie ja että χ - jakautuut satuaismuuttuja saa arvoksee ei-egatiivisia reaalilukuja 33 Olkoo χ -jakaumaa vapausastei k oudattava satuaismuuttuja χ k Määritellää luku χ α;k P(χ χα;k ) = α k site, että Näitä arvoja o taulukoitu muutamilla α: arvoilla ja eri vapausastei 31 χ -YHTEENSOPIVUUSTESTI χ -yhteesopivuustesti avulla voidaa testata sitä, oko satuaisotos peräisi tietystä jakaumasta Tässä siis hypoteesia väite jakaumasta, ei aiostaa jostai se parametrista, kute tähä asti esillä olleissa hypoteeseissa o ollut Esim 311 : Otos peräisi diskr tasajakaumasta : Otos ei ole peräisi kojakaumasta : Otos peräisi ormaalijakaumasta : Otos ei ole peräisi ormaalijakaumasta 34 Olkoo alkio satuaisotokse muuttuja luokiteltu site, että luokkie lukumäärä o k Olkoo lisäksi äide luokkie frekvessit f 1, f,, f k Testataa sitä, oko havaitut frekvessit sopusoiussa k teoreettiste eli odotettuje frekvessie e 1, e,, e k kassa Teoreettise frekvessit määrätää se perusteella, mistä jakaumasta ajattelemme otokse oleva peräisi Nyt : Otos peräisi tietyllä tavalla jakautueesta populaatiosta Jos o tosi, ii χ k (f = i e i ) i=1 e i ~ χ k 1 ja hylätää riskitasolla α, jos otokse perusteella laskettu χ : arvo χ havaittu >χ α;k 1 χ -yhteesopivuustestiä voidaa käyttää, jos kaikki teoreettiset frekvessit ovat >1 ja eitää 0% <5 35 Esim 31 Yhtiö tietää aikaisempie vuosie perusteella, että talve loputtua 80% se asiakkaista o maksaut laskusa ajoissa, 10% kuukaude myöhässä, 6% kuukautta myöhässä ja 4% eemmä kui kaksi kuukautta myöhässä Viimeisimmä talve loputtua tehdää 400 lähetety lasku satuaisotos, jossa ajallaa maksaeita o 87, 49 kuukaude myöhässä, 30 kaksi kuukautta myöhässä ja 34 eemmä kui kaksi kuukautta myöhässä Oko tämä perusteella epäiltävissä, että asiakkaide laskuje maksutavoissa o muutosta aiempii vuosii? Vastaus: χ =758, χ 0005, 3 = 184, jote voidaa olettaa, että o tapahtuut muutosta Lähde: Newbold (1995), Statistics for Busiess ad Ecoomics Yhteesopivuustesti yhteydessä joudutaa teoreettisia frekvessejä laskettaessa usei estimoimaa jakauma parametrit Tällöi käytety testisuuree jakauma vapausasteet väheevät estimoituje parametrie määrällä 36
10 Esim 313 Jos halutaa tutkia oko otos peräisi ormaalijakaumasta, o aluksi estimoitavaa kaksi parametria (odotusarvo ja variassi) Tehtii 1000 alkio satuaisotos ja saatii otoskeskiarvoksi 50 ja keskihajoaksi 10 Muodostetaa luokiteltu jakauma otokse perusteella site, että yksi luokka o (40,50) Mikä o tämä luoka teoreettie frekvessi? Vastaus: e 1 = 3413 Esim 314 Eräällä tilastotietee kurssilla ilmoittautumise yhteydessä "heitettii oppaa" site, että lomakkeessa oli kysymys: Kuvittele heittäväsi oppaa Heittosi tulos o Silmäluvu jakaumaksi saatii: silmäluku frekv % 1 8 6,6 5 4, ,9 4 7, , ,0 1 Testataa tapahtuiko heittämie satuaisesti Vastaus: χ =40,6, χ 0005, 5 = , jote äyttäisi siltä, että opaheitto ei tapahtuut täysi satuiasesti ================================== SPSS: χ -yhteesopivuustesti Noparametric tests > Chi-Square 3 χ -RIIPPUMATTOMUUSTESTI Ristiitaulukoide perusteella voitii tutkia muuttujie välistä riippuvuutta vertailemalla selitettävä muuttuja ehdollisia prosettijakauma Tällöi : : X ja Y ovat riippumattomia X ja Y ovat riippuvia χ -riippumattomuustestillä voidaa testata asetettua ollahypoteesia käyttäe perustaa ristiitaulukkoa 38 Olkoo muodostettu ristiitaulukko x 1 J 1 f 11 f 1 f 1J f 1 f 1 f f J f y I f I1 f I f IJ f I f 1 f f J Jos o tosi, ii e ij /f j = f i / eli e ij =f i f j / Lisäksi, ku o tosi, ii χ I J (f = ij e ij ) ~ χ (I 1)(J 1) i=1 j=1 e ij Nyt hylätää riskitasolla α, jos otokse perusteella laskettu χ : arvo χ havaittu >χ α;(i 1)(J 1) 39 χ = (f 11 f f 1 f 1 ) f 1 f f 1 f Riippumattomuustesti yhteydessä ei tarvita siis populaatioo liittyviä jakaumaoletuksia, kute esimerkiksi variassiaalyysi yhteydessä tehtii Riippumattomuustestiä voidaa siis käyttää jo luokitteluasteikolliste muuttujie yhteydessä Kuiteki, jotta χ -riippumattomuustestiä voidaa käyttää, o 1) df>1, kaikkie teoreettiste frekvessie oltava>1 sekä eitää 0% saa olla<5, ) df=1, jos >40 testi käyttö sallittu, jos 0 40 kaikkie teoreettiste frekvessie oltava 5 Jos edellä esitetyt vaatimukset eivät ole täytetty, voidaa koettaa luokituksia muuttumalla saada oletukset kutoo 40 Jos molemmat muuttuja o luokiteltu kahtee luokkaa (kyse eliketästä), ii testisuure voidaa laskea
11 Esim31 Erää lukuvuode TILTP: kurssi arvioitii liittyvässä kyselyssä oli mm seuraavat kysymykset: A Taustai Pääaieei o (ympyröi umero) 1 matematiikka tai tilastotiede kasataloustiede 3 tietojekäsittelyoppi 4 joki muu B Kurssi arvioiti 1 Kurssi sisältö Tämä kurssi o mielestäi työläs vähätöie vaikea helppo Odoti kurssi oleva työläämpi vähätöisempi vaikeampi helpompi Vastauste perusteella saatii seuraavat ristiitaulukot: Pääaie kas mat&til tko Kurssi vaikeus Pääaie kas mat&til tko Odotettu vaikeus Pääaie kas mat&til tko 1-10,34% 15,38% 9,17% Odotettu 3 6,07% 66,67% 37,50% vaikeus 4-5 7,59% 17,95% 33,33% Odotetut frekvessit toisee ristiitaulukkoo liittye ovat: Pääaie kas mat&til tko 1-5,04 6,78 4,17 Odotettu 3 16,71,47 13,83 vaikeus 4-5 7,5 9,75 6,00 Test ChiSquare Prob>ChiSq Pearso 6,69 0, Esim3 Erää Tilastotietee teti tulos pääaieittai kas mat&til tko Hylätty ,33 37,93 43,75 Hyv ,67 6,07 56, ChiSquare Prob>ChiSq 0,810 0,6670 Neliketästä voidaa myös laskea z- testisuure prosettiosuuksie yhtäsuuruude testaamiseksi Tällöi χ = z Esim33 Esimerkissä 145 z = 0318 ja χ = Määritä p -arvo ================================== SPSS: Ristiitaulukot ja χ Descriptive Statistics > Crosstabs StatisticsChi-square 43 4 REGRESSIOANALYYSI Regressioaalyysillä tutkitaa joki muuttuja y riippuvuutta joukosta muita muuttujia x 1, x,, x k Regressioaalyysi yhteydessä y: riippuvuude muuttujista x 1, x,, x k ajatellaa oleva muotoa Y = β 0 + β 1 x 1 + β x +β k x k + ε, missä Y o satuaismuuttuja (respose) selitettävä muuttuja, havaittavissa oleva; x 1, x,, x k ovat selittäviä, ei-satuaisia, havaittuja, kotrolloitavissa olevia; ε o satuaismuuttuja, jääöstermi (ei havaittavissa oleva); β 0, β 1, β,, β k ovat malli tutemattomat parametrit, jotka aieisto perusteella ovat estimoitavissa 44
12 41 YKSI SELITTÄVÄ MUUTTUJA Esim 411 Nuoresta metsiköstä, jossa oli samaikäisiä puita, poimittii arpomalla 10 puuta Näistä puista mitattii kuutiomäärät (y) ja poikkileikkauspita-alat (x) puu pita-ala (dm ) tilavuus (m 3 ) Pisteparvesta (ks Esim 413) huomataa, että riippuvuus äyttää hyvi lieaariselta Tämä esimerki tilateessa pisteparvee voidaa sovittaa suora, joka ympärille pisteide ajatellaa ryhmittyee Tällöi y: riippuvuude x:stä ajatellaa oleva muotoa Y = β 0 + β 1 x + ε, 45 missä β 0 ja β 1 ovat malli parametrit sekä ε satuaisvirhe Mallissa ajatellaa siis satuaismuuttuja Y: muodostuva x: avulla selitettävästä osasta β 0 + β 1 x sekä satuaisvaihtelusta ε Regressioaalyysissä halutaaki estimoida β 0 ja β 1 havaitu aieisto perusteella Näi tehtäessä siis (ed mallii liittye) estimoidaa suora, joka ajatellaa kuvaava y: riippuvuutta x:stä Jos oletetaa, että edellä esitetystä yhde selittäjä regressiomallista o tehty havaitoja kertaa selittävie muuttujie eri arvoilla, ii malli voida kirjoittaa muodossa Y i = β 0 + β 1 x i + ε i, i= 1,,, Lisäksi regressiomallissa oletetaa, että ε i ~N(0,σ ), i = 1,,,, sekä ε i :t ovat toisistaa riippumattomiksi Tästä seuraa, että edellä esitety malli tilateessa Y i ~N(β 0 + β 1 x i,σ ) Tämä tarkoittaa siis sitä, että jokaista x: arvoa kohti o olemassa Y: todeäköisyysjakauma Havaiot ovat otoksia äistä jakaumista 46 Esim 41 Regressiomalli graafisesti 47 y i = β 0 + β 1 x i, i = 1,,,, missä 48 Havaitoje y 1, y,, y ja x 1, x,, x perusteella malli parametrit voidaa estimoida (käyttäe kriteeriä sitä, että sovitettava suora o keskimääri mahdollisimma lähellä kaikkia pisteitä, kyse pieimmä eliösumma estimoiista, PNS -estimoiti) seuraavalla tavalla: β 0 = y β 1 x (x i x)(y i y) i=1 β 1 = (x i x) i=1 x i y i ( x i )( y i )/ i=1 i=1 i=1 = x i ( ) / i=1 x i i=1 β 0 o estimoitu β 0 eli estimoitu vakiokerroi, ja β 1 o estimoitu β 1 eli estimoitu x: regressiokerroi Estimoidusta mallista voidaa laskea estimoidut y: arvot ja verrata iitä havaittuihi Laskemalla erotukset e i = y i y i,i = 1,,, saadaa residuaalit PNS -estimoiissa määrätää estimoidut malli parametrit ii, että eliösumma Σe i o mahdollisimma piei Näi saadaa regressiosuora (estimoitu)
13 Esim 413 Esimerki 411 aieistosta estimoititulokset tilavuus By ala tilavuus 0,7 0,6 0,5 0,4 0,3 0, 0,1 Liear Fit ala Liear Fit Summary of Fit Rsquare Root Mea Square Error Mea of Respose Observatios (or Sum Wgts) Aalysis of Variace Source Model Error C Total Parameter Term Itercept ala DF Estimates Estimate 0, , , , , Sum of Squares 0, , , Std Error 0, ,00171 Mea Square 0, ,00011 t Ratio 0,55 38,35 F Ratio 1470,377 Prob>F 0,0000 Prob> t 0,5991 0, Esim 414 Olkoo y=satomäärä, x=laoitemäärä Estimoi regressiosuora oheisesta aieistosta x i y i x i y i x i y i e i = y i y i Vastaus: y= ˆ x Lähde: Liski & Putae, Tilastotietee peruskurssi II O osoitettavissa, että E( β 1 ) =β 1 ja E( β 0 ) =β 0 Regressioaalyysissä estimoii lisäksi suoritetaa erilaisia malli uskottavuude ja hyvyyde tarkasteluja Esimmäiseä o selvitettävä voidaako estimoituje parametrie perusteella päätellä, että malli parametrit ovat ollasta poikkeavia 50 Testataa aluksi sitä oko x merkittävä selittäjä Tällöi testattavaa hypoteesia o : β 1 = 0 : β 1 0 Jos o tosi, ii βˆ 1 t = t s(ˆ β ) ~ 1 MSE missä s(ˆ β ) = 1 SSx o βˆ estimoitu hajota 1 Nyt hylätää riskitasolla α, jos aieisto perusteella laskettu t hav >t α/;- Jos x o todettu merkittäväksi selittäjäksi, ii seuraavaksi tutkitaa, oko vakiokertoime β 0 syytä olla mallissa Tällöi : β 0 = 0 : β 0 0 Jos o tosi, ii 51 βˆ 0 t = t s(ˆ β ) ~ 0 1 x missä s(ˆ β ) = MSE + 0 SS x o βˆ estimoitu hajota 0 Nyt hylätää riskitasolla α, jos aieisto perusteella laskettu t hav >t α/;- Jos o todettu x merkittäväksi selittäjäksi, mutta edellä o tullut hyväksytyksi, ii silloi uutea mallia oki Y = βx + ε, joka o estimoitava Tässä tapauksessa ˆβ= i i xy x i Esim 415 Esimerki 414 tilateessa testaus (ks jaettu moiste) Esim 416 Esimerki 413 kertoimie testaus ja uude malli estimoiti (ks myös jaettu SPSS -tuloste) Jos malli estimoidaa ilma vakiokerroita, ii poikkileikkauspita- 5
14 ala kertoimeksi saadaa (t = 1908, p = 0000) Samalla tavalla kui variassiaalyysi yhteydessä regressioaalyysissäki voidaa jakaa y: vaihtelu (SST) kahtee osaa, joista toie osa kertoo selitety vaihtelu (SSR) ja toie selittämättä jäävä vaihtelu (SSE) O osoitettavissa, että SST=SSR+SSE, missä kokoaiseliösumma SST = (y i y), i=1 regressioeliösumma SSR = ( y i y), i=1 jääöseliösumma SSE = (y i y i ) i=1 Koska SST=SSR+SSE, ii 1=SSR/SST+SSE/SST, josta edellee SSR/SST=1-SSE/SST 53 Merkitää R =SSR/SST, jota kutsutaa malli selityskertoimeksi, koska siiä verrataa malli avulla selitettyä vaihtelua kokoaisvaihteluu Ilmoittamalla 100R, voidaa puhua malli selitysasteesta Jos SSE=0, ii R =1 Yhde selittäjä mallissa, ku vakio o mukaa, R =(r xy ), jolloi 100(r xy ) kertoo kuika mota prosettia y: vaihtelusta voidaa x: avulla selittää kyseisellä mallilla Esim 417 Neliösummat ja selitysasteet edellisissä esimerkeissä Olkoo populaatiossa kahde muuttuja X ja Y välie korrelaatiokerroi ρ Siis ρ = Cov(X, Y)/ σ x σ y Sitä voidaa estimoida otoksesta lasketulla otoskorrelaatiokertoimella r ja testata seuraavasti: : ρ = 0 : ρ 0 Jos o tosi, ii 54 t = r 1 r ~t Nyt hylätää riskitasolla α, jos aieisto perusteella laskettu t hav >t α/;- Voidaa osoittaa, että yhde selittäjä mallissa vakio ollessa mukaa β 1 = rs/ s Esim 418 Jaettu moiste xy y x 4 USEAMPI SELITTÄVÄ MUUTTUJA Yleisesti regressioaalyysissä y: riippuvuude muuttujista x 1, x,, x k ajatellaa oleva muotoa Y = β 0 + β 1 x 1 + β x +β k x k + ε, missä Y o satuaismuuttuja (respose) selitettävä muuttuja, havaittavissa oleva; x 1, x,, x k ovat selittäviä, ei-satuaisia, havaittuja, kotrolloitavissa olevia; ε o satuaismuuttuja, jääöstermi (ei 55 havaittavissa oleva); β 0, β 1, β,, β k ovat malli tutemattomat parametrit, jotka aieisto perusteella ovat estimoitavissa Lisäksi regressiomallissa oletetaa, että ε i ~N(0,σ ), i = 1,,,, sekä ε i :t ovat toisistaa riippumattomiksi Parametrie estimoitii ei voida esittää samatapaisia lausekkeita kui yhde selittäjä mallissa Tyydytääki tässä vai toteamaa, että parametrit voidaa estimoida samoje periaatteide mukaisesti kui yhde selittäjä mallissa ja aetaa tarvittaessa tilastollise ohjelmisto suorittaa estimoiti sekä tarvittavie testisuureide lasku Esim 41 Olkoo y = keuhkoje tilavuus (ml), x 1 = ikä vuosia, x = pituus (tuumia), x 3 =poltettuja savukkeita/päivä (askeia) Olkoo eräästä 50 havaio aieistosta estimoitu kolme selittäjä regressiomalli ja saatu y=-39x x -180x 3 56
15 Estimoi keuhkoje tilavuus, jos ikä o 0 vuotta, pituus 71 ja savukkeita kuluu aski päivässä Useamma selittäjä mallissa kertoimet voidaa tulkita site, että yksittäie kerroi kertoo keskimääräise muutokse y:ssä ku kyseie muuttuja kasvaa yhde yksikö muide selittäjie pysyessä muuttumattomia Tässä iältää ja pituudeltaa samalaiste hekilöide kohdalla yhde paketi polttamie päivässä vähetää keuhkoje tilavuutta keskimääri 180 ml Viide vuode iä lisäys pieetää keuhkoje tilavuutta keskimääri -39x5 ml=195 ml, ku muut selittäjät pidetää vakioa Seuraavaksi käydää läpi useamma selittäjä mallii liittyvät testaukset Esiäki voidaa testata yksittäisiä kertoimia eli tutkia oko tarkasteltava muuttuja syytä lisätä mallii mukaa muide selittäjie ollessa jo mallissa Tällöi 57 : β i = 0 (i=0, 1,, k) : β i 0 Jos o tosi, ii β t = i s( β i ) ~t k 1 missä s( β i ) o β i estimoitu hajota ja k o mallissa olevie selittäjie lkm Jos mallii ei kuulu vakiokerroita, ii edellä testisuuree vapausasteet -k Lisäksi voidaa testata kaikkie selittäjie yhteisvaikutusta eli tutkia sitä saadaako y: vaihtelua selitettyä site, että otetaa kaikki tarkasteltavat selittäjät yhtaikaa mallii Regressiokertoimie yhteistestaus (ku vakiokerroi o mallissa mukaa) voidaa muotoilla : β 1 = β == β k = 0 : aiaki joki β i 0 Jos o tosi,ii F =MSR/MSE =(SSR/k)/(SSE/(-k-1))~F(k,-k-1) 58 Neliösummat SST, SSR ja SSE määritellää kute yhde selittäjäki tilateessa MS-eliösummat saadaa ku vastaava eliösumma jaetaa k vakausasteillaa O osoitettavissa, että E(MSE) = σ Siis MSE o regressiomallissa oleva ε-satuaistermi variassi harhato estimaattori Malli selitysvoimakkuudesta, kute yhde selittäjäki mallissa, kertoo vakiotermi ollessa mukaa R =SSR/SST = 1 - SSE/SST Jos parametrie määrä o suuri suhteessa havaitomäärää tai jos halutaa vertailla malleja, jotka tehty eri aieistoista, voidaa käyttää R (adjusted) = 1 - MSE/(SST/(-1)) Yhteistestausta ei voida korvata peräkkäisillä t -testeillä Yhde selittäjä tilateessa t - testillä ja F -testillä testataa samaa hypoteesia : β 1 = 0 ja tällöi t = F Samaa tapaa kui variassiaalyysiki yhteydessä regressioaalyysi tulokset o tapaa ilmoittaa taulukkoa, josta löytyy estimoidut kertoimet, iide estimoidut 59 hajoat, t-testisuureet, eliösummat sekä F-testisuure Esim 4 Jaettu moiste kahde selittäjä regressioaalyysi tuloksista 43 SELITTÄVIEN MUUTTUJIEN VALINNASTA JA MALLIN OLETUKSISTA Malli valita ei aia ole kovi helppoa Pyritää valitsemaa ii mota selittäjää, että selitysaste o mahdollisimma hyvä O kuiteki pidettävä mielessä se, että malli o oltava käyttötarkoitukseesa sopiva ja tulkittavissa oleva Vaikka o olemassa erilaisia automaattisia mallivalitameettelyjä, o iitä syytä käyttää hyvi harkite Moesti joudutaa tekemää erilaisia muuoksia muuttujille ee varsiaista malli raketamista Taloudellisissa aieistoissa logaritmoiti o usei tuiki tarpeellie O tilateita, joissa selittäjät voivat olla esim x, x, x 3, 60
16 Esim 431 Malli valiasta Polyomiregressiosta Jääöste tarkastelusta Logaritmoii käytöstä Dummy-muuttujie käytöstä Autoregressiosta 44 VARIANSSIANALYYSIMALLI Erillie moiste ================================= SPSS: Regressioaalyysi Regressio > Liear Korrelaatiokerroi Correlate > Bivariate (Pearso) 5 EPÄPARAMETRISISTÄ MENETELMISTÄ Useimmissa tähä asti esillä olleissa testeissä ja meetelmissä o tehty oletuksia populaatio jakaumasta Oletetaa esim, että jakauma o peräisi ormaalijakaumasta Testejä/meetelmiä, jotka perustuvat johoki 61 jakaumaoletuksee, kutsutaa parametrisiksi testeiksi/meetelmiksi O kehitetty meetelmiä, joissa jakaumaoletuksia ei tarvitse tehdä Näihi liittyviä testejä kutsutaa epäparametrisiksi tai ei-parametrisiksi testeiksi Käytäössä epäparametrise meetelmä käyttö ei aseta muuttujalle korkeita mittaasteikkovaatimuksia Useat epäparametriset meetelmät perustuvat järjestysasteikollisee mittauksee ja testaus kombiatoriikkaa Tähä asti esillä olleita epäparametrisiä testejä ovat olleet χ -testit Epäparametrisissä meetelmissä voidaa tutkia vaikkapa jakauma sijaitia tai vertailla kahde jakauma sijaiteja luopumalla ormaalijakaumaoletuksesta Tässä yhteydessä otetaa esimerkiomaisesti yksi epäparametrie testi, merkkitesti Oletetaa, että meillä o kaksi toisistaa riippuvaa otosta ja halutaa tutkia jakaumie sijaiteja (vertaa vastiparie t-testi) Ei tehdä jakaumaoletuksia, jolloi meillä voi olla järjestysasteikollista mittausta 6 Esim 51Halutaa vertailla kahta viiimerkkiä Kahdeksa hekilöä maistaa molempia merkkejä ja arvioi makua järjestysasteikollisella mittarilla Saadaa tulokset: Hekilö Viii 1 Viii Merkki (+,jos "Viii 1">"Viii ") (jätetää pois) Jos viiie laaduissa ei ole eroja, pitäisi plus ja miius-merkkejä olla sama verra Merkitää X=plus-merkkie lkm : Viiie laaduissa ei eroja : Viii parempi Jos o tosi, ii P(1 merkki o +)=05 P( merkki o +)=05 P(7 merkki o +)=05 63 Lasketaa yt todeäköisyys sille, että saadaa X: arvo, joka o havaittu tai sitä pieempi : ollessa tosi Tehdää johtopäätelmä lasketu todeäköisyyde perusteella Jos tämä todeäköisyydeksi α, ii hylätää riskitasolla α Jos o tosi, ii X~Bi(7, 05) ja asetetut hypoteesit voidaa kirjata : p=05, : p<05 Nyt : ollessa tosi P(X ) = P(X=0)+P(X=1)+P(X=)==066 Lähde: Newbold (1995), Statistics for Busiess ad Ecoomics Edellä esitety merkkitesti yhteydessä voidaa käyttää ormaalijakaumaa approksimoimaa X: jakaumaa, ku otoskoko suuri Tällöi X~N(p, p(1-p)) Esim 5 Sata satuaisesti valittua lasta vertaili jäätelömerkkejä A ja B 56 lasta piti jäätelöä A parempaa, 4 lasta piti molempia 64
17 jäätelöitä yhtä hyviä Määritellää X= jäätelöä A parempaa pitävie lkm : Jäätelöt samalaisia Jos tosi ii, X~N(96/, 96/4), likimai ja Z = X 96 / ~N(0,1), joho testaus voidaa 96 / 4 perustaa Lähde: Newbold (1995), Statistics for Busiess ad Ecoomics Muutamia epäparametrisiä testejä: Wilcoxoi testi Merkkitesti tilateisii sopiva, ku mittaustaso sellaie, että voidaa vertailla erotuksie suuruutta Ma-Witey testi Kahde riippumattoma otokse t-testi epäparametrie vastie Kruskal- Wallisi U-testi Epäparametrie vastie yksisuutaiselle variassiaalyysille ======================= SPSS: Noparametric Tests> 65 Kirjallisuusluettelo, jota o käytetty tukea tämä luetorugo kirjoittamisessa Agresti, A & Filay, B, Statistical Methods for the Social Scieces Pretice Hall, 1997 Aderso, T W & Sclove, S L, Itroductory Statistical Aalysis Houghto Miffli Compay, 1974 Clarke, GM & Cooke, D, A Basic course i Statistics Arold, 1998 Devore, J & Peck, R, Statistics, The Exploratio ad Aalysis of Data West Publishig Compay, 1986 Heleius, H,Tilastolliste meetelmie perustiedot Statco Oy, 199 Karjalaie, L & Ruuskae, A Tilastomatematiikka Piikirjat, 1994 Liski, E & Putae, S, Tilastotietee peruskurssi I&II Tamperee yliopisto Maie P, Tilastotiedettä yhteiskutatieteilijöille Gaudeamus, 1978 Mattila, S, Tilastotiede 1&, Gaudeamus Melli, I, Johdatus tilastotieteesee, 1kirja, tilastotietee johdatokurssi, Helsigi yliopisto Melli, I, Johdatus tilastotieteesee, kirja, tilastotietee jatkokurssi, Helsigi yliopisto Moore, D, The Basic Practice of Statistics, Freema, 1997, Moore, D, Itroductio to the Practice of Statistics, 3rd ed, Freema, 1998, Newbold, P, Statistics for Busiess ad Ecoomics Pretice Hall, 1995 Ott, L & Medehall, W, Uderstadig Statistics Duxbury Press, 1985 Siegel, A, Statistics ad Data Aalysis A Itroductio Joh Wiley & Sos, 1988 Vasama, P-M& Vartia, Y, Johdatus tilastotieteesee 1&, Gaudeamus 66
Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh , sähköposti
Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh. 03-2156301, sähköposti raija.leppala@uta.fi 3.2.01 Tilastollisten menetelmien perusteet II,TILTP3 Luentorunko, kevät
Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (004) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo otosjakauma Otosvariassi otosjakauma
Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?
TKK (c) Ilkka Melli (4) Johdato Johdatus todeäköisyyslasketaa TKK (c) Ilkka Melli (4) : Mitä opimme? / Tutustumme tässä luvussa seuraavii ormaalijakaumasta (ks. lukua Jatkuvia jakaumia) johdettuihi jakaumii:
Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004
Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004 Esimerkkien ratkaisut http://mtl.uta.fi/tilasto/tiltp3/kevat2004/kaikki_esimerkit.pdf Raija Leppälä 19. joulukuuta 2003 Sisältö 1
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollise aalyysi perusteet, kevät 007 6. lueto: Johdatus regressioaalyysii S ysteemiaalyysi Tekillie korkeakoulu Kai Virtae 1 Regressioaalyysi idea Tavoitteea selittää selitettävä tekiä/muuttua
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Melli Tilastolliset meetelmät Osa : Otokset, otosjakaumat ja estimoiti Otokset ja otosjakaumat TKK (c) Ilkka Melli (007) 1 Otokset ja otosjakaumat >> Satuaisotata ja satuaisotokset Otostuusluvut
Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot
TKK (c) Ilkka Melli (4) Testit suhdeasteikollisille muuttujille Johdatus tilastotieteesee Testit suhdeasteikollisille muuttujille Testit ormaalikauma parametreille Yhde otokse t-testi Kahde otokse t-testi
MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (005) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo ja otosvariassi otosjakaumat
8. laskuharjoituskierros, vko 11, ratkaisut
Mat-2.091 Sovellettu todeäköisyyslasku, kevät -05 Heliövaara, Palo, Melli 8. laskuharjoituskierros, vko 11, ratkaisut D1. Oletetaa, että havaiot X i, i = 1, 2,..., 100 muodostavat yksikertaise satuaisotokse
MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todeäköisyyslaskea ja tilastotietee peruskurssi 4A Satuaisotata ja parametrie estimoiti Lasse Leskelä Matematiika ja systeemiaalyysi laitos Perustieteide korkeakoulu Aalto-yliopisto Syksy 2016,
1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).
HY / Matematiika ja tilastotietee laitos Tilastollie päättely II, kevät 018 Harjoitus 5B Ratkaisuehdotuksia Tehtäväsarja I 1. (Jatkoa Harjoitus 5A tehtävää ). Moistee esimerki 3.3.3. mukaa momettimeetelmä
Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot
TKK (c Ilkka Melli (004 Johdatus tilastotieteesee TKK (c Ilkka Melli (004 : Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikolliste muuttujie testejä: ja merkkitesti parivertailuille
Tilastollisten menetelmien perusteet II TILTP3 Luentorunko
Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,
Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.
Kvatitatiivie metodologia verkossa Moitasomallius Pekka Ratae Helsigi yliopisto isältö Moitasomallit Matemaattisia peruskäsitteitä Esimerkki kovariassista Otatavirhe Esimerkki elittävie muuttujie lisäämie
Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:
Mat-.090 Sovellettu todeäköisyyslasku A Mat-.090 Sovellettu todeäköisyyslasku A / Ratkaisut Aiheet: Avaisaat: Otos- ja otosjakaumat Estimoiti Estimoitimeetelmät Väliestimoiti Aritmeettie keskiarvo, Beroulli-jakauma,
Otantajakauman käyttö päättelyssä
Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus
Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501
Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662
Yhden selittäjän lineaarinen regressiomalli
Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli
Tilastolliset menetelmät: Tilastolliset testit
Tilastolliset meetelmät Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille.
pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489
Perusjoukko ja otos Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Havaitoyksikkö o empiirise mittaukse kohde Perusjoukko o kaikkie havaitoyksiköide muodostama kokoaisuus Otos o perusjoukkoa
Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä
Otatajakauma kuvaa tarkasteltava parametri jakauma eri otoksista laskettua parametria o joki yleesä tuusluku, esim. keskiarvo, suhteellie osuus, riskisuhde, korrelaatiokerroi, regressiokerroi, je. parametria
Väliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
Mat Tilastollisen analyysin perusteet, kevät 2007
Mitä tilastotiede o? Mat-.04 Tilastollise aalyysi perusteet, kevät 007. lueto: Johdato Tilastotiede kehittää ja soveltaa meetelmiä: reaalimaailma ilmiöistä johtopäätökset ilmiöitä kuvaavie tietoje perusteella
n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:
1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:
Tilastolliset menetelmät: Tilastolliset testit
Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille 0. Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille
2-suuntainen vaihtoehtoinen hypoteesi
Mat-.6 Sovellettu todeäköisyyslasketa. harjoitukset Mat-.6 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Tilastolliset testit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, F-jakauma,
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit
Mat-.09 Sovellettu todeäköisyyslasku Mat-.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Estimoiti Luottamusvälit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Estimaattori, Estimoiti, Frekvessi,
Tilastollinen päättömyys, kevät 2017 Harjoitus 5b
Tilastollie päättömyys, kevät 07 Harjoitus b Heikki Korpela 3. helmikuuta 07 Tehtävä. a Olkoot Y,..., Y Bθ. Johda uskottavuusosamäärä testisuuree ry, Waldi testisuuree wy ja Rao pistemäärätestisuuree uy
Tilastollinen päättömyys, kevät 2017 Harjoitus 6A
Tilastollie päättömyys, kevät 07 Harjoitus 6A Heikki Korpela 8. helmikuuta 07 Tehtävä. Moistee teht. 5.. Olkoo Y,..., Y riippumato otos ekspoettiperhee jakaumasta, joka ptf/tf o muotoa fy i ; θ cθhye φθtyi
Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
11.1.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 11.1.2018 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017 11.1.2018/2
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteesee Estimoitimeetelmät TKK (c) Ilkka Melli (2005) 1 Estimoitimeetelmät Todeäköisyysjakaumie parametrie estimoiti Momettimeetelmä Normaalijakauma parametrie estimoiti Ekspoettijakauma
Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää
Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.
9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2
Tilastollinen päättely II, kevät 2017 Harjoitus 3B
Tilastollie päättely II, kevät 7 Harjoitus 3B Heikki Korpela 3. maaliskuuta 7 Tehtävä. Jatkoa harjoitukse B tehtävii -3. Oletetaa, että x i c kaikilla i, ku c > o vakio. Näytä, että ˆβ, T ja T ovat tarketuvia.
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Melli Tilastolliset meetelmät Osa 2: Otokset, otosjakaumat ja estimoiti Estimoitimeetelmät TKK (c) Ilkka Melli (2007) Estimoitimeetelmät >> Todeäköisyysjakaumie parametrie estimoiti Suurimma uskottavuude
Regressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II
Otokset MS-A050 Todeäköisyyslaskea ja tilastotietee peruskurssi Lueot, osa II Kaksi hyödyllista jakaumaa 3 Estimoiti G. Gripeberg 4 Luottamusvälit Aalto-yliopisto. helmikuuta 05 5 Hypoteesie testaus 6
Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.
Testimuuttuja kriittie arvo 5 %: merkitsevyystasolla katsotaa taulukosta. Kriittie arvo o 9,488. Koska laskettu arvo 4,35 o pieempi kui taulukosta saatu kriittie arvo 9,488, ii ollahypoteesi jää voimaa.
VARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
2-suuntainen vaihtoehtoinen hypoteesi
MS-A53 Todeäköisyyslaskea ja tilastotietee peruskurssi Esimerkkikokoelma 5 Aiheet: Tilastolliset testit Yhde otokse t-testi Testausasetelma yhde otokse t-testissä odotusarvolle Olkoo X i, i =,,, riippumato
S Laskennallinen systeemibiologia
S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude
Tilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:
Mat-.60 Sovellettu todeäköisyyslasketa B Mat-.60 Sovellettu todeäköisyyslasketa B / Ratkaisut Aiheet: Estimoiti Estimoitimeetelmät Väliestimoiti Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Beroulli-koe,
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)
MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli
MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
Todennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.
HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy 08 Harjoitus 3 Ratkaisuehdotuksia Tehtäväsarja I Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var
MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
Harjoitukset 1 : Tilastokertaus
31C99904, Capstoe: Ekoometria ja data-aalyysi TA : markku.siikae(a)aalto.fi & tuuli.vahapelto(a)aalto.fi Harjoitukset 1 : Tilastokertaus (Palautus 10.1.2017) Palautellaa mielii hiema tilasto-oppia ja todeäköisyyslasketaa.
Regressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
Kaksisuuntainen varianssianalyysi. Heliövaara 1
Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
χ 2 -yhteensopivuustesti
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Tilastollie
Mat Tilastollisen analyysin perusteet, kevät 2007
Usea selittää lieaarie regressiomalli Mat-.04 Tilastollise aalyysi perusteet, evät 007 8. lueto: Usea selittää lieaarie regressiomalli Selitettävä muuttua havaittue arvoe vaihtelu halutaa selittää selittävie
Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio
17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla
/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2
KURSSIN TILASTOMATEMATIIKKA KAAVOJA
KURSSIN TILASTOMATEMATIIKKA KAAVOJA X = S = s = Otossuureita X i tai x = x i (otoskeskiarvo) (X i X) = (x i x) = Xi x i E(X) =µ, var(x) = σ X x tai, E(S )=σ (otosvariassi) Normaalijakautuee populaatio
SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko
Moimuuttujameetelmät Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Mikko Mattila 009 1 Yhde muuttuja meetelmät (uivariate statistics): keskiluvut ja hajotaluvut Moimuuttujameetelmät:
2.1. Parametrien estimointi 2.2. Regressiokertoimien estimointi kovariansseista ja korrelaatioista
Moimuuttujameetelmät: Ilkka Melli. Yleise lieaarise malli määrittelemie.. ja malli oletukset.. Yleise lieaarise malli matriisiesitys. Yleise lieaarise malli parametrie estimoiti.. Parametrie estimoiti..
Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
χ 2 -yhteensopivuustesti
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Tilastollie
Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,
H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta
22.1.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 22.1.2019 Luku 3 2 -yhteensopivuus- ja riippumattomuustestit 3.1 2 -yhteensopivuustesti H0: otos peräisin tietystä jakaumasta H1: otos ei peräisin
Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
Tilastolliset luottamusvälit
Luku 8 Tilastolliset luottamusvälit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 8.1 Piste-estimaatti ja väliestimaatti Edellisessä luvussa opittii määrittämää parametreille estimaatteja suurimma uskottavuude
Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1
Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu
Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden
1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma
HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.
HY, MTO / Matemaattiste tieteide adiohjelma Tilastollie päättely II, evät 2018 Harjoitus 6A Rataisuehdotusia Tehtäväsarja I 1. (Moistee tehtävä 5.4) Kauppias myy mäysiemeiä, joide itävyyde väitetää oleva
/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:
2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli
TKK (c) Ilkka Melli (4) Yhde selittää lieaarie regressiomalli Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää
Tilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
HAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
Johdatus regressioanalyysiin. Heliövaara 1
Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen
Testejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
EX1 EX 2 EX =
HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var X,
Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
10. laskuharjoituskierros, vko 14, ratkaisut
10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset
6.1 Riippumattomat satunnaismuuttujat
Luku 6 Otatajakaumie teoria 6.1 Riippumattomat satuaismuuttujat Muistamme edellisistä luvuista, että satuaismuuttujat X 1 ja X 2 ovat riippumattomat (määritelmät 4.6 ja 5.5), jos f(x 1, x 2 ) f 1 (x 1
Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3
LIITTEET... 2 Liite A Stirligi kaava tarkkuudesta...2 Liite B Lagrage kertoimet... 2 Liitteet Liitteet Liite A Stirligi kaava tarkkuudesta Luoollista logaritmia suureesta! approksimoidaa usei Stirligi