Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Tilastollie riippuvuus ja korrelaatio Avaisaat: Havaittu frekvessi, Heterogeeisuus, Hylkäysalue, Hyväksymisalue, Homogeeisuus, Jakaumaoletus, Keskihajota, -jakauma, -homogeeisuustesti, -riippumattomuustesti, -yhteesopivuustesti, Kaksi-ulotteie ormaalijakauma, Korrelaatio, Korreloimattomuus, Kovariassi, Kriittie arvo, Merkitsevyystaso, Momettimeetelmä, Nollahypoteesi, Normaalijakauma, Odotettu frekvessi, Otos, Parametri, p-arvo, Riippumattomuus, Riippuvuus, Sovite, Suurimma uskottavuude meetelmä, Testi, Vaihtoehtoie hypoteesi, Vapausasteet, Yhteesopivuus, z-muuos Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie -yhteesopivuustesti Testausasetelma -yhteesopivuustestissä Tarkastellaa tutkimusasetelmaa, jossa perusjouko S alkioita kuvataa faktorilla eli tekijällä A, joka saa olla laatuero-, järjestys-, välimatka- tai suhdeasteikollie muuttuja. Oletetaa, että perusjoukosta S o poimittu yksikertaie satuaisotos. Haluamme testata jakaumaoletusta, joka mukaa tekijä A oudattaa perusjoukossa S jotaki määrättyä todeäköisyysjakaumaa. Testattava oletus voidaa muotoilla seuraavilla tavoilla: (i) Voidaako havaitoje jakaumaa kuvata oletukse määrittelemällä todeäköisyysjakaumalla? (ii) Voiko otos olla oletukse määrittelemä todeäköisyysjakauma geeroima eli tuottama? Yhteesopivuustestissä tutkitaa ovatko otos ja tehty jakaumaoletus yhteesopivia. -yhteesopivuustestissä havaitoje ja havaitoje jakaumasta tehdy oletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille sopiva luokitus. () Määrätää havaitoje luokkafrekvessit. (3) Määrätää tehdy jakaumaoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa -testisuureella. TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Hypoteesit -yhteesopivuustestissä Yleie hypoteesi H : Havaiot X, X,, X o saatu poimimalla yksikertaie satuaisotos perusjoukosta S. Nollahypoteesi H 0 : Havaiot X, X,, X oudattavat todeäköisyysjakaumaa f(x;θ), joka parametrit eivät välttämättä ole tuettuja. Vaihtoehtoie hypoteesi H : Havaiot X, X,, X eivät oudata ollahypoteesi H 0 määrittelemää todeäköisyysjakaumaa. Havaitut luokkafrekvessit Luokitellaa havaiot X, X,, X toisesa poissulkevii luokkii, joide lukumäärä olkoo m. Olkoo O k, k =,,, m iide havaitoje frekvessi eli lukumäärä jotka kuuluvat luokkaa k. Frekvessi O k o luokkaa k kuuluvie havaitoje havaittu frekvessi. Oletetaa, että havaiot X, X,, X ovat diskreeti satuaismuuttuja X havaittuja arvoja ja, että satuaismuuttuja X mahdolliset arvot ovat y, y,, y m Luokitellaa havaito X i luokkaa k, jos X i = y k, i =,,,, k =,,, m Luokkaa k kuuluvie havaitoje X i havaittu frekvessi O k o iide havaitoje lukumäärä, jotka saavat arvo y k. Oletetaa, että havaiot X, X,, X ovat jatkuva satuaismuuttuja X havaittuja arvoja ja, että X (a,b) Jaetaa väli (a,b) pisteillä pistevieraisii osaväleihi a = a < a < a < < a < a = b 0 m (a k,a k ], k =,,, m Luokitellaa havaito X i luokkaa k, jos X i (a k,a k ], i =,,,, k =,,, m Luokkaa k kuuluvie havaitoje X i havaittu frekvessi O k o iide havaitoje lukumäärä, jotka kuuluvat välii k. m TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Havaitut luokkafrekvessit O k voidaa esittää frekvessitaulukkoa seuraavassa muodossa: Luokka m Summa Havaittu frekvessi O O O m Frekvessiä O k kutsutaa havaituksi solufrekvessiksi frekvessitauluko solussa k. Havaitut solufrekvessit O k toteuttavat yhtälö m k = O k = Odotetut luokkafrekvessit Oletetaa, että havaiot X, X,, X ovat satuaismuuttuja X havaittuja arvoja ja, että havaiot o luokiteltu toisesa poissulkevii luokkii, joide lukumäärä o m. Oletetaa, että ollahypoteesi H 0 täysi määrää satuaismuuttuja X jakauma. Olkoo P k todeäköisyys sille, että satuaismuuttuja X saa arvo luokasta k, ku ollahypoteesi H 0 pätee. Tällöi luokkaa k kuuluvie havaitoje odotettu frekvessi E k o E = P, k =,,, m k k Oletetaa, että ollahypoteesi H 0 määrää satuaismuuttuja X jakauma tyypi, mutta jakauma parametrit ovat tutemattomia. Jos jakauma parametreja ei tueta, jakaumasta ei voida määrätä todeäköisyyksiä, ellei jakauma parametreja esi estimoida havaioista. Olkoo P k tällöi estimoitu todeäköisyys sille, että satuaismuuttuja X saa arvo luokasta k, ku ollahypoteesi H 0 pätee. Tällöi luokkaa k kuuluvie havaitoje odotettu frekvessi E k o E = P, k =,,, m k k Oletetaa, että X o diskreetti satuaismuuttuja, joka mahdolliset arvot ovat Tällöi y, y,, y m P k = Pr(X = y k ), k =,,, m jossa todeäköisyys Pr(X = y k ) määrätää olettae, että ollahypoteesi H 0 pätee. Todeäköisyydet Pr(X = y k ) voidaa määrätä satuaismuuttuja X kertymäfuktio tai pistetodeäköisyysfuktio avulla. TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Oletetaa, että X o jatkuva satuaismuuttuja, joka saa arvoja väliltä (a,b) ja, että väli (a,b) o jaettu pisteillä pistevieraisii osaväleihi Tällöi a = a < a < a < < a < a = b 0 m (a k,a k ], k =,,, m P = Pr( a < X a ), k =,,, m k k k jossa todeäköisyys Pr( a < k X ak) määrätää olettae, että ollahypoteesi H 0 pätee. Todeäköisyydet Pr( ak < X ak) voidaa määrätä satuaismuuttuja X kertymäfuktio tai tiheysfuktio avulla. Odotetut frekvessit E k voidaa esittää frekvessitaulukkoa seuraavassa muodossa: m Luokka m Summa Odotettu frekvessi E E E m Frekvessiä E k kutsutaa odotetuksi solufrekvessiksi frekvessitauluko solussa k. Odotetut solufrekvessit E k toteuttavat yhtälö m k = E k = Testisuure -yhteesopivuustestissä Testi ollahypoteesille H 0 perustuu havaittuje frekvessie O k ja odotettuje frekvessie E k vertaamisee. Jos havaittuje frekvessie O k ja odotettuje frekvessie E k jakaumat muistuttavat toisiaa, havaiot ovat sopusoiussa ollahypoteesi H 0 kassa. Määritellää -testisuure jossa m ( Ok Ek) = E k = k O k = havaittu frekvessi luokassa k E k = odotettu frekvessi luokassa k m = luokkie lukumäärä Testisuure mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja siksi sitä kutsutaa usei -etäisyydeksi. TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset -testisuure voidaa kirjoittaa myös muotoo jossa m (ˆ pk Pk) = P k = k p ˆk = O k / = havaittu suhteellie frekvessi luokassa k P k = todeäköisyys, että havaito kuuluu luokkaa k, ku ollahypoteesi H 0 pätee m = luokkie lukumäärä Jos ollahypoteesi H 0 pätee, testisuure oudattaa suurissa otoksissa approksimatiivisesti - jakaumaa vapausastei f = (m p): jossa ( f ) a f = m p m = luokkie lukumäärä p = odotettuje frekvessie E k määräämiseksi estimoituje parametrie lukumäärä Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E k toteuttavat ehdot E > 5, k =,,, m k Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o jossa E( ) = f f = m p Normaaliarvoaa merkitsevästi suuremmat -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Normaaliarvoaa merkitsevästi pieemmät -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 pätee liia hyvi: Havaiot saattavat olla vääreettyjä. TKK @ Ilkka Melli (006) 5/5
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Homogeeisuude testaamie Testausasetelma -homogeeisuustestissä Tarkastellaa tutkimusasetelmaa, jossa perusjouko S alkioita kuvataa yhdellä faktorilla eli tekijällä A, joka saa olla laatuero-, järjestys-, välimatka- tai suhdeasteikollie muuttuja. Jaetaa perusjoukko S jakaa kahtee tai useampaa ryhmää, poimitaa ryhmistä toisistaa riippumattomat yksikertaiset satuaisotokset ja tarkastellaa tekijä A vaihtelua otoksissa. Tehdää oletus, että tekijä A oudattaa kaikissa ryhmissä samaa, tarkemmi määrittelemätötä todeäköisyysjakaumaa. Haluamme testata tehtyä jakaumaoletusta: (i) Voidaako eri otoksista (ryhmistä) saatuja havaitoarvoje jakaumia kuvata samalla todeäköisyysjakaumalla? (ii) Voivatko otokset olla sama todeäköisyysjakauma geeroimia eli tuottamia? Jos tehty jakaumaoletus pätee ja tekijä A oudattaa siis kaikissa ryhmissä samaa jakaumaa, perusjoukko o homogeeie ja perusjoukkoa ei tarvitse jakaa tekijää A koskevissa tarkasteluissa erillisiksi ryhmiksi. Jos tehty jakaumaoletus ei päde ja tekijä A oudattaa siis eri ryhmissä eri jakaumia, perusjoukko o heterogeeie ja ryhmiä o syytä tarkastella tekijää A koskevissa tarkasteluissa erillisiä. Tällaiste jakaumaoletukse testaamisee tarkoitettuja testejä kutsutaa homogeeisuustesteiksi. -homogeeisuustesti suorittamie -homogeeisuustestissä havaitoje ja iide jakaumasta eri ryhmissä tehdy homogeeisuusoletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille yhteie luokitus. () Määrätää havaitoje luokkafrekvessit jokaisesta otoksesta. (3) Määrätää tehdy homogeeisuusoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa -testisuureella. Hypoteesit -homogeeisuustestissä Yleie hypoteesi H : Perusjoukosta voidaa jakaa r ryhmää, joista o poimittu (toisistaa riippumattomat) yksikertaiset satuaisotokset. Nollahypoteesi H 0 : Otokset i =,,, r o poimittu samasta todeäköisyysjakaumasta. Vaihtoehtoie hypoteesi H : Otokset i =,,, r o poimittu eri todeäköisyysjakaumista. TKK @ Ilkka Melli (006) 6/6
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Havaitut frekvessit Oletetaa, että tutkimukse kohteea oleva perusjoukko S o jaettu r ryhmää. Poimitaa ryhmistä toisistaa riippumattomat yksikertaiset satuaisotokset, joide koot ovat i, i =,,, r. Luokitellaa havaiot jokaisessa otoksessa samaa luokitusta käyttäe toisesa poissulkevii luokkii, joide lukumäärä olkoo c ja määrätää ryhmä i luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä O ij, i =,,, r, j =,,, c. Muodostetaa havaituista frekvesseistä O ij (r c)-frekvessitaulukko [O ij ] : Luokat c Summa Ryhmät O O O c O O O c r O r O r O rc r Summa C C C c Taulukossa: r = ryhmie lukumäärä c = luokkie lukumäärä O ij = havaittu frekvessi ryhmä i luokassa j, i =,,, r, j =,,, c i = otoskoko ryhmässä i C j = havaittu frekvessi yhdistety havaitoaieisto luokassa j = havaitoje kokoaislukumäärä Frekvessiä O ij kutsutaa tavallisesti havaituksi solufrekvessiksi frekvessitaulu solussa (i, j). Havaittuje frekvessie O ij frekvessitaulukossa pätee: (i) Rivisummat yhtyvät ryhmäkohtaisii otoskokoihi: (ii) c Oij = i, i =,,, r j= Sarakesummat yhtyvät yhdistety havaitoaieisto luokkafrekvesseihi: r Oij = Cj, j =,,, c i= TKK @ Ilkka Melli (006) 7/7
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset (iii) Havaitoje kokoaislukumäärä: r c r c O = = C = ij i j i= j= i= j= Nollahypoteesi tulkita -homogeeisuustestissä Jos ollahypoteesi H 0 pätee, havaitoje pitää jakautua (satuaisvaihtelua lukuu ottamatta) jokaisessa ryhmässä i =,,, r samalla tavalla luokkii j =,,, c. Jos ollahypoteesi H 0 pätee, havaitoje jakautumie luokkii j =,,, c ei saa riippua siitä, mihi ryhmää i =,,, r e kuuluvat. Jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu luokkaa j =,,, c ei saa riippua siitä, mihi ryhmää i =,,, r se kuuluu. Odotettuje frekvessie määräämie Olkoo x o tarkastelu kohteea oleva perusjouko S alkio. Määritellää seuraavat todeäköisyydet: pij = Pr( x kuuluu ryhmää i ja luokkaa j) p ji = Pr( x kuuluu luokkaa j x kuuluu ryhmää i) pic = Pr( x kuuluu ryhmää i) pc j = Pr( x kuuluu luokkaa j) i =,,, r, j =,,, c Todeäköisyyslaskea yleise tulosääö mukaa pij = pj i pic, i =,,, r, j =,,, c Jos ollahypoteesi H 0 pätee, todeäköisyys, että perusjouko S alkio x kuuluu luokkaa j ei saa riippua siitä, mihi ryhmää i alkio x kuuluu. Site ollahypoteesi H 0 perusjouko homogeeisuudesta voidaa ilmaista muodossa H 0 : p ji = pc j, i =,,, r, j =,,, c tai muodossa H 0 : pij = picpc j, i =,,, r, j =,,, c Todeäköisyydet pij, pic, pc j voidaa estimoida havaituista frekvesseistä O ij kaavoilla Oij C i j pˆ ˆ ˆ ij = pic = pc j = Jos ollahypoteesi H 0 pätee, solutodeäköisyydet p ij voidaa estimoida kaavoilla C i j P = ˆ ˆ ij pi p j = C C TKK @ Ilkka Melli (006) 8/8
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Määrätää ollahypoteesi H 0 pätiessä odotetut solufrekvessit E ij yhtälöillä Cj C i j Eij = Pij = i =, i =,,, r, j =,,, c Muodostetaa odotetuista frekvesseistä E ij (r c)-frekvessitaulukko [E ij ] : Luokat c Summa Ryhmät E E E c E E E c r E r E r E rc r Summa C C C c Taulukossa r = ryhmie lukumäärä c = luokkie lukumäärä E ij = odotettu frekvessi ryhmä i luokassa j, i =,,, r, j =,,, c i = otoskoko ryhmässä i C j = havaittu frekvessi yhdistety havaitoaieisto luokassa j = havaitoje kokoaislukumäärä Frekvessiä E ij kutsutaa tavallisesti odotetuksi solufrekvessiksi frekvessitaulu solussa (i, j). Odotettuje frekvessie E ij frekvessitaulukossa pätee: (i) Rivisummat yhtyvät ryhmäkohtaisii otoskokoihi: (ii) c Eij = i, i =,,, r j= Sarakesummat yhtyvät yhdistety havaitoaieisto luokkafrekvesseihi: r Eij = Cj, j =,,, c i= (iii) Havaitoje kokoaislukumäärä: r c r c E = = C = ij i j i= j= i= j= TKK @ Ilkka Melli (006) 9/9
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Testisuure -homogeeisuustestissä Määritellää -testisuure r c ( O ) ij Eij = E jossa i= j= ij O ij = havaittu frekvessi solussa (i, j) E ij = odotettu frekvessi solussa (i, j) r c = ryhmie lukumäärä = lukkie lukumäärä Testisuure mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja siksi sitä kutsutaa usei -etäisyydeksi. Homogeeisuustesti -testisuure voidaa kirjoittaa myös muotoo r c (ˆ p ) ij Pij = P i= j= ij jossa Oij pˆ ij = Eij C i j P = = = pˆ ˆ CpC i pˆ ic = C j pˆ C j = i =,,, r, j =,,, c ij i j Jos ollahypoteesi H 0 pätee, testisuure oudattaa suurissa otoksissa approksimatiivisesti -jakaumaa vapausastei f = (r )(c ): jossa ( f ) a r = ryhmie lukumäärä c = luokkie lukumäärä Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E ij ja keskimääräiset odotetut frekvessit C j /r toteuttavat ehdot Eij >, i =,,, r, j =,,, c C / r > 5, j =,,, c j TKK @ Ilkka Melli (006) 0/0
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o jossa E( ) = f f = (r )(c ) Normaaliarvoaa merkitsevästi suuremmat -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Riippumattomuude testaamie Testausasetelma -riippumattomuustestissä Tarkastellaa tutkimusasetelmaa, jossa perusjouko S alkioita kuvataa kahdella faktorilla eli tekijällä A ja B, jotka saavat olla laatuero-, järjestys-, välimatka- tai suhdeasteikollisia muuttujia. Poimitaa perusjoukosta S yksikertaie satuaisotos ja tarkastellaa tekijöide A ja B vaihtelua otoksessa. Tehdää oletus, että tekijät A ja B ovat riippumattomia. Haluamme testata tehtyä riippumattomuusoletusta: Ovatko havaiot sopusoiussa tehdy riippumattomuusoletukse kassa? Jos tehty oletus pätee ja tekijät A ja B ovat siis riippumattomia, tekijöitä A ja B voidaa tarkastella erillisiä. Jos tehty oletus ei päde ja tekijät A ja B eivät siis ole riippumattomia, tekijät A ja B ovat assosioitueita. Riippumattomuusoletukse testaamisee tarkoitettuja testejä kutsutaa riippumattomuustesteiksi. -riippumattomuustesti suorittamie -riippumattomuustestissä havaitoje ja tehdy riippumattomuusoletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille sopivat luokitukset tekijöide A ja B suhtee. () Luokitellaa havaiot tekijöide A ja B suhtee ristii ja määrätää havaitut luokkafrekvessit. (3) Määrätää tehdy riippumattomuusoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa -testisuureella. Hypoteesit -riippumattomuustestissä Yleie hypoteesi H : Perusjoukosta o poimittu yksikertaie satuaisotos ja havaitoyksiköt o voitu luokitella ristii kahde tekijä A ja B suhtee. Nollahypoteesi H 0 : Tekijät A ja B ovat riippumattomia. Vaihtoehtoie hypoteesi H : Tekijät A ja B eivät ole riippumattomia. Havaitut frekvessit Poimitaa tutkimukse kohteea olevasta perusjoukosta S yksikertaie satuaisotos, joka koko o. Luokitellaa havaitoyksiköt tekijä A suhtee toisesa poissulkevii luokkii, joide lukumäärä o r. Määrätää tekijä A luokkaa i kuuluvie havaitoje havaittu frekvessi eli lukumäärä R i, ku i =,,, r. TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Luokitellaa havaitoyksiköt tekijä B suhtee toisesa poissulkevii luokkii, joide lukumäärä o c. Määrätää tekijä B luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä C j, ku j =,,, c. Luokitellaa havaitoyksiköt tekijöide A ja B suhtee ristii toisesa poissulkevii luokkii, joide lukumäärä o r c. Määrätää tekijä A luokkaa i ja tekijä B luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä O ij, ku i =,,, r ja j =,,, c. Muodostetaa havaituista frekvesseistä O ij (r c)-frekvessitaulukko [O ij ] : B-luokat c Summa A-luokat O O O c R O O O c R r O r O r O rc R r Summa C C C c Taulukossa: r c = A-luokkie lukumäärä = B-luokkie lukumäärä O ij = havaittu frekvessi luokassa, joka määrää A-luokka i ja B-luokka j, i =,,, r, j =,,, c R i = havaittu frekvessi A-luokassa i C j = havaittu frekvessi B-luokassa j = havaitoje kokoaislukumäärä Frekvessiä O ij kutsutaa tavallisesti havaituksi solufrekvessiksi frekvessitaulu solussa (i, j). Havaittuje frekvessie O ij frekvessitaulukossa pätee: (i) Rivisummat yhtyvät havaittuihi frekvesseihi A-luokituksessa: (ii) c Oij = Ri, i =,,, r j= Sarakesummat yhtyvät havaittuihi frekvesseihi B-luokituksessa: r Oij = Cj, j =,,, c i= TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset (iii) Havaitoje kokoaislukumäärä: r c r c O = R = C = ij i j i= j= i= j= Nollahypoteesi tulkita -riippumattomuustestissä Jos ollahypoteesi H 0 pätee, havaitoje jakautumie A-luokkii ei saa riippua siitä, mihi B-luokkaa havaiot kuuluvat, toisi saoe, jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu A-luokkaa i =,,, r ei saa riippua siitä, mihi B-luokkaa j =,,, c se kuuluu. Jos ollahypoteesi H 0 pätee, havaitoje jakautumie B-luokkii ei saa riippua siitä, mihi A-luokkaa havaiot kuuluvat, toisi saoe, jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu B-luokkaa j =,,, c ei saa riippua siitä, mihi A-luokkaa i =,,, r se kuuluu. Odotettuje frekvessie määräämie Olkoo x o tarkastelu kohteea oleva perusjouko S alkio. Määritellää seuraavat todeäköisyydet: pij = Pr( x kuuluu A-luokkaa i ja B-luokkaa j) pic = Pr( x kuuluu A-luokkaa i) pc j = Pr( x kuuluu B-luokkaa j) i =,,, r, j =,,, c Jos ollahypoteesi H 0 pätee, tapahtumat {x S x kuuluu A-luokkaa i} {x S x kuuluu B-luokkaa j} ovat riippumattomia kaikille i =,,, r, j =,,, c. Site ollahypoteesi H 0 tekijöide A ja B riippumattomuudesta voidaa ilmaista muodossa H 0 : pij = picpc j, i =,,, r, j =,,, c Todeäköisyydet pij, pic, pc j voidaa estimoida havaituista frekvesseistä O ij kaavoilla Oij R C i j pˆ ˆ ˆ ij = pic = pc j = Jos ollahypoteesi H 0 pätee, solutodeäköisyydet p ij voidaa estimoida kaavoilla R C i j P = ˆ ˆ ij pi p j = C C Määrätää ollahypoteesi H 0 pätiessä odotetut solufrekvessit E ij yhtälöillä RC i j Eij = Pij =, i =,,, r, j =,,, c TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Muodostetaa odotetuista frekvesseistä E ij (r c)-frekvessitaulukko [E ij ] : B-luokat c Summa A-luokat E E E c R E E E c R r E r E r E rc R r Summa C C C c Taulukossa r c = A-luokkie lukumäärä = B-luokkie lukumäärä E ij = odotettu frekvessi luokassa, joka määrää A-luokka i ja B-luokka j, i =,,, r, j =,,, c R i = havaittu frekvessi A-luokassa i C j = havaittu frekvessi B-luokassa j = havaitoje kokoaislukumäärä Frekvessiä E ij kutsutaa tavallisesti odotetuksi solufrekvessiksi frekvessitaulu solussa (i, j). Odotettuje frekvessie E ij frekvessitaulukossa pätee: (i) Rivisummat yhtyvät havaittuihi frekvesseihi A-luokituksessa: (ii) c Eij = Ri, i =,,, r j= Sarakesummat yhtyvät havaittuihi frekvesseihi B-luokituksessa: r Eij = Cj, j =,,, c i= (iii) Havaitoje kokoaislukumäärä: r c r c E = R = C = ij i j i= j= i= j= TKK @ Ilkka Melli (006) 5/5
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Testisuure -riippumattomuustestissä Määritellää -testisuure r c ( O ) ij Eij = E jossa i= j= ij O ij = havaittu frekvessi solussa (i, j) E ij = odotettu frekvessi solussa (i, j) r c = A-luokkie lukumäärä = B-luokkie lukumäärä Testisuure mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja siksi sitä kutsutaa usei -etäisyydeksi. -testisuure voidaa kirjoittaa myös muotoo r c (ˆ p ) ij Pij = P i= j= ij jossa Oij pˆ ij = Eij R C i j P = = = pˆ ˆ CpC Ri pˆ ic = C j pˆ C j = i =,,, r, j =,,, c ij i j Jos ollahypoteesi H 0 pätee, testisuure oudattaa suurissa otoksissa approksimatiivisesti -jakaumaa vapausastei f = (r )(c ): jossa ( f ) a r = A-luokkie lukumäärä c = B-luokkie lukumäärä Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E ij ja keskimääräiset odotetut frekvessit R i /c ja C j /r toteuttavat ehdot Eij >, i =,,, r, j =,,, c Ri / c> 5, i =,,, r C / r > 5, j =,,, c j TKK @ Ilkka Melli (006) 6/6
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o jossa E( ) = f f = (r )(c ) Normaaliarvoaa merkitsevästi suuremmat -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. -homogeeisuustesti ja -riippumattomuustesti vertailu -homogeeisuustesti ja -riippumattomuustesti tehdää tekisesti täsmällee samalla tavalla ja iipä frekvessitaulukosta ei voi sellaiseaa ähdä kummasta testausasetelmasta o kyse: Odotetut frekvessit määrätää samalla kaavalla. Testisuureet lasketaa samalla kaavalla. Testisuureet oudattavat ollahypoteesi pätiessä approksimatiivisesti samaa jakaumaa. Testie testausasetelmat ovat kuiteki täysi erilaiset. Homogeeisuustesti testausasetelma: (i) Perusjoukko koostuu r ryhmästä ja testissä tarkastellaa perusjouko alkioide jakautumista luokkii eri ryhmissä, ku alkiot o luokittelu yhde tekijä A suhtee käyttäe kaikissa ryhmissä samaa luokitusta. (ii) Havaitoaieisto muodostuu toisistaa riippumattomista ryhmäkohtaisista satuaisotoksista. (iii) Sekä ryhmäkohtaiset otoskoot i että havaitoje kokoaislukumäärä ovat kiiteitä eli ei-satuaisia (eli valittuja) lukuja, ku taas sattuma määrää mite havaiot jakautuvat luokkii ryhmie sisällä. Riippumattomuustesti testausasetelma: (i) Testissä tarkastellaa kahde tekijä A ja B assosiaatiota eli riippuvuutta, ku havaiot o luokiteltu ristii tekijöide A ja B suhtee. (ii) Havaitoaieisto muodostuu yhdestä satuaisotoksesta. (iii) Vai havaitoje kokoaislukumäärä o kiiteä eli ei-satuaie (eli valittu) luku, ku taas sattuma määrää mite havaiot jakautuvat luokkii tekijöide A ja B ristiluokitukse suhtee. TKK @ Ilkka Melli (006) 7/7
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tilastollie riippuvuus ja korrelaatio Otos kaksiulotteisesta ormaalijakaumasta Oletetaa, että satuaismuuttujie x ja y pari (x,y) oudattaa kaksiulotteista ormaalijakaumaa eli ( xy, ) N ( µ x, µ y, σx, σ y, ρxy) jossa µ = E( x) µ = E( y) x σ = Var( x) = E[( x µ ) ] σ = Var( y) = E[( y µ ) ] x x y y σ = Cov( xy, ) = E[( x µ )( y µ )] ρ xy x y xy σ xy = Cor( xy, ) = σσ x y y Olkoot y, y,, y muuttuja y havaitut arvot ja x, x,, x muuttuja x havaitut arvot ja oletetaa, että havaitoarvoje x i ja y i parit (x i,y i ), i =,,, muodostavat yksikertaise satuaisotokse kaksiulotteista ormaalijakaumasta N ( µ x, µ y, σx, σ y, ρ xy) Tällöi ( x, y ),( x, y ),,( x, y ) x y µ µ σ σ ρ i ( i, i) N ( x, y, x, y, xy), =,,, Kaksiulotteise ormaalijakauma parametrie estimoiti Kaksiulotteise ormaalijakauma parametrie mometiestimaattorit tai suurimma uskottavuude estimaattorit ovat ˆ µ = x = x ˆ µ = y = y σˆ x i y i i= i= ( ) ˆ x = xi x = sx σ y = ( yi y) = sy i= i= σˆ = ( x x)( y y) = s ˆ ρ xy i i xy i= xy σˆ xy sxy = = = r σσ ˆ ˆ ss x y x y xy TKK @ Ilkka Melli (006) 8/8
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset jossa s x x s y y x = ( i ) y = ( i ) i= i= s = ( x x)( y y) xy i i i= Korreloimattomuude testaamie Olkoo ollahypoteesia H : ρ = 0 Määritellää t-testisuure Jos ollahypoteesi 0 xy rxy t = r H : ρ = 0 0 xy xy pätee, testisuure t oudattaa Studeti t-jakaumaa vapausastei ( ): t t( ) Testisuuree t ormaaliarvo = 0, koska ollahypoteesi pätiessä E(t) = 0 Site itseisarvoltaa suuret testisuuree t arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Testi korrelaatiokertoimelle Olkoo ollahypoteesia H : ρ = ρ 0 xy 0 Määritellää Fisheri z-muuos kaavalla + u z = f( u) = log u Sovelletaa Fisheri z-muuosta z = f (u) otoskorrelaatiokertoimee r xy : + r xy z = f( rxy ) = log r xy TKK @ Ilkka Melli (006) 9/9
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Voidaa osoittaa, että satuaismuuttuja z oudattaa suurissa otoksissa approksimatiivisesti ormaalijakaumaa: jossa z ( µ σ ) N, a z z + ρ xy µ z = f ( ρxy) = log ρ xy σ z = 3 Approksimaatio o käytäössä riittävä hyvä, jos > 5. Muodostetaa testisuure jossa z µ ν = σ z 0 z Jos ollahypoteesi H 0 pätee, + r xy z = f( rxy ) = log r xy 0 + ρ 0 µ z = f ( ρ0) = log ρ0 σ z = 3 v a N(0,) Testisuuree ν ormaaliarvo = 0, koska ollahypoteesi pätiessä E(ν) = 0 Site itseisarvoltaa suuret testisuuree ν arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. TKK @ Ilkka Melli (006) 0/0
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.. Kahdelle hekilölle, A ja B, o kummalleki aettu oppa ja kumpaaki o pyydetty heittämää sitä 0 kertaa. A ja B kertovat saaeesa heittoje tuloksea alla esitetyt silmälukuje jakaumat. (a) Tutki -yhteesopivuustesti avulla voidaako A: ja B: heittämiä oppia pitää virheettömiä eli symmetrisiä? Tämä tapahtuu testaamalla -yhteesopivuustestillä ollahypoteesia, että opaheito tulos oudattaa diskreettiä tasaista jakaumaa. Tällöi suuret -testisuuree arvot johtavat ollahypoteesi hylkäämisee. (b) Tutki -yhteesopivuustesti avulla, kuika todeäköistä o se, että A ja B ovat rehellisiä kertoessaa heittäeesä oppaa? Tämä tapahtuu testaamalla -yhteesopivuustestillä ollahypoteesia, että opaheito tulos oudattaa diskreettiä tasaista jakaumaa. Tällöi pieet -testisuuree arvot viittaavat siihe, että tulokset ovat liia hyviä ollaksee todellisia. Käytä (a)-kohda testeissä sekä %: että 5 %: merkitsevyystasoja ja (b)-kohda testeissä %: merkitsevyystasoa. Silmäluku 3 4 5 6 A: tulokset 6 0 7 33 B: tulokset 9 9 9 Tehtävä.. Mitä opimme? Tehtävässä sovelletaa -yhteesopivuustestiä. Tehtävä.. Ratkaisu: Kahdelle hekilölle A ja B o kummalleki aettu oppa ja kumpaaki o pyydetty heittämää sitä 0 kertaa. A ja B kertovat saaeesa heittoje tuloksea alla esitetyt silmälukuje jakaumat. Silmäluku 3 4 5 6 A: tulokset 6 0 7 33 B: tulokset 9 9 9 Tehtävä ollahypoteesia o H 0 : Pr(Saadaa silmäluku i) = p = /6, i =,, 3, 4, 5, 6 Site odotetuiksi frekvesseiksi saadaa: E i = p = 0, i =,, 3, 4, 5, 6 TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset A: käyttämälle opalle -testisuuree arvoksi saadaa = 3. Laskutoimitukset (Microsoft Excel ohjelmistolla): i O i E i (O i - E i ) /E i 0 3. 6 0 0.8 3 0 0 0 4 7 0 0.45 5 0 0. 6 33 0 8.45 Summa 0 0 3. B: käyttämälle opalle -testisuuree arvoksi saadaa = 0.3 Laskutoimitukset (Microsoft Excel ohjelmistolla): i O i E i (O i - E i ) /Ei 9 0 0.05 0 0.05 3 9 0 0.05 4 0 0.05 5 9 0 0.05 6 0 0.05 Summa 0 0 0.3 Koska k = 6 ja m = 0 (yhtää parametria ei ole estimoitu), -testisuuree vapausasteide lukumäärä o molemmissa tapauksissa f = k m = 6 0 = 5 -jakauma taulukoide mukaa %: merkitsevyystasoa vastaavat kriittie arvo 0.0 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.0 jakauma oikealle häälle. Koska ii Pr( 5.09) = 0.0 0.0 = 5.09 Etsitää vielä piste 0.99 häälle., joka erottaa todeäköisyysmassa 0.0 jakauma vasemmalle TKK @ Ilkka Melli (006) /
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Koska Pr( 0.554) = 0.99 ii ja site Pr( 0.554) = 0.0 0.99 = 0.554 -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii Pr(.07) = 0.05 0.05 =.07 Etsitää vielä piste 0.95, joka erottaa todeäköisyysmassa 0.05 jakauma vasemmalle häälle. Koska ii ja site Pr(.5) = 0.95 Pr(.5) = 0.05 0.95 =.5 (a) Normaaliarvoosa ähde liia suuret -testisuuree arvot viittaavat siihe, että havaiot eivät oudata ollahypoteesi kiiittämää jakaumaa. A: oppa ja %: merkitsevyystaso: Koska -testisuuree arvo = 3. < 5.09 = 0.0 ii ollahypoteesi jää voimaa %: merkitsevyystasolla A: opa tapauksessa. B: oppa ja %: merkitsevyystaso: Koska -testisuuree arvo = 0.3 < 5.09 = 0.0 ii ollahypoteesi jää voimaa %: merkitsevyystasolla B: opa tapauksessa. TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset A: oppa ja 5 %: merkitsevyystaso: Koska -testisuuree arvo = 3. >.07 = 0.05 ii ollahypoteesi hylätää 5 %: merkitsevyystasolla A: opa tapauksessa. B: oppa ja 5 %: merkitsevyystaso: Koska -testisuuree arvo = 0.3 <.07 = 0.05 ii ollahypoteesi jää voimaa 5 %: merkitsevyystasolla B: opa tapauksessa. (b) Normaaliarvoosa ähde liia pieet -testisuuree arvot viittaavat siihe, että havaiot oudattavat jossaki mielessä liia hyvi ollahypoteesi kiiittämää jakaumaa. A: oppa ja %: merkitsevyystaso: Koska -testisuuree arvo = 3. > 0.554 = 0.99 ii voimme päätellä, että A o todeäköisesti todella heittäyt oppaa. B: oppa ja %: merkitsevyystaso: Koska -testisuuree arvo = 0.3 < 0.554 = 0.99 ii, o syytä epäillä sitä, että B o heittäyt oppaa. B o saattaut keksiä heittotulokset, mutta o aliarvioiut satuaisvaihtelu merkitykse. TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.. Geiger-mittari laskee radioaktiivise aiee emissioide lukumääriä. Emissioide lukumäärä o lyhyellä aikavälillä satuaismuuttuja, joka voidaa olettaa oudattava Poissoi jakaumaa. Erästä aietta tutkittaessa emissioide lukumäärät rekisteröitii 0:llä samamittaisella lyhyellä aikavälillä. Alla olevassa taulukossa o aettu emissioide lukumäärie frekvessit. Tutki -yhteesopivuustesti avulla oko Poisso-jakaumaoletus sopusoiussa havaitoje kassa. Käytä testissä 5 %: merkitsevyystasoa. Emissioide lkm 0 3 4 5 Frekvessi 40 34 8 5 Tehtävä.. Mitä opimme? Tehtävässä sovelletaa -yhteesopivuustestiä. Tehtävä.. Ratkaisu: Erästä radioaktiivista aietta tutkittaessa Geiger-mittarilla rekisteröitii emissioide lukumäärät 0:llä samamittaisella lyhyellä aikavälillä. Alla olevassa taulukossa o aettu emissioide lukumäärie frekvessit. Emissioide lkm 0 3 4 5 Frekvessi 40 34 8 5 Tehtävä ollahypoteesia o H 0 : Emissioide lukumäärä oudattaa Poisso-jakaumaa Poisso-jakauma pistetodeäköisyysfuktio o x e λ λ f( x) = Pr( X = x) =, x = 0,,, x! Itesiteettiparametri λ suurimma uskottavuude estimaattori o havaitoje aritmeettie keskiarvo: jossa 5 ioi i = 0 x = = 03 =.098 0 = havaitoje kokoaislukumäärä = 0 O i = havaittu frekvessi luokassa i TKK @ Ilkka Melli (006) 5/5
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Odotetuiksi frekvesseiksi saadaa: E 0 = Pr(X = 0) = 36.43 E = Pr(X = ) = 37.5 E = Pr(X = ) = 8.94 E 3 = Pr(X = 3) = 6.44 E 4 = Pr(X = 4) =.64 E 5 = Pr(X = 5) = 0.33 Koska E 4 =.64 < 5 E 5 = 0.33 < 5 ii luokat 4 ja 5 yhdistetää luokkaa 3. -testisuuree arvoksi saadaa = 0.705 Laskutoimitukset (Microsoft Excel ohjelmistolla): i O i E i (O i - E i ) /E i 0 40 36.43 0.350 34 37.5 0.67 8 8.94 0.047 3 tai yli 9 8.4 0.04 Summa 0 00.93 0.705 Koska k = 4 ja m = (yksi parametri o estimoitu), -testisuuree vapausasteide lukumäärä o f = k m = 4 = -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii Pr( 5.99) = 0.05 0.05 = 5.99 Koska -testisuuree arvo = 0.705 < 5.99 = 0.05 ii ollahypoteesi jää voimaa 5 %: merkitsevyystasolla. TKK @ Ilkka Melli (006) 6/6
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Johtopäätös: Havaiot saattavat oudattaa Poisso-jakaumaa. TKK @ Ilkka Melli (006) 7/7
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.3. Erää tehtaa johto epäili, että työtekijöide keskuutee oli leviyt tapa veyttää viikolopu viettoa perjataihi ja maaataihi ilmoittautumalla sairaiksi. Asiaa tutkittii eljä viiko aja rekisteröimällä poissaoloje lukumäärät jokaisea työpäivää. Keskiarvotiedot ko. ajajaksolta o aettu alla olevassa taulukossa. (a) Testaa -yhteesopivuustesti avulla ollahypoteesia, että poissaoloje lukumäärä jakautuu tasaisesti työpäiville. (b) Yhdistä sekä perjatai ja maaatai että tiistai, keskiviiko ja torstai havaiot. Mite (a)-kohda ollahypoteesia o tällöi modifioitava? Testaa -yhteesopivuustesti avulla modifioitua ollahypoteesia. Käytä testeissä 5 %: merkitsevyystasoa. Viikopäivä ma ti ke to pe Summa Poissaoloje lukumäärä (ka) 49 35 3 39 45 00 Tehtävä.3. Mitä opimme? Tehtävässä sovelletaa -yhteesopivuustestiä. Tehtävä.3. Ratkaisu: (a) Määrätää odotetut frekvessit E j käyttäe ollahypoteesia H 0 : Poissaolot jakautuvat tasaisesti eri viikopäiville Odotetut frekvessit E j : Viikopäivä ma ti ke to pe Summa Poissaoloje lukumäärä 40 40 40 40 40 00 -testisuuree arvoksi saadaa = 4.90 Laskutoimitukset (Microsoft Excel ohjelmistolla): Päivä ma ti ke to pe Summa O i 49 35 3 39 45 00 E i 40 40 40 40 40 00 Khi.05 0.65.6 0.05 0.65 4.90 TKK @ Ilkka Melli (006) 8/8
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Koska k = 5 ja m = 0 (yhtää parametria ei ole estimoitu), -testisuuree vapausasteide lukumäärä o f = k m = 5 0 = 4 -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii Pr( 9.488) = 0.05 0.05 = 9.488 Koska -testisuuree arvo = 4.90 < 9.488 = 0.05 ii ollahypoteesi jää voimaa 5 %: merkitsevyystasolla. Johtopäätös: Poissaolot saattavat hyviki jakautua tasaisesti eri viikopäiville. (b) Yhdistämällä sekä perjatai ja maaatai havaiot että tiistai, keskiviiko ja torstai havaiot saadaa seuraava havaittuje frekvessie taulukko: Viikopäivä pe-ma ti-ke-to Summa Poissaoloje lukumäärä (ka) 94 06 00 Vastaava yhdistämie (a)-kohda odotettuje frekvessie taulukossa tuottaa tauluko Viikopäivä pe-ma ti-ke-to Summa Poissaoloje lukumäärä 80 0 00 -testisuuree arvoksi saadaa = 4.08 TKK @ Ilkka Melli (006) 9/9
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Laskutoimitukset (Microsoft Excel ohjelmistolla): Päivä pe-ma ti-ke-to Summa O i 94 06 00 E i 80 0 00 Khi.45.63 4.08 Koska k = ja m = 0 (yhtää parametria ei ole estimoitu), -testisuuree vapausasteide lukumäärä o f = k m = 0 = -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii site Pr( 3.84) = 0.05 0.05 = 3.84 Koska -testisuuree arvo = 4.08 > 3.84 = 0.05 ii ollahypoteesi hylätää 5 %: merkitsevyystasolla. Johtopäätös: Poissaolot eivät jakaudu tasaisesti eri viikopäiville. Huomautus: Tehtävästä.3. ähdää, että käytetty luokitus saattaa vaikuttaa -yhteesopivuustesti tuloksee. TKK @ Ilkka Melli (006) 30/30
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.4. Hekilöille A ja B o kummalleki aettu oppa ja kumpaaki o pyydetty heittämää sitä 0 kertaa. A ja B kertovat saaeesa heittoje tuloksea alla esitetyt silmälukuje jakaumat. Tutki -homogeeisuustesti avulla, oko mahdollista, että A ja B ovat käyttäeet samaa oppaa (tai oikeammi: oppia, joide silmälukuje todeäköisyydet ovat samat). Käytä testissä 5 %: merkitsevyystasoa. Silmäluku 3 4 5 6 A: tulokset 6 8 9 9 6 B: tulokset 6 0 7 33 Tehtävä.4. Mitä opimme? Tehtävässä sovelletaa -homogeeisuustestiä. Vrt. tässä tarkasteltavaa -homogeeisuustestiä tehtävissä.5. ja.6. sovellettavaa -riippumattomuustestii. Tehtävä.4. Ratkaisu: Sovelletaa testisuuretta r c ( O ) ij Eij = E i= j= ij jossa odotetut frekvessit E ij määrätää käyttäe ollahypoteesia H 0 : A ja B ovat käyttäeet samaa oppaa (tai oikeammi: oppia, joide silmälukuje todeäköisyydet ovat samat) Site odotetut frekvessit saadaa kaavalla jossa E ij = i C j / i = i. ryhmä otoskoko C j = j. sarakesumma = kokoaissumma Nollahypoteesi H 0 pätiessä testisuure oudattaa suurissa otoksissa approksimatiivisesti -jakaumaa mukaa vapausastei (r )(c ), jossa r c = frekvessitaulu rivie lukumäärä = frekvessitaulu sarakkeide lukumäärä Olkoo vaihtoehtoisea hypoteesia H se, että A ja B eivät ole käyttäeet samaa oppaa (tai oikeammi: A ja B ovat käyttäeet oppia, joide silmälukuje todeäköisyydet eroavat tosistaa). TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset -testisuuree arvoksi saadaa =.406 Laskutoimitukset (Microsoft Excel -ohjelmalla): O ij 3 4 5 6 Summa A 6 8 9 9 6 0 B 6 0 7 33 0 Summa 8 34 39 39 4 59 40 E ij 3 4 5 6 Summa A 4 7 9.5 9.5 0.5 9.5 0 B 4 7 9.5 9.5 0.5 9.5 0 Summa 8 34 39 39 4 59 40 Khi 3 4 5 6 Summa A 0.8574 0.05884 0.08 0.3053 0.09756 0.4554.088 B 0.8574 0.05884 0.08 0.3053 0.09756 0.4554.088 Summa 0.5749 0.7647 0.0564 0.6406 0.95 0.830508.405763 Vapausteide lukumääräksi saadaa f = (r )(c ) = ( )(6 ) = 5 Site 5 %: merkitsevyystasoa vastaava kriittiseksi arvoksi taulukoista 0.05 =.07 Koska testisuuree arvo =.4 <.07 = 0.05 0.05 saadaa -jakauma ii testisuuree arvo o jääyt hyväksymisalueelle ja ollahypoteesi H 0 voidaa jättää voimaa merkitsevyystasolla 0.05. Johtopäätös: A: ja B: tulokset voivat olla peräisi samasta opasta (tai oikeammi: opista, joide silmälukuje todeäköisyydet ovat samat). TKK @ Ilkka Melli (006) 3/3
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.5. Erää rokotuskokee tulokset o aettu alla. (a) Testaa ollahypoteesia, että rokotettuje ja rokottamattomie sairastavuudessa ei ole eroa suhteelliste osuuksie vertailutestiä käyttäe. (b) Testaa ollahypoteesia, että sairastavuus ei riipu rokotuksesta -riippumattomuustestiä käyttäe. Käytä molemmissa testeissä 5 %: merkitsevyystasoa. Vertaa (a)- ja (b)-kohtie testie tuloksia toisiisa. Voivatko testit johtaa eri tuloksii? Sairastumie Rokotus Sairastuut: S Ei sairastuut: ei-s Rokotettu: R 9 4 Ei rokotettu: ei-r 7 8 Tehtävä.5. Mitä opimme? Tehtävässä sovelletaa samaa aieistoo suhteelliste osuuksie vertailutestiä riippumattomille otoksille ja -riippumattomuustestiä. Lisätietoja suhteelliste osuuksie vertailutestistä: ks. 0. harjoitukset. Vrt. tässä tarkasteltavaa -riippumattomuustestiä tehtävässä.4. sovellettavaa -homogeeisuustestii. Tehtävä.5. Ratkaisu: (a) Olkoo A = Hekilö sairastuu ja olkoo Pr(A) = p, jos hekilö o rokotettu Pr(A) = p, jos hekilöä ei ole rokotettu Määritellää riippumattomat satuaismuuttujat jossa X ik, jos i. hekilö, jolle o tehty toimepide k, sairastuu = 0, jos i. hekilö, jolle o tehty toimepide k, ei sairastu i =,,,, k =, k = hekilö rokotetaa k = hekilöä ei rokoteta k TKK @ Ilkka Melli (006) 33/33
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tällöi X Ber( p ), i =,,,, k =, ik k k Asetetaa ollahypoteesi H 0 : p = p Määritellää testisuure (ks. 0. harjoitukset) z = pˆ pˆ pˆ( pˆ) + Testisuuree lausekkeessa = Rokotettuje lukumäärä ˆp = Sairastueide suhteellie osuus rokotettuje joukossa = Ei-rokotettuje lukumäärä ˆp = Sairastueide suhteellie osuus ei-rokotettuje joukossa ja ˆp = Sairastueide suhteellie osuus, ku rokotettuja ja ei-rokotettuja käsitellää yhteä ryhmää Huomaa, että ˆp = f / ˆp = f / jossa ja f = Sairastueide lukumäärä rokotettuje joukossa f = Sairastueide lukumäärä ei-rokotettuje joukossa f + f pˆ + pˆ pˆ = = + + Jos ollahypoteesi H 0 pätee, testisuure z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: z a N(0,) TKK @ Ilkka Melli (006) 34/34
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä tapauksessa: = 9+ 4= 5 f 9 pˆ = = = 0.765 5 ja edellee = 7 + 8 = 45 f 7 pˆ = = = 0.3778 45 f + f 9+ 7 3 pˆ = = = = 0.708 + 5+ 45 48 z pˆ pˆ 0.77 0.378 = = = pˆ( pˆ) + 0.7 ( 0.7) + 5 45.5 Valitaa vaihtoehtoiseksi hypoteesiksi se, että sairastuvuus o rokotettuje joukossa pieempää kui ei-rokotettuje joukossa eli olkoo vaihtoehtoisea hypoteesia yksisuutaie vaihtoehto H : p < p Tällöi 5 %: merkitsevyystasoa vastaavaksi kriittiseksi arvoksi z0.05 saadaa ormaalijakauma taulukosta Koska z 0.05 =.65 z =. <.65 = z0.05 ii testisuuree z arvo o jääyt hylkäysalueelle ja ollahypoteesi H 0 voidaa hylätä ja vaihtoehtoie hypoteesi H hyväksyä merkitsevyystasolla 0.05. Johtopäätös: Sairastuvuus rokotettuje joukossa o pieempää kui rokottamattomie joukossa. (b) Sovelletaa -testisuuretta r c ( O ) ij Eij = E i= j= ij jossa odotetut frekvessit E ij määrätää käyttäe ollahypoteesia H 0 : Sairastumistodeäköisyys ei riipu rokotuksesta TKK @ Ilkka Melli (006) 35/35
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Site odotetut frekvessit E ij saadaa kaavalla E ij = R i C j / jossa R i = i. rivisumma C j = j. sarakesumma = kokoaissumma Nollahypoteesi H 0 pätiessä testisuure oudattaa suurissa otoksissa approksimatiivisesti -jakaumaa vapausastei (r )(c ), jossa r c = frekvessitaulu rivie lukumäärä = frekvessitaulu sarakkeide lukumäärä Olkoo vaihtoehtoisea hypoteesia H se, että sairastumistodeäköisyys riippuu rokotuksesta. -testisuuree arvoksi saadaa = 4.906 Laskutoimitukset (Microsoft Excel ohjelmalla): O ij S ei-s Summa R 9 4 5 ei-r 7 8 45 Summa 6 70 96 E ij S ei-s Summa Tarkistus R 3.85 37.875 5 5 ei-r.875 3.85 45 45 Summa 6 70 96 Tarkistus 6 70 Khi S ei-s Summa R.676753 0.6794.99548 ei-r.9003 0.705833.60654 Summa 3.577074.3867 4.90570 Vapausasteide lukumääräksi saadaa f = (r )(c ) = ( )( ) = Site 5 %: merkitsevyystasoa vastaavaksi kriittiseksi arvoksi jakauma taulukoista 0.05 = 3.84 0.05 saadaa - TKK @ Ilkka Melli (006) 36/36
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Koska testisuuree arvo = 4.9 > 3.84 = 0.05 ii testisuuree arvo o joituut hylkäysalueelle ja ollahypoteesi H 0 voidaa hylätä ja vaihtoehtoie hypoteesi H hyväksyä merkitsevyystasolla 0.05. Johtopäätös: Sairastumistodeäköisyys riippuu siitä oko hekilö rokotettu vai ei. Huomautuksia: (i) (ii) (a)-kohda z-testisuuree arvo eliö yhtyy (b)-kohda -testisuuree arvoo. Tämä ei ole sattumaa, vaa perustuu -testisuuree omiaisuuksii - frekvessitaulussa. Huomaa kuiteki, että z-testi ja -testi ekvivalessia -frekvessitaulu tapauksessa ei voida yleistää r c-tauluihi, joissa r > ja/tai c >. TKK @ Ilkka Melli (006) 37/37
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.6. Alla olevassa taulukossa o aettu tulokset kyselytutkimuksesta, joka kohteea olivat USA: kasalaiset. Kysely kohteet poimittii yksikertaisella satuaisotaalla ja otoksee poimituilta kysyttii puoluekataa ja suhtautumista käsiaseide hallussapido rajoituksii. Oko suhtautumie aserajoituksii riippumatota puoluekaasta? Käytä asia tutkimisessa -riippumattomuustestiä 0.5 %: merkitsevyystasolla. Suhtautumie aserajoituksii Puoluekata Puoltaa Ei kataa Vastustaa Demokraatti 0 6 64 Republikaai 90 4 6 Riippumato 55 0 35 Tehtävä.6. Mitä opimme? Tehtävässä sovelletaa -riippumattomuustestiä. Vrt. tässä tarkasteltavaa -riippumattomuustestiä tehtävässä.4. sovellettavaa -homogeeisuustestii. Tehtävä.6. Ratkaisu: Sovelletaa testisuuretta r c ( O ) ij Eij = E i= j= ij jossa odotetut frekvessit E ij määrätää käyttäe ollahypoteesia H 0 : Suhtautumie aserajoituksii ei riipu puoluekaasta Site odotetut frekvessit saadaa kaavalla jossa E ij = R i C j / R i = i. rivisumma C j = j. sarakesumma = kokoaissumma Nollahypoteesi H 0 pätiessä -testisuure oudattaa suurissa otoksissa approksimatiivisesti -jakauma mukaa vapausastei (r )(c ), jossa r = frekvessitaulu rivie lukumäärä c = frekvessitaulu sarakkeide lukumäärä TKK @ Ilkka Melli (006) 38/38
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Olkoo vaihtoehtoisea hypoteesia H se, että suhtautumie aserajoituksii riippuu puoluekaasta. Havaitut frekvessit O ij : O ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 0 6 64 00 Rep 90 4 6 0 Riip 55 0 35 00 Yhteesä 55 50 5 50 Odotetut frekvessit E ij : E ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 98. 9. 8.7 00 Rep 07.9. 9.0 0 Riip 49.0 9.6 4.4 00 Yhteesä 55 50 5 50 -testisuuree arvoksi saadaa =.05 Laskutoimitukset (Microsoft Excel -ohjelmalla): O ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 0 6 64 00 Rep 90 4 6 0 Riip 55 0 35 00 Summa 55 50 5 50 E ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 98. 9. 8.7 00 Rep 07.9. 9.0 0 Riip 49.0 9.6 4.3 00 Summa 55 50 5 50 Khi Puoltaa Ei kataa Vastustaa Yhteesä Dem.45.38 4.3 8.06 Rep.96.4 6.89.8 Riip 0.7 0.0 0.97.7 Summa 5.4 4.8.09.05 TKK @ Ilkka Melli (006) 39/39
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Vapausteide lukumääräksi saadaa f = (r )(c ) = (3 )(3 ) = 4 Site 0.5 %: merkitsevyystasoa vastaava kriittiseksi arvoksi taulukoista 0.005 = 4.86 Koska testisuuree arvo =.05 > 4.86 = 0.005 0.005 saadaa -jakauma ii testisuuree arvo o joutuut hylkäysalueelle ja ollahypoteesi H 0 voidaa hylätä ja vaihtoehtoie hypoteesi H voidaa hyväksyä merkitsevyystasolla 0.005. Johtopäätös: Puoluekata ja suhtautumie aserajoituksii riippuvat toisistaa. TKK @ Ilkka Melli (006) 40/40
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.7. Eräässä 4: kua otoksessa Suome kutie joukosta suhteellise rikollisuude (muuttuja x; rikoksia per 000 asukasta) ja asukastiheyde (muuttuja y; asukasta per km ) välise otoskorrelaatiokertoime arvoksi saatii r = 0.57. Oletetaa, että havaitoje parit (x i,y i ), i =,,, jossa ideksi i viittaa kutaa i, oudattavat kaksiulotteista ormaalijakaumaa N ( µ x, µ y, σx, σ y, ρ xy) Testaa 5 %: merkitsevyystasoa käyttäe ollahypoteesia, että muuttujat x ja y ovat korreloimattomia, ku vaihtoehtoiseksi hypoteesiksi valitaa kaksisuutaie vaihtoehto. Tehtävä.7. Mitä opimme? Tehtävässä tarkastellaa korreloimattomuude testaamista. Lisätietoja kaksiulotteisesta ormaalijakaumasta: ks.. harjoitukset. Yleie testi korrelaatiokertoimelle: ks. tehtävää.8. Tehtävä.7. Ratkaisu: t-testisuure ollahypoteesille H : ρ = 0 0 xy o muotoa rxy t = r xy jossa r xy o muuttujie x ja y havaituista arvoista määrätty Pearsoi otoskorrelaatiokerroi. Jos ollahypoteesi H 0 pätee, testisuure t o jakautuut Studeti t-jakauma mukaa vapausastei ( ): t t( ) Tehtävä tapauksessa testisuuree arvoksi saadaa r 0.57 t = = 4 =.005 0.57 Vapausasteide lukumääräksi saadaa df = = 40 xy rxy TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Koska vaihtoehtoiseksi hypoteesiksi o valittu kaksisuutaie vaihtoehto H: ρ 0 xy ii 5 %: merkitsevyystasoa vastaavaksi kriittisiksi rajoiksi t 0.05 ja +t 0.05 saadaa Studeti t-jakauma taulukoista t 0.05 =.0 +t 0.05 = +.0 Koska t 0.05 =.0 < t =.0 < +.0 = +t 0.05 testisuuree t arvo o jääyt hyväksymisalueelle ja ollahypoteesi H 0 voidaa jättää voimaa 5 %: merkitsevyystasolla. Johtopäätös: Otoksesta saatuje tietoje perusteella kua suhteellise rikollisuude ja asukasluvu välillä ei ole korrelaatiota. TKK @ Ilkka Melli (006) 4/4
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.8. Meestymie opioissa saattaa vaikuttaa vastavalmistuee alkupalkkaa. Asiaa tutkittii eräässä USA: yliopistossa poimimalla vastavalmistueide joukosta yksikertaie satuaisotos, joka koko oli 5. Otoksee poimituilta opiskelijoilta kysyttii heidä arvosaapisteidesä keskiarvoa (muuttuja x) ja alkupalkkaa (muuttuja y; 000 $). Otosta kuvaavat perustuusluvut olivat: x = 3.04 y = 8.05 s x = 0.063 s y = 5.8 r xy = 0.848 Oletetaa, että havaitoje parit (x i,y i ), i =,,, oudattavat kaksiulotteista ormaalijakaumaa N ( x, y, x, y, xy) µ µ σ σ ρ. Testaa 5 %: merkitsevyystasolla ollahypoteesia H : ρ = 0.5 0 xy ku vaihtoehtoiseksi hypoteesiksi valitaa se, että arvosaapisteide keskiarvo ja alkupalka välise korrelaatiokertoime arvo o suurempi kui 0.5. Tehtävä.8. Mitä opimme? Tehtävässä tarkastellaa yleistä testiä Pearsoi tulomomettikorrelaatiokertoimelle. Lisätietoja kaksiulotteisesta ormaalijakaumasta: ks.. harjoitukset. Korreloimattomuude testaamie: ks. tehtävää.7. Tehtävä.8. Ratkaisu: Testisuure ollahypoteesille o muotoa H : ρ = ρ = 0.5 0 xy 0 v = + r xy + ρ 0 log log r xy ρ0 3 jossa r xy o muuttujie x ja y havaituista arvoista määrätty Pearsoi otoskorrelaatiokerroi. Jos ollahypoteesi H 0 pätee, v a N(0,) TKK @ Ilkka Melli (006) 43/43
Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä tapauksessa + r xy + 0.848 log = log =.49 r xy 0.848 jote + ρ + 0.5 = = 0.5 0 log log 0.549 ρ0.49 0.549 v = =.4 5 3 Koska vaihtoehtoiseksi hypoteesiksi o valittu yksisuutaie vaihtoehto H 0 : ρ > 0.5 ii 5 %: merkitsevyystasoa vastaavaksi kriittiseksi rajoiksi +z 0.05 saadaa ormaalijakauma taulukoista +z 0.05 = +.64 Koska +z 0.05 = +.64 < +.4 = z testisuuree z arvo o joutuut hylkäysalueelle ja ollahypoteesi H 0 voidaa hylätä ja vaihtoehtoie hypoteesi H voidaa hyväksyä 5 %: merkitsevyystasolla. Johtopäätös: Otoksesta saatuje tietoje perusteella arvosaapisteide keskiarvo ja alkupalka välise otoskorrelaatiokertoime arvo o suurempi kui 0.5. TKK @ Ilkka Melli (006) 44/44