χ 2 -yhteensopivuustesti

Samankaltaiset tiedostot
χ 2 -yhteensopivuustesti

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Osa 2: Otokset, otosjakaumat ja estimointi

11. laskuharjoituskierros, vko 15, ratkaisut

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

2-suuntainen vaihtoehtoinen hypoteesi

8. laskuharjoituskierros, vko 11, ratkaisut

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Tilastolliset menetelmät: Tilastolliset testit

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Osa 2: Otokset, otosjakaumat ja estimointi

2-suuntainen vaihtoehtoinen hypoteesi

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset menetelmät: Tilastolliset testit

Yhden selittäjän lineaarinen regressiomalli

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Mat Tilastollisen analyysin perusteet, kevät 2007

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Tilastollinen riippuvuus ja korrelaatio

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Otantajakauman käyttö päättelyssä

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi.

Harjoitus 7: NCSS - Tilastollinen analyysi

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Tilastollinen päättely II, kevät 2017 Harjoitus 3B

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Testit järjestysasteikollisille muuttujille

Moniulotteisia todennäköisyysjakaumia

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Tilastolliset luottamusvälit

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Harjoitukset 1 : Tilastokertaus

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

EX1 EX 2 EX =

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

10. laskuharjoituskierros, vko 14, ratkaisut

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Mat Sovellettu todennäköisyyslasku A

Transkriptio:

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Tilastollie riippuvuus ja korrelaatio Avaisaat: Havaittu frekvessi, Heterogeeisuus, Hylkäysalue, Hyväksymisalue, Homogeeisuus, Jakaumaoletus, Keskihajota, χ -jakauma, χ -homogeeisuustesti, χ -riippumattomuustesti, χ -yhteesopivuustesti, Kaksiulotteie ormaalijakauma, Korrelaatio, Korreloimattomuus, Kovariassi, Kriittie arvo, Merkitsevyystaso, Momettimeetelmä, Nollahypoteesi, Normaalijakauma, Odotettu frekvessi, Otos, Parametri, p-arvo, Riippumattomuus, Riippuvuus, Sovite, Suurimma uskottavuude meetelmä, Testi, Vaihtoehtoie hypoteesi, Vapausasteet, Yhteesopivuus, z-muuos Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie χ -yhteesopivuustesti Testausasetelma χ -yhteesopivuustestissä Tarkastellaa tutkimusasetelmaa, perusjouko S alkioita kuvataa faktorilla eli tekijällä A, joka saa olla laatuero-, järjestys-, välimatka- tai suhdeasteikollie muuttuja. Oletetaa, että perusjoukosta S o poimittu yksikertaie satuaisotos. Haluamme testata jakaumaoletusta, joka mukaa tekijä A oudattaa perusjoukossa S jotaki tiettyä todeäköisyysjakaumaa. Testattava oletus voidaa muotoilla saallisesti seuraavilla tavoilla: (i) Voidaako havaitoje jakaumaa kuvata oletukse määrittelemällä todeäköisyysjakaumalla? (ii) Voiko otos olla oletukse määrittelemä todeäköisyysjakauma geeroima eli tuottama? Yhteesopivuustestissä tutkitaa ovatko otos ja tehty jakaumaoletus yhteesopivia. χ -yhteesopivuustestissä havaitoje ja havaitoje jakaumasta tehdy oletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille sopiva luokitus. () Määrätää havaitoje luokkafrekvessit. (3) Määrätää tehdy jakaumaoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa χ -testisuureella. Hypoteesit χ -yhteesopivuustestissä Yleie hypoteesi H : Havaiot X, X,, X o saatu poimimalla yksikertaie satuaisotos perusjoukosta S. Nollahypoteesi H 0 : Havaiot X, X,, X oudattavat todeäköisyysjakaumaa f(x;θ), joka parametri θ o tavallisesti tutemato. TKK @ Ilkka Melli (008) /4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Vaihtoehtoie hypoteesi H : Havaiot X, X,, X eivät oudata ollahypoteesi H 0 määrittelemää todeäköisyysjakaumaa. Havaitut luokkafrekvessit Luokitellaa havaiot X, X,, X toisesa poissulkevii luokkii, joide lukumäärä olkoo m. Olkoo O k, k =,,, m iide havaitoje frekvessi eli lukumäärä jotka kuuluvat luokkaa k. Frekvessi O k o luokkaa k kuuluvie havaitoje havaittu frekvessi. Jos havaiot X, X,, X ovat diskreeti satuaismuuttuja X havaittuja arvoja ja satuaismuuttuja X mahdolliset arvot ovat y, y,, y m ii, havaito X i luokitellaa luokkaa k, jos X i = y k, i =,,,, k =,,, m Luokkaa k kuuluvie havaitoje X i havaittu frekvessi O k o iide havaitoje lukumäärä, jotka saavat arvo y k. Oletetaa yt, että havaiot X, X,, X ovat jatkuva satuaismuuttuja X havaittuja arvoja ja että X (a, b) Jaetaa väli (a, b) pisteillä a = a < a < a < < a < a = b 0 m pistevieraisii osaväleihi (a k, a k ], k =,,, m Tällöi havaito X i luokitellaa luokkaa k, jos X i (a k, a k ], i =,,,, k =,,, m Luokkaa k kuuluvie havaitoje X i havaittu frekvessi O k o iide havaitoje lukumäärä, jotka kuuluvat välii k. Havaitut luokkafrekvessit O k voidaa esittää frekvessitaulukkoa seuraavassa muodossa: Luokka m Summa Havaittu frekvessi O O O m m Frekvessiä O k kutsutaa havaituksi solufrekvessiksi frekvessitauluko solussa k. Havaitut solufrekvessit O k toteuttavat yhtälö m k = O k = TKK @ Ilkka Melli (008) /4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Odotetut luokkafrekvessit Oletetaa, että havaiot X, X,, X ovat satuaismuuttuja X havaittuja arvoja ja, että havaiot o luokiteltu toisesa poissulkevii luokkii, joide lukumäärä o m. Oletetaa esi, että ollahypoteesi H 0 määrää täydellisesti satuaismuuttuja X jakauma. Olkoo P k todeäköisyys sille, että satuaismuuttuja X saa arvo luokasta k, ku ollahypoteesi H 0 pätee. Tällöi luokkaa k kuuluvie havaitoje odotettu frekvessi E k saadaa kaavasta E = P, k =,,, m k k Oletetaa yt, että ollahypoteesi H 0 määrää satuaismuuttuja X jakauma vai osittai eli, että ollahypoteesi H 0 määrää jakauma tyypi, mutta jakauma parametrit ovat tutemattomia. Koska jakauma parametreja ei tueta, e o estimoitava havaioista. Olkoo P k yt estimoitu todeäköisyys sille, että satuaismuuttuja X saa arvo luokasta k, ku ollahypoteesi H 0 pätee. Myös tällöi luokkaa k kuuluvie havaitoje odotettu frekvessi E k saadaa kaavasta E = P, k =,,, m k k Jos X o diskreetti satuaismuuttuja, joka mahdolliset arvot ovat y, y,, y m ii P k = Pr(X = y k ), k =,,, m todeäköisyys Pr(X = y k ) määrätää olettae, että ollahypoteesi H 0 pätee. Todeäköisyydet Pr(X = y k ) voidaa määrätä satuaismuuttuja X kertymäfuktio tai pistetodeäköisyysfuktio avulla. Oletetaa yt, että X o jatkuva satuaismuuttuja, joka saa arvoja väliltä (a, b) ja että väli (a, b) o jaettu pisteillä a= a < a < a < < a < a = b 0 m pistevieraisii osaväleihi (a k, a k ], k =,,, m Tällöi P = Pr( a < X a ), k =,,, m k k k todeäköisyys Pr( a < k X ak) määrätää olettae, että ollahypoteesi H 0 pätee. Todeäköisyydet Pr( ak < X ak) voidaa määrätä satuaismuuttuja X kertymäfuktio tai tiheysfuktio avulla. Odotetut frekvessit E k voidaa esittää frekvessitaulukkoa seuraavassa muodossa: Luokka m Summa Odotettu frekvessi E E E m m TKK @ Ilkka Melli (008) 3/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Frekvessiä E k kutsutaa odotetuksi solufrekvessiksi frekvessitauluko solussa k. Odotetut solufrekvessit E k toteuttavat yhtälö m k = E k = Testisuure χ -yhteesopivuustestissä Testi ollahypoteesille H 0 perustuu havaittuje frekvessie O k ja odotettuje frekvessie E k vertaamisee. Jos havaittuje frekvessie O k ja odotettuje frekvessie E k jakaumat muistuttavat toisiaa, havaiot ovat sopusoiussa ollahypoteesi H 0 kassa. Määritellää χ -testisuure m ( Ok Ek) χ = E k = k O k = havaittu frekvessi luokassa k E k = odotettu frekvessi luokassa k m = luokkie lukumäärä Testisuure χ mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja sitä kutsutaa usei χ -etäisyydeksi. χ -testisuure voidaa kirjoittaa myös muotoo m (ˆ pk Pk) χ = P k = k p ˆk = O k / = havaittu suhteellie frekvessi luokassa k P k = todeäköisyys, että havaito kuuluu luokkaa k, ku ollahypoteesi H 0 pätee m = luokkie lukumäärä Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ - jakaumaa vapausastei f = (m p): χ χ ( f ) a f = m p m = luokkie lukumäärä p = odotettuje frekvessie E k määräämiseksi estimoituje parametrie lukumäärä Approksimaatiota voidaa pitää riittävä hyvää, jos odotetut frekvessit E k toteuttavat ehdot E > 5, k =,,, m k TKK @ Ilkka Melli (008) 4/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree χ ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o E( χ ) = f f = m p Normaaliarvoaa merkitsevästi suuremmat χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Normaaliarvoaa merkitsevästi pieemmät χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 pätee liia hyvi: Havaiot saattavat olla vääreettyjä. Homogeeisuude testaamie Testausasetelma χ -homogeeisuustestissä Tarkastellaa tutkimusasetelmaa, perusjouko S alkioita kuvataa yhdellä faktorilla eli tekijällä A, joka saa olla laatuero-, järjestys-, välimatka- tai suhdeasteikollie muuttuja. Jaetaa perusjoukko S jakaa kahtee tai useampaa ryhmää, poimitaa ryhmistä toisistaa riippumattomat yksikertaiset satuaisotokset ja tarkastellaa tekijä A vaihtelua otoksissa. Tehdää oletus, että tekijä A oudattaa kaikissa ryhmissä samaa, tarkemmi määrittelemätötä todeäköisyys-jakaumaa. Testattava oletus voidaa muotoilla saallisesti seuraavilla tavoilla: (i) Voidaako eri otoksista (ryhmistä) saatuja havaitoarvoje jakaumia kuvata samalla todeäköisyysjakaumalla? (ii) Voivatko otokset olla sama todeäköisyysjakauma geeroimia eli tuottamia? Jos tehty jakaumaoletus pätee ja tekijä A oudattaa kaikissa ryhmissä samaa jakaumaa, ii perusjoukko o homogeeie ja perusjoukkoa ei tarvitse jakaa tekijää A koskevissa tarkasteluissa erillisiksi ryhmiksi. Jos tehty jakaumaoletus ei päde ja tekijä A oudattaa siis eri ryhmissä eri jakaumia, ii perusjoukko o heterogeeie ja ryhmiä o syytä tarkastella tekijää A koskevissa tarkasteluissa erillisiä. Tällaiste jakaumaoletukse testaamisee tarkoitettuja testejä kutsutaa homogeeisuustesteiksi. χ -homogeeisuustesti suorittamie χ -homogeeisuustestissä havaitoje ja iide jakaumasta eri ryhmissä tehdy homogeeisuusoletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille yhteie luokitus. () Määrätää havaitoje luokkafrekvessit jokaisesta otoksesta. (3) Määrätää tehdy homogeeisuusoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa χ -testisuureella. TKK @ Ilkka Melli (008) 5/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Hypoteesit χ -homogeeisuustestissä Yleie hypoteesi H : Perusjoukosta voidaa jakaa r ryhmää, joista o poimittu (toisistaa riippumattomat) yksikertaiset satuaisotokset. Nollahypoteesi H 0 : Otokset i =,,, r o poimittu samasta todeäköisyysjakaumasta. Vaihtoehtoie hypoteesi H : Otokset i =,,, r o poimittu eri todeäköisyysjakaumista. Havaitut frekvessit Oletetaa, että tutkimukse kohteea oleva perusjoukko S o jaettu r ryhmää. Poimitaa ryhmistä toisistaa riippumattomat yksikertaiset satuaisotokset, joide koot ovat i, i =,,, r Luokitellaa havaiot jokaisessa otoksessa samaa luokitusta käyttäe toisesa poissulkevii luokkii, joide lukumäärä olkoo ja määrätää ryhmä i luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä O ij, i =,,, r, j =,,, Muodostetaa havaituista frekvesseistä O ij (r )-frekvessitaulukko [O ij ] : Luokat Summa Ryhmät O O O O O O r O r O r O r r Summa C C C Taulukossa: r = ryhmie lukumäärä = luokkie lukumäärä O ij = havaittu frekvessi ryhmä i luokassa j, i =,,, r, j =,,, i = otoskoko ryhmässä i C j = havaittu frekvessi yhdistety havaitoaieisto luokassa j = havaitoje kokoaislukumäärä Frekvessiä O ij kutsutaa tavallisesti havaitoje havaituksi solufrekvessiksi frekvessitaulu solussa (i, j). TKK @ Ilkka Melli (008) 6/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Havaittuje frekvessie O ij frekvessitaulukossa pätee: (i) Rivisummat yhtyvät ryhmäkohtaisii otoskokoihi: (ii) Oij = i, i =,,, r j= Sarakesummat yhtyvät yhdistety havaitoaieisto luokkafrekvesseihi: r Oij = Cj, j =,,, i= (iii) Havaitoje kokoaislukumäärä: r r O = = C = ij i j i= j= i= j= Nollahypoteesi tulkita χ -homogeeisuustestissä Jos ollahypoteesi H 0 pätee, havaitoje pitää jakautua (satuaisvaihtelua lukuu ottamatta) jokaisessa ryhmässä i =,,, r samalla tavalla luokkii j =,,,. Jos ollahypoteesi H 0 pätee, havaitoje jakautumie luokkii j =,,, ei saa riippua siitä, mihi ryhmää i =,,, r e kuuluvat. Jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu luokkaa j =,,, ei saa riippua siitä, mihi ryhmää i =,,, r se kuuluu. Odotettuje frekvessie määräämie Olkoo x o tarkastelu kohteea oleva perusjouko S alkio. Määritellää seuraavat todeäköisyydet: pij = Pr( x kuuluu ryhmää i ja luokkaa j) p ji = Pr( x kuuluu luokkaa j x kuuluu ryhmää i) pi i = Pr( x kuuluu ryhmää i) pi j = Pr( x kuuluu luokkaa j) i =,,, r, j =,,, Todeäköisyyslaskea yleise tulosääö mukaa pij = pj i pi i, i=,,, r, j =,,, Jos ollahypoteesi H 0 pätee, todeäköisyys, että perusjouko S alkio x kuuluu luokkaa j ei saa riippua siitä, mihi ryhmää i alkio x kuuluu. Site ollahypoteesi H 0 perusjouko homogeeisuudesta voidaa ilmaista muodossa H 0 : p ji = pi j, i =,,, r, j =,,, tai muodossa H 0 : pij = pi ipi j, i =,,, r, j =,,, TKK @ Ilkka Melli (008) 7/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Todeäköisyydet pij, pi i, pi j voidaa estimoida havaituista frekvesseistä O ij kaavoilla Oij C i j pˆ ˆ ˆ ij = pii = pi j = Jos ollahypoteesi H 0 pätee, solutodeäköisyydet p ij voidaa estimoida kaavoilla C i j P = ˆ ˆ ij pi p j = i i Määrätää ollahypoteesi H 0 pätiessä odotetut solufrekvessit E ij yhtälöillä Cj C i i j Eij = Pij = =, i=,,, r, j =,,, Muodostetaa odotetuista frekvesseistä E ij (r )-frekvessitaulukko [E ij ] : Luokat Summa Ryhmät E E E E E E r E r E r E r r Summa C C C Taulukossa r = ryhmie lukumäärä = luokkie lukumäärä E ij = odotettu frekvessi ryhmä i luokassa j, i =,,, r, j =,,, i = otoskoko ryhmässä i C j = havaittu frekvessi yhdistety havaitoaieisto luokassa j = havaitoje kokoaislukumäärä Frekvessiä E ij kutsutaa tavallisesti odotetuksi solufrekvessiksi frekvessitaulu solussa (i, j). Odotettuje frekvessie E ij frekvessitaulukossa pätee: (i) Rivisummat yhtyvät ryhmäkohtaisii otoskokoihi: Eij = i, i =,,, r j= TKK @ Ilkka Melli (008) 8/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset (ii) Sarakesummat yhtyvät yhdistety havaitoaieisto luokkafrekvesseihi: r Eij = Cj, j =,,, i= (iii) Havaitoje kokoaislukumäärä: r r E = = C = ij i j i= j= i= j= Testisuure χ -homogeeisuustestissä Määritellää χ -testisuure r ( O ) ij Eij χ = E i= j= ij O ij = havaittu frekvessi solussa (i, j) E ij = odotettu frekvessi solussa (i, j) r = ryhmie lukumäärä = lukkie lukumäärä Testisuure χ mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja sitä kutsutaa usei χ -etäisyydeksi. Homogeeisuustestiχ -testisuure voidaa kirjoittaa myös muotoo r (ˆ p ) ij Pij χ = P i= j= ij Oij pˆ ij = Eij C i j P ˆ ˆ ij = = = piipi j i pˆ ii = C j pˆ i j = i =,,, r, j =,,, Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ -jakaumaa vapausastei f = (r )( ): χ χ ( f ) a r = ryhmie lukumäärä TKK @ Ilkka Melli (008) 9/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset = luokkie lukumäärä Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E ij ja keskimääräiset odotetut frekvessit C j /r toteuttavat ehdot Eij >, i =,,, r, j =,,, C / r > 5, j =,,, j Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree χ ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o E( χ ) = f f = (r )( ) Normaaliarvoaa merkitsevästi suuremmat χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Riippumattomuude testaamie Testausasetelma χ -riippumattomuustestissä Tarkastellaa tutkimusasetelmaa, perusjouko S alkioita kuvataa kahdella faktorilla eli tekijällä A ja B, jotka saavat olla laatuero-, järjestys-, välimatka- tai suhdeasteikollisia muuttujia. Poimitaa perusjoukosta S yksikertaie satuaisotos ja tarkastellaa tekijöide A ja B vaihtelua otoksessa. Tehdää oletus, että tekijät A ja B ovat riippumattomia. Haluamme testata tehtyä riippumattomuusoletusta: Ovatko havaiot sopusoiussa tehdy riippumattomuusoletukse kassa? Jos tehty oletus pätee ja tekijät A ja B ovat siis riippumattomia, ii tekijöitä A ja B voidaa tarkastella erillisiä. Jos tehty oletus ei päde ja tekijät A ja B eivät siis ole riippumattomia, ii tekijät A ja B ovat assosioitueita. Riippumattomuusoletukse testaamisee tarkoitettuja testejä kutsutaa riippumattomuustesteiksi. χ -riippumattomuustesti suorittamie χ -riippumattomuustestissä havaitoje ja tehdy riippumattomuusoletukse yhteesopivuutta mitataa seuraavalla tavalla: () Valitaa havaioille sopivat luokitukset tekijöide A ja B suhtee. () Luokitellaa havaiot tekijöide A ja B suhtee ristii ja määrätää havaitut luokkafrekvessit. (3) Määrätää tehdy riippumattomuusoletukse mukaiset odotetut luokkafrekvessit. (4) Verrataa havaittuja ja odotettuja luokkafrekvessejä toisiisa χ -testisuureella. Hypoteesit χ -riippumattomuustestissä Yleie hypoteesi H : Perusjoukosta o poimittu yksikertaie satuaisotos ja havaitoyksiköt o voitu luokitella ristii kahde tekijä A ja B suhtee. TKK @ Ilkka Melli (008) 0/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Nollahypoteesi H 0 : Tekijät A ja B ovat riippumattomia. Vaihtoehtoie hypoteesi H : Tekijät A ja B eivät ole riippumattomia. Havaitut frekvessit Poimitaa tutkimukse kohteea olevasta perusjoukosta S yksikertaie satuaisotos, joka koko o. Luokitellaa havaitoyksiköt tekijä A suhtee toisesa poissulkevii luokkii, joide lukumäärä o r. Määrätää tekijä A luokkaa i kuuluvie havaitoje havaittu frekvessi eli lukumäärä R i, ku i =,,, r. Luokitellaa havaitoyksiköt tekijä B suhtee toisesa poissulkevii luokkii, joide lukumäärä o. Määrätää tekijä B luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä C j, ku j =,,,. Luokitellaa havaitoyksiköt tekijöide A ja B suhtee ristii toisesa poissulkevii luokkii, joide lukumäärä o r. Määrätää tekijä A luokkaa i ja tekijä B luokkaa j kuuluvie havaitoje havaittu frekvessi eli lukumäärä O ij, ku i =,,, r ja j =,,,. Muodostetaa havaituista frekvesseistä O ij (r )-frekvessitaulukko [O ij ] : B-luokat Summa A-luokat O O O R O O O R r O r O r O r R r Summa C C C Taulukossa: r = A-luokkie lukumäärä = B-luokkie lukumäärä O ij = havaittu frekvessi luokassa, joka määrää A-luokka i ja B-luokka j, i =,,, r, j =,,, R i = havaittu frekvessi A-luokassa i C j = havaittu frekvessi B-luokassa j = havaitoje kokoaislukumäärä Frekvessiä O ij kutsutaa tavallisesti havaituksi solufrekvessiksi frekvessitaulu solussa (i, j). Havaittuje frekvessie O ij frekvessitaulukossa pätee: TKK @ Ilkka Melli (008) /4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset (i) (ii) Rivisummat yhtyvät havaittuihi frekvesseihi A-luokituksessa: Oij = Ri, i =,,, r j= Sarakesummat yhtyvät havaittuihi frekvesseihi B-luokituksessa: r Oij = Cj, j =,,, i= (iii) Havaitoje kokoaislukumäärä: r r O = R = C = ij i j i= j= i= j= Nollahypoteesi tulkita χ -riippumattomuustestissä Jos ollahypoteesi H 0 pätee, havaitoje jakautumie A-luokkii ei saa riippua siitä, mihi B-luokkaa havaiot kuuluvat, toisi saoe, jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu A-luokkaa i =,,, r ei saa riippua siitä, mihi B-luokkaa j =,,, se kuuluu. Jos ollahypoteesi H 0 pätee, havaitoje jakautumie B-luokkii ei saa riippua siitä, mihi A-luokkaa havaiot kuuluvat, toisi saoe, jos ollahypoteesi H 0 pätee, todeäköisyys, että havaito kuuluu B-luokkaa j =,,, ei saa riippua siitä, mihi A-luokkaa i =,,, r se kuuluu. Odotettuje frekvessie määräämie Olkoo x o tarkastelu kohteea oleva perusjouko S alkio. Määritellää seuraavat todeäköisyydet: pij = Pr( x kuuluu A-luokkaa i ja B-luokkaa j) pi i = Pr( x kuuluu A-luokkaa i) pi j = Pr( x kuuluu B-luokkaa j) i =,,, r, j =,,, Jos ollahypoteesi H 0 pätee, tapahtumat {x S x kuuluu A-luokkaa i} {x S x kuuluu B-luokkaa j} ovat riippumattomia kaikille i =,,, r, j =,,,. Site ollahypoteesi H 0 tekijöide A ja B riippumattomuudesta voidaa ilmaista muodossa H 0 : pij = pi ipi j, i =,,, r, j =,,, Todeäköisyydet pij, pi i, pi j voidaa estimoida havaituista frekvesseistä O ij kaavoilla Oij R C i j pˆ ˆ ˆ ij = pi i = pi j = Jos ollahypoteesi H 0 pätee, solutodeäköisyydet p ij voidaa estimoida kaavoilla TKK @ Ilkka Melli (008) /4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset R C i j P = ˆ ˆ ij pi p j = i i Määrätää ollahypoteesi H 0 pätiessä odotetut solufrekvessit E ij yhtälöillä R Cj RC i i j Eij = Pij = =, i=,,, r, j =,,, Muodostetaa odotetuista frekvesseistä E ij (r )-frekvessitaulukko [E ij ] : B-luokat Summa A-luokat E E E R E E E R r E r E r E r R r Summa C C C Taulukossa r = A-luokkie lukumäärä = B-luokkie lukumäärä E ij = odotettu frekvessi luokassa, joka määrää A-luokka i ja B-luokka j, i =,,, r, j =,,, R i = havaittu frekvessi A-luokassa i C j = havaittu frekvessi B-luokassa j = havaitoje kokoaislukumäärä Frekvessiä E ij kutsutaa tavallisesti odotetuksi solufrekvessiksi frekvessitaulu solussa (i, j). Odotettuje frekvessie E ij frekvessitaulukossa pätee: (i) Rivisummat yhtyvät havaittuihi frekvesseihi A-luokituksessa: (ii) Eij = Ri, i =,,, r j= Sarakesummat yhtyvät havaittuihi frekvesseihi B-luokituksessa: r Eij = Cj, j =,,, i= TKK @ Ilkka Melli (008) 3/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset (iii) Havaitoje kokoaislukumäärä: r r E = R = C = ij i j i= j= i= j= Testisuure χ -riippumattomuustestissä Määritellää χ -testisuure r ( O ) ij Eij χ = E i= j= ij O ij = havaittu frekvessi solussa (i, j) E ij = odotettu frekvessi solussa (i, j) r = A-luokkie lukumäärä = B-luokkie lukumäärä Testisuure χ mittaa havaittuje ja odotettuje frekvessie jakaumie yhteesopivuutta tai etäisyyttä ja sitä kutsutaa usei χ -etäisyydeksi. χ -testisuure voidaa kirjoittaa myös muotoo r (ˆ p ) ij Pij χ = P i= j= ij Oij pˆ ij = Eij R C i j P ˆ ˆ ij = = = piipi j Ri pˆ ii = C j pˆ i j = i =,,, r, j =,,, Jos ollahypoteesi H 0 pätee, testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ -jakaumaa vapausastei f = (r )( ): χ χ ( f ) a r = A-luokkie lukumäärä = B-luokkie lukumäärä TKK @ Ilkka Melli (008) 4/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Approksimaatio o tavallisesti riittävä hyvä, jos odotetut frekvessit E ij ja keskimääräiset odotetut frekvessit R i / ja C j /r toteuttavat ehdot Eij >, i =,,, r, j =,,, Ri / > 5, i =,,, r C / r > 5, j =,,, j Ehdot saadaa toteutumaa valitsemalla havaioille sopiva luokitus. Testisuuree χ ormaaliarvo eli odotusarvo ollahypoteesi H 0 pätiessä o E( χ ) = f f = (r )( ) Normaaliarvoaa merkitsevästi suuremmat χ -testisuuree arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. χ -homogeeisuustesti ja χ -riippumattomuustesti vertailu χ -homogeeisuustesti ja χ -riippumattomuustesti frekvessitaulukoista ei voi sellaiseaa ähdä kummasta testausasetelmasta o kyse ja lisäksi testit tehdää tekisesti täsmällee samalla tavalla: Odotetut frekvessit määrätää samalla kaavalla. Testisuureet lasketaa samalla kaavalla. Testisuureet oudattavat ollahypoteesi pätiessä approksimatiivisesti samaa jakaumaa. Testie testausasetelmat ovat kuiteki täysi erilaiset. Homogeeisuustesti testausasetelma: (i) Perusjoukko koostuu r ryhmästä ja testissä tarkastellaa perusjouko alkioide jakautumista luokkii eri ryhmissä, ku alkiot o luokittelu yhde tekijä A suhtee käyttäe kaikissa ryhmissä samaa luokitusta. (ii) Havaitoaieisto muodostuu toisistaa riippumattomista ryhmäkohtaisista satuaisotoksista. (iii) Sekä ryhmäkohtaiset otoskoot i että havaitoje kokoaislukumäärä ovat kiiteitä eli ei-satuaisia (eli valittuja) lukuja, ku taas sattuma määrää mite havaiot jakautuvat luokkii ryhmie sisällä. Riippumattomuustesti testausasetelma: (i) (ii) Testissä tarkastellaa kahde tekijä A ja B assosiaatiota eli riippuvuutta, ku havaiot o luokiteltu ristii tekijöide A ja B suhtee. Havaitoaieisto muodostuu yhdestä satuaisotoksesta. (iii) Vai havaitoje kokoaislukumäärä o kiiteä eli ei-satuaie (eli valittu) luku, ku taas sattuma määrää mite havaiot jakautuvat luokkii tekijöide A ja B ristiluokitukse suhtee. TKK @ Ilkka Melli (008) 5/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja välistä (lieaarista) tilastollista riippuvuutta kutsutaa tilastotieteessä tavallisesti korrelaatioksi. Korrelaatio eli (lieaarise) tilastollise riippuvuude voimakkuutta mittaavia tilastollisia tuuslukuja kutsutaa korrelaatiokertoimiksi. Korrelaatiot muodostavat perusta muuttujie väliste (lieaariste) riippuvuuksie ymmärtämiselle. Vaikka korrelaatiot muodostavat perusta muuttujie väliste riippuvuuksie ymmärtämiselle, riippuvuuksia halutaa tavallisesti aalysoida myös tarkemmi. Regressioaalyysi o tilastollie meetelmä, joki, s. selitettävä muuttuja tilastollista riippuvuutta joistaki toisista, s. selittävistä muuttujista pyritää mallitamaa regressiomalliksi kutsutulla tilastollisella mallilla (ks.. harjoitukset). Kahde järjestys-, välimatka- tai suhdeasteikoillise muuttuja havaittuje arvoje pareja havaiollistetaa tavallisesti graafisella esityksellä, jota kutsutaa pistediagrammiksi. Pistediagrammi Tarkastellaa tilaetta, tutkimukse kohteia olevista havaitoyksiköistä o mitattu kahde järjestys-, välimatka- tai suhdeasteikollise muuttuja x ja y arvot. Olkoot ja x, x,, x y, y,, y välimatka- tai suhdeasteikolliste muuttujie x ja y havaittuja arvoja. Oletetaa lisäksi, että havaitoarvot x i ja y i liittyvät samaa havaitoyksikköö kaikille i =,,,. Tällöi havaitoarvoje x, x,, x ja y, y,, y parie pistediagrammi saadaa esittämällä lukuparit (x i, y i ), i =,,, pisteiä avaruudessa. Aritmeettiset keskiarvot Olkoot ja x, x,, x y, y,, y välimatka- tai suhdeasteikolliste muuttujie x ja y havaittuja arvoja. Oletetaa lisäksi, että havaitoarvot x i ja y i liittyvät samaa havaitoyksikköö kaikille i =,,,. Havaitoarvoje x, x,, x aritmeettie keskiarvo o xi i = x = Havaitoarvoje y, y,, y aritmeettie keskiarvo o yi i = y = TKK @ Ilkka Melli (008) 6/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Otosvariassit ja otoskeskihajoat Havaitoarvoje x, x,, x (otos-) variassi o s ( ) x = xi x i= x o x-havaitoarvoje aritmeettie keskiarvo ja havaitoarvoje y, y,, y (otos-) variassi o s ( ) y = yi y i= y o y-havaitoarvoje aritmeettie keskiarvo. Havaitoarvoje x, x,, x keskihajota o s = s = x x x x i i= ( ) x o x-havaitoarvoje aritmeettie keskiarvo ja havaitoarvoje y, y,, y keskihajota o s = s = y y y y i i= ( ) y o y-havaitoarvoje aritmeettie keskiarvo. Otoskovariassi Havaitoarvoje pareista (x i, y i ), i =,,, laskettu otoskovariassi o sxy = ( xi x)( yi y) i= x = x-havaitoarvoje aritmeettie keskiarvo y = y-havaitoarvoje aritmeettie keskiarvo Otoskorrelaatio Havaitoarvoje pareista (x i, y i ), i =,,, laskettu Pearsoi otoskorrelaatiokerroi o r xy sxy = ss x y s xy = x- ja y-havaitoarvoje otoskovariassi s x = x-havaitoarvoje keskihajota = y-havaitoarvoje keskihajota s y TKK @ Ilkka Melli (008) 7/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Pearsoi otoskorrelaatiokertoime kaava voidaa kirjoittaa myös muotoo r xy = i= ( x x)( y y) i ( x x) ( y y) i i= i= i i x = x-havaitoarvoje aritmeettie keskiarvo y = y-havaitoarvoje aritmeettie keskiarvo Havaitoarvoje pareista (x i, y i ), i =,,, lasketulla Pearsoi otoskorrelaatiokertoimella r xy o seuraavat omiaisuudet: (i) r xy + (ii) r xy = ± jos ja vai jos y i = α +βx i, i =,,, α ja β 0 ovat reaalisia vakioita. (iii) Otoskorrelaatiokertoimella r xy ja otoskovariassilla s xy o aia sama merkki. Otostuuslukuje laskemie Oletetaa, että haluamme laskea havaitoarvoje pareista (x i, y i ), i =,,, seuraavat otostuusluvut käsi tai käyttämällä laskita: aritmeettiset keskiarvot, otosvariassit, keskihajoat, otoskovariassi ja korrelaaatio. Tällöi tarvittavat laskutoimitukset o mukavita järjestää alla esitety kaavio muotoo. Määrätää esi havaitoarvoje summat, eliösummat ja tulosumma: i x y x y x y x x y y x x y y x y x y x y x y x y Summa i i i i i i x i y i x i y i x i y i i = i = i = i = i = TKK @ Ilkka Melli (008) 8/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Em. otostuusluvut saadaa havaitoarvoje summista, eliösummista ja tulosummasta alla esitetyillä kaavoilla: x = x y = y i i i= i= x = i i y i i i = = i= i= i= s x x s y y sxy = xi yi xi yi i= i= i= s = s s = s sxy rxy = ss x x y y x y Otos kaksiulotteisesta ormaalijakaumasta Oletetaa, että satuaismuuttujie x ja y pari (x, y) oudattaa kaksiulotteista ormaalijakaumaa eli ( xy, ) N ( µ x, µ y, σx, σ y, ρxy) µ = E( x) µ = E( y) x σ = Var( x) = E[( x µ ) ] σ = Var( y) = E[( y µ ) ] x x y y σ = Cov( xy, ) = E[( x µ )( y µ )] xy x y σ xy ρxy = Cor( xy, ) = σσ x y y Olkoot y, y,, y muuttuja y havaitut arvot ja x, x,, x muuttuja x havaitut arvot ja oletetaa, että havaitoarvoje x i ja y i parit (x i, y i ), i =,,, muodostavat satuaisotokse kaksiulotteista ormaalijakaumasta N( µ x, µ y, σx, σ y, ρ xy) Tällöi ( x, y ),( x, y ),,( x, y ) x y i = ( i, i) N ( µ x, µ y, σx, σ y, ρxy),,,, TKK @ Ilkka Melli (008) 9/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Kaksiulotteise ormaalijakauma parametrie estimoiti Kaksiulotteise ormaalijakauma parametrie suurimma uskottavuude estimaattorit tai momettiestimaattorit ovat ˆ µ = x = x ˆ µ = y = y ˆ σ x i y i i= i= ( ) ˆ x = xi x = sx σ y = ( yi y) = sy i= i= ˆ σ = ( x x)( y y) = s ˆ ρ xy i i xy i= xy ˆ σ xy sxy = = = r ˆ σσˆ ss x y x y xy s x x s y y x = ( i ) y = ( i ) i= i= s = ( x x)( y y) xy i i i= Korreloimattomuude testaamie Oletetaa, että havaitoarvoje x i ja y i parit (x i, y i ), i =,,, muodostavat satuaisotokse kaksiulotteista ormaalijakaumasta Tällöi N( µ x, µ y, σx, σ y, ρ xy) Olkoo ollahypoteesia H : ρ = 0 Määritellää t-testisuure rxy t = r Jos ollahypoteesi H : ρ = 0 ( x, y ),( x, y ),,( x, y ) x y i ( i, i) N ( µ x, µ y, σx, σ y, ρxy), =,,, 0 0 xy xy xy pätee, testisuure t oudattaa Studeti t-jakaumaa vapausastei ( ): t t( ) TKK @ Ilkka Melli (008) 0/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Testisuuree t ormaaliarvo = 0, koska ollahypoteesi pätiessä E(t) = 0 Site itseisarvoltaa suuret testisuuree t arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Testi korrelaatiokertoimelle Oletetaa, että havaitoarvoje x i ja y i parit (x i, y i ), i =,,, muodostavat satuaisotokse kaksiulotteista ormaalijakaumasta Tällöi Olkoo ollahypoteesia H : ρ N( µ x, µ y, σx, σ y, ρ xy) ( x, y ),( x, y ),,( x, y ) x y i ( i, i) N ( µ x, µ y, σx, σ y, ρxy), =,,, = ρ 0 xy 0 Määritellää Fisheri z-muuos kaavalla + u z = f( u) = log u Sovelletaa Fisheri z-muuosta otoskorrelaatiokertoimee r xy : + r xy z = f( rxy ) = log r xy Voidaa osoittaa, että satuaismuuttuja z oudattaa suurissa otoksissa approksimatiivisesti ormaalijakaumaa: z ( µ σ ) N, a z z + ρ xy µ z = f ( ρxy) = log ρ xy σ = 3 Approksimaatio o käytäössä riittävä hyvä, jos > 5. Muodostetaa testisuure 0 z µ z ν = σ z z TKK @ Ilkka Melli (008) /4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Jos ollahypoteesi H 0 pätee, v a N(0,) + r xy z = f( rxy ) = log r xy 0 + ρ 0 µ z = f ( ρ0) = log ρ0 σ z = 3 Testisuuree ν ormaaliarvo = 0, koska ollahypoteesi pätiessä E(ν) = 0 Site itseisarvoltaa suuret testisuuree ν arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. TKK @ Ilkka Melli (008) /4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.. Kahdelle hekilölle, A ja B, o kummalleki aettu oppa ja kumpaaki o pyydetty heittämää sitä 0 kertaa. A ja B kertovat saaeesa heittoje tuloksea alla esitetyt silmälukuje jakaumat. (a) Tutki χ -yhteesopivuustesti avulla voidaako A: ja B: heittämiä oppia pitää virheettömiä (so. symmetrisiä)? Tämä tapahtuu testaamalla χ -yhteesopivuustestillä ollahypoteesia, että opaheito tulos oudattaa diskreettiä tasaista jakaumaa. Poikkeuksellise suuret χ -testisuuree arvot viittaavat siihe, että oppia ei voida pitää virheettömiä. (b) Tutki χ -yhteesopivuustesti avulla, kuika todeäköistä o se, että A ja B ovat olleet rehellisiä kertoessaa heittäeesä oppaa? Tämä tapahtuu testaamalla χ -yhteesopivuustestillä ollahypoteesia, että opaheito tulos oudattaa diskreettiä tasaista jakaumaa. Poikkeuksellise pieet χ -testisuuree arvot viittaavat siihe, että heittotulokset ovat liia hyviä ollaksee todellisia. Käytä (a)-kohda testeissä sekä %: että 5 %: merkitsevyystasoja ja (b)-kohda testeissä %: merkitsevyystasoa. Silmäluku 3 4 5 6 A: tulokset 6 0 7 33 B: tulokset 9 9 9 Tehtävä.. Mitä opimme? Tehtävässä sovelletaa χ -yhteesopivuustestiä. Tehtävä.. Ratkaisu: Kahdelle hekilölle A ja B o kummalleki aettu oppa ja kumpaaki o pyydetty heittämää sitä 0 kertaa. A ja B kertovat saaeesa heittoje tuloksea alla esitetyt silmälukuje jakaumat. Silmäluku 3 4 5 6 A: tulokset 6 0 7 33 B: tulokset 9 9 9 Tehtävä ollahypoteesia o H 0 : Pr(Saadaa silmäluku i) = p = /6, i =,, 3, 4, 5, 6 Site odotetuiksi frekvesseiksi saadaa: E i = p = 0, i =,, 3, 4, 5, 6 A: käyttämälle opalle χ -testisuuree arvoksi saadaa χ = 3. TKK @ Ilkka Melli (008) 3/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Laskutoimitukset (Mirosoft Exel ohjelmistolla): i O i E i (O i - E i ) /E i 0 3. 6 0 0.8 3 0 0 0 4 7 0 0.45 5 0 0. 6 33 0 8.45 Summa 0 0 3. B: käyttämälle opalle χ -testisuuree arvoksi saadaa χ = 0.3 Laskutoimitukset (Mirosoft Exel ohjelmistolla): i O i E i (O i - E i ) /Ei 9 0 0.05 0 0.05 3 9 0 0.05 4 0 0.05 5 9 0 0.05 6 0 0.05 Summa 0 0 0.3 Koska k = 6 ja m = 0 (yhtää parametria ei ole estimoitu), χ -testisuuree vapausasteide lukumäärä o molemmissa tapauksissa f = k m = 6 0 = 5 χ -jakauma taulukoide mukaa %: merkitsevyystasoa vastaavat kriittie arvo χ 0.0 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.0 jakauma oikealle häälle. Koska ii Pr( χ 5.09) = 0.0 χ 0.0 = 5.09 Etsitää vielä piste χ 0.99 häälle. Koska ii ja site Pr( χ 0.554) = 0.99 Pr( χ 0.554) = 0.0, joka erottaa todeäköisyysmassa 0.0 jakauma vasemmalle TKK @ Ilkka Melli (008) 4/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset χ 0.99 = 0.554 χ -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo χ 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii Pr( χ.07) = 0.05 χ 0.05 =.07 Etsitää vielä piste χ 0.95, joka erottaa todeäköisyysmassa 0.05 jakauma vasemmalle häälle. Koska ii ja site Pr( χ.5) = 0.95 Pr( χ.5) = 0.05 χ 0.95 =.5 (a) Normaaliarvoosa ähde liia suuret χ -testisuuree arvot viittaavat siihe, että havaiot eivät oudata ollahypoteesi kiiittämää jakaumaa. A: oppa ja %: merkitsevyystaso: Koska χ -testisuuree arvo χ = 3. < 5.09 = χ 0.0 ii ollahypoteesi jää voimaa %: merkitsevyystasolla A: opa tapauksessa. B: oppa ja %: merkitsevyystaso: Koska χ -testisuuree arvo χ = 0.3 < 5.09 = χ 0.0 ii ollahypoteesi jää voimaa %: merkitsevyystasolla B: opa tapauksessa. A: oppa ja 5 %: merkitsevyystaso: Koska χ -testisuuree arvo χ = 3. >.07 = χ 0.05 ii ollahypoteesi hylätää 5 %: merkitsevyystasolla A: opa tapauksessa. TKK @ Ilkka Melli (008) 5/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset B: oppa ja 5 %: merkitsevyystaso: Koska χ -testisuuree arvo χ = 0.3 <.07 = χ 0.05 ii ollahypoteesi jää voimaa 5 %: merkitsevyystasolla B: opa tapauksessa. (b) Normaaliarvoosa ähde liia pieet χ -testisuuree arvot viittaavat siihe, että havaiot oudattavat ki mielessä liia hyvi ollahypoteesi kiiittämää jakaumaa. A: oppa ja %: merkitsevyystaso: Koska χ -testisuuree arvo χ = 3. > 0.554 = χ 0.99 ii voimme päätellä, että A o todeäköisesti todella heittäyt oppaa. B: oppa ja %: merkitsevyystaso: Koska χ -testisuuree arvo χ = 0.3 < 0.554 = χ 0.99 ii, o syytä epäillä sitä, että B o heittäyt oppaa. B o saattaut keksiä heittotulokset, mutta o aliarvioiut satuaisvaihtelu merkitykse. Tehtävä.. Geiger-mittari laskee radioaktiivise aiee emissioide lukumääriä. Emissioide lukumäärä o lyhyellä aikavälillä satuaismuuttuja, joka voidaa olettaa oudattava Poissoi jakaumaa. Erästä aietta tutkittaessa emissioide lukumäärät rekisteröitii 0:llä samamittaisella lyhyellä aikavälillä. Alla olevassa taulukossa o aettu emissioide lukumäärie frekvessit. Tutki χ -yhteesopivuustesti avulla oko Poisso-jakaumaoletus sopusoiussa havaitoje kassa. Käytä testissä 5 %: merkitsevyystasoa. Emissioide lkm 0 3 4 5 Frekvessi 40 34 8 5 Tehtävä.. Mitä opimme? Tehtävässä sovelletaa χ -yhteesopivuustestiä. Tehtävä.. Ratkaisu: Erästä radioaktiivista aietta tutkittaessa Geiger-mittarilla rekisteröitii emissioide lukumäärät 0:llä samamittaisella lyhyellä aikavälillä. Alla olevassa taulukossa o aettu emissioide lukumäärie frekvessit. TKK @ Ilkka Melli (008) 6/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Emissioide lkm 0 3 4 5 Frekvessi 40 34 8 5 Tehtävä ollahypoteesia o H 0 : Emissioide lukumäärä oudattaa Poisso-jakaumaa Poisso-jakauma pistetodeäköisyysfuktio o x e λ λ f( x) = Pr( X = x) =, x = 0,,, x! Itesiteettiparametri λ suurimma uskottavuude estimaattori o havaitoje aritmeettie keskiarvo: 5 ioi i = 0 x = = 03 =.098 0 = havaitoje kokoaislukumäärä = 0 O i = havaittu frekvessi luokassa i Odotetuiksi frekvesseiksi saadaa: Koska E 0 = Pr(X = 0) = 36.43 E = Pr(X = ) = 37.5 E = Pr(X = ) = 8.94 E 3 = Pr(X = 3) = 6.44 E 4 = Pr(X = 4) =.64 E 5 = Pr(X = 5) = 0.33 E 4 =.64 < 5 E 5 = 0.33 < 5 ii luokat 4 ja 5 yhdistetää luokkaa 3. χ -testisuuree arvoksi saadaa χ = 0.705 Laskutoimitukset (Mirosoft Exel ohjelmistolla): i O i E i (O i - E i ) /E i 0 40 36.43 0.350 34 37.5 0.67 8 8.94 0.047 3 tai yli 9 8.4 0.04 Summa 0 00.93 0.705 TKK @ Ilkka Melli (008) 7/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Koska k = 4 ja m = (yksi parametri o estimoitu), χ -testisuuree vapausasteide lukumäärä o f = k m = 4 = χ -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo χ 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii Pr( χ 5.99) = 0.05 χ 0.05 = 5.99 Koska χ -testisuuree arvo χ = 0.705 < 5.99 = χ 0.05 ii ollahypoteesi jää voimaa 5 %: merkitsevyystasolla. Johtopäätös: Havaiot saattavat oudattaa Poisso-jakaumaa. Tehtävä.3. Erää tehtaa johto epäili, että työtekijöide keskuutee oli leviyt tapa veyttää viikolopu viettoa perjataihi ja maaataihi ilmoittautumalla sairaiksi. Asiaa tutkittii eljä viiko aja rekisteröimällä poissaoloje lukumäärät jokaisea työpäivää. Keskiarvotiedot ko. ajajaksolta o aettu alla olevassa taulukossa. (a) Testaa χ -yhteesopivuustesti avulla ollahypoteesia, että poissaoloje lukumäärä jakautuu tasaisesti työpäiville. (b) Yhdistä sekä perjatai ja maaatai että tiistai, keskiviiko ja torstai havaiot. Mite (a)-kohda ollahypoteesia o tällöi modifioitava? Testaa χ -yhteesopivuustesti avulla modifioitua ollahypoteesia. Käytä testeissä 5 %: merkitsevyystasoa. Viikopäivä ma ti ke to pe Summa Poissaoloje lukumäärä (ka) 49 35 3 39 45 00 Tehtävä.3. Mitä opimme? Tehtävässä sovelletaa χ -yhteesopivuustestiä. TKK @ Ilkka Melli (008) 8/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.3. Ratkaisu: (a) Määrätää odotetut frekvessit E j käyttäe ollahypoteesia H 0 : Poissaolot jakautuvat tasaisesti eri viikopäiville Odotetut frekvessit E j : Viikopäivä ma ti ke to pe Summa Poissaoloje lukumäärä 40 40 40 40 40 00 χ -testisuuree arvoksi saadaa χ = 4.90 Laskutoimitukset (Mirosoft Exel ohjelmistolla): Päivä ma ti ke to pe Summa O i 49 35 3 39 45 00 E i 40 40 40 40 40 00 Khi.05 0.65.6 0.05 0.65 4.90 Koska k = 5 ja m = 0 (yhtää parametria ei ole estimoitu), χ -testisuuree vapausasteide lukumäärä o f = k m = 5 0 = 4 χ -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo χ 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii Pr( χ 9.488) = 0.05 χ 0.05 = 9.488 Koska χ -testisuuree arvo χ = 4.90 < 9.488 = χ 0.05 ii ollahypoteesi jää voimaa 5 %: merkitsevyystasolla. Johtopäätös: Poissaolot saattavat hyviki jakautua tasaisesti eri viikopäiville. (b) Yhdistämällä sekä perjatai ja maaatai havaiot että tiistai, keskiviiko ja torstai havaiot saadaa seuraava havaittuje frekvessie taulukko: Viikopäivä pe-ma ti-ke-to Summa Poissaoloje lukumäärä (ka) 94 06 00 TKK @ Ilkka Melli (008) 9/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Vastaava yhdistämie (a)-kohda odotettuje frekvessie taulukossa tuottaa tauluko Viikopäivä pe-ma ti-ke-to Summa Poissaoloje lukumäärä 80 0 00 χ -testisuuree arvoksi saadaa χ = 4.08 Laskutoimitukset (Mirosoft Exel ohjelmistolla): Päivä pe-ma ti-ke-to Summa O i 94 06 00 E i 80 0 00 Khi.45.63 4.08 Koska k = ja m = 0 (yhtää parametria ei ole estimoitu), χ -testisuuree vapausasteide lukumäärä o f = k m = 0 = χ -jakauma taulukoide mukaa 5 %: merkitsevyystasoa vastaava kriittie arvo χ 0.05 saadaa seuraavalla tavalla: Erotetaa todeäköisyysmassa 0.05 jakauma oikealle häälle. Koska ii site Pr( χ 3.84) = 0.05 χ 0.05 = 3.84 Koska χ -testisuuree arvo χ = 4.08 > 3.84 = χ 0.05 ii ollahypoteesi hylätää 5 %: merkitsevyystasolla. Johtopäätös: Poissaolot eivät jakaudu tasaisesti eri viikopäiville. Huomautus: Tehtävästä.3. ähdää, että käytetty luokitus saattaa vaikuttaa χ -yhteesopivuustesti tuloksee. Tehtävä.4. Hekilöille A ja B o kummalleki aettu oppa ja kumpaaki o pyydetty heittämää sitä 0 kertaa. A ja B kertovat saaeesa heittoje tuloksea alla esitetyt silmälukuje jakaumat. Tutki χ -homogeeisuustesti avulla, oko mahdollista, että A ja B ovat käyttäeet samaa oppaa (tai oikeammi: oppia, joide silmälukuje todeäköisyydet ovat samat). TKK @ Ilkka Melli (008) 30/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Käytä testissä 5 %: merkitsevyystasoa. Silmäluku 3 4 5 6 A: tulokset 6 8 9 9 6 B: tulokset 6 0 7 33 Tehtävä.4. Mitä opimme? Tehtävässä sovelletaa χ -homogeeisuustestiä. Vrt. tässä tarkasteltavaa χ -homogeeisuustestiä tehtävissä.5. ja.6. sovellettavaa χ -riippumattomuustestii. Tehtävä.4. Ratkaisu: Sovelletaa testisuuretta χ r ( O ) ij Eij = E i= j= ij odotetut frekvessit E ij määrätää käyttäe ollahypoteesia H 0 : A ja B ovat käyttäeet samaa oppaa (tai oikeammi: oppia, joide silmälukuje todeäköisyydet ovat samat) Site odotetut frekvessit saadaa kaavalla E ij = i C j / i = i. ryhmä otoskoko C j = j. sarakesumma = kokoaissumma Nollahypoteesi H 0 pätiessä testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ -jakaumaa mukaa vapausastei (r )( ), r = frekvessitaulu rivie lukumäärä = frekvessitaulu sarakkeide lukumäärä Olkoo vaihtoehtoisea hypoteesia H se, että A ja B eivät ole käyttäeet samaa oppaa (tai oikeammi: A ja B ovat käyttäeet oppia, joide silmälukuje todeäköisyydet eroavat tosistaa). χ -testisuuree arvoksi saadaa χ =.406 TKK @ Ilkka Melli (008) 3/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Laskutoimitukset (Mirosoft Exel -ohjelmalla): O ij 3 4 5 6 Summa A 6 8 9 9 6 0 B 6 0 7 33 0 Summa 8 34 39 39 4 59 40 E ij 3 4 5 6 Summa A 4 7 9.5 9.5 0.5 9.5 0 B 4 7 9.5 9.5 0.5 9.5 0 Summa 8 34 39 39 4 59 40 Khi 3 4 5 6 Summa A 0.8574 0.05884 0.08 0.3053 0.09756 0.4554.088 B 0.8574 0.05884 0.08 0.3053 0.09756 0.4554.088 Summa 0.5749 0.7647 0.0564 0.6406 0.95 0.830508.405763 Vapausteide lukumääräksi saadaa f = (r )( ) = ( )(6 ) = 5 Site 5 %: merkitsevyystasoa vastaava kriittiseksi arvoksi taulukoista χ 0.05 =.07 Koska testisuuree arvo χ =.4 <.07 = χ 0.05 χ 0.05 saadaa χ -jakauma ii testisuuree χ arvo o jääyt hyväksymisalueelle ja ollahypoteesi H 0 voidaa jättää voimaa merkitsevyystasolla 0.05. Johtopäätös: A: ja B: tulokset voivat olla peräisi samasta opasta (tai oikeammi: opista, joide silmälukuje todeäköisyydet ovat samat). Tehtävä.5. Erää rokotuskokee tulokset o aettu alla. (a) (b) Testaa ollahypoteesia, että rokotettuje ja rokottamattomie sairastavuudessa ei ole eroa suhteelliste osuuksie vertailutestiä käyttäe. Testaa ollahypoteesia, että sairastavuus ei riipu rokotuksesta χ -riippumattomuustestiä käyttäe. Käytä molemmissa testeissä 5 %: merkitsevyystasoa. Vertaa (a)- ja (b)-kohtie testie tuloksia toisiisa. Voivatko testit johtaa eri tuloksii? TKK @ Ilkka Melli (008) 3/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Sairastumie Rokotus Sairastuut: S Ei sairastuut: ei-s Rokotettu: R 9 4 Ei rokotettu: ei-r 7 8 Tehtävä.5. Mitä opimme? Tehtävässä sovelletaa samaa aieistoo suhteelliste osuuksie vertailutestiä riippumattomille otoksille ja χ -riippumattomuustestiä. Lisätietoja suhteelliste osuuksie vertailutestistä: ks. 0. harjoitukset. Vrt. tässä tarkasteltavaa χ -riippumattomuustestiä tehtävässä.4. sovellettavaa χ -homogeeisuustestii. Tehtävä.5. Ratkaisu: (a) Olkoo A = Hekilö sairastuu ja olkoo Pr(A) = p, jos hekilö o rokotettu Pr(A) = p, jos hekilöä ei ole rokotettu Määritellää riippumattomat satuaismuuttujat X ik, jos i. hekilö, jolle o tehty toimepide k, sairastuu = 0, jos i. hekilö, jolle o tehty toimepide k, ei sairastu i =,,,, k =, k = hekilö rokotetaa k = hekilöä ei rokoteta Tällöi X Ber( p ), i =,,,, k =, ik k k Asetetaa ollahypoteesi H 0 : p = p Määritellää testisuure (ks. 0. harjoitukset) z = pˆ pˆ pˆ( pˆ) + k TKK @ Ilkka Melli (008) 33/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset käsitellää Testisuuree lausekkeessa ja = Rokotettuje lukumäärä ˆp = Sairastueide suhteellie osuus rokotettuje joukossa = Ei-rokotettuje lukumäärä ˆp = Sairastueide suhteellie osuus ei-rokotettuje joukossa Huomaa, että ˆp = Sairastueide suhteellie osuus, ku rokotettuja ja ei-rokotettuja yhteä ryhmää ja ˆp = f / ˆp = f / f = Sairastueide lukumäärä rokotettuje joukossa f = Sairastueide lukumäärä ei-rokotettuje joukossa f + f pˆ + pˆ pˆ = = + + Jos ollahypoteesi H 0 pätee, testisuure z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: z a N(0,) Tehtävä tapauksessa: = 9+ 4= 5 f 9 pˆ = = = 0.765 5 ja edellee = 7 + 8 = 45 f 7 pˆ = = = 0.3778 45 f + f 9+ 7 3 pˆ = = = = 0.708 + 5+ 45 48 z pˆ pˆ 0.77 0.378 = = = pˆ( pˆ) + 0.7 ( 0.7) + 5 45.5 TKK @ Ilkka Melli (008) 34/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Valitaa vaihtoehtoiseksi hypoteesiksi se, että sairastuvuus o rokotettuje joukossa pieempää kui ei-rokotettuje joukossa eli olkoo vaihtoehtoisea hypoteesia yksisuutaie vaihtoehto H : p < p Tällöi 5 %: merkitsevyystasoa vastaavaksi kriittiseksi arvoksi z0.05 saadaa ormaalijakauma taulukosta Koska z 0.05 =.65 z =. <.65 = z0.05 ii testisuuree z arvo o jääyt hylkäysalueelle ja ollahypoteesi H 0 voidaa hylätä ja vaihtoehtoie hypoteesi H hyväksyä merkitsevyystasolla 0.05. Johtopäätös: Sairastuvuus rokotettuje joukossa o pieempää kui rokottamattomie joukossa. (b) Sovelletaa χ -testisuuretta χ r ( O ) ij Eij = E i= j= ij odotetut frekvessit E ij määrätää käyttäe ollahypoteesia H 0 : Sairastumistodeäköisyys ei riipu rokotuksesta Site odotetut frekvessit E ij saadaa kaavalla E ij = R i C j / R i = i. rivisumma C j = j. sarakesumma = kokoaissumma Nollahypoteesi H 0 pätiessä testisuure χ oudattaa suurissa otoksissa approksimatiivisesti χ -jakaumaa vapausastei (r )( ), r = frekvessitaulu rivie lukumäärä = frekvessitaulu sarakkeide lukumäärä Olkoo vaihtoehtoisea hypoteesia H se, että sairastumistodeäköisyys riippuu rokotuksesta. χ -testisuuree arvoksi saadaa χ = 4.906 TKK @ Ilkka Melli (008) 35/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Laskutoimitukset (Mirosoft Exel ohjelmalla): O ij S ei-s Summa R 9 4 5 ei-r 7 8 45 Summa 6 70 96 E ij S ei-s Summa Tarkistus R 3.85 37.875 5 5 ei-r.875 3.85 45 45 Summa 6 70 96 Tarkistus 6 70 Khi S ei-s Summa R.676753 0.6794.99548 ei-r.9003 0.705833.60654 Summa 3.577074.3867 4.90570 Vapausasteide lukumääräksi saadaa f = (r )( ) = ( )( ) = Site 5 %: merkitsevyystasoa vastaavaksi kriittiseksi arvoksi jakauma taulukoista χ 0.05 = 3.84 Koska testisuuree arvo χ = 4.9 > 3.84 = χ 0.05 χ 0.05 saadaa χ - ii testisuuree χ arvo o joutuut hylkäysalueelle ja ollahypoteesi H 0 voidaa hylätä ja vaihtoehtoie hypoteesi H hyväksyä merkitsevyystasolla 0.05. Johtopäätös: Sairastumistodeäköisyys riippuu siitä oko hekilö rokotettu vai ei. Huomautuksia: (i) (ii) (a)-kohda z-testisuuree arvo eliö yhtyy (b)-kohda χ -testisuuree arvoo. Tämä ei ole sattumaa, vaa perustuu χ -testisuuree omiaisuuksii - frekvessitaulussa. Huomaa kuiteki, että z-testi ja χ -testi ekvivalessia -frekvessitaulu tapauksessa ei voida yleistää r -tauluihi, joissa r > ja/tai >. TKK @ Ilkka Melli (008) 36/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Tehtävä.6. Alla olevassa taulukossa o aettu tulokset kyselytutkimuksesta, joka kohteea olivat USA: kasalaiset. Kysely kohteet poimittii yksikertaisella satuaisotaalla ja otoksee poimituilta kysyttii puoluekataa ja suhtautumista käsiaseide hallussapido rajoituksii. Oko suhtautumie aserajoituksii riippumatota puoluekaasta? Käytä asia tutkimisessa χ -riippumattomuustestiä 0.5 %: merkitsevyystasolla. Suhtautumie aserajoituksii Puoluekata Puoltaa Ei kataa Vastustaa Demokraatti 0 6 64 Republikaai 90 4 6 Riippumato 55 0 35 Tehtävä.6. Mitä opimme? Tehtävässä sovelletaa χ -riippumattomuustestiä. Vrt. tässä tarkasteltavaa χ -riippumattomuustestiä tehtävässä.4. sovellettavaa χ -homogeeisuustestii. Tehtävä.6. Ratkaisu: Sovelletaa testisuuretta χ r ( O ) ij Eij = E i= j= ij odotetut frekvessit E ij määrätää käyttäe ollahypoteesia H 0 : Suhtautumie aserajoituksii ei riipu puoluekaasta Site odotetut frekvessit saadaa kaavalla E ij = R i C j / R i = i. rivisumma C j = j. sarakesumma = kokoaissumma Nollahypoteesi H 0 pätiessä χ -testisuure oudattaa suurissa otoksissa approksimatiivisesti χ -jakauma mukaa vapausastei (r )( ), r = frekvessitaulu rivie lukumäärä = frekvessitaulu sarakkeide lukumäärä Olkoo vaihtoehtoisea hypoteesia H se, että suhtautumie aserajoituksii riippuu puoluekaasta. TKK @ Ilkka Melli (008) 37/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Havaitut frekvessit O ij : O ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 0 6 64 00 Rep 90 4 6 0 Riip 55 0 35 00 Yhteesä 55 50 5 50 Odotetut frekvessit E ij : E ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 98. 9. 8.7 00 Rep 07.9. 9.0 0 Riip 49.0 9.6 4.4 00 Yhteesä 55 50 5 50 χ -testisuuree arvoksi saadaa χ =.05 Laskutoimitukset (Mirosoft Exel -ohjelmalla): O ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 0 6 64 00 Rep 90 4 6 0 Riip 55 0 35 00 Summa 55 50 5 50 E ij Puoltaa Ei kataa Vastustaa Yhteesä Dem 98. 9. 8.7 00 Rep 07.9. 9.0 0 Riip 49.0 9.6 4.3 00 Summa 55 50 5 50 Khi Puoltaa Ei kataa Vastustaa Yhteesä Dem.45.38 4.3 8.06 Rep.96.4 6.89.8 Riip 0.7 0.0 0.97.7 Summa 5.4 4.8.09.05 Vapausteide lukumääräksi saadaa f = (r )( ) = (3 )(3 ) = 4 Site 0.5 %: merkitsevyystasoa vastaava kriittiseksi arvoksi taulukoista χ 0.005 = 4.86 χ 0.005 saadaa χ -jakauma TKK @ Ilkka Melli (008) 38/4

Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Koska testisuuree arvo χ =.05 > 4.86 = χ 0.005 ii testisuuree χ arvo o joutuut hylkäysalueelle ja ollahypoteesi H 0 voidaa hylätä ja vaihtoehtoie hypoteesi H voidaa hyväksyä merkitsevyystasolla 0.005. Johtopäätös: Puoluekata ja suhtautumie aserajoituksii riippuvat toisistaa. Tehtävä.7. Eräässä 4: kua otoksessa Suome kutie joukosta suhteellise rikollisuude (muuttuja x; rikoksia per 000 asukasta) ja asukastiheyde (muuttuja y; asukasta per km ) välise otoskorrelaatiokertoime arvoksi saatii r = 0.57. Oletetaa, että havaitoje parit (x i, y i ), i =,,, ideksi i viittaa kutaa i, oudattavat kaksiulotteista ormaalijakaumaa µ µ σ σ ρ N( x, y, x, y, xy) Testaa 5 %: merkitsevyystasoa käyttäe ollahypoteesia, että muuttujat x ja y ovat korreloimattomia, ku vaihtoehtoiseksi hypoteesiksi valitaa kaksisuutaie vaihtoehto. Tehtävä.7. Mitä opimme? Tehtävässä tarkastellaa korreloimattomuude testaamista. Lisätietoja kaksiulotteisesta ormaalijakaumasta: ks.. harjoitukset. Yleie testi korrelaatiokertoimelle: ks. tehtävää.8. Tehtävä.7. Ratkaisu: t-testisuure ollahypoteesille H : ρ = 0 0 xy o muotoa rxy t = r xy r xy o muuttujie x ja y havaituista arvoista määrätty Pearsoi otoskorrelaatiokerroi. Jos ollahypoteesi H 0 pätee, testisuure t o jakautuut Studeti t-jakauma mukaa vapausastei ( ): t t( ) TKK @ Ilkka Melli (008) 39/4