Generoidaan tiedostoon BINORM satunnaislukuja jakaumasta N(0,1) muuttujiksi U, V: (U, V): N 2 (0, 0, 1, 1, 0)

Samankaltaiset tiedostot
1. PARAMETRIEN ESTIMOINTI

Mat Sovellettu todennäköisyyslaskenta B 8. harjoitukset / Ratkaisut Aiheet: Otos ja otosjakaumat Avainsanat:

Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio: Esitiedot

MTTTP1 SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Koesuunnittelu ja tilastolliset mallit. Yhden selittäjän lineaarinen regressiomalli. Avainsanat:

2-suuntainen vaihtoehtoinen hypoteesi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 5 Aiheet: Tilastolliset testit Avainsanat:

Tilastollinen riippuvuus ja korrelaatio

Mat Sovellettu todennäköisyyslasku A

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 6

Mat Sovellettu todennäköisyyslasku A

Muuttujien välisten riippuvuuksien analysointi

1. (Monisteen teht. 5.16) Eräiden kuulalaakereiden kestoa (miljoonaa kierrosta) on totuttu kuvaamaan Weibull-jakaumalla, jonka tiheysfunktio on

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2

1.4. Aritmeettisen keskiarvon otosjakauma: Suurten otosten tuloksia

Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet: Mitä opimme?

on tavanomainen yhden selittäjän lineaarinen regressiomalli, jossa jäännöstermit ε i toteuttavat seuraavat oletukset:

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

1.2. Aritmeettisen keskiarvon ja otosvarianssin otosjakaumat: Odotusarvot ja varianssit

Ilkka Mellin. Sovellettu todennäköisyyslasku: Kaavat ja taulukot

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

Ilkka Mellin (2008) 1/24

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus

Tilastolliset menetelmät: Otokset, otosjakaumat ja estimointi. 4. Otokset ja otosjakaumat 5. Estimointi 6. Estimointimenetelmät 7.

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

Moniulotteiset jakaumat ja havaintoaineistot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Varianssianalyysi. Varianssianalyysi. Varianssianalyysi. Varianssianalyysi: Mitä opimme? Varianssianalyysi: Johdanto

Mat Tilastollinen päättely 7. harjoitukset / Tehtävät. Hypoteesien testaus. Avainsanat:

Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava: Esitiedot

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4

Jaksolliset ja toistuvat suoritukset

Mat Koesuunnittelu ja tilastolliset mallit

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Suoran sovittaminen pistejoukkoon

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 2

9. Jakojärjestelmät. Sisältö. Puhdas jakojärjestelmä. Yksinkertainen liikenneteoreettinen malli

Ilkka Mellin (2006) 1/1

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu

3. Datan käsittely lyhyt katsaus

9. Jakojärjestelmät. Sisältö. Puhdas jakojärjestelmä. Yksinkertainen liikenneteoreettinen malli

MTTTP5, luento Luottamusväli, määritelmä

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Luento 6 Luotettavuus Koherentit järjestelmät

5. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Tilastollisten aineistojen kerääminen ja mittaaminen Tilastolliset aineistot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Raja-arvot. Osittaisderivaatat.

13. Lineaariset ensimmäisen kertaluvun differentiaalisysteemit

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Tilastolliset menetelmät: Otokset, otosjakaumat ja estimointi

Tilastollinen päättely. 3. Piste estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä.

Tavoitteet skaalaavan funktion lähestymistapa eli referenssipiste menetelmä

Todennäköisyyden aksioomat. Todennäköisyyden aksioomat. Todennäköisyyden aksioomat: Mitä opimme? 2/2. Todennäköisyyden aksioomat: Mitä opimme?

Testaa onko lämpökäsittelyllä vaikutusta tankojen keskimääräiseen vetolujuuteen.

Jakaumien tunnusluvut. Jakaumien tunnusluvut. Jakaumien tunnusluvut: Mitä opimme? 2/2. Jakaumien tunnusluvut: Mitä opimme? 1/2

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättely. 3. Piste-estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Mat Tilastollisen analyysin perusteet, kevät 2007

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Turingin kone on kuin äärellinen automaatti, jolla on käytössään

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Osa 2: Otokset, otosjakaumat ja estimointi

7.5. Yleinen lineaarinen malli ja suurimman uskottavuuden menetelmä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Baltian Tie 2001 ratkaisuja

Sovellettu todennäköisyyslaskenta B

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

10.5 Jaksolliset suoritukset

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Puupintaisen sandwichkattoelementin. lujuuslaskelmat. Sisältö:

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

3.5 Generoivat funktiot ja momentit

1. Luvut 1, 10 on laitettu ympyrän kehälle. Osoita, että löytyy kolme vierekkäistä

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Monimuuttujamenetelmät: Multinormaalijakauma. Ilkka Mellin. 1. Multinormaalijakauma ja sen ominaisuudet

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Transkriptio:

Mat-2.04 Tlastollse aalyys perusteet / Ratkasut Aheet: Avasaat Korrelaato ja assosaato Hypotees, Järjestyskorrelaatokertomet, χ 2 -rppumattomuustest, Korrelaatokerro, Pstedagramm, Päätössäätö, Nollahypotees, p-arvo, Rppumattomuude testaame, Spearma rho, Test, Testsuure, Testsuuree ormaalarvo, Vahtoehtoe hypotees, Yhteesopvuustest, Ylee hypotees. Pstedagramm ja korrelaato (a) (b) (c) (d) Ratkasu: (a) Geero STATISTIX-ohjelma satuaslukuja tuottavlla alohjelmlla tedostoo BINORM seuraavat muuttujat (50 havatoa): U: N(0,) V: N(0,) Muodosta STATISTIX-ohjelma trasformaatolla tedostoo BINORM kaksulottesta ormaaljakaumaa N 2 (µ, µ 2, σ 2, σ 2 2, ρ) oudattavat muuttujapart (ks. kaavoja tehtäve lopussa): (X, Y): N 2 (0, 20,, 4, 0.95) (X2, Y2): N 2 ( 5, 2, 9,, 0.4) (X3, Y3): N 2 (0, 0,,, 0.7) Prrä pstedagrammt (U, V), (X, Y), (X2, Y2), (X3, Y3) ja arvo de perusteella muuttuje välste korrelaatode merkt ja suuruusluokat. Arvo satuaslukuje geero ostumsta estmomalla geerotuje muuttuje artmeettset keskarvot, otosvarasst ja otoskorrelaatokertomet muuttujaparelle (U, V), (X, Y), (X2, Y2), (X3, Y3) ja vertaamalla tä vastaave teoreettste tuuslukuje arvoh. Testaa muuttujaparssa (X3, Y3) ollahypoteesa H 0 : ρ = 0.7 Satuaslukuje geerot Geerodaa tedostoo BINORM satuaslukuja jakaumasta N(0,) muuttujks U, V: (U, V): N 2 (0, 0,,, 0) Data > Trasformatos Trasformato Expresso U / V = NRadom (0,) TKK Ilkka Mell (2005) /23

Trasformodaa muuttujat U ja V 2-ulottesta ormaaljakaumaa N 2 (µ, µ 2, σ 2, σ 2 2, ρ) oudattavks satuasmuuttuje pareks (X, Y), (X2, Y2), (X3, Y3): (X, Y): N 2 (0, 20,, 4, 0.95) (X2, Y2): N 2 ( 5, 2, 9,, 0.4) (X3, Y3): N 2 (0, 0,,, 0.7) Data > Trasformatos Trasformato Expresso X / X2 / X3 = σ * U + µ Data > Trasformatos Trasformato Expresso Y / Y2 / Y3 = σ 2 (ρ * U + Sqrt( ρ * ρ) * V) + µ 2 (b) Pstedagrammt Muodostetaa muuttujapare (U, V), (X, Y), (X2, Y2), (X3, Y3) parettaset pstedagrammt: Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = U / X / X2 / X3 Y Axs Varables = V / Y / Y2 / Y3 TKK Ilkka Mell (2005) 2/23

(U, V): N 2 (0, 0,,, 0) X-Axs Varables = U Y-Axs Varables = V Scatter Plot of V vs U.6 0.7-0.2 V -. -2.0-2.9-2.2 -.4-0.6 0.2.0.8 U Muuttujat U ja V äyttävät lähes korrelomattomlta. (X, Y): N 2 (0, 20,, 4, 0.95) X-Axs Varables = X Y-Axs Varables = Y Scatter Plot of Y vs X 24 2 Y 8 5 7.8 8.6 9.4 0.2.0.8 X Muuttujat X ja Y äyttävät vomakkaast postvsest korrelotueta. TKK Ilkka Mell (2005) 3/23

(X2, Y2): N 2 ( 5, 2, 9,, 0.4) X-Axs Varables = X2 Y-Axs Varables = Y2 3.6 Scatter Plot of Y2 vs X2 2.8 2.0 Y2.2 0.4-0.4-3 -8-3 2 X2 Muuttujat X2 ja Y2 äyttävät leväst postvsest korrelotuelta. (X3, Y3): N 2 (0, 0,,, 0.7) X-Axs Varables = X3 Y-Axs Varables = Y3 Scatter Plot of Y3 vs X3.9.0 0. Y3-0.8 -.7-2.6-2.2 -.4-0.6 0.2.0.8 X3 Muuttujat X3 ja Y3 äyttävät melko vomakkaast egatvsest korrelotueta. TKK Ilkka Mell (2005) 4/23

(c) Tuusluvut Lasketaa muuttuje U, V, X, Y, X2, Y2, X3, Y3 artmeettset keskarvot ja varasst: Statstcs > Summary Statstcs > Desrptve Statstcs Descrptve Varables = U, V, X, Y, X2, Y2, X3, Y3 DESCRIPTIVE STATISTICS VARIABLE MEAN VARIANCE U -0.2297 0.8202 V -0.607 0.6940 X 9.7703 0.8202 Y 9.463 2.9057 X2-5.689 7.385 Y2.7609 0.636 X3-0.2297 0.8202 Y3 0.0460 0.893 Vertaa geerodusta havaosta laskettuja artmeettsa keskarvoja ja varasseja geerossa käytettyh 2-ulottese ormaaljakauma parametre arvoh: Muuttuja Odotusarvo Varass U 0 V 0 X 0 Y 20 4 X2 5 9 Y2 2 X3 0 Y3 0 Erot havatoje geerossa käytettyje parametre arvoje ja geerodusta havaosta laskettuje vastaave otossuurede arvoje välllä evät ole yhdessäkää tapauksessa kov suura. Tos varasst äyttävät oleva systemaattsest jok verra la peä. Erot johtuvat satuasvahtelusta ja/ta satuaslukugeeraattor omasuukssta. TKK Ilkka Mell (2005) 5/23

Pearso otoskorrelaatokerro lasketaa kaavalla jossa r s xy xy = = ss x y = xy = ( x x)( y y) 2 2 ( x x) ( y y) = = s = ( x x)( y y) o x- ja y-havatoarvoje otoskovarass, s 2 2 x = ( x x ) = o x-havatoarvoje varass, s 2 2 y = ( y y ) = o y-havatoarvoje varass sekä s x ja s y ovat vastaavat otoskeskhajoat. Lasketaa korrelaatot muuttujaparesta (U, V), (X, Y), (X2, Y2), (X3, Y3): Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = U, V / X, Y / X2, Y2 / X3, Y3 CORRELATIONS (PEARSON) U V -0.89 CASES INCLUDED 50 MISSING CASES 0 CORRELATIONS (PEARSON) X Y 0.9539 CASES INCLUDED 50 MISSING CASES 0 TKK Ilkka Mell (2005) 6/23

CORRELATIONS (PEARSON) X2 Y2 0.285 CASES INCLUDED 50 MISSING CASES 0 CORRELATIONS (PEARSON) X3 Y3-0.7854 CASES INCLUDED 50 MISSING CASES 0 Vertaa geerodusta havaosta laskettuja korrelaatota geerossa käytettyh 2-ulottese ormaaljakauma parametr arvoh: Muuttujapar Korrelaato U, V 0 X, Y 0.95 X2, Y2 0.4 X3, Y3 0.7 Erot havatoje geerossa käytettyje parametr arvoje ja geerodusta havaosta laskettuje vastaave otossuurede arvoje välllä evät ole yhdessäkää tapauksessa kov suura. Erot johtuvat satuasvahtelusta ja/ta satuaslukugeeraattor omasuukssta. (d) Korrelaato testaame Testataa muuttujaparssa (X3, Y3) ollahypoteesa H 0 : ρ = 0.7 ku geerodusta havaosta laskettu korrelaato o 0.7854. Käytetää testssä Fsher z-muuoksee perustuvaa testsuuretta + r + ρ 0 log log 2 r 2 ρ0 z = 3 TKK Ilkka Mell (2005) 7/23

Jos ollahypotees H 0 : ρ = ρ 0 pätee, testsuure z o jakautuut approksmatvsest stadardodu ormaaljakauma mukaa: z a N(0,) Testsuuree arvoks saadaa z =.364 Stä vastaava p-arvo 2-suutaselle vahtoehtoselle hypoteeslle o p = 0.8804 Ste ollahypotees H 0 : ρ = 0.7 jää vomaa. Testsuuree arvoa vastaava p-arvo määrääme tapahtuu seuraavalla operaatolla: Statstcs > Probablty Fuctos Fucto = Z 2-tal (x) x = -.364 2. Pstedagramm ja korrelaato STATISTIX-tedostossa TUPAKKA o aettu seuraavat tedot maasta: (a) (b) (c) Ratkasu: KULUTUS = savukkede kulutus per capta 930 SAIRAST = keuhkosyöpätapauste lukumäärä per 00 000 heklöä 950 Prrä aestosta pstedagramm (KULUTUS, SAIRAST) ja arvo se perusteella muuttuje välse korrelaato merkk ja suuruusluokka. Laske aestosta Pearso tulomomettkorrelaatokerro. Laske aestosta Pearso tulomomettkorrelaatokerro, ku jätät USA: pos. Vertaa tulosta (b)-kohda tuloksee. Kommetteja? Tedosto TUPAKKA havatomet saadaa äkyv seuraavalla operaatolla: Data > Labels > Value Labels Source Varable = MAA TKK Ilkka Mell (2005) 8/23

Aesto vodaa tulostaa seuraavalla operaatolla: Fle > Prt Prt Varables = MAA, KULUTUS, SAIRAST TUPAKKA CASE MAA KULUTUS SAIRAST Islat 220 58 2 Norja 250 90 3 Ruots 30 5 4 Kaada 50 50 5 Taska 380 65 6 Itavalta 455 70 7 USA 280 90 8 Hollat 460 245 9 Svets 530 250 0 Suom 5 350 GB 45 465 (a) Pstedagramm Muodostetaa pstedagramm muuttujaparsta (KULUTUS, SAIRAST): Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = KULUTUS Y Axs Varables = SAIRAST 490 Scatter Plot of SAIRAST vs KULUTUS 400 SAIRAST 30 220 USA 30 40 00 500 900 300 KULUTUS TKK Ilkka Mell (2005) 9/23

Kuvo perusteella savukkede kulutuksella ja sarastavuudella o melko vomakas postve korrelaato: Savukkede kulutuksella ja sarastuvuudella ol keskmäär seuraava yhteys: Mtä eemmä maassa poltett savukketa per capta 930 stä eemmä sellä ol 20 vuode kuluttua keuhkosyöpätapauksa per 00 000 asukasta. (b) Korrelaatokerro kaklle havaolle Lasketaa korrelaato muuttujaparlle (KULUTUS, SAIRAST): Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = KULUTUS, SAIRAST TUPAKKA CORRELATIONS (PEARSON) KULUTUS SAIRAST 0.740 CASES INCLUDED MISSING CASES 0 (c) Korrelaatokerro, ku USA jätetää pos Jätetää USA (Case = 7) pos: Data > Omt/Select/Restore Cases Omt/Select/Restore Expresso Omt Case = 7 Lasketaa korrelaato muuttujaparlle (KULUTUS, SAIRAST): Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = KULUTUS, SAIRAST TUPAKKA CORRELATIONS (PEARSON) KULUTUS SAIRAST 0.940 CASES INCLUDED 0 MISSING CASES 0 TKK Ilkka Mell (2005) 0/23

USA: posjättäme kasvattaa korrelaatota vomakkaast, ts. tupaka ja keuhkosyövä yhteys tulee vomakkaamm es, jos USA jätetää pos. Oko ä okeutettua tehdä? Pstedagramma katsellessa huomaa, että USA:ssa o poltettu ete savukketa per capta 930, mutta keuhkosyöpätapauste lukumäärä per 00 000 heklöä 950 o ollut va keskmääräe. Vosko USA olla musta masta pokkeava havato? Kyllä! USA:ssa poltett 930 vaarattomampa savukketa ku muualla: USA:ssa poltett 930 paljo flttersavukketa, ku muualla poltett edellee pääasassa fltterttömä savukketa. Lsäks amerkkalassavukkede tupakka ol tavallsest medompaa ku muualla poltettuje savukkede tupakka. Johtopäätös: Pokkeavat havaot saattavat väärstää tlastollse aalyys tuloksa. Pokkeave havatoje tustame ja vakutukse selvttäme ovat keskee osa tlastollsta aalyysa. 3. Pstedagramm ja korrelaato STATISTIX-tedostossa DATA2 o aettu 0 havatoa muuttujsta X ja Y. (a) (b) (c) Ratkasu: (a) Prrä aestosta pstedagramm (X, Y) ja arvo se perusteella muuttuje välse korrelaato merkk ja suuruusluokka. Laske aestosta Pearso tulomomettkorrelaatokerro. Vertaa (a)-kohda kuvaa ja (b)-kohdassa laskettua korrelaatokerrota. Kommetteja? Pstedagramm Muodostetaa pstedagramm muuttujaparsta (X, Y): Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = X Y Axs Varables = Y TKK Ilkka Mell (2005) /23

Scatter Plot of Y vs X 8 6 Y 4 2 0-3 - 3 X Kuvosta vodaa päätellä, että muuttuje X ja Y otoskorrelaato = 0. Mks? Johtopäätös seuraa otoskovarass s = ( X X)( Y Y) XY = geometrsesta tulkasta: Otoskovarass kaava summalausekkeessa = jokae term ( X X)( Y Y) ( X X)( Y Y ) vastaa suorakatee pta-alaa varustettua etumerkllä, joka rppuu pstee (X, Y ) sjasta artmeettste keskarvoje määräämä pstee( X, Y ) suhtee. Yo. kuvossa psteet sjatsevat symmetrsest suora X = 0 suhtee, jollo jokasella psteellä (X, Y ) o vastpste ( X, Y ). Vastaavat termt otoskovarass kaava summalausekkeessa ovat vastakkasmerkkset ja kumoavat summassa tosesa. TKK Ilkka Mell (2005) 2/23

Ks. alla olevaa esmerkkkuvaa: 8 Scatter Plot of Y vs X ( X, Y ) ( X, Y) 6 Y 4 ( X, Y ) 2 0-3 - 3 X (b) Korrelaatokerro Lasketaa korrelaato muuttujaparlle (X, Y): Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = KULUTUS, SAIRAST DATA2 CORRELATIONS (PEARSON) X Y 0.0000 CASES INCLUDED 0 MISSING CASES 0 Korrelaatokerro = 0 eljä desmaal tulostustarkkuudella (tse asassa koee laskutarkkuudella). TKK Ilkka Mell (2005) 3/23

(c) Kommetteja Koska muuttuje X ja Y otoskorrelaatokerro = 0, muuttuje X ja Y välllä e vo olla leaarsta tlastollsta rppuvuutta. Se sjaa muuttuje X ja Y välllä o eksakt el tarkka epäleaare rppuvuus Y = X 2 Johtopäätös: Satuasmuuttuje korrelomattomuudesta e välttämättä seuraa de rppumattomuutta. Se sjaa satuasmuuttuje rppumattomuudesta seuraa aa de korrelomattomuus. 4. Spearma järjestyskorrelaatokerro Erää tlastollse data-aalyys kurss suortus koostu harjotustyöstä ja tetstä, jotka kummatk arvot pste 0-00. Kurss osallstuje joukosta pomtt satuasest 0 opskeljaa. Hedä psteesä o aettu alla olevassa taulukossa ja STATISTIX-tedotossa KURSSI. Tett 8 62 74 78 93 69 72 83 90 84 Harjotustyö 76 7 69 76 87 62 80 75 92 79 (a) (b) (c) (d) (e) Prrä aestosta pstedagramm ja arvo se perusteella muuttuje välse korrelaato merkk ja suuruusluokka. Laske Pearso tulomomettkorrelaatokerro ja testaa ollahypoteesa, että psteet tetstä ja harjotuystyöstä ovat korrelomattoma. Laske Spearma järjestyskorrelaatokerro ja testaa ollahypoteesa, että psteet tetstä ja harjotuystyöstä ovat korrelomattoma. Laske Spearma järjestyskorrelaatokerro käyttäe kaavaa mssä 6 = = ρ S 3 D 2 D = R( X ) R( Y) o X- ja Y-havatoarvoje rake erotus. Laske Spearma järjestyskorrelaatokerro soveltamalla Pearso tulomomettkorrelaatokertome kaavaa X- ja Y-havatoarvoje rake muodostam lukupareh. TKK Ilkka Mell (2005) 4/23

Ratkasu: (a) Pstedagramm Muodostetaa pstedagramm muuttujaparsta (TENTTI, HTYO): Statstcs > Summary Statstcs > Scatter Plot X Axs Varables = TENTTI Y Axs Varables = HTYO 92 Scatter Plot of HTYO vs TENTTI 86 80 HTYO 74 68 62 62 70 78 86 94 TENTTI Muuttuje HTYO ja TENTTI välllä o selvää postvsta korrelaatota: Opskeljat meestyvät kurss molemmssa osossa keskmäär samalla tavalla. TKK Ilkka Mell (2005) 5/23

(b) Pearso tulomomettkorrelaatokerro ja test korrelomattomuudelle Lasketaa korrelaato muuttujaparlle (X, Y): Statstcs > Lear Models > Correlatos (Pearso) Correlato Varables = HTYO, TENTTI KURSSI CORRELATIONS (PEARSON) HTYO TENTTI 0.7759 CASES INCLUDED 0 MISSING CASES 0 Testataa ollahypoteesa H 0 : ρ = 0 Testsuure r t = 2 r 2 oudattaa ollahypotees H 0 pätessä t-jakaumaa vapausaste 2. Statstcs > Assocato Tests > Correlatos (Pearso) Correlato Varables = HTYO, TENTTI KURSSI CORRELATIONS (PEARSON) HTYO TENTTI 0.7759 P-VALUE 0.0083 CASES INCLUDED 0 MISSING CASES 0 Testsuuree t arvoa vastaava p-arvo o 0.0083. Ste ollahypotees H 0 vodaa hylätä %: merktsevyystasolla. TKK Ilkka Mell (2005) 6/23

(c) Spearma järjestyskorrelaatokerro ja test korrelomattomuudelle Statstcs > Assocato Tests > Spearma Rak Correlatos Correlato Varables = HTYO, TENTTI KURSSI SPEARMAN RANK CORRELATIONS, CORRECTED FOR TIES HTYO TENTTI 0.773 MAXIMUM DIFFERENCE ALLOWED BETWEEN TIES 0.0000 CASES INCLUDED 0 MISSING CASES 0 Testataa ollahypoteesa Testsuure H 0 : ρ = 0 ρs t = 2 ρ 2 S oudattaa ollahypotees H 0 pätessä suurssa otoksssa approksmatvsest stadardotua ormaaljakaumaa N(0,). t-testsuuree arvoks saadaa t = 2.98 jota vastaava p-arvo 2-suutaselle vahtoehtoselle hypoteeslle o p = 0.00359 Ste ollahypotees H 0 vodaa hylätä %: merktsevyystasolla. p-arvo määrääme tapahtuu seuraavalla operaatolla: Statstcs > Probablty Fuctos Fucto = Z 2-tal (x) x = 2.98 TKK Ilkka Mell (2005) 7/23

(d) Spearma järjestyskorrelaatokertome laskeme Lasketaa Spearma järjestyskorrelaatokerro käyttäe kaavaa mssä 6 = ρ S = 3 D 2 D = R( X ) R( Y) o X- ja Y-havatoarvoje raklukuje erotus. Muodostetaa es tedostoo KURSSI X- ja Y-havatoarvoje rakluvut, de erotukset ja erotuste toset potesst: Data > Trasformatos Trasformato Expresso RTENTTI = Rak (TENTTI) Data > Trasformatos Trasformato Expresso RHTYO = Rak (HTYO) Data > Trasformatos Trasformato Expresso D = RTENTTI - RHTYO Data > Trasformatos Trasformato Expresso D2 = D * D TKK Ilkka Mell (2005) 8/23

Tedosto KURSSI äyttää trasformaatode jälkee seuraavalta: KURSSI CASE TENTTI HTYO RTENTTI RHTYO D D2 8 76 6 5.5 0.5 0.25 2 62 7 3-2 4 3 74 69 4 2 2 4 4 78 76 5 5.5-0.5 0.25 5 93 87 0 9 6 69 62 2 7 72 80 3 8-5 25 8 83 75 7 4 3 9 9 90 92 9 0-0 84 79 8 7 Määrätää seuraavaks muuttuja D2 arvoje summa: Statstcs > Summary Statstcs > Descrptve Statstcs Descrptve Varables = D2 KURSSI DESCRIPTIVE STATISTICS VARIABLE N SUM D2 0 46.500 Sjottamalla summa = D 2 = 46.50 Spearma korrelaatokertome kaavaa saadaa ρ S = 0.782 mkä o melke sama ku kohdassa (c) saatu tulos. Ero johtuu stede (= egl. te) erlasesta kästtelytavasta. TKK Ilkka Mell (2005) 9/23

(e) Spearma järjestyskorrelaatokertome laskeme 2 Lasketaa Spearma järjestyskorrelaatokertome arvo soveltamalla Pearso tulomomettkorrelaatokertome kaavaa X- ja Y-havatoarvoje raklukuh: Statstcs > Assocato Tests > Correlatos (Pearso) Correlato Varables = RHTYO, RTENTTI KURSSI CORRELATIONS (PEARSON) RHTYO RTENTTI 0.773 CASES INCLUDED 0 MISSING CASES 0 Tulos o sama ku kohdassa (c) saatu tulos, mutta e ole sama ku kohdassa (a) alkuperässtä havatoarvosta laskettu Pearso tulomomettkorrelaatokertome arvo. 5. χ 2 -rppumattomuustest Eräässä kyselytutkmuksessa kartotett Flordaa vmese kolme vuode akaa tomtasa srtäede yrtyste sytä srtymsee. Yrtykset ol jaettu tomalasa suhtee kolmee luokkaa: Teollsuus, Kauppa, Tursm Essjase perustelu srtymselle sa valta yhde seuraavsta kolmesta: Myötee tekologaympärstö, Verohelpotukset, Työvoma saatavuus Srtyede yrtyste joukosta pomtt ykskertae satuasotos ja yrtykset luoktelt rst tomalasa ja srtymse perustelu suhtee 9 luokkaa. Tulokset o aettu alla olevassa frekvesstaulukossa ja STATISTIX-tedostossa MUUTTO. Tomala Syy srtymsee Teollsuus Kauppa Tursm Tekologaympärstö 53 25 0 Verohelpotukset 67 36 20 Työvoma saatavuus 30 40 33 Ovatko tomala ja srtymse perustelu rppumattoma tekjötä? TKK Ilkka Mell (2005) 20/23

Ratkasu: Olkoo Tekjä A = Syy srtymsee Tekjä B = Tomala ja olkoo ollahypoteesa Havatut frekvesst: Odotetut frekvesst: jossa H 0 : Tekjät A ja B ovat rppumattoma O j = havattu frekvess A-luokassa ja B-luokassa j, =, 2,, r, j =, 2,, c E R C Huomaa, että j j RC = = = c j= r = O j j O j R = luokkafrekvess A-luokassa C j = luokkafrekvess B-luokassa j Nollahypotees H 0 pätessä testsuure χ ( O E ) r c 2 2 j j 2 = a χ = j= Ej ( f ) jossa f = (r )(c ) TKK Ilkka Mell (2005) 2/23

χ 2 -rppumattomuustest Statstcs > Assocato Tests > Ch-Square Test Model Specfcato = Table Table Varables = TEOL, KAUPPA, TURISMI MUUTTO CHI-SQUARE TEST FOR HETEROGENEITY OR INDEPENDENCE VARIABLE CASE TEOL KAUPPA TURISMI +-----------+-----------+-----------+ OBSERVED 53 25 0 88 EXPECTED 42.44 28.58 6.98 CELL CHI-SQ 2.63 0.45 2.87 +-----------+-----------+-----------+ 2 OBSERVED 67 36 20 23 EXPECTED 59.32 39.95 23.73 CELL CHI-SQ 0.99 0.39 0.59 +-----------+-----------+-----------+ 3 OBSERVED 30 40 30 00 EXPECTED 48.23 32.48 9.29 CELL CHI-SQ 6.89.74 5.94 +-----------+-----------+-----------+ 50 0 60 3 OVERALL CHI-SQUARE 22.49 P-VALUE 0.0002 DEGREES OF FREEDOM 4 CASES INCLUDED 9 MISSING CASES 0 χ 2 -testsuuree arvo o 22.49 ja stä vastaava p-arvo o 0.0002, ku vapausasteta o 4. Ste ollahypotees stä, että tekjät A = Tomala B = Syy srtymsee ovat rppumattoma hylätää kaklla tavaomaslla merktsevyystasolla. TKK Ilkka Mell (2005) 22/23

Lte: Satuaslukuje geerot 2-ulottesesta ormaaljakaumasta Oletetaa, että rppumattomat satuasmuuttujat U ja V oudattavat stadardotua ormaaljakaumaa U ~ N(0,) V ~ N(0,) Määrtellää satuasmuuttujat () X = σ U + µ 2 ( ) Y = σ ρu + ρ V +µ 2 2 jossa µ, µ 2, σ > 0, σ 2 > 0 ja ρ + ovat reaalsa vakota. Tällö jossa ( XY, ) N ( µ, µ, σ, σ, ρ) 2 2 2 2 E( X) = µ E( Y) = µ 2 Var( X) = σ Var( Y) = σ Cor( XY, ) = ρ 2 2 2 Ste rppumattomat stadardotua ormaaljakaumaa N(0, ) oudattavat satuasmuuttujat vodaa muutaa muuoksella () kaksulottesta ormaaljakaumaa oudattavaks satuasmuuttuje parks. Estety trasformaato avulla vodaa rppumattomsta stadardotua ormaaljakaumaa N(0, ) oudattavsta satuasluvusta geeroda kaksulottesta ormaaljakaumaa oudattava satuaslukuje pareja. TKK Ilkka Mell (2005) 23/23