Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Koko: px
Aloita esitys sivulta:

Download "Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset."

Transkriptio

1 Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit, Nollahypoteesi, p-arvo, Päätössääntö, Testi, Testisuure, Testisuureen normaaliarvo, Testit suhdeasteikollisille muuttujille, t-testi, t-testi parivertailuille, Vaihtoehtoinen hypoteesi, Varianssien vertailutesti, Yhden otoksen t-testi, Yleinen hypoteesi. Kahden riippumattoman otoksen t-testi STATISTIX-tiedostossa MORT on esitetty 9 amerikkalaispankin käyttämät korot (muuttuja KORKO; yksikkö = %) asuntolainoille. Lainat voidaan ryhmitellä kahteen ryhmään sen mukaan onko korko ollut kiinteä vai vaihtuva (muuttuja LAINATYYP; 0 = kiinteä korko, = vaihtuva korko). (a) (b) Ratkaisu: (a) Määrää kummallekin lainatyypille: aritmeettinen keskiarvo, keskihajonta, minimi, maksimi, 95 %:n luottamusväli keskimääräiselle korolle, Box ja Whisker -kuvio Tee tulostusten perusteella johtopäätöksiä lainatyyppien koroista. Testaa kahden riippumattoman otoksen t-testillä nollahypoteesia, että keskimääräinen korko on kummallekin lainatyypille sama. Käytä vaihtoehtoisena hypoteesina oletusta: Keskimääräinen lainakorko on kiinteäkorkoiselle lainalle korkeampi. Vaihtoehtoinen hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista. Muotoile myös kaikki testiin liittyvät hypoteesit. Käytätkö varianssien yhtäsuuruusoletukseen vai erisuuruusoletukseen perustuvaa t-testiä? Perustele! Tunnusluvut, luottamusvälit, Box ja Whisker -kuvio Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks.. harjoitukset. Tunnusluvut ja luottamusväli Statistics > Summary Statistics > escriptive Statistics escriptive Variables = KORKO Grouping Variable = LAINATYYP C. I. Percent Coverage = 95 TKK Systeemianalyysin laboratorio (009) /

2 Mat-.04 Tilastollisen analyysin perusteet ESCRIPTIVE STATISTICS FOR LAINATYYP = 0 KORKO N 3 LO 95% CI 7.08 MEAN UP 95% CI S MINIMUM MAXIMUM ESCRIPTIVE STATISTICS FOR LAINATYYP = KORKO N 6 LO 95% CI MEAN UP 95% CI S MINIMUM MAXIMUM Tunnuslukujen ja luottamusvälien perusteella näyttää ilmeiseltä, että kiinteäkorkoisten lainojen korot (LAINATYYP = 0) ovat keskimäärin korkeampia. Box ja Whisker -kuvio Statistics > Summary Statistics > Box and Whisker Plots Model Specification = Categorical ependent Variable = KORKO Grouping Variable = LAINATYYP Box ja Whisker -kuvio muodostuu laatikosta ja viiksistä (ks. tarkemmin. harjoitusten tehtävän ratkaisua): Alakvartiili Q määrää laatikon alareunan paikan. Yläkvartiili Q 3 määrää laatikon yläreunan paikan. Puolet havaintoarvoista on laatikon sisällä. Mediaanin Q = Me paikka merkitään poikkiviivalla laatikon sisään. Viiksien kärjet kertovat normaalien havaintojen minimin ja maksimin paikat. Poikkeuksellisten havaintojen paikat merkitään tähdillä tai ympyröillä viiksien jatkeille. TKK Systeemianalyysin laboratorio (009) /

3 KORKO Mat-.04 Tilastollisen analyysin perusteet Box and Whisker Plot LAINATYYP 9 cases missing cases Kuvion perusteella on ilmeistä, että kiinteäkorkoisten lainojen korot (LAINATYYP = 0) ovat keskimäärin korkeampia. (b) Kahden riippumattoman otoksen t-testi Koska havaintoja eri lainatyyppejä käyttävistä pankeista voidaan pitää riippumattomina otoksina, sovelletaan kahden riippumattoman otoksen t-testiä. LAINATYYP = 0 X i = kiinteäkorkoisen lainan korko pankissa i LAINATYYP = X j = vaihtuvakorkoisen lainan korko pankissa j H 0 : = Vaihtoehtoinen hypoteesi: H : > TKK Systeemianalyysin laboratorio (009) 3/3

4 Mat-.04 Tilastollisen analyysin perusteet STATISTIX tulostaa yhdellä kertaa tulokset 3:sta testistä: Kahden riippumattoman otoksen t-testi, kun ryhmäkohtaiset varianssit saavat erota toisistaan (ks. Testi ratkaisujen lopussa). Kahden riippumattoman otoksen t-testi, kun ryhmäkohtaiset varianssit ovat yhtä suuret (ks. Testi ratkaisujen lopussa). Varianssien vertailutesti (ks. Testi 4 ratkaisujen lopussa). Statististics > One, Two, Multi-Sample Tests > Two-Sample T Test Model Specification = Categorical ependent Variable = KORKO Categorical Variable = LAINATYYP Null Hypothesis = 0 Alternate Hypothesis = Greater Than TWO-SAMPLE T TESTS FOR KORKO BY LAINATYYP SAMPLE LAINATYYP MEAN SIZE S.. S.E IFFERENCE.4006 NULL HYPOTHESIS: IFFERENCE = 0 ALTERNATIVE HYP: IFFERENCE > 0 ASSUMPTION T F P 95% CI FOR IFFERENCE EQUAL VARIANCES (.9009,.9004) UNEQUAL VARIANCES (.79, ) F NUM F EN F P TESTS FOR EQUALITY OF VARIANCES CASES INCLUE 9 MISSING CASES Varianssien yhtäsuuruutta testaavan F-testisuureen arvo =.73 ja vastaava p-arvo = Siten nollahypoteesi varianssien yhtäsuuruudesta voidaan hyväksyä 5 %:n merkitsevyystasolla. Siten kahden riippumattoman otoksen t-testeistä voidaan valita yhtä suuriin variansseihin perustuva versio. Vastaava testisuureen arvo = 0.4. Sitä vastaava p-arvo on neljällä desimaalilla = Siten nollahypoteesi H 0 voidaan hylätä kaikilla tavanomaisilla merkitsevyystasoilla: Kiinteäkorkoisten lainojen keskimääräiset korot ovat korkeampia kuin vaihtuvakorkoisten lainojen korot. TKK Systeemianalyysin laboratorio (009) 4/4

5 Mat-.04 Tilastollisen analyysin perusteet. t-testi parivertailuille STATISTIX-tiedostossa PalkkaMF on esitetty 0 amerikkalaismiehen (= MALE) ja 0 amerikkalaisnaisen (= FEMALE) vuosipalkat (yksikkö = $). Havainnot muodostuvat sovitetuista pareista, joissa jokaista miestä vastaa samanlaisen taustan (iän, ammatin, koulutustason, työpaikan jne.) omaava nainen. (a) (b) (c) (d) Ratkaisu: (a) Määrää naisten ja miesten palkoille: aritmeettinen keskiarvo, keskihajonta, minimi, maksimi, 95 %:n luottamusväli keskimääräiselle korolle, Box ja Whisker -kuvio Tee tulostusten perusteella johtopäätöksiä palkkaeroista. Testaa t-testillä parivertailuille nollahypoteesia, että miesten ja naisten palkat eivät eroa tosistaan. Käytä vaihtoehtoisena hypoteesina oletusta: Naisten ja miesten palkat eroavat toisistaan. Testaa riippumattomien otosten t-testillä nollahypoteesia, että miesten ja naisten palkat eivät eroa tosistaan. Vertaa (b)- ja (c)-kohdan tuloksia toisiinsa. Kumpi menettely on oikea? Tunnusluvut, luottamusvälit, Box ja Whisker -kuvio Tunnusluvut ja luottamusväli Statistics > Summary Statistics > escriptive Statistics escriptive Variables = FEMALE, MALE C. I. Percent Coverage = 95 ESCRIPTIVE STATISTICS FEMALE MALE N 8 8 LO 95% CI MEAN UP 95% CI S MINIMUM MAXIMUM Tunnuslukujen ja luottamusvälien perusteella näyttää siltä, että naisten palkat saattavat olla keskimäärin pienempiä kuin miesten palkat. TKK Systeemianalyysin laboratorio (009) 5/5

6 Mat-.04 Tilastollisen analyysin perusteet Box ja Whisker -kuvio Statistics > Summary Statistics > Box and Whisker Plots Model Specification = Table Table Variables = FEMALE, MALE Ks. kuvion selitystä tehtävässä. 000 Box and Whisker Plot FEMALE MALE 6 cases Kuvion mukaan naisten palkat näyttävät yleensä olevan pienempiä kuin miesten palkat. (b) t-testi parivertailuille t-testi parivertailuille: ks. Testi 3 ratkaisujen lopussa. FEMALE X i = naisen palkka parissa i MALE X i = miehen palkka parissa i i = X i X i TKK Systeemianalyysin laboratorio (009) 6/6

7 Mat-.04 Tilastollisen analyysin perusteet H: 0 0 Vaihtoehtoinen hypoteesi: H: 0 Statististics > One, Two, Multi-Sample Tests > Paired T Test Sample Variables = FEMALE, MALE Null Hypothesis = 0 Alternate Hypothesis = Not Equal PAIRE T TEST FOR FEMALE - MALE NULL HYPOTHESIS: IFFERENCE = 0 ALTERNATIVE HYP: IFFERENCE <> 0 MEAN ST ERROR 64. LO 95% CI UP 95% CI T -.56 F 7 P CASES INCLUE 8 MISSING CASES 0 t-testisuureen arvo =.56 ja vastaava p-arvo = Nollahypoteesi H 0 voidaan hylätä 5 %:n merkitsevyystasolla: Naisten ja miesten palkat eroavat toisistaan. (c) Kahden riippumattoman otoksen t-testi FEMALE X i = naisen palkka parissa i MALE H: 0 Vaihtoehtoiset hypoteesit: H: X i = miehen palkka parissa i TKK Systeemianalyysin laboratorio (009) 7/7

8 Mat-.04 Tilastollisen analyysin perusteet STATISTIX tulostaa yhdellä kertaa tulokset 3:sta testistä: Kahden riippumattoman otoksen t-testi, kun ryhmäkohtaiset varianssit saavat erota toisistaan (ks. Testi ratkaisujen lopussa). Kahden riippumattoman otoksen t-testi, kun ryhmäkohtaiset varianssit ovat yhtä suuret (ks. Testi ratkaisujen lopussa). Varianssien vertailutesti (ks. Testi 4 ratkaisujen lopussa). Statististics > One, Two, Multi-Sample Tests > Two-Sample T Test Model Specification = Table Table Variables = FEMALE, MALE Null Hypothesis = 0 Alternate Hypothesis = Not Equal TWO-SAMPLE T TESTS FOR FEMALE VS MALE SAMPLE VARIABLE MEAN SIZE S.. S.E FEMALE MALE IFFERENCE NULL HYPOTHESIS: IFFERENCE = 0 ALTERNATIVE HYP: IFFERENCE <> 0 ASSUMPTION T F P 95% CI FOR IFFERENCE EQUAL VARIANCES ( , 347.4) UNEQUAL VARIANCES (-4548., 348.) F NUM F EN F P TESTS FOR EQUALITY OF VARIANCES CASES INCLUE 6 MISSING CASES 0 Varianssien yhtäsuuruutta testaavan F-testisuureen arvo =.0 ja vastaava p-arvo = Siten nollahypoteesi varianssien yhtäsuuruudesta voidaan hyväksyä kaikilla tavanomaisilla merkitsevyystasoilla. Siten kahden riippumattoman otoksen t-testeistä voidaan valita yhtä suuriin variansseihin perustuva versio. Vastaava testisuureen arvo =.6. Sitä vastaava p-arvo = Siten nollahypoteesi H 0 jätetään voimaan: Naisten ja miesten palkat eivät eroa toisistaan. TKK Systeemianalyysin laboratorio (009) 8/8

9 Mat-.04 Tilastollisen analyysin perusteet (d) Kohtien (b) ja (c) testien vertailu (b)- ja (c)-kohtien testit antavat ristiriitaiset tulokset. (c)-kohdan testiä ei saa kuitenkaan käyttää, koska havainnot muodostuvat sovitetuista pareista, mikä johtaa muuttujien riippuvuuteen; muuttujien MALE ja FEMALE korrelaatio on (varmista tämä lla). Opetus: Väärän tilastollisen menetelmän perusteella ei voi tehdä luotettavia johtopäätöksiä! 3. t-testi parivertailuille STATISTIX-tiedostossa VERENP on tulokset samoille potilaille tehdyistä verenpaineen mittauksista (ns. yläpaine) ennen (muuttuja ENNEN) ja jälkeen (muuttuja JALKEEN) verenpainetta alentavan lääkkeen antamisen. (a) (b) (c) Ratkaisu: (a) Testaa t-testillä parivertailuille nollahypoteesia, että lääkkeen antamisella ei ole vaikututusta verenpaineeseen, kun vaihtoehtoisena hypoteesina on, että lääke alentaa verenpainetta. Muodosta verenpaineiden erotukset ja tee niille tavallinen t-testi, jossa nollahypoteesina on, että erotusten odotusarvo = 0. Vertaa kohtien (a) ja (b) tuloksia toisiinsa. t-testi parivertailuille t-testi parivertailuille: ks. Testi 3 ratkaisujen lopussa. ENNEN X i = potilaan i verenpaine ennen lääkkeen antamista JALKEEN X i = potilaan i verenpaine lääkkeen antamisen jälkeen i = X i X i H: 0 0 Vaihtoehtoinen hypoteesi: H: 0 Statististics > One, Two, Multi-Sample Tests > Paired T Test Sample Variables = ENNEN, JALKEEN Null Hypothesis = 0 Alternate Hypothesis = Greater Than TKK Systeemianalyysin laboratorio (009) 9/9

10 Mat-.04 Tilastollisen analyysin perusteet PAIRE T TEST FOR ENNEN - JALKEEN NULL HYPOTHESIS: IFFERENCE = 0 ALTERNATIVE HYP: IFFERENCE > 0 MEAN ST ERROR.439 LO 95% CI.0967 UP 95% CI T 3.3 F 7 P CASES INCLUE 8 MISSING CASES 0 t-testisuureen arvo = 3.3 ja vastaava p-arvo = Siten nollahypoteesi H 0 voidaan hylätä % merkitsevyystasolla: Lääke alentaa verenpainetta. (b) Yhden otoksen t-testi Lisätään tiedostoon VERENP muuttuja = ENNEN JALKEEN ata > Transformations Transformation Expression = ENNEN JALKEEN Yhden otoksen t-testi: ks. Luentokalvot. ENNEN X i = potilaan i verenpaine ennen lääkkeen antamista JALKEEN X i = potilaan i verenpaine lääkkeen antamisen jälkeen i = X i X i H: 0 0 Vaihtoehtoinen hypoteesi: H: 0 TKK Systeemianalyysin laboratorio (009) 0/0

11 Mat-.04 Tilastollisen analyysin perusteet Statististics > One, Two, Multi-Sample Tests > One-Sample T Test Sample Variables = Null Hypothesis = 0 Alternate Hypothesis = Greater Than ONE-SAMPLE T TEST FOR NULL HYPOTHESIS: MU = 0 ALTERNATIVE HYP: MU > 0 MEAN ST ERROR.439 LO 95% CI.0967 UP 95% CI T 3.3 F 7 P CASES INCLUE 8 MISSING CASES 0 t-testisuureen arvo = 3.3 ja vastaava p-arvo on Siten nollahypoteesi voidaan hylätä %:n merkitsevyystasolla: Verenpaineiden erotusten keskimääräinen arvo on positiivinen. (c) Parivertailutestin ja yhden otoksen t-testin vertailu (a)- ja (b)-kohdat antavat saman tuloksen kuten pitääkin! TKK Systeemianalyysin laboratorio (009) /

12 Mat-.04 Tilastollisen analyysin perusteet 4. Kahden riippumattoman otoksen t-testi STATISTIX-tiedostossa COMPRon tiedot betonin puristuslujuutta koskevista testeistä. Muuttuja CONCR sisältää testitulokset betonierästä, jotka on tehty valmistusmenetelmällä ja muuttuja CONCR sisältää testitulokset 30 betonierästä, jotka on tehty valmistusmenetelmällä. Puristuslujuuden yksikkönä on kg/cm. Testaa kahden riippumattoman otosten t-testillä nollahypoteesia, että keskimääräiset puristuslujuudet eivät eroa toisistaan, kun vaihtoehtoisena hypoteesina on, että ne eroavat. Ratkaisu: Kahden riippumattoman otoksen t-testi Koska havaintoja eri menetelmillä tehdystä betonista voidaan pitää riippumattomina otoksina, sovelletaan kahden riippumattoman otoksen t-testiä. CONCR X i = testitulos menetelmän betonierästä i CONCR X j = testitulos menetelmän betonierästä j H 0 : = Vaihtoehtoinen hypoteesi: H : STATISTIX tulostaa yhdellä kertaa tulokset 3:sta testistä: Kahden riippumattoman otoksen t-testi, kun ryhmäkohtaiset varianssit saavat erota toisistaan (ks. Testi ratkaisujen lopussa). Kahden riippumattoman otoksen t-testi, kun ryhmäkohtaiset varianssit ovat yhtä suuret (ks. Testi ratkaisujen lopussa). Varianssien vertailutesti (ks. Testi 4 ratkaisujen lopussa). Statististics > One, Two, Multi-Sample Tests > Two-Sample T Test Model Specification = Table Table Variables = CONCR, CONCR Null Hypothesis = 0 Alternate Hypothesis = Not Equal TKK Systeemianalyysin laboratorio (009) /

13 Mat-.04 Tilastollisen analyysin perusteet TWO-SAMPLE T TESTS FOR CONCR VS CONCR SAMPLE VARIABLE MEAN SIZE S.. S.E CONCR CONCR IFFERENCE NULL HYPOTHESIS: IFFERENCE = 0 ALTERNATIVE HYP: IFFERENCE <> 0 ASSUMPTION T F P 95% CI FOR IFFERENCE EQUAL VARIANCES (9.7309, 8.435) UNEQUAL VARIANCES (9.6434, 8.53) F NUM F EN F P TESTS FOR EQUALITY OF VARIANCES CASES INCLUE 5 MISSING CASES 9 Varianssien yhtäsuuruutta testaavan F-testisuureen arvo =.8 ja vastaava p-arvo = Nollahypoteesi varianssien yhtäsuuruudesta voidaan hyväksyä 5 %:n merkitsevyystasolla. Siten kahden riippumattoman otoksen t-testeistä voidaan valita yhtäsuuriin variansseihin perustuva versio. Vastaava testisuureen arvo = Sitä vastaava p-arvo on neljällä desimaalilla = Nollahypoteesi H 0 voidaan hylätä kaikilla tavanomaisilla merkitsevyystasoilla: Valmistusmenetelmät eroavat toisistaan ja menetelmä tuottaa puristus-lujuudeltaan parempaa betonia. TKK Systeemianalyysin laboratorio (009) 3/3

14 Mat-.04 Tilastollisen analyysin perusteet Liitteet Testi : Yleinen hypoteesi H : Riippumattomien otosten t-testi, kun ryhmäkohtaiset varianssit saavat erota toisistaan X i = muuttujan havaittu arvo havainnossa i X j = muuttujan havaittu arvo havainnossa j () Havainnot () Havainnot ix ~N(, ), i,,, n jx ~N(, ), j,,, n (3) Havainnot X i ja X j ovat riippumattomia kaikille i ja j H: 0 Vaihtoehtoiset hypoteesit: H: H: H: Testisuure ja sen approksimatiivinen jakauma nollahypoteesin pätiessä: jossa XX t s s n n t() a s s nn s n n n n s Testisuureen approksimatiivisena jakaumana nollahypoteesin pätiessä käytetään usein myös standardoitua normaalijakaumaa: XX t N(0,) a s s nn Tämä approksimaatio on kuitenkin heikompi kuin edellä mainittu t-jakaumaan perustuva approksimaatio. TKK Systeemianalyysin laboratorio (009) 4/4

15 Mat-.04 Tilastollisen analyysin perusteet Testi : Yleinen hypoteesi H : Riippumattomien otosten t-testi, kun ryhmäkohtaiset varianssit ovat yhtä suuret X i = muuttujan havaittu arvo havainnossa i X j = muuttujan havaittu arvo havainnossa j () Havainnot () Havainnot ix ~N(, ), i,,, n jx ~N(, ), j,,, n (3) Havainnot X i ja X j ovat riippumattomia kaikille i ja j H: 0 Vaihtoehtoiset hypoteesit: H: H: H: Testisuure ja sen jakauma nollahypoteesin pätiessä: jossa XX t tnn ( ) sp nn ( n ) s ( n) s P nn s TKK Systeemianalyysin laboratorio (009) 5/5

16 Mat-.04 Tilastollisen analyysin perusteet Testi 3: t-testi parivertailuille X i = muuttujan havaittu arvo havainnossa i X i = muuttujan havaittu arvo havainnossa i i = X i X i Yleinen hypoteesi H : () Havainnot i n i~n(, ),,,, () Havainnot i ovat riippumattomia kaikille i H: 0 0 Vaihtoehtoiset hypoteesit: H : 0 H : 0 H : 0 Testisuure ja sen jakauma nollahypoteesin pätiessä: t tn () s n / TKK Systeemianalyysin laboratorio (009) 6/6

17 Mat-.04 Tilastollisen analyysin perusteet Testi 4: Varianssien vertailutesti X i = muuttujan havaittu arvo havainnossa i X j = muuttujan havaittu arvo havainnossa j Yleinen hypoteesi H : () Havainnot () Havainnot ix ~N(, ), i,,, n jx ~N(, ), j,,, n (3) Havainnot X i ja X j ovat riippumattomia kaikille i ja j H: 0 Vaihtoehtoiset hypoteesit: H: H: H: Testisuure ja sen jakauma nollahypoteesin pätiessä: s F Fn (, n ) s TKK Systeemianalyysin laboratorio (009) 7/7

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat: Mat-.04 Tilastollise aalyysi perusteet / Ratkaisut Aiheet: Avaisaat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahde riippumattoma otokse t-testit, Nollahypoteesi, p-arvo, Päätössäätö, Testi,

Lisätiedot

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista. Mat-2.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Hypoteesi, Mannin ja Whitneyn testi (Wilcoxonin

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat: Mat-.04 Tilatollie aalyyi peruteet. harjoituket Mat-.04 Tilatollie aalyyi peruteet. harjoituket / Tehtävät Aiheet: Avaiaat: Tetit uhdeateikolliille muuttujille Hypoteei, Kahde riippumattoma otoke t-tetit,

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15,

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45. Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit Merkkitesti Wilcoxonin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5 TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007

Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 Mat-2.204 Tilastollisen analyysin perusteet, kevät 2007 3. luento: Pari sanaa vielä hypoteesien formuloinneista Kai Virtanen Hypoteesien muodoista Luennolla nro. 2 muotoiltiin nollahypoteesi - H 0 : θ

Lisätiedot

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto Kytkentäanalyysin teoriaa Pyritään selvittämään tiettyyn ominaisuuteen vaikuttavien eenien paikka enomissa Perustavoite: löytää markkerilokus jonka alleelit ja tutkittava ominaisuus (esim. sairaus) periytyvät

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

1 TILASTOMENETELMIEN PERUSTEITA

1 TILASTOMENETELMIEN PERUSTEITA 1 TILASTOMENETELMIEN PERUSTEITA Insinööritieteissä suoritetaan usein erilaisia mittauksia tai kokeita, joiden tuloksena saadaan numeerisia havaintoaineistoja tutkittavasta ilmiöstä. Hyvinvointiteknologiassa

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro Lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19,

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Mat Tilastollisen analyysin perusteet

Mat Tilastollisen analyysin perusteet / Mat-2.21 04 Tilastollisen analyysin perusteet Tentti 24.5.2013/Virtanen Kirjoita selvasti jokaiseen koepaperiin alia mainitussa jarjestyksessa: Mat-2.2104 Tap 24.5.2013 opiskelijanumero kirjain TEKSTATEN

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2007) 1 Yhteensopivuuden, homogeenisuuden ja riippumattomuuden

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen Tilastollisen analyysin perusteet Luento 5: Sisältö Tilastotieteessä tehdään usein oletuksia havaintojen jakaumasta. Useat tilastolliset menetelmät toimivat tehottomasti tai jopa virheellisesti, jos jakaumaoletukset

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Keskivirheyksiköllä ilmaistuna voidaan erottaa otantajakaumalta kriittisiä kohtia: Keskimmäinen 95 % otoskeskiarvoista välillä [-1.96,+1.96] Keskimmäinen

Lisätiedot

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio TKK (c) Ilkka Mellin (2005) 1 Tilastollinen riippuvuus ja korrelaatio Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan

Lisätiedot

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 2. Tehtävät 2-4 sekä 6 10 liittyvät keväällä 2002 suoritettuun ammattikorkeakoulusta

Lisätiedot

Empiirinen projekti. Olli-Matti Laine Kauppatieteet

Empiirinen projekti. Olli-Matti Laine Kauppatieteet Empiirinen projekti Olli-Matti Laine Kauppatieteet 1 Contents 1. Johdanto... 3 2. Kuvaileva osa... 4 3. Analyysiosa... 17 4. Yhteenveto... 35 2 1. Johdanto Tutkin projektissa tilastollisin menetelmin kansantaloudellisia

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

SELVITTÄJÄN KOMPETENSSISTA

SELVITTÄJÄN KOMPETENSSISTA OTM, KTM, Mikko Hakola, Vaasan yliopisto, Laskentatoimen ja rahoituksen laitos Helsinki 20.11.200, Helsingin kauppakorkeakoulu Projekti: Yrityksen maksukyky ja strateginen johtaminen SELVITTÄJÄN KOMPETENSSISTA

Lisätiedot

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 2) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo,

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

2. Aineiston kuvailua

2. Aineiston kuvailua 2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien

Lisätiedot

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2004) 1 Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen Jakaumaoletuksien

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

analyysin perusteet Mat Ti lastol I isen Tentti /Mellin

analyysin perusteet Mat Ti lastol I isen Tentti /Mellin Mat-2.1 04 Ti lastol Tentti 7.5.2005/Mellin I isen analyysin perusteet Kirjoita selvdsti jokaiseen koepaperii n alla mainitussa jdirjestyksessd: - Mat-2.104 Tap 7.5.2005 - opiskelijanumero + kirjain -

Lisätiedot

Ratkaisuja luvun 15 tehtäviin

Ratkaisuja luvun 15 tehtäviin Tarja Heikkilä 1. Luettele hyvän tutkimuksen perusvaatimukset ja riskitekijät. Katso Hyvän tutkimuksen perusvaatimukset luvusta 1 ja Tutkimusraporttien arviointi luvusta 4. Esimerkkejä riskitekijöistä

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila TILASTOLLINEN PÄÄTTELY Aki Taanila TILASTOLLINEN PÄÄTTELY 17.6.2010 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...

Lisätiedot

Otoskoon arviointi. Tero Vahlberg

Otoskoon arviointi. Tero Vahlberg Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on? Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä.

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot