TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Samankaltaiset tiedostot
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Estimointi. Otantajakauma

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Otantajakauman käyttö päättelyssä

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Harjoitus 7: NCSS - Tilastollinen analyysi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Luottamusvälit. Normaalijakauma johnkin kohtaan

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Parametrin estimointi ja bootstrap-otanta

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Sovellettu todennäköisyyslasku A

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Teema 8: Parametrien estimointi ja luottamusvälit

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollinen aineisto Luottamusväli

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Estimointi. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

10. laskuharjoituskierros, vko 14, ratkaisut

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Kandidaatintutkielman aineistonhankinta ja analyysi

MTTTP1, luento KERTAUSTA

1. Tilastollinen malli??

MTTTP1, luento KERTAUSTA

Mat Tilastollisen analyysin perusteet, kevät 2007

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

tilastotieteen kertaus

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Testit järjestysasteikollisille muuttujille

Kyllä. Kyllä. Jäitkö vielä epävarmaksi: Selvitä antavatko testit samansuuntaisen tuloksen.

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

Sovellettu todennäköisyyslaskenta B

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

031021P Tilastomatematiikka (5 op) viikko 5

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Transkriptio:

TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas

Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564.

POIKKEAVAN HAVAINNON VAIKUTUS

PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla on erilainen lukumäärä puuttuvia havaintoja, voidaan korrelaatio laskea kahdella tavalla Pairwise: jokaiselta muuttuja parilta huomioidaan kaikki parilla havaitut arvot Listwise: muuttujapareilta huomioidaan arvot, jotka jäävät kun kaikki puuttuvat arvot poistetaan tarkastelusta Listwiseon tilastomatemaattisesti usein paremmin perusteltu ja johtaa jatkoanalyyseissa usein harvemmin ongelmiin kuin pairwise Koehenkilö Pituus Paino Vyötärönympärys 1 169 76 98.5 2 -- 82 85.5 3 187 -- 86.0 Pairwise: 2 tapausta Listwise: 1 tapaus

C. JÄRJESTYSLUKUASTEIKOLLISET MUUTTUJAT: SPEARMANIN JÄRJESTYSLUKUKORRELAATIOKERROIN Symbolit: otos, r S, perusjoukko, ρ S Vähintään järjestysasteikolliset muuttujat; poikkeavia havaintoja sisältävät muuttujat; kun jakaumaoletukset eivät ole kunnossa Pearsonin korrelaatiolle Havaintoarvojen sijasta perustuu havaintojen keskinäiseen riippuvuuteen Laskeminen: 1) X-ja Y-muuttujien havaintoarvot korvataan järjestysluvuilla R(x i ) ja R(y i ). 2) Lasketaan järjestyslukujen erotusten neliö d i2 = [R(x i ) R(y i )] 2 3) Sijoitetaan neliöt kaavaan:

ESIMERKKI Tarkastellaan itse arvioidun terveydentilan ja käden puristusvoiman välistä riippuvuutta (n = 5). Aineisto: Koehenkilö Terveydentila Käden puristusvoima (Newton) 1 4 = huono 363 2 3 = kohtalainen 198 3 5 = erittäin huono 78 4 1 = erittäin hyvä 387 5 2 = hyvä 387 Olkoon seuraavassa terveydentila Xja puristusvoima Y. Huom. Terveydentila kertoo huonosta terveydentilasta (suuret arvot).

ESIMERKKI Koehenkilö x y R(x) R(y) d i d 2 i 1 4 363 2 3-1.0 1.00 2 3 198 3 2 1.0 1.00 3 5 78 1 1 0.0 0.00 4 1 387 5 4.5 0.5 0.25 5 2 387 4 4.5-0.5 0.25 Σ 0.0 2.50 = 1 6 = 1 6 2.5 5 5 = 1 15 120 = 0.875 Terveinä itsensä kokevilla havaittiin siis myös vastaavasti korkea puristusvoiman arvo. Korrelaatio on varsin korkea ja se laskettiin varsin pienestä aineistosta.

ESIMERKKI Korrelaatio SPSS-ohjelmalla tarkasteltuna: Kertoimen itseisarvo on hieman pienempi kuin käsin laskettaessa. SPSS käyttää tasatulosten osalta korjauskaavaa, joka johtaa hieman erilaiseen tulokseen (vrt. Ranta: Biometria) Huom. p= 0.054, mikä on johtopäätös H 0 :n suhteen?

KORRELAATIOMATRIISI Korrelaatio ja sen merkitsevyyden indikaattori (**) Tarkka p-arvo Ristitulo Kovarianssi Otoskoko Jyväskyläläiset 75-v. naiset, NORA tutkimus, 1989.

KORRELAATIOMATRIISIN RAPORTOINTI Table 1.Correlation matrix of height, weight, waist and hip girth among 75-year-old women living in Jyväskylä in 1989 (n= 191). Height Weight Waist girth Height -- Weight 0.29* -- Waist girth 0.01 0.84* -- Hip girth 0.10 0.90* 0.82 * * Singificance: p < 0.001. HUOM! Viimeinen sarake on turha, koska muuttujan (tässä: lantionleveys) korrelaatio itsensä kanssa on aina 1, eikä siksi mielenkiintoinen.

KORRELAATIOMATRIISIN RAPORTOINTI Table 1.Correlation matrix of height, weight, waist and hip girth among 75-year-old women living in Jyväskylä in 1989 (n= 191). Height Weight Waist girth Height -- Weight 0.31 ** -- Waist girth 0.01 a 0.82 ** -- Hip girth 0.15 * 0.98 ** 0.80 ** a Pearson correlation (unmarked is Spearman correlation) * Significance: p < 0.05 ** Singificance: p < 0.001.

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

Tarkastellaan minkälaisia otoksia kuuden tutkittavan perusjoukosta voi muodostaa Kun otostetaansatunnaisotos, on mahdollista, että otokseen päätyvät tapaukset 1, 2 ja 3 Otos Henkilöt otoksessa 1 1 2 3 Henkilö Mitta 1 168.78 2 182.52 Otostaminen 3 181.40 4 146.62 5 188.81 6 165.12 Perusjoukon Keskiarvo 172.21

Satunnaistamisen tuloksena otokseen olisi voinut yhtä hyvin päätyä henkilöt 1, 2 ja 4 Otos Henkilöt otoksessa 1 1 2 3 2 1 2 4 Henkilö Mitta 1 168.78 2 182.52 3 181.40 4 146.62 5 188.81 6 165.12 Otostaminen Perusjoukon Keskiarvo 172.21

Ja niin edelleen Otos Henkilöt otoksessa 1 1 2 3 2 1 2 4 3 1 2 5 Henkilö Mitta 1 168.78 2 182.52 3 181.40 4 146.62 5 188.81 6 165.12 Otostaminen Perusjoukon Keskiarvo 172.21

Lopulta havaitaan, että perusjoukosta voidaan otostaa20 erilaista otosta, joista kussakin on ainakin yksi eri henkilö kuin muissa Henkilö Mitta 1 168.78 2 182.52 3 181.40 4 146.62 5 188.81 6 165.12 Perusjoukon Keskiarvo 172.21 Otostaminen Otos Henkilöt otoksessa 1 1 2 3 2 1 2 4 3 1 2 5 4 1 2 6 5 1 3 4 6 1 3 5 7 1 3 6 8 1 4 5 9 1 4 6 10 1 5 6 11 2 3 4 12 2 3 5 13 2 3 6 14 2 4 5 15 2 4 6 16 2 5 6 17 3 4 5 18 3 4 6 19 3 5 6 20 4 5 6

Siten otoksista voidaan laskea 20 erilaista otoskeskiarvoa Henkilö Mitta 1 168.78 2 182.52 3 181.40 4 146.62 5 188.81 6 165.12 Perusjoukon Keskiarvo 172.21 Otostaminen Keskiarvon otantajakauma Otos Otoskeskiarvo Henkilöt otoksessa 1 177.57 1 2 3 2 165.97 1 2 4 3 180.04 1 2 5 4 172.14 1 2 6 5 165.60 1 3 4 6 179.66 1 3 5 7 171.77 1 3 6 8 168.07 1 4 5 9 160.17 1 4 6 10 174.24 1 5 6 11 170.18 2 3 4 12 184.24 2 3 5 13 176.35 2 3 6 14 172.65 2 4 5 15 164.75 2 4 6 16 178.82 2 5 6 17 172.28 3 4 5 18 164.38 3 4 6 19 178.44 3 5 6 20 166.85 4 5 6

Keskiarvon otantajakauma Huom. Perusjoukon keskiarvo on yhtä suuri kuin otantajakauman keskiarvo. Perusjoukon vaihteluväli: [146.62, 188.81] Otantajakauman vaihteluväli: [160.17, 184.24] Perusjoukon keskiarvo

OTANTAJAKAUMA Tarkastellaan jotain otoksen parametria(esim. keskiarvo tai korrelaatiokerroin) Yksittäinen otos on yksi mahdollinen edustava perusjoukon osajoukko, kun otos on poimittu jollain satunnaistamismenetelmällä (esim. yksinkertainen satunnaisotanta) Otoksesta laskettua parametrin arvoa, estimaattia, voi siis pitää parhaana arviona parametrin arvosta Jos otoksesta poimitaan toinen otos, siihen ei yleensä päädy täsmälleen samat tutkittavat ja estimaatti saa siten erilaisen arvon kuin ensimmäisestä otoksesta laskettuna Eli: Eri otoksista laskettavat estimaatit eivät ole yhtä suuria, koska otoksissa eivät ole samat tutkittavat

OTANTAJAKAUMA Kun perusjoukosta poimitaan kaikki nyksikön otokset ja lasketaan niistä parametrin estimaatti, saadaan enemmän tai vähemmän toisistaan poikkeavia lukuarvoja Parametrien arvoon liittyy siis otostamisesta aiheutuvaa satunnaisvaihtelua Parametrien erilaisista arvoista muodostettu jakauma muodostaa parametrin otantajakauman Kun halutaan tehdä päätelmiä esim. perusjoukon keskiarvosta, päätelmät helpottuvat, jos perusjoukosta voidaan olettaa jotain: Jos muuttuja on normaalisti jakautunut perusjoukossa, on myös otantajakauman muoto normaalijakauma Riittää siis tietää otantajakauman keskiarvo ja sen hajonta, että voidaan tehdä päätelmiä otantajakaumasta Otoksesta otantajakauman hajontaaarvioidaan keskivirheellä Jos perusjoukon hajonta tunnetaan: Jos perusjoukon hajontaa ei tunneta: / /

Henkilö Mitta 1 168.78 2 182.52 3 181.40 4 146.62 5 188.81 6 165.12 Perusjoukon Keskiarvo 172.21 Otos Otoskeskiarvo Keskivirhe Otantayksiköt perusjoukossa 1 177.57 4.41 1 2 3 2 165.97 10.46 1 2 4 3 180.04 5.91 1 2 5 4 172.14 5.29 1 2 6 5 165.60 10.17 1 3 4 6 179.66 5.85 1 3 5 7 171.77 4.93 1 3 6 8 168.07 12.18 1 4 5 9 160.17 6.86 1 4 6 10 174.24 7.36 1 5 6 11 170.18 11.78 2 3 4 12 184.24 2.30 2 3 5 13 176.35 5.62 2 3 6 14 172.65 13.14 2 4 5 15 164.75 10.36 2 4 6 16 178.82 7.08 2 5 6 17 172.28 13.01 3 4 5 18 164.38 10.05 3 4 6 19 178.44 7.00 3 5 6 20 166.85 12.21 4 5 6

Keskihajonnan yhteydessä puhuttiin muuttujien ilmoittamisesta keskihajontayksiköillä (standardointi), standardointi voidaan tehdä myös otantajakaumalle, mutta tällöin se tehdään keskivirheen suhteen, joka on otantajakauman keskihajonta Keskivirheyksiköllä ilmaistuna voidaan erottaa otantajakaumalta kriittisiä kohtia: Keskimmäinen 95 % otoskeskiarvoista välillä [-1.96,+1.96] Keskimmäinen 99 % otoskeskiarvoista välillä [-2.58,+2.58] Keskimmäinen 99.9 % otoskeskiarvoista välillä [-3.29,+3.29] 99.9 % 99 % 95 % (otantajakaumalla)

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

ESTIMOINTI Tehdään päätelmiä perusjoukon parametreista (keskiarvo, korrelaatio jne.) Parametrin estimaattion arvo, jota lasketaan otostiedon perusteella ja edustaa arvioita perusjoukon parametrin arvosta On luotettava, kun laskentaan liittyvät matemaattiset oletukset ovat voimassa Mitä suurempi otos, sitä tarkemmat estimaatit A. Piste-estimaatit Perusjoukon parametrin arvo vastaa yksi lukuarvo Esim. otoskeskiarvo on perusjoukon keskiarvon piste-estimaatti B. Väliestimaatit Märitetään väli, jolla perusjoukon parametrin arvo sijaitsee valitulla todennäköisyydellä (luottamusväli) Esim. väli, jolla perusjoukon keskiarvo sijaitsee 95 % luottamustasolla

KESKIARVON LUOTTAMUSVÄLI Esim. keskiarvon 95 % luottamusväli saadaan määrittämällä väli, jolla 95 % keskimmäisistä otoskeskiarvoista sijaitsee otantajakaumalla Keskivirheyksiköillä ilmaistuna tämä väli sijaitsi ±1.96 keskivirheyksikön etäisyydellä keskiarvosta 95 % otantajakaumalla

ESIMERKKI Otoksesta (n= 3) lasketaan keskiarvo: 171.77 Keskihajonta: 8.541 =. = 4.931 Keskivirhe on siis Koska 95 % luottamusväli on 1.96 keskivirheyksikön päässä keskiarvon ala-ja yläpuolella, lasketaan Alaraja: 171.77 1.96 4.931 = 171.77 9.665 = 162.102 Yläraja: 171.77 + 1.96 4.931 = 171.77 + 9.665 = 181.432 Tulkinta: tutkijalla on 95 % luottamus siihen, että perusjoukon keskiarvo sijaitsee välillä [162, 181]

KESKIARVON LUOTTAMUSVÄLI Yleisesti keskiarvon luottamusväli voidaan laskea normaalisti jakautuneelle muuttujalle, kun n> 30 kaavalla: ±# Vakion zarvona käytetään vakiintuneita varmuuden asteita z= 1.96 (95 %) z= 2.58 (99 %) z= 3.29 (99.9 %)

Luottamusvälit, joita kuuden tutkittavan perusjoukon eri otoksille Otos Otoskeskiarvo Keskivirhe 95% Luottamusväli Otantayksiköt perusjoukossa 1 177.57 4.41 169 186 1 2 3 2 165.97 10.46 145 186 1 2 4 3 180.04 5.91 168 192 1 2 5 4 172.14 5.29 162 183 1 2 6 5 165.60 10.17 146 186 1 3 4 6 179.66 5.85 168 191 1 3 5 7 171.77 4.93 162 181 1 3 6 8 168.07 12.18 144 192 1 4 5 9 160.17 6.86 147 174 1 4 6 10 174.24 7.36 160 189 1 5 6 11 170.18 11.78 147 193 2 3 4 12 184.24 2.30 180 189 2 3 5 13 176.35 5.62 165 187 2 3 6 14 172.65 13.14 147 198 2 4 5 15 164.75 10.36 144 185 2 4 6 16 178.82 7.08 165 193 2 5 6 17 172.28 13.01 147 198 3 4 5 18 164.38 10.05 145 184 3 4 6 19 178.44 7.00 165 192 3 5 6 20 166.85 12.21 143 191 4 5 6

PITUUSMUUTTUJAN 95% LUOTTAMUSVÄLIT Pituus (cm) 200 195 190 185 180 175 170 165 160 155 150 145 140 1 2 3 4 5 6 7 8 9.......... Otos (keskiarvon mukaan järjestettynä) 20 Perusjoukon keskiarvo 172.21 cm Alaraja Keskiarvo Yläraja

Henkilö Mitta 1 168.78 2 182.52 3 181.40 4 146.62 5 188.81 6 165.12 Otos Otoskeskiarvo Keskivirhe Otantayksiköt perusjoukossa 12 184.24 2.30 2 3 5

TULKINTA Lähes kaikki luottamusvälit pitävät sisällään perusjoukon keskiarvon Yksi luottamusväleistä (otos 12, kuvion viimeinen) ei sisällä perusjoukon keskiarvoa 172.21 Lasketaan: 1/20 = 0.05, eli 5 % Tulkinta: Tutkija X ei tiedä otostaessaan, minkä erilaisista otoksista hän saa käyttöönsä, joten hän hyväksyy 5 % riskin sille, ettei luottamusväli sisällä perusjoukon keskiarvoa Hänellä on siis 95 % luottamus siihen, että luottamusväli sisältää perusjoukon keskiarvon

VIRHEPÄÄTELMÄN RISKI Luottamustasoon liittyy siis riski virhepäätelmälle 95 % luottamus 5 % riski (α = 0.05) 99 % luottamus 1 % riski (α = 0.01) 99.9 % luottamus 0.1 % riski (α = 0.001) Riskitaso (α) kuvaa todennäköisyyttä tehdä virhepäätelmä Luottamustason valintaan liittyy siis riski tehdä virhepäätelmä Yleisesti tutkimuskäytössä 5 % riskitaso on riittävä Kun määritetään esim. lääkkeiden haittavaikutuksiinliittyviä luottamusvälejä, voidaan käyttää tiukempia riskitasoja

PROSENTTIOSUUDEN LUOTTAMUSVÄLI Prosenttiosuuden keskivirhe: Luottamusväli: $ # $ (100 $)/ $ (100 $)/ z: käytössä samat arvot kuin keskiarvon luottamusvälien yhteydessä Parametrin arvon sanotaan poikkeavan tilastollisesti merkitsevästi jotain vertailuarvosta, jos vertailuarvo ei ole luottamusvälin sisällä Jos kahden ryhmän luottamusvälit eivät mene päällekkäin, sanotaan niiden välillä olevan tilastollisesti merkitsevä ero parametrin suhteen Vaihtoehto tilastolliselle testille, kun vertaillaan kahta ryhmää, ei sovellu suoraan useammalle

ESIMERKKI Pojilta ja tytöiltä esitettiin omaa terveydentilaa koskeva kysymys. Pojista 23.8 % ja tytöistä 16.2 % tunsi terveydentilansa huonoksi p(%) Vastaajien lkm (n/ryhmä) Virhemarg. prosenttiosuudelle Luottamusvälin Alaraja Yläraja 40 30 23.8 300 4.82 19.0 28.6 20 23.8 900 2.78 21.0 26.6 23.8 2100 1.82 22.0 25.6 10 16.2 300 4.17 12.0 20.4 16.2 900 2.41 13.8 18.6 16.2 2100 1.58 14.6 17.8 0 Pojat Tytöt

KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit

TILASTOLLINEN TESTAUS On olemassa ennakkokäsitys tarkasteltavan parametrin mahdollisesta arvosta Testaamisen tarkoitus on selvittää, pitääkö tällainen ennakkokäsitys paikkansa Testaamista varten määritetään periaatteessa toisen poissulkevat testaushypoteesit: nollahypoteesi ja vastahypoteesi Sopivan testin perusteella selvitetään onko otosinformaatio sopusoinnussa nollahypoteesin mukaisen parametriarvon kanssa

TESTIN VALINTA Kiinnostuksen kohteena on jokin parametri, joka määritetään tutkimuskysymyksen ja muuttujien mitta-asteikon perusteella χ 2 -testisuureen arvo Korrelaatiokertoimen arvo Keskiarvon erotus vertailuarvosta Kahden tai useamman ryhmän keskiarvojen erotus Jokaisella testin parametrilla on otantajakauma Otantajakauma kertoo parametriarvon todennäköisyyden, kun nollahypoteesin uskotaan pitävän paikkansa

TESTAUKSEN VAIHEET Tilastollisen testauksen vaiheet: 1. Testaushypoteesien määrittäminen 2. Testisuureen / testin valinta 3. Oletusten tarkistaminen 4. Riskitason valinta 5. Testisuureen arvon laskeminen ja p-arvon määritys 6. Nollahypoteesin hyväksyminen tai hylkääminen 7. Raportointi

ESIMERKKI Aikaisempien tutkimusten perusteella tiedetään vain, että painon keskiarvoksi 75-vuotiaiden jyväskyläläisillä miehillä on 74 kg (muuta ei tiedetä). Uudesta otoksesta lasketaan painon keskiarvoksi vastaavassa otoksessa 80 kg (keskihajonta 10 kg). Onko keskipaino noussut? Onko siis niin, että satunnaisvaihtelun puitteissa 80 kg olisi todennäköinen otoskeskiarvo perusjoukosta, jonka keskiarvo on 74 kg?

TESTAUSHYPOTEESIT Tutkimuskysymys Tutkimushypoteesi Testaushypoteesit H 0 : Nollahypoteesi ρ = 0 µ 1 =µ 2 µ 1 µ 2 = 0 Nollahypoteesi Vastahypoteesi ρ < 0 ρ > 0 µ 1 <µ 2 µ 1 µ 2 < 0 µ 1 >µ 2 µ 1 µ 2 > 0 Yksisuuntainen Kaksisuuntainen ρ 0 µ 1 µ 2 µ 1 µ 2 0 Kuvaa ennakko-olettamusta, josta ollaan valmiita luopumaan vasta, kun sitä vastaan saadaan tarpeeksi vahvaa näyttöä H 1 : Vastahypoteesi (vaihtoehtohypoteesi) Kuvaa nollahypoteesille vastakkaista tilaa Astuu voimaan, jos nollahypoteesi hylätään

TESTAUSHYPOTEESIT Suuntaisuus Kaksisuuntainen vastahypoteesi valitaan, kun ei ole etukäteen tietoa vaikutuksen suunnasta Yksisuuntaisen hypoteesin tilanteessa on ennakkotietoa vaikutuksen suunnasta tai kiinnostus on vain yhdensuuntaisesta vaikutuksesta Vastahypoteesi tulee rajata ennen aineiston tarkastelua (ts. ei voi perustua esim. keskiarvojen tarkasteluun) ja sen tulee olla perusteltua Tutkimuskäytössä valitaan kaksisuuntainen vastahypoteesi, sillä suunnasta ei usein ole ennakkotietoa Hypoteesit testissä Joko nolla-tai vastahypoteesi on alkuperäisen tutkimushypoteesin mukainen Testin lähtökohta on, että ajatellaan nollahypoteesin pitävän paikkansa ilmiön suhteen (odotettu) Testaus kertoo, kuinka hyvin tämä pitää paikkansa aineistoinformaation (havaittu) pohjalta

ESIMERKKEJÄ Yksisuuntainen H 0 : Perusjoukon keskiarvo on (edelleen) 74 kg, µ= 74. H 1 : Perusjoukon keskiarvo on suurempi kuin 74 kg, µ> 74. Kaksisuuntainen H 0 : Perusjoukon keskiarvo on (edelleen) 74 kg, µ= 74. H 1 : Perusjoukon keskiarvo ei ole 74 kg, µ 74. Tässä kaksisuuntainen vastahypoteesi olisi perusteltu, koska ei ollut syytä olettaa suuntaa keskipainon muutokselle