Satunnaismuuttujien mittausasteikot 93

Save this PDF as:
 WORD  PNG  TXT  JPG

Koko: px
Aloita esitys sivulta:

Download "Satunnaismuuttujien mittausasteikot 93"

Transkriptio

1 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Otos 90 Otosta tarvitaan, kun koko perusjoukon tutkiminen on mahdotonta esim. seuraavista syistä: joukko on ääretön tai erittäin suuri kaikkia joukon alkioita ei tunneta tai voida tavoittaa tutkimus/mittaaminen on kallista tai aikaa vievää mittauksen tekeminen voi vahingoittaa tai tuhota tutkimuskohteen. varmennetaan kokeellisesti jotain ilmiötä koskevaa teoriaa

2 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Otoksen poiminta 91 Otoksen poiminta voi käytännössä tarkoittaa tarkkailevaa havainnointia kokeiden suorittamista mittauksia kyselyjä, haastatteluja tiedon keräämistä valmiista tietokannoista Otokseen perustuva päättely sisältää virhemahdollisuuksia. Päätelmiin liittyvä epävarmuus on pyrittävä ilmaisemaan johtopäätösten yhteydessä (esim. virhemarginaalit).

3 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Termilogia 92 Perusjoukko, populaatio (Ω) on tutkimuksen kohdejoukko, josta otos poimitaan. Satunnaisotos perusjoukosta Ω on sellainen äärellinen joukko Ω:n alkioita, johon jokaisella perusjoukon alkiolla on etukäteen yhtäsuuri valintatodennäköisyys ja valinnat ovat toisistaan riippumattomia. Otokseen valittuja alkioita a 1,..., a n kutsutaan tilastoyksiköiksi ja n on otoskoko. Otos satunnaismuuttujasta: Yhden muuttujan X arvot otoksessa muodostavat jonon satunnaismuuttujia (X 1, X 2,..., X n ), jotka ovat täydellisesti riippumattomia ja noudattavat samaa jakaumaa. Otoksen realisaatio on sen havaittujen arvojen jono, jota merkitään pienillä kirjaimilla (x 1, x 2,..., x n ).

4 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Satunnaismuuttujien mittausasteikot 93 Nominaali- eli luokitteluasteikko: luokkien välillä ei järjestystä. Ordinaali- eli järjestysasteikko: luokat voidaan asettaa järjestykseen, mutta luokkien välisiä eroja ei voida vertailla Intervalli- eli välimatka-asteikko: muuttuja-arvot voidaan asettaa järjestykseen ja arvojen erotuksilla on mielekäs tulkinta. Suhdeasteikko: kuten intervalliasteikko, mutta asteikossa absoluuttuinen nollakohta.

5 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Havaintoaineiston kuvaus 94 Suuren numerojoukon sisältämää informaatiota pyritään tiivistämään olennaisen tutkittavan tiedon esille saamiseksi. Ennen varsinaisten otostunnuslukujen laskemista ja tilastollista päättelyä luokitellaan havainnot (jos ne ovat intervalli- tai suhdeasteikollisia) lasketaan luokkafrekvenssit ym. jakaumaa kuvaavia lukuja taulukoidaan piirretään jakauman pylväsdiagrammi (diskreetit muuttujat) tai histogrammi + frekvenssimonikulmio (jatkuvat muuttujat).. Näin saadaan käsitys arvojen suuruusluokasta ja levinneisyydestä sekä jakauman muodosta

6 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Otossuure 95 Otossuure on otoksesta laskettu reaaliarvoinen suure. Satunnaismuuttujan T (X 1, X 2,..., X n ) jakaumaa kutsutaan T :n otantajakaumaksi. Otoskeskiarvo: x = x 1 + x x n n = 1 n Otosvarianssi: [ s 2 = 1 n n (x i x) 2 = 1 xi 2 n 1 n 1 i=1 i=1 Otoshajonta: s = s 2 n i=1 x i ] 1 n n ( x i ) 2 i=1

7 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Luokiteltu aineisto 96 Otoskeskiarvo: x = 1 n k f i y i i=1 Otosvarianssi: s 2 = 1 n 1 [ n i=1 f i y 2 i ] 1 n n ( f i y i ) 2 i=1 Missä k = luokkien lukumäärä, y i =luokkavälin keskikohta, f i = luokkafrekvenssi.

8 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Empirinen jakauma 97 Keskilukuja Moodi: se havaintoarvo, jolla on suurin frekvenssi (ei välttämättä yksikäsitteinen).. Mediaani: järjestetyn otoksen keskimmäinen havaintoarvo tai kahden keskimmäisen keskiarvo, kun n on parillinen Hajontalukuja Keskipoikkeama: 1 n n x i x i=1 Vaihteluväli: R = x max x min Variaatiokerroin: V = s x

9 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Empirinen jakauma 98 Hajontalukuja Kvartaalipoikkeama: (Q 3 Q 1 ) n missä alakvartiili Q 1 on arvo, jota pienempiä havaintoja on 25%, yläkvartiili Q 3 on arvo, jota pienempiä havaintoja on 75% (ja suurempia 25%). Kvartiilivälille (Q 1, Q 3 ) jää puolet havainnoista. s Keskiarvon keskivirhe: n

10 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Outliers: Poikkeavat havainnot 99 Eräs kriteeri poikkeavien havaintojen tunnistamiselle: Olkoon kvartiilivälin pituus (interquartile range) IQR = Q 3 Q 1. Jos x < Q IQR tai x > Q IQR niin havaintoarvoa x voidaan pitää poikkeavana havaintona.

11 Piste-estimaatit Luottamusvälit Piste-estimaatit 100 Parametrien estimointi on populaation/otosavaruuden tunnuslukujen arviointia. Parametrin θ estimaattori, merk. ˆθ tai ˆθ(X 1, X 2,..., X n ) on siis satunnaismuuttuja. Hyvä estimaattori on: Harhaton E(ˆθ) = θ Minimivarianssinen D 2 ˆθ tarkentuva lim n P( ˆθ(X 1,..., X n ) θ < ɛ) = 1 kaikilla ɛ > 0.

12 Piste-estimaatit Luottamusvälit Piste-estimaatit 101 Tavallisimpia estimaattoreita: Odotusarvo: ˆµ = X Varianssi: ˆσ 2 = s 2 Bin(n, p)-jakauman parametri: ˆp = P = X n Exp(λ)-jakauman parametri: ˆλ = 1/X Näistä kolme ensimmäistä ovat harhattomia.

13 Piste-estimaatit Luottamusvälit Luottamusvälit 102 Estimoitavan parametrin θ (1 α)100%:n luottamusväli on otoksen määräämä väli, jolle parametrin θ todellinen arvo kuuluu todennäköisyydellä 1 α Tavallisimmat tasot: α = %:n luottamusväli α = %:n luottamusväli α = %:n luottamusväli

14 Piste-estimaatit Luottamusvälit Väliestimoinnin periaate 103 Muunnetaan otossuure (estimaattori) sellaiseen muotoon, johon sisältyy estimoitava parametri θ ja jonka jakauma on riippumaton θ:sta (vrt. normeeraus): olkoon tämä T θ (X 1,..., X n ). Otossuureen T θ (X 1,..., X n ) jakaumasta voidaan määrätä rajat (fraktiilit) a ja b siten, että P(a T θ (X 1,..., X n ) b) = 1 α Ja lisäksi P(T θ (X 1,..., X n ) < a) = α 2 P(T θ (X 1,..., X n ) > b) = α 2

15 Piste-estimaatit Luottamusvälit Väliestimoinnin periaate 104 Epäyhtälöparista a T θ (X 1,..., X n ) b ratkaistaan ylä- ja alaraja parametrille θ: L(X 1,..., X n ) θ U(X 1,..., X n ) Numeeriset rajat saadaan sijoittamalla ylä- ja alarajan lausekkeeseen otoksen realisaatio (x 1,..., x n ). Jos kiinnostuksen kohteena on vain parametrin alaraja TAI yläraja, voidaan vastaavalla tavalla muodostaa toispuoleinen luottamusväli θ:lle P(T θ (X 1,..., X n ) a) = 1 α tai P(T θ (X 1,..., X n ) b) = 1 α

16 Sokeria pussitetaan kilon paketeihin, mutta keskimääräinen paino ei yleensä ole tasan 1000 g. Tutkimuksessa punnittiin 12 satunnaisesti valittua pussia. Olkoon X pussissa olevan sokerin määrä (g) ja oletaan, että X N(µ, σ 2 ), missä annostelulaitteen aiheuttaman painon hajonnan tiedetään olevan 4.0 g. Estimoidaan aineiston perusteella X :n odotusarvo ja määritetään sen 95%:n luottamusväli (α = 0.05) Havainnot (g): 1004, 998, 1005, 1001, 999, 997, 1008, 1010, 1003, 1005, 1002, 998 Piste-estimaatti: ˆµ = x = g, n = 12, σ = 4.0 g Koska X i N(µ, σ 2 ), niin X N(µ, σ 2 /n), joten 95%:n varmuudella Z = X µ σ/ n N(0, 1) z Z z 0.975

17 z X µ σ/ n z z σ/ n X µ z σ/ n X z σ/ n µ X + z σ/ n X z σ/ n µ X + z σ/ n Sijoittamalla tähän saadut arvot ja taulukosta z = 1.96, saadaan odotusarvon 95%:n luottamusväliksi / 12 µ / µ µ µ = ± 2.26

18 Piste-estimaatit Luottamusvälit Odotusarvon luottamusväli 107 Varianssi tunnetaan Oletukset: X i N(µ, σ 2 ), i = 1,..., n, missä σ 2 tunnettu TAI otoskoko n suuri (n 50), jolloin σ 2 = s 2. Piste-estimaatti: ˆµ = x Otossuure: Z = x µ σ/ N(0, 1) n Otossuuren (1 α)100%: luottamusväli: z 1 α/2 x µ σ/ n z 1 α/2 Odostusarvon (1 α)100%: luottamusväli: x z 1 α/2 σ/ n µ x + z 1 α/2 σ/ n eli µ = x ± z 1 α/2 σ/ n

19 Piste-estimaatit Luottamusvälit Odotusarvon luottamusväli 108 Varianssi tuntematon Oletukset: X i N(µ, σ 2 ), i = 1,..., n, missä otoskoko pieni ja σ 2 tuntematon. Piste-estimaatti: ˆµ = x Otossuure: T = x µ s/ t(n 1) n Otossuuren (1 α)100%: luottamusväli: t 1 α/2 (n 1) x µ s/ n t 1 α/2(n 1) Odostusarvon (1 α)100%: luottamusväli: x t 1 α/2 (n 1)s/ n µ x + t 1 α/2 (n 1)s/ n eli µ = x ± t 1 α/2 (n 1)s/ n

20 Fyysikko määritti kastepistehygrometrin avulla ilman absoluuttisen kosteuden ( g/m 3) neljä kertaa ja sai tulokset 12.8, 12.7, 12.8, Määrää kosteuden odotusarvon 95%:n luottamusväli, kun määritystulos oletetaan normaalijakautuneeksi. Oletus: Kosteusmäärityksen tulos x N ( µ, σ 2) µ = x = 1 4 ( ) = 12.8 s 2 = 1 n 1 (xi x) 2 = 1 ( ( 0.1) ) = Hajonta tuntematon: Luottamusväli perustuu otossuureeseen T = x µ s/ t (n 1) n 95%:n luottamusväli odotusarvolle on µ = x ± t 1 α/2 (n 1) s/ n Sijoitetaan estimaatit ja t 1 α/2 (n 1) = t (3) = 3.18 µ = 12.8 ± /4 = 12.8 ± 0.13

21 Piste-estimaatit Luottamusvälit Suhteellisen osuuden luottamusväli 110 Oletukset: X Bin(n, p), missä n suuri Piste-estimaatti: ˆp = x/n Otossuure: Z = ˆp p p(1 p) n N(0, 1) Otossuuren (1 α)100%: luottamusväli: z 1 α/2 ˆp p p(1 p) n z 1 α/2 Suhteellisen osuuden (1 α)100%: luottamusväli: ˆp z 1 α/2 ˆp(1 ˆp) n p ˆp + z 1 α/2 ˆp(1 ˆp) n

22 Haastateltiin 200 satunnaista henkilöä, joilta kysyttiin kantaa pyöräilykypärän käyttöpakkoon. Haastatelluista 118 kannatti kypäräpakkoa. Laske 95% luottamusväli kannatusosuudelle koko väestössä. n=200, x=118 ˆp = x n = 0, 59 kannatusosuus otoksessa n suuri ja nˆp(1 ˆp) > 9, joten voidaan käyttää normaalijakaumaa Z = N(0, 1) ˆp p ˆp(1 ˆp) n 95% luottamusväli (α = 0, 05) ˆp(1 ˆp) ˆp(1 ˆp) ˆp Z 0,975 n p ˆp + Z 0,975 n ˆp(1 ˆp) p = ˆp ± Z 0,975 n Sijoitetaan p = 0, 59 ± 1, 96 = 0, 59 ± 0, 07 % eli 59 ± 7 % 0,59 0,41 200

23 Piste-estimaatit Luottamusvälit Varianssin luottamusväli 112 Oletukset: X i N(µ, σ 2 ), i = 1,..., n, missä n suuri Piste-estimaatti: ˆσ2 = s 2 Otossuure: χ 2 (n 1)s2 = σ 2 χ 2 (n 1) Otossuuren (1 α)100%: luottamusväli: χ 2 (n 1)s2 α/2 (n 1) σ 2 χ 2 1 α/2 (n 1) Varianssin (1 α)100%: luottamusväli: (n 1)s 2 χ 2 1 α/2 (n 1) σ2 (n 1)s2 (n 1) χ 2 α/2

24 Kartongin tuotannon laadunvalvonnassa saatiin neliöpainon hajonnaksi 25 mittauksen otoksessa 0, 93g/m 2. Neliöpaino noudattaa normaalijakaumaa N(µ,σ 2 ). Mitä arvoa pienempi neliöpainon hajonta σ on 95%:n varmuudella kyseisen otoksen perusteella? χ 2 = (n 1)s2 σ 2 χ 2 (n 1) P(χ 2 χ 2 α(n 1)) = 1 α P( (n 1)s2 χ 2 σ α(n 1)) = 1 α 2 P(σ 2 (n 1)s2 χ 2 (n 1)) = 1 α α (n 1)s 2 P(σ ) = 1 α χ 2 α (n 1) Hajonta on (1 α)100%:n varmuudella pienempi kuin Tehtävä Otos n=25, s=0,93, α = 0, 05, xα(n 2 1) = x0,05 2 (24) = 13, 85 95%:n varmuudella σ 24 0,93 13,85 = 1, 22 n 1s x 2 α (n 1)

25 Piste-estimaatit Luottamusvälit Odotusarvojen erotuksen luottamusväli 114 Varianssit tunnetaan Oletukset: Kaksi perusjoukko, joissa riippumattomat otokset kokoa n 1 ja n 2 satunnaismuuttujista X 1 N(µ 1, σ1 2), X 2 N(µ 2, σ2 2 ). Varianssit tunnetaan tai otoskoot suuria Estimoitava: µ 1 µ 2 Piste-estimaatti: x 1 x 2 Otossuure: Z = x 1 x 2 (µ 1 µ 2 ) N(0, 1) σ 2 1 n 1 + σ2 2 n 2 Odotusarvojen erotuksen (1 α)100%: luottamusväli: µ 1 µ 2 = x 1 x 2 ± z 1 α/2 σ 2 1 n 1 + σ2 2 n 2

26 Piste-estimaatit Luottamusvälit Odotusarvojen erotuksen luottamusväli 115 Varianssit tuntemattomia Oletukset: Kaksi perusjoukko, joissa riippumattomat (pienet) otokset kokoa n 1 ja n 2 satunnaismuuttujista X 1 N(µ 1, σ1 2), X 2 N(µ 2, σ2 2 ). Varianssit tuntemattomia, mutta yhtäsuuria σ1 2 = σ2 2 Estimoitava: µ 1 µ 2 Piste-estimaatti: x 1 x 2 Otossuure: T = x 1 x 2 (µ 1 µ 2 ) T (n 1 + n 2 2) s 1 p n n 2 missä yhdistetty otosvarianssi s 2 p = (n 1 1)s (n 2 1)s 2 2 n 1 + n 2 2

27 Piste-estimaatit Luottamusvälit Odotusarvojen erotuksen luottamusväli 116 Varianssit tuntemattomia Odotusarvojen erotuksen (1 α)100%: luottamusväli: µ 1 µ 2 = x 1 x 2 ± t 1 α/2 (n 1 + n 2 2)s p 1 n n 2

28 Vertailtiin kahden tietokoneen laskentanopeuksia, jotka voidaan olettaa normaalijakautuneiksi (varianssit yhtäsuuret). Testiohjelma ajettiin 10 kertaa molemmissa koneissa ja laskettiin suoritusaikojen keskiarvot ja hajonnat: x 1 = 5.1 x 2 = 4.8 s 1 = 1.2 s 2 = 0.9 Muodosta 95%:n luottamusväli laskenta-aikojen odotusarvojen erotukselle. Laskentanopeudet testiohjelmalle X 1 N(µ 1, σ 2 1 ), X 2 N(µ 2, σ 2 2 ) σ2 1 = σ2 2 T = x 1 x 2 (µ 1 µ 2 ) s p 1 n n 2 t(n 1 + n 2 2) 95%:n luottamusväli: T ± t (n 1 + n 2 2)

29 µ 1 µ 2 = x 1 x 2 ± t (n 1 + n 2 2)s p 1 n n 2 x 1 = 5.1 x 2 = 4.8 s 1 = 1.2 s 2 = 0.9 n 1 = 10 n 2 = 10 Yhdistetty otosvarianssi: s 2 p = (n 1 1)s 2 1 +(n 2 1)s 2 2 n 1 +n 2 2 = = t (n 1 + n 2 2) = t (18) = %:n luottamusväliksi: µ 1 µ 2 = ± ( ) }{{} µ 1 µ µ 1 µ

30 Piste-estimaatit Luottamusvälit Varianssisuhteen luottamusväli 119 Oletukset: Estimoitava: σ 2 1 /σ2 2 Kaksi perusjoukko, joissa riippumattomat otokset kokoa n 1 ja n 2 satunnaismuuttujista X 1 N(µ 1, σ 2 1 ), X 2 N(µ 2, σ 2 2 ). Otossuure: F = s2 1 /σ2 1 s2 2 F (n 1 1, n 2 1) /σ2 2 Varianssisuhteen (1 α)100%: luottamusväli: 1 F 1 α/2 (n 1 1, n 2 1) s1 2 s2 2 σ2 1 σ 2 2 F 1 α/2 (n 1 1, n 2 1) s2 1 s 2 2 Huom! 1 F 1 α/2 (n 2 1, n 1 1) = F α/2(n 1 1, n 2 1)

31 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Testauksen vaiheet Hypoteesin asettelu 2. Riskitason valinta 3. Testisuureen valinta ja hylkäysehdon määrittäminen 4. Havaintoaineiston kerääminen ja testisuureen arvon laskenta 5. Johtopäätöksen tekeminen

32 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Hypoteesin asettelu 121 Tilastollisessa testauksessa asetetaan kaksi vaihtoehtoista hypoteesia: H 0 nollahypoteesi H 1 vastahypoteesi, vaihtoehtoinen hypoteesi Hypoteesien ero: Vastahypoteesi kuvaa yleensä poikkeamaa totutusta tilanteesta, vaikutusta, eroa, muutosta. Usein se asia, jota tutkija yrittää todistaa. Nollahypoteesi kuvaa vallitsevaa tilannetta, tai väittää ettei todellista vaikutusta, eroa tai muutosta ole. Nollahypoteesi pysyy voimassa, ellei sitä vastaan saada riittäviä todisteita.

33 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Riskitason valinta 122 Perinteisessä testauksessa johtopäätös, joka perustuu havaintoaineistoon, ilmoitetaan muodossa "H 0 hylätään"tai "H 0 jää voimaan". Testauksessa voidaan tehdä väärä johtopäätös kahdella tavalla: 1. H 0 hylätään, vaikka se on tosi. 2. H 0 hyväksytään, vaikka se ei ole tosi. Riskitaso α = todennäköisyys, että H 0 hylätään, vaikka se on tosi Testin voimakkuus kuvaa testin kykyä erottaa todellinen poikkeama satunnaisvaihtelusta. Testin voimakkuus riippuu yleisesti testattavan parametrin todellisesta arvosta,

34 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Testisuuren valinta 123 Testisuure, merk. yleisesti T (X 1, X 2,..., X n ), on otossuure, jonka perusteella voidaan tehdä johtopäätös siitä, kumpi hypoteesi on uskottavampi. Testisuure perustuu yleensä testattavan parametrin harhattomaan estimaattoriin ja sen jakauma täytyy tuntea nollahypoteesin vallitessa.

35 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Hylkäysehdon määrittäminen 124 Testisuureen mahdolliset arvot jaetaan tietyin kriteerein kahteen toisensa poissulkevaan joukkoon: nollahypoteesin hyväksymisalueeseen (merk. S 0 ) ja hylkäysalueseen (merk. S 1 ). Jos testisuureen arvo kuuluu alueeseen S 0, H 0 jää voimaan Jos testisuureen arvo kuuluu alueeseen S 1, H 0 hylätään. Määrätään hylkäysalueen raja tai rajat eli kriittinen arvo tai kriittiset arvot siten, että nollahypoteesin vallitessa testisuure kuuluu hylkäysalueelle (korkeintaan) todennäköisyydellä α.

36 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Havaintoaineiston kerääminen ja testisuureen arvon laskenta 125 Havaintoaineiston keräämiseen liittyvät otannan ja kokeiden suunnittelu, otoksen poiminta ja mittausten suorittaminen. Näitä käsittelevät tilastotieteen erikoisalueet koesuunnittelu ja otantateoria. Havainnoista eli otoksesta lasketaan valitun testisuureen arvo.

37 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Johtopäätöksen tekeminen 126 Tarkistetaan hylkäysehto vertaamalla testisuureen laskettua arvoa kriittiseen arvoon (tai arvoihin). Tilastollisena johtopäätöksenä joko "H 0 hylätään"tai "H 0 jää voimaan"(eli "H 0 hyväksytään") riskitasolla α. Muodollisesti Jos T (x 1, x 2,..., x n ) S 0, H 0 jää voimaan Jos T (x 1, x 2,..., x n ) S 1, H 0 hylätään.

38 Oletetaan, että sokerin pussituslaite on säädetty annostelemaan pussiin keskimäärin 1001 g sokeria, mutta epäillään keskiarvon kasvaneen. Laite on siinä tapauksessa säädettävä uudelleen, jotta raaka-ainekulut pysyisivät minimaalisina. Sokeripussien keskipainoksi saatiin n = 12 pussin otoksessa x = g. Painon keskihajonnan tiedetään olevan 4 g. Paino X N(µ, σ 2 ), missä σ = 4 g. Testataan hypoteeseja H 0 : µ = 1001 g H 1 : µ > 1001 g Kriittinen arvo tasolla = 0.05 saadaan N(0, 1)-jakauman taulukosta standardoidulle arvolle z = x µ 0 σ/ n missä µ 0 = 1001 on H 0 -hypoteesin väittämä arvo Hylkäysehto: Hylkää H 0, jos z > z 0.95

39 Testisuureen arvoksi saadaan z = x µ 0 σ/ n = / 12 = Kriittinen arvo tasolla α = 0.05 on z 0.95 = Johtopäätös: Koska z < z 0.95, niin H 0 jää voimaan. Keskipainon ei siis voida katsoa kasvaneen tilastollisesti merkitsevästi, vaan havaittua poikkeamaa voidaan pitää normaaliin satunnaisvaihteluun kuuluvana. Pussituslaitetta ei siis tarvitse säätää.

40 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Testisuureen P-arvo 129 P-arvo on todennäköisyys saada lasketun testisuureen suuruinen tai sitä suurempi poikkeama nollahypoteesin väittämästä arvosta, jos H 0 on tosi. P-arvo mittaa nollahypoteesin uskottavuutta: mitä pienempi testisuureen P-arvo, sitä vahvempi tuki vastahypoteesille! Jos tutkimuksen tekijä käyttää perinteistä testausta ja valitsee riskitason α etukäteen, johtopäätös tehdään seuraavasti. Tämä pätee kaikissa testeissä: Jos P < α, H 0 hylätään Jos P α, H 0 jää voimaan

41 Lasketaan P-arvo sokerin pussituslaiteen keskiarvolle. Testisuureen z = P-arvo on P = P(Z > 1.299) = 1 Φ(1.299) = Jos riskitasoksi on valittu α = 0.05, niin H 0 jää voimaan

42 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Odotusarvon testaus, varianssi tunnetaan: 131 Oletukset: X i N(µ, σ 2 ), i = 1,..., n, missä σ 2 tunnettu TAI n suuri (n 50) jolloin s 2 = σ 2. Hypoteesit: Tapaus 1: Tapaus 2: Tapaus 3: H 0 : µ = µ 0 H 0 : µ = µ 0 H 0 : µ = µ 0 H 1 : µ µ 0 H 1 : µ > µ 0 H 1 : µ < µ 0 Otossuure: Z = X µ 0 σ/ n Testisuureen Jakauma : Z N(0, 1), kun µ = µ 0

43 Nollahypoteesin hylkäysehto eri tapauksissa Tapaus 1: z > z 1 α/2 P( Z > z ) = 2[1 Φ( z )] Tapaus 2:z > z 1 α P(Z > z) = 1 Φ(z) Tapaus 3:z < z 1 α P(Z < z) = Φ(z)

44 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Odotusarvon testaus, varianssi tuntematon: 133 Oletukset: X i N(µ, σ 2 ), i = 1,..., n, otos pieni ja σ 2 tuntematon. Hypoteesit: Tapaus 1: Tapaus 2: Tapaus 3: H 0 : µ = µ 0 H 0 : µ = µ 0 H 0 : µ = µ 0 H 1 : µ µ 0 H 1 : µ > µ 0 H 1 : µ < µ 0 Otossuure: T = X µ 0 s/ n Testisuureen Jakauma : T t(n 1), kun µ = µ 0

45 Nollahypoteesin hylkäysehto eri tapauksissa Tapaus 1: t > t 1 α/2 (n 1) P = P(T > t ) = P(T > t ) + P(T < t ) Tapaus 2:t > t 1 α (n 1) P = P(T > t) Tapaus 3:t < t 1 α (n 1) P = P(T < t)

46 Generaattoreita valmistava tehdas ilmoittaa laitteen ulostulojännitteeksi 120 V. Mittaamalla saatiin 20:n suuruisesta otoksesta keskiarvoksi x = ja keskihajonnaksi s = 2.1. Voidaanko valmistajan ilmoituksen katsoa pitävän paikkaansa? Suorita kaksisuuntainen testaus riskitasolla α = Olkoon X N(µ, σ 2 ) jännitearvo H 0 : µ = 120 H 1 : µ 120 Otos : n = 20, x = 118.6, s = 2.1 Pieni otos, hajonta tuntematon testisuure T = x µ 0 s/ n t(n 1) H 0 hylätään riskitasolla α = 0.01, jos T > t 1 α/2 (n 1) = t 0,995 (19) = 2.86 Testisuureen arvo T = 118, ,1/ 20 = 2.98 Koska T > 2.86, H 0 hylätään: µ 120V

47 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Suhteellisen osuuden testaus, Suuri otos: 136 Oletukset: Hypoteesit: Kokoa n oleva otos (suuresta tai äärettömästä) perusjoukosta, jossa tutkittavan ominaisuuden/ tapahtuman suhteellinen osuus on p. Esiintymiskertojen määrä otoksessa: X Bin(n, p). Otoskoko n niin suuri, että normaalijakauma-approksimaatiota voi käyttää. Tapaus 1: Tapaus 2: Tapaus 3: H 0 : p = p 0 H 0 : p = p 0 H 0 : p = p 0 H 1 : p p 0 H 1 : p > p 0 H 1 : p < p 0 Otossuure: Z = ˆp p 0 p 0 (1 p 0 ) n N(0, 1) missä ˆp = x/n on tutkittavan tapahtuman suhteellinen osuus otoksessa.

48 Nollahypoteesin hylkäysehto eri tapauksissa Tapaus 1: z > z 1 α/2 P( Z > z ) = 2[1 Φ( z )] Tapaus 2:z > z 1 α P(Z > z) = 1 Φ(z) Tapaus 3:z < z 1 α P(Z < z) = Φ(z)

49 Erään aikakausilehden järjestämään yleisökilpailuun osallistuneista oli puolet lehden tilaajia. Yhteensä sadasta palkinnosta 58 meni lehden tilaajille ja vain 43 muille. Voidaanko tästä vetää johtopäätös, että arvonnasaa suosittiin lehden tilaajia vai oliko kaikilla sama mahdollisuus voittoon? X = tilaajien määrä voittajien joukossa X Bin(100, p) missä p = tilaajien osuus voitosta H 0 : p = 0, 5 H 1 : p > 0, 5 Otos : n = 100, ˆp = x/n = 58/100 = 0, 58 Testisuure ˆp P z = 0 N(0, 1), koska, n suuri ja, np (P0 0(1 P 0 ) > 9 (1 P 0 )/n z = 0,58 0,5 (0,5 0,5)/100 = 1, 60 H 0 hylätään riskillä α, jos Z > z 1 α α = 0, 05, z 1 α = z 0,95 = 1, 645 H 0 hyväksytään α = 0, 01, z 1 α = z 0,99 = 2, 33 H 0 hyväksytään

50 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Suhteellisen osuuden testaus, pieni otos: 139 Hypoteesit kuten edellä, nyt testisuureena X Bin(n, p), jonka arvo on otoksessa x. Nollahypoteesin hylkäysehto eri tapauksissa x ( ) n Tapaus 1: P(X x) = p0 k (1 p 0 ) n k < α/2 tai k P(X x) = n k=x Tapaus 2: P(X x) = Tapaus 3:P(X x) = k=0 ( ) n p0 k (1 p 0 ) n k < α/2 k n ( n k=x x k=0 k ) p k 0 (1 p 0 ) n k < α ( ) n p0 k (1 p 0 ) n k < α k

51 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Varianssitesti 140 Oletukset: X i N(µ, σ 2 ), i = 1,..., n Hypoteesit: Tapaus 1: Tapaus 2: Tapaus 3: H 0 : σ 2 = σ0 2 H 0 : σ 2 = σ0 2 H 0 : σ 2 = σ0 2 H 1 : σ 2 σ0 2 H 1 : σ 2 > σ0 2 H 1 : σ 2 < σ0 2 Otossuure: χ 2 = (n 1)s2 σ 2 0 χ 2 (n 1), kun σ = σ 0

52 Nollahypoteesin hylkäysehto eri tapauksissa Tapaus 1: χ 2 < χ 2 α/2 (n 1) tai χ 2 > χ 2 1 α/2 (n 1) Tapaus 2:χ 2 > χ 2 1 α (n 1) Tapaus 3:χ 2 < χ 2 α(n 1)

53 Tutkittiin robottikäden tarkkuutta mittaamalla sen kosketuskohdan etäisyys tarkoitetusta kosketuspisteestä. Etäisyyden otoshajonnaksi saatiin 25 mittauksesta s=0.92 mm. Testaa riskitasoa α = 0.05 käyttäen hypoteesit H 0 : σ 0.80 H 1 : σ > 0.80 Olkoon että etäisyys kosketuskohdasta X N(µ, σ 2 ) H 0 : σ 0.8 H 1 : σ > 0.8 Testisuure χ 2 = (n 1)s2 σ 2 0 Otos n=25 s=92 χ 2 = 24 0,922 0,8 2 = χ 2 (n 1) H 0 hylätään riskitasolla α = 0.05, jos χ 2 > χ 2 1 α (n 1) = χ2 0,95 (24) = Hylkäysehto ei ole voimassa H 0 jää voimaan

54 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Odotusarvojen vertailu, varianssi tunnetaan: 143 Oletukset: Hypoteesit: Otossuure: Kaksi perusjoukkoa, joissa riippumattomat otokset kokoa n 1 ja n 2 satunnaismuuttujista X 1 N(µ 1, σ1 2) ja X 2 N(µ 2, σ2 2 ). Varianssit tunnetaan tai otoskoot suuria Tapaus 1: Tapaus 2: H 0 : µ 1 µ 2 = d H 0 : µ 1 µ 2 d H 1 : µ 1 µ 2 d H 1 : µ 1 µ 2 > d Tapaus 3: H 0 : µ 1 µ 2 d H 1 : µ 1 µ 2 < d Z = x 1 x 2 d N(0, 1) kun µ σ 2 1 µ 2 = d 1 n 1 + σ2 2 n 2

55 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Odotusarvojen vertailu, varianssit tuntemattomia: 144 Oletukset: Hypoteesit: Otossuure: Kaksi perusjoukkoa, joissa riippumattomat (pienet) otokset kokoa n 1 ja n 2 satunnaismuuttujista X 1 N(µ 1, σ1 2) ja X 2 N(µ 2, σ2 2 ). Varianssit tuntemattomia, mutta yhtäsuuria σ1 2 = σ2 2 Kuten edellä T = x 1 x 2 d 1 s p + 1 t(n 1 + n 2 2) kun µ 1 µ 2 = d n 1 n 2 missä s 2 p = (n 1 1)s (n 2 1)s 2 2 n 1 + n 2 2

56 Vertailtiin kahta paperin puhkaisumittaria, jota varten poimittiin sattumanvaraisesti 40 näytettä samasta paperilaadusta ja mitattiin kummallakin mittarilla 20 näytettä. Tulokset olivat: n 1 = 20 n 2 = 20 x 1 = 58.0 m 2 x 2 = 55.6 m 2 = 4.0 m4 s = 3.8 m4 s 2 1 Tutkitaan, antavatko mittarit keskimäärin samanlaisia tuloksia: 2 2 H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 Riskitaso α = 0.05 Koska varianssit ovat tuntemattomia mutta yhtäsuuria ja otokset pieniä, käytetään t-testiä s 2 p = (n 1 1)s (n 2 1)s 2 2 n 1 + n 2 2 = = 3.9

57 t = x 1 x 2 s p 1 n n 2 = ( ) = H 0 hylätään, jos t > t 1 α/2 (n 1 + n 2 2) = t (38) 2.02 Johtopäätös: H 0 hylätään, mittareilla on systemaattista eroa.

58 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Varianssien vertailu 147 Oletukset: Hypoteesit: Kaksi perusjoukkoa, joissa riippumattomat otokset kokoa n 1 ja n 2 satunnaismuuttujista X 1 N(µ 1, σ 2 1 ) ja X 2 N(µ 2, σ 2 2 ). Tapaus 1: Tapaus 2: Tapaus 3: H 0 : σ1 2 = σ2 2 H 0 : σ1 2 = σ2 2 H 0 : σ1 2 = σ2 2 H 1 : σ1 2 σ2 2 H 1 : σ1 2 > σ2 2 H 1 : σ1 2 < σ2 2 Otossuure: F = s2 1 s 2 2 F (n 1 1, n 2 1), kun σ 2 1 = σ2 2

59 Nollahypoteesin hylkäysehto eri tapauksissa Tapaus 1: F < 1/F 1 α/2 (n 2 1, n 1 1) tai F > F 1 α/2 (n 1 1, n 2 1) Tapaus 2:F > F 1 α (n 1 1, n 2 1) Tapaus 3:F < 1/F 1 α (n 2 1, n 1 1)

60 Vertailtiin kahta paperin puhkaisumittaria, jota varten poimittiin sattumanvaraisesti 40 näytettä samasta paperilaadusta ja mitattiin kummallakin mittarilla 20 näytettä. Tulokset olivat: n 1 = 20 n 2 = 20 x 1 = 58.0 m 2 x 2 = 55.6 m 2 = 4.0 m4 s = 3.8 m4 s 2 1 Testataan menetelmien varianssien yhtäsuuruus: 2 2 H 0 : σ 2 1 = σ2 2 H 1 : σ 2 1 σ2 2 Riskitaso α = 0.05 Testisuure: F = s1 2/s2 2 F (19, 19) H 0 hylätään, jos F < F (19, 19) tai F > F (19, 19) Testisuureen arvo on F = 4.0/3.8 = 1.05 Kriittiset arvot ovat F (19, 19) = 1/F (19, 19) = 1/2.5 = 0.4 ja F (19, 19) = 2.5 H 0 jää voimaan

61 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä Odotusarvojen vertailu, parittaiset havainnot: 150 Oletukset: Hypoteesit: Muuttujien X N(µ 1, σ 2 1 ) ja Y N(µ 2, σ 2 2 ) arvo. mitataan n:stä tilastoyksiköistä, riippumattomana otoksena havaintoparit (x i, y i ), i = 1,..., n. Tapaus 1: Tapaus 2: Tapaus 3: H 0 : µ 1 = µ 2 H 0 : µ 1 µ 2 H 0 : µ 1 µ 2 H 1 : µ 1 µ 2 H 1 : µ 1 > µ 2 H 1 : µ 1 > µ 2 Satunnaismuuttuja D i = X i Y i N(µ D, σd 2 ), missä µ D = µ 1 µ 2. Testaus palautuu yhden otoksen odotusarvotestiin. Otossuure: T = d s d / t(n 1) n missä d on erotusten otoskeskiarvo ja s d erotusten otoshajonta.

62 Malmin rautapitoisuus määritettiin kahdeksasta malminäytteestä, kustakin kahdella eri menetelmällä. Antavatko menetelmät samanlaisia tuloksia? Men Men Ero d i Kaksisuuntainen testi, H 0 : µ 1 = µ 2, H 1 : µ 1 µ 2 Valitaan riskitasoksi α = 0.05 H 0 hylätään, jos t > t 1 α/2 (n 1) = t (7) = 2.65 Testisuureen arvo t = n = 8, d = , s 2 d = d s d / n = /8 = H 0 jää voimaan: menetelmät antavat samanlaisia tuloksia

63 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -yhteensopivuustesti: 152 Seuraavassa tutkitaan tilastollisesti, noudattaako satunnaismuuttuja X annettua jakaumaa, jota tässä merkitään symbolisesti γ:lla. Jakauma voi olla diskreetti tai jatkuva. Hypoteesit: H 0 : X noudattaa jakaumaa γ H 1 : X ei noudata jakaumaa γ

64 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -yhteensopivuustesti: 153 1) Diskreetti satunnaismuuttuja Oletetaan että satunnaismuuttujalla X on äärellinen, diskreetti jakauma ja sen mahdolliset arvot ovat x 1,..., x k todennäköisyyksin p 1,..., p k, ts. P(X = x i ) = p i, i = 1,..., k Luvut p i ovat tuntemattomia. Olkoot tunnetun jakauman γ mukaiset eri arvojen todennäköisyydet π i i = 1,..., k. Havaintoaineisto: n:n suuruinen otos satunnaismuuttujasta X, josta arvoja x i havaitaan f i kpl. Näitä kutsutaan havaituiksi frekvensseiksi ja f i = n

65 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -yhteensopivuustesti: 154 Testin periaate: verrataan havaittuja frekvenssejä f i jakauman γ mukaisiin odotettuihin frekvensseihin e i, jotka ovat e i = nπ i Hypoteesit: H 0 : p i = π i kaikilla i = 1,..., k H 1 : p i π i ainakin joillakin i k Testisuure: χ 2 (f i e i ) 2 =, missä e i = nπ i Jakauma: i=1 e i Kun H 0 on voimassa χ 2 χ 2 (k 1) asymptoottisesti.

66 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -yhteensopivuustesti: 155 Hylkäysehto: Jakaumahypoteesi H 0 hylätään riskitasolla α, jos χ 2 > χ 2 1 α (k 1) Testin käytön edelletykset: 1) havainnot riippumattomat 2) n 50 3) kaikki odotetut frekvenssit e i 2 4) korkeintaan 20% odotetuista frekvensseistä < 5 Ääretön diskreetti jakauma: Havaitut satunnaismuuttujan arvot kuuluvat aina jollekin äärelliselle välille.

67 Olkoon X tietokoneen toimintahäiriöiden lukumäärä päivässä. Tutkitaan noudattaako X Poisson-jakaumaa. Havainnot H 0 : H 1 : X noudattaa Poisson-jakaumaa X ei noudata Poisson-jakaumaa x i f i n = f i = 100 Poisson(λ)-jakauman parametri on jakauman odotusarvo λ = EX. Sen estimaatti on otoskeskiarvo k ˆλ = x = 1 n f i x i = ( )/100 = 1.5 i=1 Poisson(1.5)-jakauman mukaiset todennäköisyydet: x i π i

68 Odotetut frekvenssit e i = nπ i : x i e i Testin käytön edellytykset 3 ja 4 eivät ole voimassa, joten yhdistetään kaksi viimeistä luokkaa, jolloin saadaan frekvenssit: Testisuureen arvo χ 2 = x i f i e i ( ) (4 6.6)2 6.6 = 3.37 Koska estimoitiin l = 1 parametri ja lopullinen luokkien lukumäärä k = 5, on testisuureen jakauma χ 2 (k 1 l) = χ 2 (3) Valitaan α = 0.05 χ (3) = 7.81 H 0 jää voimaan

69 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -yhteensopivuustesti: 158 2) Jatkuva satunnaismuuttuja Testataan, noudattaako jatkuva satunnaismuuttuja X jakaumaa, jonka kertymä funktio olkoon F. Ennen testisuureen arvon laskemista satunnaismuuttujan arvojoukko luokitellaan eli jaetaan äärelliseksi määräksi osavälejä: E 1 = (c 0, c 1 ] E 2 = (c 1, c 2 ]. E k = (c k 1, c k ] Testisuureen laskenta suoritetaan samalla tavalla kuin diskreetissä tapauksessa.

70 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -riippumattomuustesti: 159 Tutkitaan ovatko kaksi luokittelutasoista satunnaismuuttujaa X ja Y välillä riippuvuutta. Riippuvuus käsitetään tässä mahdollisimman yleisesti: se voi merkitä mitä tahansa yhteyttä ominaisuuksien X ja Y välillä, ei välttämättä suoraa vuorovaikutusta tai syy-seuraussuhdetta. Havaintoaineisto annetaan kontingenssitaulukkona, joka saadaan ristiintaulukoimalla kaksi muuttujaa X ja Y.

71 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -riippumattomuustesti: 160 F 1 F 2... F m E 1 n 11 n n 1m r 1 E 2 n 21 n n 2m r E k n k1 n k2... n km r k c1 c 2... c m n Missä E i,..., E k ovat muuttujan X luokat ja F i,..., F m muuttujan Y luokat n ij on niiden havaintojen (x, y) lukumäärä, joilla x E i, y F j

72 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -riippumattomuustesti: 161 Hypoteesi: tai H 0 : X ja Y riippumattomat H 1 : X :n ja Y :n välillä on riippuvuutta H 0 : Y :n vaakarivijakaumat samanlaisia X :n eri luokissa H 1 : Y :n vaakarivijakaumissa eroa tai H0: X :n pystyrivijakaumat samanlaisia Y :n eri luokissa H1: X :n pystyrivijakaumissa eroa. k m Testisuure: χ 2 (n ij e ij ) 2 = missä e ij = r i c j n i=1 j=1 Jakauma: Kun H 0 on voimassa χ 2 χ 2 ((k 1)(m 1)) asymptoottisesti. e ij

73 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä χ 2 -riippumattomuustesti: 162 Hylkäysehto: Jakaumahypoteesi H 0 hylätään riskitasolla α, jos χ 2 > χ 2 1 α ((k 1)(m 1)) Testin käytön edelletykset: 1) havainnot riippumattomat 2) n 50 3) kaikki odotetut frekvenssit e i 2 4) korkeintaan 20% odotetuista frekvensseistä < 5

74 Tutkitaan tupakoiniin harrastamista tyttöjen ja poikien keskuudesssa, kun haastattelemalla 40 tyttöä ja 60 poikaa on saatu seuraava kontingenssitaulu: Kyllä Ei Tytöt Pojat Nollahypoteesi voidaan lausua muodossa: H 0 : tupakointi ei riipu sukupuolesta Odotetut frekvenssit e ij : Kyllä Ei Tytöt Pojat Testisuureen arvon laskeminen: χ 2 = (5 10) (35 30) (20 15) (40 45)2 45 = 5.56

75 Luokkien lukumäärät ovat k = 2, m = 2, joten testisuureen jakauma on χ 2 ((k 1)(m 1)) = χ 2 (1). Valitaan riskitasoksi α = 0.05, jolloin testin kriittinen arvo on χ 2 1 α (1) = χ (1) = 3.84 Koska laskettu arvo χ 2 = 5.56 > 3.84 = χ (1), niin H 0 hylätään.

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

Hypoteesin testaus Alkeet

Hypoteesin testaus Alkeet Hypoteesin testaus Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Johdanto Kokeellinen tutkimus: Varmennetaan teoreettista olettamusta fysikaalisen systeemin käyttäytymisestä

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014 1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 4

031021P Tilastomatematiikka (5 op) viikko 4 031021P Tilastomatematiikka (5 op) viikko 4 Jukka Kemppainen Mathematics Division Tilastollinen aineisto Tilastolliset menetelmät ovat eräs keino tutkia numeerista havaintoaineistoa todennäköisyyslaskentaa

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden 1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma

Lisätiedot

11. laskuharjoituskierros, vko 15, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut 11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa

Lisätiedot

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5 TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä

Lisätiedot

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1 Tilastolliset menetelmät Osa 1: Johdanto Johdanto tilastotieteeseen KE (2014) 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä ja malleja, joiden avulla reaalimaailman ilmiöistä voidaan

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia. Tehtävien ratkaisuja 4. Palloja yhteensä 60 kpl. a) P(molemmat vihreitä) = P((1. pallo vihreä) ja (. pallo vihreä)) = P(1. pallo vihreä) P(. pallo vihreä 1. pallo vihreä) = 0.05 (yleinen kertolaskusääntö)

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen MTTTP5, kevät 2016 4.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen 1. Laitosneuvostoon valitaan 2 professoria, 4 muuta henkilökuntaan kuuluvaa jäsentä sekä 4 opiskelijaa. Laitosneuvostoon

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 017 Laskuharjoitus 4, Kotitehtävien palautus Mycourses:iin PDF-tiedostona

Lisätiedot

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen Tilastollisen analyysin perusteet Luento 5: Sisältö Tilastotieteessä tehdään usein oletuksia havaintojen jakaumasta. Useat tilastolliset menetelmät toimivat tehottomasti tai jopa virheellisesti, jos jakaumaoletukset

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II G. Gripenberg Aalto-yliopisto 11. helmikuuta 2015 G. Gripenberg (Aalto-yliopisto) MS-A0502 Todennäköisyyslaskennan ja tilastotieteen

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Batch means -menetelmä

Batch means -menetelmä S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 1(9) Batch means -menetelmä Batch means -menetelmää käytetään hyvin yleisesti Simulointi suoritetaan tässä yhtenä pitkänä ajona olkoon simuloinnin

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

3.6 Su-estimaattorien asymptotiikka

3.6 Su-estimaattorien asymptotiikka 3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot