Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Samankaltaiset tiedostot
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Väliestimointi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Harjoitus 7: NCSS - Tilastollinen analyysi

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

10. laskuharjoituskierros, vko 14, ratkaisut

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Tilastollisia peruskäsitteitä ja Monte Carlo

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Lohkoasetelmat. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

1. Tutkitaan tavallista kahden selittäjän regressiomallia

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Sovellettu todennäköisyyslaskenta B

Lohkoasetelmat. Kuusinen/Heliövaara 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

HAVAITUT JA ODOTETUT FREKVENSSIT

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Testit laatueroasteikollisille muuttujille

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Mat Sovellettu todennäköisyyslasku A

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Estimointi. Otantajakauma

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Genetiikan perusteet 2009

pisteet Frekvenssi frekvenssi Yhteensä

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Tilastotieteen jatkokurssi syksy 2003 Välikoe

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Testejä suhdeasteikollisille muuttujille

11. laskuharjoituskierros, vko 15, ratkaisut

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

031021P Tilastomatematiikka (5 op) viikko 5

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Todennäköisyyden ominaisuuksia

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

riippumattomia ja noudattavat samaa jakaumaa.

Kertausluento. Vilkkumaa / Kuusinen 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Transkriptio:

Mat-.103 Koesuunnittelu ja tilastolliset mallit Harjoitus 8, kevät 004 Esimerkkiratkaisut. 1. Myrkyllistä ainetta oli kaadettu jokeen, joka johtaa suurelle kalastusalueelle. Tie- ja vesirakennusinsinöörit tutkivat tapaa, jolla vesi kuljettaa myrkyllistä ainetta, mittaamalla myrkkypitoisuuksia kolmesta eri paikasta pyydystetyistä ostereista. Saatiin seuraavanlainen aineisto: Paikka 1 Paikka Paikka 3 15 19 6 15 6 0 10 4 0 6 6 9 11 15 8 0 17 1 13 4 6 15 18 Testaa onko myrkkypitoisuus eri ryhmissä sama. (Summat: i [Milton-Arnold: 13.1.5] j Y ij = 10546, T 1 = 185, T = 147, T 3 = 154) RATK. Lasketaan kaikkien havaintoarvojen summa: T = T i = 185 + 147 + 154 = 486. Lasketaan kaikkien havaintoarvojen lukumäärä: n 1 = 8, n = 9, n 3 = 7, n = n i = 8 + 9 + 7 = 4. 1

Lasketaan neliösummat: SS T = n i j=1 ij T n Y = 10546 486 4 = 704.5, ja SS G = T i T n i n = 185 8 + 147 9 + 154 7 486 4 = 5.65. SS E = SS T SS G = 704.5 5.65 = 478.875. F = SS G/(k 1) SS E /(n k) = 5.65/(3 1) 478.875/(4 3) = 4.94714 Testisuure F noudattaa F,1 -jakaumaa nollahypoteesin H 0 : µ 1 = µ = µ 3 ollessa tosi. P-arvon laskeminen: Mellinin monisteen taulukosta 4.A saadaan ja taulukosta 4.C saadaan P-arvolle saadaan siis arvio P [F,1 3.467] = 5% = 0.05 P [F,1 5.780] = 1% = 0.01. 0.01 < P [F,1 4.94714] < 0.05 (Jotain tilasto-ohjelmistoa käyttämällä saadaan laskettua tarkka P- arvo P [F,1 4.94714] = 0.01736). Saadaan pieni ( melkein merkitsevä ) P-arvo, joten aineiston perusteella myrkkypitoisuudet näyttäisivät eroavan eri pyydystyspaikoissa.

. On testattu alumiinitankojen vetolujuutta. Neljäkymmentä samanlaista alumiinitankoa jaettiin satunnaisesti kolmeen yhtä suureen ryhmään. Jokaiselle ryhmälle annettiin erilaista lämpökäsittelyä ja sen jälkeen mitattiin tankojen vetolujuudet (mittayksikkö: 1000 pauna/tuuma ). Saatiin seuraavanlainen aineisto: Käsittely 1 3 4 18.9 18.3 1.3 15.9 0.0 19. 1.5 16.0 0.5 17.8 19.9 17. 0.6 18.4 0. 17.5 19.3 18.8 1.9 17.9 19.5 18.6 1.8 16.8 1.0 19.9 3.0 17.7.1 17.5.5 18.1 0.8 16.9 1.7 17.4 0.7 18.0 1.9 19.0 (a) Testaa yksisuuntaisen varianssianalyysin avulla onko eri käsittelyillä vaikutusta vetolujuuteen. (b) Testaa nollahypoteeseja H 0 : µ 1 µ + µ 3 µ 4 = 0 ja H 0 : µ 1 µ 3 = 0. (Summat: i T 4 = 173.5) j Y ij = 15194.1, T 1 = 03.4, T = 183.4, T 3 = 15.7, [Milton-Arnold: 13.3.(b) and 13.4.7] 3

RATK. (a) Lasketaan kaikkien havaintoarvojen summa: T = T i = 03.4 + 183.4 + 15.7 + 173.5 = 776. Lasketaan kaikkien havaintoarvojen lukumäärä: n 1 = n = n 3 = n 4 = 10, n = 4 10 = 40. Lasketaan neliösummat: SS T = n i j=1 ij T n Y = 15194.1 776 40 = 139.7 Ti SS G = T n i n = 03.4 + 183.4 + 15.7 + 173.5 776 10 10 10 10 40 = 109.186 SS E = SS T SS G = 139.7 109.186 = 30.514 F = SS G/(k 1) 109.186/(4 1) = SS E /(n k) 30.514/(40 4) = 4.9387 Testisuure F noudattaa F 3,36 -jakaumaa nollahypoteesin H 0 : µ 1 = µ = µ 3 = µ 4 ollessa tosi. P-arvon laskeminen: Mellinin monisteen taulukosta 4.C saadaan ja P [F 3,30 4.510] = 1% = 0.01 P [F 3,40 4.313] = 1% = 0.01. Näiden kahden arvon perusteella voidaan päätellä, että P [F 3,36 4.4] 0.01 4

P-arvolle saadaan siis arvio P [F 3,36 4.9387] < 0.01. (Tilasto-ohjelmistoja käyttämällä saadaan laskettua tarkka P-arvo P [F 3,36 4.9387] = 5.57764 10 1 ). Saadaan hyvin pieni ( erittäin merkitsevä ) P-arvo, joten nollahypoteesi voidaan hylätä. (b) Testataan nollahypoteesia H 0 : µ 1 µ + µ 3 µ 4 = 0 Kyseessä on kontrastin L 1 = k a iµ i testaus missä k = 4, a 1 = 1, a = 1, a 3 = 1, a 4 = 1. Lasketaan L 1 :n estimaatti ˆL 1 : ˆL 1 = a i Ȳ i = 1 03.4 10 1 183.4 10 + 1 15.7 10 1 173.5 = 6.. 10 Lasketaan summa Kohdan (a) perusteella: a i = 1 n i 10 + ( 1) + 1 10 10 + ( 1) 10 = 4 10 = 0.4. MS E = SS E /(n k) = 30.514/(40 4) = 0.8476111. Testisuureena on Q 1 /1 Q /(n k) = SS L 1 MS E missä ˆL 1 SS L1 = k a i n i on kontrastia L 1 vastaava neliösumma. Edellä oleva testisuure on F 1,n k -jakautunut, kun nollahypoteesi on tosi. SS L1 = 6. /0.4 = 96.71. 5

Q 1 /1 Q /(n k) = 96.71 0.8476111 = 114.1101. Lasketaan P-arvo: Mellinin monisteen taulukon 4.C perusteella ja P [F 1,30 7.56] = 0.01 P [F 1,40 7.314] = 0.01. Näiden kahden arvon perusteella voidaan päätellä, että P-arvolle saadaan siis arvio P [F 1,36 7.4] 0.01 P [F 1,36 114.1101] < 0.01. (Tilasto-ohjelmistoja käyttämällä saadaan laskettua tarkka P-arvo P [F 1,36 114.1101] = 1.03478 10 1 ). Saadaan erittäin merkitsevä P-arvo, joten nollahypoteesi voidaan hylätä. Siis aineiston perusteella näyttää siltä, että µ 1 µ + µ 3 µ 4 0 eli 1 (µ 1 + µ 3 ) 1 (µ + µ 4 ). Testataan seuraavaksi nollahypoteesia H 0 : µ 1 µ 3 = 0. Kyseessä on kontrastin L = k b iµ i testaus missä k = 4, b 1 = 1, b = 0, b 3 = 1, b 4 = 0. Lasketaan L :n estimaatti ˆL : ˆL = Lasketaan summa b i Ȳ i = 1 03.4 10 1 15.7 = 1.3. 10 b i = 1 n i 10 + ( 1) 10 = 0.. SS L = ( 1.3) /0. = 7.5645. 6

Q 1 /1 Q /(n k) = 7.5645 0.8476111 = 8.94494. Lasketaan P-arvo: Mellinin monisteen taulukon 4.C perusteella (katso kontrastin L 1 testaus) P-arvolle saadaan arvio P [F 1,36 8.94494] < 0.01. (Tilasto-ohjelmistoja käyttämällä saadaan laskettua tarkka P-arvo P [F 1,36 8.94494] = 0.005040638). Saadaan erittäin merkitsevä P-arvo, joten nollahypoteesi voidaan hylätä. Siis aineiston perusteella näyttää siltä, että µ 1 µ 3 0 eli µ 1 µ 3. 7

3. Kemian insinööri tutkii vasta kehitettyä polymeeriä, jota haluttaisiin käyttää myrkkyjätteiden poistamiseen vedestä. Puhdistuskoe suoritettiin viidessä eri lämpötilassa. Vedestä mitattiin kuinka suuri osa epäpuhtauksista (prosentteina) saatiin poistettua uuden polymeerin avulla. Lämpötila I II III IV V 40 36 49 47 55 35 4 51 49 60 4 38 53 51 6 48 39 53 5 63 50 37 5 50 59 51 40 50 51 61 (a) Testaa eroavatko eri ryhmät toisistaan. (b) Anna kontrasti, jota voidaan käyttää populaation 5 keskiarvon vertaamiseen neljän muun populaation yhdistettyyn keskiarvoon. Testaa onko tämän kontrastin arvo nolla. (Summat: i j Y ij = 73468, T 1 = 66, T = 3, T 3 = 308, T 4 = 300, T 5 = 360) [Milton-Arnold: 13.4.8, 13.4.30] RATK. (a) Lasketaan kaikkien havaintoarvojen summa: T = T i = 66 + 3 + 308 + 300 + 360 = 1466. Lasketaan kaikkien havaintoarvojen lukumäärä: n 1 = n = n 3 = n 4 = n 5 = 6, n = 5 6 = 30. 8

Lasketaan neliösummat: SS T = n i j=1 ij T n Y = 73468 1466 = 188.467 30 Ti SS G = T n i n = 66 + 3 + 308 + 300 + 360 1466 6 6 6 6 6 30 SS E = SS T SS G = 189.467 1535.467 = 94.0. = 1535.467 F = SS G/(k 1) 1535.467/(5 1) = SS E /(n k) 94.0/(30 5) = 3.64173. Testisuure F noudattaa F 4,5 -jakaumaa nollahypoteesin H 0 : µ 1 = µ = µ 3 = µ 4 = µ 5 ollessa tosi. P-arvon laskeminen: Mellinin monisteen taulukosta 4.C saadaan joten P-arvolle saadaan arvio P [F,5 5.568] = 1% = 0.01, P [F,5 3.64173] < 0.01. (Tilasto-ohjelmistoja käyttämällä saadaan laskettua tarkka P-arvo P [F,5 3.64173] = 1.069418 10 7 ). Saadaan hyvin pieni ( erittäin merkitsevä ) P-arvo, joten nollahypoteesi voidaan hylätä. Aineiston perusteella ryhmien odotusarvot näyttäisivät eroavan toisistaan. (b) Testataan hypoteesia H 0 : 1 4 (µ 1 + µ + µ 3 + µ 4 ) = µ 5 eli hypoteesia H 0 : µ 1 + µ + µ 3 + µ 4 4µ 5 = 0 9

Kyseessä on kontrastin L 1 = k a iµ i testaus missä k = 5, a 1 = 1, a = 1, a 3 = 1, a 4 = 1 ja a 5 = 4. Lasketaan L 1 :n estimaatti ˆL 1 : ˆL 1 = a i Ȳ i = 1 66 6 +1 3 6 +1 308 6 +1 300 6 4 360 6 = 55.66667. Lasketaan summa a i = 1 n i 6 + 1 6 + 1 6 + 1 6 + ( 4) 6 = 3.33333. SS L = ( 55.66667) /3.33333 = 99.6333. Q 1 /1 Q /(n k) = SS L = 99.6333 = 79.05045. MS E 11.76 Lasketaan P-arvo: Mellinin monisteen taulukon 4.C perusteella joten P-arvolle saadaan arvio P [F 1,5 7.770] = 0.01, P [F 1,5 79.05045] < 0.01. (Tilasto-ohjelmistoja käyttämällä saadaan laskettua tarkka P-arvo P [F 1,5 79.05045] = 3.51187 10 9 ). Saadaan erittäin merkitsevä P-arvo, joten nollahypoteesi voidaan hylätä. Siis aineiston perusteella näyttää siltä, että 1 4 (µ 1 + µ + µ 3 + µ 4 ) µ 5. 10