Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Samankaltaiset tiedostot
Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op) "kynä-paperi"-harjoitukset/til

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Väliestimointi (jatkoa) Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Sovellettu todennäköisyyslaskenta B

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 5

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Harjoitus 7: NCSS - Tilastollinen analyysi

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Otoskoko 107 kpl. a) 27 b) 2654

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

HAVAITUT JA ODOTETUT FREKVENSSIT

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

dx=5&uilang=fi&lang=fi&lvv=2014

pisteet Frekvenssi frekvenssi Yhteensä

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Jatkuvat satunnaismuuttujat

11. laskuharjoituskierros, vko 15, ratkaisut

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Todennäköisyyden ominaisuuksia

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

Sovellettu todennäköisyyslaskenta B

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

5 Lisa materiaali. 5.1 Ristiintaulukointi

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Otantajakauma

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Estimointi. Vilkkumaa / Kuusinen 1

riippumattomia ja noudattavat samaa jakaumaa.

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

P5: Kohti Tutkivaa Työtapaa Kesä Aritmeettinen keskiarvo Ka KA. Painopiste Usein teoreettinen tunnusluku Vähintään välimatka-asteikko.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

10. laskuharjoituskierros, vko 14, ratkaisut

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Testejä suhdeasteikollisille muuttujille

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

6. laskuharjoitusten vastaukset (viikot 10 11)

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

ikä (vuosia) on jo muuttanut 7 % 46 % 87 % 96 % 98 % 100 %

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Testit järjestysasteikollisille muuttujille

2. TILASTOLLINEN TESTAAMINEN...

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Tilastollinen aineisto Luottamusväli

Transkriptio:

Kynä-paperi -harjoitukset Taina Lehtinen 43

Loput ratkaisut harjoitustehtäviin 44

Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu pistemäärällään 34 vajaan keskihajonnan mitan (-0.75) päähän keskiarvon alapuolelle Kalle on keskimääräistä vähemmän stressaantunut Ville sijoittuu pistemäärällään (1.5) keskiarvon yläpuolelle Ville on keskimääräistä stressaantuneempi 45

Testin z-pisteet ilmaisevat tarkasteltavien arvojen (Kallen ja Villen pisteet) etäisyyden keskiarvosta kun mittayksikkönä keskihajonta z Kalle = -0.75 z Ville = vähemmän stressiä enemmän stressiä Kalle Ville Helsingin 46 yliopisto

Pisteen alapuolella oleva alue Kaksi keskihajonnan mittaa keskiarvon yläpuolella oleva piste.5 % 100 % -.5 % = 97.5 % (muitakin tapoja ratkaista)

merkintätapa muuttujalle, joka on normaalijakautunut Paino ~ N(59, 3) Väli [53 kg, 6 kg]? 95% 68% 81.5% Välille [53 kg, 6 kg] sijoittuu tapauksista 81.5 %. 95% 68% 50 53 56 59 6 65 68

Ratkaise seuraavat tehtävät luennolla jaetun kertymäfunktioarvotaulukon avulla: Olkoon Z ~ N(0,1). Laske a. P(Z 0.8) = 0.7939 b. P(Z 0.8) = 1-0.7939 = 0.601 c. P(-1.96 Z +1.96) = 0.9750-0.050 = 0.950 49

Olkoon Z ~ N(0,1). Laske z, kun d. P(Z z) = 0.43 Etsitään taulukosta -arvo = 0.4300 Lähinnä olevan -arvon (0.486) z = -0.18 e. P(Z z) = 0.43 1-0.4300 = 0.5700 Etsitään taulukosta -arvo = 0.5700 Lähinnä olevan -arvon (0.5714) z = +0.18 f. P(-z Z z) = 0.95 1-0.9500 = 0.05/ = 0.05 Etsitään taulukosta -arvo = 0.050 ja 1-0.050 -arvon (0.050) z = -1.96 -arvon (1-0.050 = 0.975) z = +1.96 50

Olkoon X ~ N(117, 3). Laske g. P(X 13) eli mikä tn. että muuttuja saa arvon 13 z 13117 3 0.608 Etsitään taulukosta (0.6) = 0.606 h. P(X 110) ensin: mikä tn. että muuttuja saa arvon 110 110 117 z 0.3043 3 ( 0.3043) 0.381 Tehtävässä kysytään yläpuolella () olevaa aluetta (tn.) joten 1 0.381 = 0.6179 51

Olkoon X ~ N(117, 3). Laske i. P(100 X 140) eli väliin jäävä alue (tn.) z 140117 3 1 (1) 0.8413 z 100117 0.7391 3 ( 0.74) 0.96 Kysytään väliin jäävää aluetta (tn.) eli 0.84130.96 = 0.6117 5

Reaktionopeutta koskeva tutkimus: =460 ms s=80 http://davidmlane.com/hyperstat/z_table.html a. Kuinka suuri osa vastaajista on saanut tuloksen 540 tai enemmän? 15.9 % 0.1587 b. Kuinka suuri osa vastaajista on saanut tuloksen 440 tai vähemmän? 40.1 % 0.4013 c. Kuinka suuren osan tulos sijoittuu arvojen 390 ja 550 välille? 67.9 % 0.6789 53

d. Mikä on alimman 10%:n tulosraja? 358 0.10119999999999996 357 0.09899999999999998 e. Minkä arvon yläpuolelle sijoittuu 30% vastaajista? 500 0.3085 501 0.304 54

Tentistä on mahdollista saada 0.0, 1.0,, 10.0 pistettä. Kesäopetuksen ryhmän tentin pisteiden keskiarvo oli 6.7 ja keskihajonta 1.. (Tulokset noudattivat normaalijakaumaa.) Montako % kesäopetuksen ryhmän opiskelijoista sai 6 pistettä? (Pisteet 5.56.4 tulkitaan 6:ksi pisteeksi)

Lasketaan arvoille 5.5 ja 6.4 z -pisteet ja katsotaan niihin liittyvät kertymäfunktioarvot z 6.4 6.7 1. 0.5 Mikä on z -pisteen -0.5 -arvo? (Kuinka monta % pinta-alasta [tai todennäköisyydestä, tn.] sijoittuu z -pisteen -0.5 alapuolelle?) (-0.5) = 0.4013

z 5.5 6.7 1. 1 Mikä on z -pisteen -1.0 -arvo? (Kuinka monta % pinta-alasta [tn.] sijoittuu z -pisteen - 1.0 alapuolelle?) (-0.1) = 0.1587 Saatujen z-pisteiden -arvojen erotus 0.40130.41587 = 0.46 Tentin osallistujista 4.3% sai 6 pistettä

Haluttuun oppilaitokseen haki 91 opiskelijaa Oppilaitokseen hakijoiden älykkyysosamäärä normaalisti jakautunut ÄO ~ N(115, 8) Opintojen suorittaminen edellyttää vähintään ÄO 110 eli ÄO 110 Kuinka monella 91 hakijasta todennäköisesti olisi mahdollisuus älykkyytensä puolesta selviytyä opinnoista? 58

Lasketaan (vaaditun ÄO:n) arvolle 110 z-pistemäärä ja katsotaan siihen liittyvä todennäköisyys/pinta-ala (= kertymäfunktioarvo ) Ensin z-piste: 110 z 115 8 0.63 Mikä on z-pisteen -0.63 -arvo? (eli Kuinka monta % pinta-alasta [tn.] sijoittuu z-pisteen -0.63 alapuolelle?) (-0.63) = 0.643 59

Edellyttää vähintään 110 eli mikä on todennäköisyys sijoittua yli z-pisteen -0.63? z-pisteen -0.63 yläpuolella oleva pinta-ala [tn.]? 1 0.643 = 0.7357 (tn. sijoittua yli 110 pisteen on 73.57%) Kuinka paljon on 73.57% 91:stä? Riittävä ÄO olisi 0.7357 * 91 14 hakijalla -0.63 60

Tilastollisen päättelyn kurssin tenttiin osallistui 106 kt-opiskelijaa Tulokset olivat normaalijakautuneet keskiarvolla 66 pistettä, hajonnalla 5 pistettä Kuinka moni tenttiin osallistuneista opiskelijoista sai pistemäärän, joka sijoittuu välille [60, 70]? 61

Lasketaan välin [60, 70] tenttipisteille z-pisteet 70 66 60 66 zalaraja 1. z yläraja 0. 8 5 Mikä on z-pisteen -1. -arvo? (eli Kuinka monta % pinta-alasta [tn.] sijoittuu z-pisteen -1. alapuolelle?) (-1.) = 0.1151 5 Mikä on z-pisteen 0.8 -arvo? (eli Kuinka monta % pinta-alasta [tn.] sijoittuu z-pisteen 0.8 alapuolelle?) (0.8) = 0.7881 6

Mikä on tn. sijoittua z-pisteiden -1. ja 0.8 väliin? Eli z-pisteiden -1. ja 0.8 välille jäävä pinta-ala? 0.7881 0.1151 = 0.673 eli ~ 67 % Kuinka paljon on 67% 106:sta? 67%/100 * 106 Pistemäärän välille [60, 70] saavia olisi 0.673 * 106 eli 71 opiskelijaa 63

Kaksi otosta (länsisuomalaiset miehet N = 8; itäsuomalaiset miehet N = ), testimuuttuja pituus keskiarvomuuttuja länsisuomalaiset = 176., s = 13.9 itäsuomalaiset = 174.3, s = 13.7 H 0 : Länsi- ja itäsuomalaiset miehet ovat yhtä pitkiä H 1 : Länsisuomalaiset miehet ovat pidempiä kuin itäsuomalaiset miehet Testaa 1 %:n merkitsevyystasolla 64

t x 1 s1 n 1 x s n t 176. 174.3 13.9 8 13.7 1.9 6.9008.531 1.9 3.98 0.483 t = 0.483 df = (n 1 + n 1) = 8 + 1 = 48 Katsotaan taulukosta (K-K: jatkokurssin liitteen Taulukko 3) df-riviltä 40 (on lähin) suunnatun testin eli yksisuuntaisen testin (koska H 1 olettaa länsi-suomalaisten olevan pidempiä) 1 %:n kriittinen arvo =.43 65

0 0.483 1 %.43 Saatu t-testisuure (0.483) ei sijoitu 1 %:n kriittiselle alueelle (hylkäämisalueelle), joten H 0 :aa ei voida hylätä. Tulkinta: Aineiston perusteella ei voida osoittaa, että länsisuomalaiset miehet olisivat keskimäärin pidempiä kuin itäsuomalaiset miehet. Nollahypoteesi jää voimaan. 66

9-luokkalaisten kiinnostus tietotekniikkaan Otos N = 500 Tiedetään frekvenssit (havaitut arvot) H 0 : Kiinnostus tietotekniikkaan on riippumaton sukupuolesta H 1 : Kiinnostus tietotekniikkaan riippuu sukupuolesta (erilaista tytöillä ja pojilla) Testaa 1 %:n merkitsevyystasolla 67

Ensin lasketaan kuhunkin taulukon solukkoon odotettu arvo (e ij ) reunafrekvenssien avulla e ij f i e n j 80*300 500... 0*00 500 Kiinnostunut Ei kiinnostunut Yhteensä Tytöt fij 160 eij 168 fij 10 eij 11 80 Pojat fij 140 eij 13 fij 80 eij 88 0 Yht. 300 00 500 68

Kun tiedetään kunkin solukon sekä havaitut arvot (f ij ) että odotetut arvot (e ij ), voidaan laskea -testisuurre k l ( e ij f ij ) e i1 j1 ij (168 160) 168 (11 10) 11 (13 140) 13 (88 80) 88.164 69

=.164 df = (rivien lkm 1) * (sarakkeiden lkm 1) = ( 1) * ( 1) = 1 Katsotaan taulukosta (K-K: jatkokurssin liitteen Taulukko 5) df-riviltä=1 1%:n kriittinen arvo = 6.6 Saatu -testisuure (.164) ei sijoitu 1 %:n kriittiselle alueelle (raja-arvo 6.6), joten H 0 :aa ei voida hylätä. Tulkinta: Aineiston perusteella ei voida osoittaa, että tyttöjen ja poikien kiinnostus tietotekniikkaan on erilasta. Nollahypoteesi jää voimaan. 70

1 % kriittinen alue (hylkäämisalue).164 6.6 71

Helsingin 7 yliopisto