5 Lisa materiaali. 5.1 Ristiintaulukointi

Samankaltaiset tiedostot
Teema 5: Ristiintaulukointi

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Väliestimointi (jatkoa) Heliövaara 1

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Luottamusvälit. Normaalijakauma johnkin kohtaan

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Estimointi. Vilkkumaa / Kuusinen 1

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kandidaatintutkielman aineistonhankinta ja analyysi

Otantajakauman käyttö päättelyssä

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

riippumattomia ja noudattavat samaa jakaumaa.

Sovellettu todennäköisyyslaskenta B

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Tilastollinen aineisto Luottamusväli

Internetin saatavuus kotona - diagrammi

11. laskuharjoituskierros, vko 15, ratkaisut

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Teema 8: Parametrien estimointi ja luottamusvälit


TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Oma nimesi Tehtävä (5)

Sovellettu todennäköisyyslaskenta B

pisteet Frekvenssi frekvenssi Yhteensä

Sovellettu todennäköisyyslaskenta B

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

HAVAITUT JA ODOTETUT FREKVENSSIT

9. laskuharjoituskierros, vko 12-13, ratkaisut

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

dx=5&uilang=fi&lang=fi&lvv=2014

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Estimointi. Otantajakauma

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Äidinkielen valtakunnallinen koe 9.luokka

tilastotieteen kertaus

Otoskoko 107 kpl. a) 27 b) 2654

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Batch means -menetelmä

805306A Johdatus monimuuttujamenetelmiin, 5 op

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Määrällisen aineiston esittämistapoja. Aki Taanila

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

TILASTOLLINEN LAADUNVALVONTA

Kuvio 1. Matematiikan seuranta-arvioinnin kaikkien tehtävien yhteenlaskkettu pistejakauma

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TULOSSEURANTA TAPANILAN ERÄ / Yleisurheilu

Matemaatikot ja tilastotieteilijät


Tilastomenetelmien lopputyö

11. Jäsenistön ansiotaso

Sovellettu todennäköisyyslaskenta B

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Mat Tilastollisen analyysin perusteet, kevät 2007

Mielipiteet ydinvoimasta Maaliskuu Mielipiteet ydinvoimasta maaliskuu 2015

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Mielipiteet ydinvoimasta Maaliskuu 2014

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Transkriptio:

5 Lisa materiaali 5.1 Ristiintaulukointi 270. a) Aineiston koko nähdään frekvenssitaulukon oikeasta alakulmasta: N = 559. Tilastotieteen johdantokurssille osallistui yhteensä 559 opiskelijaa. Huomaa: Opiskelijoiden lukumäärä saadaan myös laskemalla frekvenssien summa. 194 + 65 + 39 + 29 + 56 + 32 + 10 + 8 + 60 + 35 + 22 + 9 = 559. b) Valtiotieteellisestä tiedekunnasta tulevien opiskelijoiden lukumäärä nähdään ensimmäisestä rivisummasta, joka on 327. Näiden osuus kaikista opiskelijoista oli 327 = 0,584 58 %. 559 Suurin osa opiskelijoista, yhteensä 327 eli 58 %, tuli valtiotieteellisestä tiedekunnasta (VT).

c) Ikäryhmien suuruudet nähdään sarakesummista: 310, 132, 71 ja 46. Suurin sarakesumma, 310, on ikäryhmällä 18 22-vuotiaat. Näiden prosenttiosuus kaikista opiskelijoista oli 310 = 0,554 55 %. 559 Suurimman ikäryhmän muodostivat 18 22-vuotiaat, joita oli yhteensä 55 % osallistujista. d) Ikäryhmien suuruudet nähdään sarakesummista. Ikäryhmän 23 27-vuotiaat sarakesumma on 132. Tästä ikäryhmästä valtiotieteilijöitä oli 65 kappaletta, eli prosentteina 65 = 0,492 49 %. 132 Opiskelijoista 132 oli 23 27-vuotiaita. Tästä ikäryhmästä 65 eli 49 % tuli valtiotieteellisestä tiedekunnasta (VT). e) Vähintään 28-vuotiaita oli yhteensä 39 + 29 + 10 + 8 + 22 + 9 =117 eli prosentteina 117 = 0,209 21 %. 559 Osallistujista 21 % oli vähintään 28-vuotias.

f) Matemaattis-luonnontieteellisestä tulevien rivisumma on 106. Näistä alle 23-vuotiaita oli 56 eli prosentteina 56 = 0,528 53 %. 106 Matemaattis-luonnontieteellisestä tiedekunnasta (ML) tulevia opiskelijoita oli yhteensä 106. Alle 23-vuotiaiden osuus heistä oli 53 %. g) Muiden tiedekuntien opiskelijoita oli yhteensä 126 eli prosentteina 126 = 0,225 23 %. 559 Ikäryhmään 18 22-vuotiaat kuului 60 opiskelijaa eli noin puolet. 60 = 0,476 48 %, 126 Muiden tiedekuntien opiskelijoiden osuus oli 23 %. Heistä noin puolet (48 %) kuului ikäryhmään 18 22-vuotiaat.

271. a) Lasketaan frekvenssien summa. 13 + 38 + 17 + 10 + 16 + 12 = 106. Kokeeseen osallistui 106 abiturienttia. b) Lasketaan frekvenssien summa riveittäin ja sarakkeittain. Tyttöjä oli yhtensä 68. Aika (h) 1 2 3 4 5 6 Yhteensä Tytöt 13 38 17 68 Pojat 10 16 12 38 Yhteensä 23 54 29 106 Osallistujista 5 6 tuntia kokeeseen käyttäneitä oli yhteensä 29. c) Lasketaan riviprosentit eli verrataan rivillä olevia frekvenssejä rivisummaan. Esimerkiksi ensimmäisen rivin suhteelliset frekvenssit saadaan vertaamalla lukuun 68.

Aika (h) Tytöt (N = 68) 1 2 3 4 5 6 13 68 = 0,191 19 % 38 68 = 0,558 56 % Yhteensä (%) 17 68 =0,25 25 % 100 Pojat (N = 38) 26 42 32 100 Yhteensä (N = 106) 22 51 27 100 Tytöistä 5 6 tuntia kokeen käytti 25 %. Pojilla vastaava osuus oli 32 %. d) Lasketaan sarakeprosentit eli verrataan sarakkeessa olevia frekvenssejä sarakesummaan. Esimerkiksi viimeisen sarakkeen suhteelliset frekvenssit saadaan vertaamalla lukuun 29. Aika (h) 1 2 (N = 23) 3 4 (N = 54) Tytöt 57 70 Pojat 43 30 5 6 (N = 29) Yhteensä (N = 106) 17 29 = 0,586 59 % 64 12 29 = 0,413 41 % 36 Yhteensä 100 100 100 100 Testiin 5 6 tuntia käyttäneistä tyttöjä oli 59 %.

272. Lasketaan frekvenssien summa. 430 + 426 + 399 + 375 + 252 + 147 + 253 ä + 470 + 668 + 528 + 387 + 172 + 78 + 98 = 4683 (tuhatta) ä a) Lasketaan naisten frekvenssit yhteen. 470 + 668 + 528 + 387 + 172 + 78 + 98 = 2401 (tuhatta) Tulonsaajista naisia oli 2401 = 0,512 51 %. 4683 b) Alle 20 000 ansaitsevia oli yhteensä 420 + 426 + 470 + 668 = 1994 (tuhatta) eli prosentteina 1994 = 0,425 43 %. 4683 Vähintään 60 000 ansaitsevia oli yhteensä 253 + 98 = 351 (tuhatta) eli prosentteina 351 = 0,0749 7,5 %. 4683

c) Miehiä oli yhteensä 2282 (tuhatta). Heistä alle 20 000 ansaitsevia oli 430 + 426 = 856 (tuhatta) eli prosentteina 856 = 0,375 38 %. 2282 d) Naisia oli yhteensä 2401 (tuhatta). Heistä vähintään 60 000 ansaitsevia oli 98 (tuhatta) eli prosentteina 98 = 0,0408 4,1 %. 2401

5.4 Virhemarginaali ja otoksen koko 273. Luottamustasolla 95 % kriittinen arvo on z* = 1,96. Keskiarvon luottamusvälin pituus on 2 1,96. Perusjoukon hajonta on σ = 15 (ml). Luottamusvälin pituus on korkeintaan 5 (ml). 2 1,96 15 5 138,29 139 Otoskoon on oltava vähintään 139.

274. a) Luottamustasolla 99 % kriittinen arvo on z* = 2,58. Keskiarvon luottamusvälin pituus on 2 2,58. Perusjoukon hajonta on σ = 0,10 (cm). Luottamusvälin pituus on korkeintaan 0,05 (cm). 2 2,58 0,10 0,05 106,502 107 Otoskoon on oltava vähintään 107.

b) Luottamusväliä varten tarvitaan tiedot: otoskeskiarvo =1,52 cm kriittinen arvo z* = 2,58 perusjoukon hajonta σ = 0,10 cm otoskoko n = 100. Luottamusväli on ± eli 1,52 ± 2,58 0,10 = 1,52 ± 0,0258 1,52 ± 0,03 (cm). 100 Luottamusväliksi saadaan [1,49 cm; 1,55 cm].

275. Luottamustasolla 99 % kriittinen arvo on z* = 2,58. Keskiarvon luottamusvälin pituus on 2 2,58. Luottamusvälin pituus on alle 0,1σ. 2 2,58 < 0,1 : 2 2,58 1 <0,1 > 2662,56 2670 Otoskoon on oltava vähintään 2670.

276. Luottamustasolla 95 % kriittinen arvo on z* = 1,96. Prosenttiosuuden virhemarginaali on (1 ) 1,96. Otoskokoa arvioitaessa otoksen prosenttiosuus korvataan arvolla = 0,5. Virhemarginaali on siis 0,5 (1 0,5) 1,96 =1,96 0,25. a) Virhemarginaali on enintään 3 % = 0,03. 1,96 0,25 0,03 1067,11 1100 Otoskoon on oltava vähintään 1100.

b) Virhemarginaali on enintään 1 % = 0,01. 1,96 0,25 0,01 9604 9700 Otoskoon on oltava vähintään 9700.

277. Luottamustasolla 95 % kriittinen arvo on z* = 1,96. a) Prosenttiosuuden virhemarginaali on (1 ) 1,96. Otoskokoa arvioitaessa otoksen prosenttiosuus korvataan etukäteisarviolla = 0,35. Virhemarginaali on siis 0,35 (1 0,35) 1,96 =1,96 0,2275. Enimmäisvirhe on 2 prosenttiyksikköä, eli virhemarginaali on enintään 2 % = 0,02. 1,96 0,2275 0,02 2184,91 2200 Otoskoon on oltava vähintään 2200.

b) Luottamusväliä varten tarvitaan tiedot: otoksesta laskettu prosenttiosuus = =0,38 kriittinen arvo z* = 1,96 otoskoko n = 1500. Luottamusväli on ± ( ) eli 0,38 (1 0,38) 0,38 ± 1,96 = 0,38 ± 0,0245 38 % ± 2,5 %. 1500 Luottamusväliksi saadaan [35,5 %; 40,5 %]. Virhemarginaali on 2,5 prosenttiyksikköä.