b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.



Samankaltaiset tiedostot
b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta.

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

pisteet Frekvenssi frekvenssi Yhteensä

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Tilastollisten aineistojen kerääminen ja mittaaminen

Sovellettu todennäköisyyslaskenta B

Kandidaatintutkielman aineistonhankinta ja analyysi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sukupuoli Mies Nainen Yht. Suhtautuminen kannattaa uudistukseen ei kannata Yht

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Teema 8: Parametrien estimointi ja luottamusvälit

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Ohjeita kvantitatiiviseen tutkimukseen

HAVAITUT JA ODOTETUT FREKVENSSIT

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Opiskelija viipymisaika pistemäärä

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MTTTP1, luento KERTAUSTA

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

805306A Johdatus monimuuttujamenetelmiin, 5 op

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Osa 2: Otokset, otosjakaumat ja estimointi

7. laskuharjoituskierros, vko 10, ratkaisut

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Regressioanalyysi. Kuusinen/Heliövaara 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

MTTTP1, luento KERTAUSTA

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Otoskoko 107 kpl. a) 27 b) 2654

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Kvantitatiiviset tutkimusmenetelmät maantieteessä

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Johdatus tilastotieteeseen

YLEISKUVA - Kysymykset

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MONISTE 2 Kirjoittanut Elina Katainen

Kvantitatiiviset menetelmät

Tehtävät 1/10. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Mat Tilastollisen analyysin perusteet, kevät 2007

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Testit järjestysasteikollisille muuttujille

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Ohjeita kvantitatiiviseen tutkimukseen

1. Matikan kurssin arvosanat jakautuivat seuraavalla tavalla:

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Til.yks. x y z

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

TUTKIMUSOPAS. SPSS-opas

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Harjoitus 2: Matlab - Statistical Toolbox

Teema 3: Tilastollisia kuvia ja tunnuslukuja

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

5 Lisa materiaali. 5.1 Ristiintaulukointi

Tilastollisten aineistojen kuvaaminen

Transkriptio:

806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta saat +1 pistettä, väärästä et menetä pisteitä. A) Mikä seuraavista otantamenetelmistä ei ole ns. todennäköisyysotantaan perustuva otantamenetelmä, vaan harkintaotantaa, joka johtaa mukavuusotokseen? a1) yksinkertainen satunnaisotanta palauttaen, a2) yksinkertainen satunnaisotanta palauttamatta, a3) ryväsotanta, a4) systemaattinen otanta, a5) kiintiöpoiminta, a6) ositettu otanta suhteellisella kiintiöinnillä. B) Ylipeitto otantatutkimuksessa tarkoittaa sitä, että b1) käytettäessä yksinkertaista satunnaisotantaa palauttamatta otoskoko tulee liian suureksi, b2) kehikkopopulaatio sisältää sellaisia havaintoyksiköitä, jotka eivät kuulu kohdepopulaatioon, b3) kohdepopulaatio sisältää sellaisia havaintoyksiköitä, jotka eivät ole mukana kehikkopopulaatiossa, b4) ositettua otantaa käytettäessä jokin ositteista tulee yliedustetuksi ositekohtaisten otoskokojen laskennassa tapahtuvien pyöristysvirheiden takia, b5) haastattelututkimukseen osallistuva henkilö valitsee tarjolla olevista vastausvaihtoehdoista useamman kuin yhden, b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia. C) Välimatka-asteikon muuttujasta x on saatu kolme havaintoa: 0, 3 ja 6. Havaintoarvon 0 standardoitu arvo on c1) -1, c2) -1/3, c3) 0, c4) 1/3, c5) 1, c6) 3. D) Havaintoaineistosta on laskettu erilaisia tilastollisia tunnuslukuja. Seuraavista tuloksista ainoa mahdollinen (lasketun arvon perusteella) on d1) C = 2.0, d2) s = 2.0, d3) Q 1 = Q 3 = 10.0, d4) vaihteluvälin pituus w = 3, d5) OR = 1, d6) variaatiokerroin V = 0.5.

E) Luokitteluasteikollisen muuttujan x mahdolliset arvot ovat A, B, C ja D. Sata havaintoa sisältävässä havaintoaineistossa arvo A esiintyy 25 kertaa, arvo B 35 kertaa, arvo C 20 kertaa ja arvo D 20 kertaa. Muuttujan x e1) jakauma voidaan esittää pistekuviona, e2) jakauman moodi on 35, e3) hajontaa voidaan kuvailla vaihteluvälin avulla, e4) summajakauma on mielekäs muodostaa, e5) havaintoarvot voidaan standardoida. e6) Mikään edellä esitetyistä kohdista e1) e5) ei pidä paikkaansa. F) Arvottujen lohkojen koejärjestelyssä f1) lohkot jaetaan satunnaisesti eri käsittelyille, f2) koeyksiköt jaetaan satunnaisesti eri lohkoihin, f3) koeyksiköt valitaan satunnaisotannalla tarjolla olevasta perusjoukosta, f4) lohkoja on aina yhtä monta kuin käsittelyjä, f5) jokaisessa lohkossa koeyksiköt jaetaan satunnaisesti eri käsittelyille, f6) kunkin lohkon sisällä koeyksiköt ovat mahdollisimman heterogeenisia (erilaisia) sellaisten ominaisuuksien suhteen, joilla oletetaan olevan vaikutusta vastemuuttujaan. 2. Eräässä vuonna 2003 tehdyssä haastattelututkimuksessa (n = 218) tutkittiin opiskelijoiden terveyskäyttäytymistä ja terveyttä. Haastattelulomakkeen yhdessä kysymyksessä vastaajaa pyydettiin arvioimaan omaa terveydentilaansa (= x). Vastausten jakauma oli seuraava: Arvio omasta terveydentilasta frekvenssi huono 1 melko huono 3 keskitasoinen 32 melko hyvä 84 hyvä 98 Yhteensä 218 a) Määrää muuttujan x:n mitta-asteikko ja se, onko muuttuja jatkuva vai diskreetti. (1 p) b) Esitä x:n jakauma graafisesti. (1 p) c) Määrää (ja laske) x:n jakaumalle kaksi sijaintilukua ja kaksi hajontalukua. (2.5 p) d) Alla oleva R-ohjelman tulostus liittyy vastaajan ikää (vuosina) kuvaavaan muuttujaan. Esitä iän jakauma laatikko-jana -kuviona. (1.5 p) > numsummary(terveys[,"ikä"], statistics=c("mean", "sd", "quantiles"), quantiles=c( 0,.25,.5,.75,1 )) mean sd 0% 25% 50% 75% 100% n 20.505 3.422 16 17 20 22 30 218

3. Eräässä perunanviljelykokeessa tutkittiin Fambo ja Van Gogh-lajikkeita. a) Kahdeksalla koealalla viljeltiin Fambo-lajikkeen perunaa. Koealoittain mukuloiden lukumäärän havaittiin olevan 46, 52, 50, 46, 56, 52, 48 54. a1) Esitä havainnot pistekuviona. (1 p) a2) Laske mukuloiden lukumäärän keskiarvo ja keskihajonta. (2 p) b) Toisessa kokeessa kerättiin koealoittain (n = 16) tiedot mm. perunoiden yhteispainosta (g, paino_v), tavoitekoon onnistumisesta (prosentteina tavoitekoosta, kokopros), satomäärästä (tonnia/hehtaari, sato) ja tärkkelyspitoisuudesta (prosentteina, tarkkelys). Koealat olivat pinta-aloiltaan yhtä suuria. Alla aineistoon liittyvää R-tulostusta: paino_v 92 94 96 98 16 17 18 19 20 250 260 270 280 92 94 96 98 kokopros sato 20 25 30 35 250 260 270 280 16 17 18 19 20 20 25 30 35 tarkkelys > cor(potut) # korrelaatiomatriisi paino_v kokopros sato tarkkelys paino_v 1.000 0.111-0.364 C kokopros 0.111 B -0.403 0.074 sato -0.364-0.403 1.000 D tarkkelys A 0.074-0.263 1.000 > cov(potut) # kovarianssimatriisi paino_v kokopros sato tarkkelys paino_v 127.059 2.773-25.545 11.158 kokopros 2.773 4.879-5.539 0.170 sato -25.545-5.539 38.685-1.689 tarkkelys 11.158 0.170-1.689 1.066 Täydennä korrelaatiomatriisi (eli määrää korrelaatiokertoimet A, B, C ja D) ja tulkitse korrelaatiokerroin A. (3 p)

4. Peikkokulman Supervalinta ilmoittaa punaisten ja sinisten karkkien alennusmyynneistä. Mörrimöykky pitää erityisesti punaisista karkeista ja siniset ovat aivan kamalan ihania (tarttuvat ikävästi hampaisiin ja aiheuttavat karvaita röyhtäyksiä). Tänä kesänä Mörrimöykyn hampaita on vihlonut ikävästi, mutta silti Mörrimöykky ryntää tohkeissaan orava-kortin kera karkkiostoksille. Syvällä mielessä kuitenkin pyörii se, miten hän on saanut hammassärkyä syötyään tietyn värisiä karkkeja. Syötyjen karkkien värin ja karkkien syönnin jälkeisen hammassäryn määrän välisen yhteyden tutkimiseen Mörrimöykyllä on käytössä seuraava ristiintaulukko: Hammassäryn määrä Syötyjen karkkien väri karkkien syönnin jälkeen punainen sininen Yhteensä särkee paljon 43 29 72 särkee vähän 323 298 621 ei särje lainkaan 108 174 282 Yhteensä 474 501 975 Tutki muuttujien välistä riippuvuutta a) ehdollisten prosenttijakaumien avulla, (2 p) b) tilanteeseen sopivan tunnusluvun avulla. (4 p) 5. Tutkimuksessa selvitettiin sitä, miten runsas lannoitteen määrä (= muuttuja lannoite, 100 kg/ha) vaikuttaa tietystä kasvista saatavan sadon määrään (= muuttuja sato, 100 kg/ha). Havaintoaineisto muodostui kymmeneltä koealalta kerätyistä tiedoista. Muuttujien lannoite ja sato välinen kovarianssi on -9.44 ja lisäksi ko. muuttujista on laskettu R-ohjelmalla seuraavat tunnuslukujen arvot: > numsummary(satokoe, statistics=c("mean", "sd", "quantiles"), quantiles=c( 0,.25,.5,.75,1 )) mean sd 0% 25% 50% 75% 100% n lannoite 7.5 0.745 6.5 7.0 7.5 8.0 8.5 10 sato 65.6 13.023 45.0 55.2 69.0 77.2 80.0 10 a) Sovita aineistoon regressiosuora y = a + bx, missä vastemuuttujana on sadon määrä ja selittävänä muuttujana lannoitteen määrä. Tulkitse regressiokertoimet a ja b selväkielisesti. Määrää myös regressioyhtälön determinaatiokerroin eli selitysaste ja tulkitse se. (4 p) b) Mikä on regressioyhtälön antama ennustearvo sadon määräksi, jos käytetty lannoitemäärä on 725 kg/ha? (1 p) c) Lisää regressiosuoran kuvaaja liitteen 1 sirontakuvioon. Palauta liite 1 nimelläsi varustettuna vastauspaperisi mukana! (1 p)

Liite 1 Nimi: sadon määrä (100 kg/ha) 45 50 55 60 65 70 75 80 6.5 7.0 7.5 8.0 8.5 lannoitteen määrä (100 kg/ha)