KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Samankaltaiset tiedostot
1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Til.yks. x y z

Til.yks. x y z

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Kandidaatintutkielman aineistonhankinta ja analyysi

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esimerkki 1: auringonkukan kasvun kuvailu

pisteet Frekvenssi frekvenssi Yhteensä

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Teema 5: Ristiintaulukointi

MTTTP1, luento KERTAUSTA

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

7. laskuharjoituskierros, vko 10, ratkaisut

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSOPAS. SPSS-opas

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.

Matin alkuvuoden budjetti

Määrällisen aineiston esittämistapoja. Aki Taanila

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

MTTTP1, luento KERTAUSTA

Ohjeita tilastollisen tutkimuksen toteuttamiseksi opintojaksolla. TILTP1 ( SPSS for Windows -ohjelmiston avulla

Kvantitatiiviset menetelmät

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Harjoittele tulkintoja

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sukupuoli Mies Nainen Yht. Suhtautuminen kannattaa uudistukseen ei kannata Yht

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sovellettu todennäköisyyslaskenta B

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Tilastollisten aineistojen kuvaaminen

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Luento JOHDANTO

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastolliset toiminnot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

MONISTE 2 Kirjoittanut Elina Katainen

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Opiskelija viipymisaika pistemäärä

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mediaani. Keskihajonta

805306A Johdatus monimuuttujamenetelmiin, 5 op

SPSS-perusteet. Sisältö

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

1.9 Harjoituksia. Frekvenssijakaumien harjoituksia. MAB5: Tilastotieteen lähtökohdat. a) Kaikki aakkoset b) Kirjaimet L, E, M, C, B, A ja i.

Tilastotieteen johdantokurssi [TILTP1]

Tilastotieteen johdantokurssi [TILTP1]

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Tilastomenetelmien lopputyö

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

2. Aineiston kuvailua

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen johdantokurssi (TILTP1)

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Määrällisen aineiston esittämistapoja. Aki Taanila

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Transkriptio:

VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! Nro Sukupuoli Asuu Varsinainen Työ Tunnit Vuosi Ikä Pituus Kenkä Matem Ydinvoima Tuuli- ja vesi Pakko 1 1 1 1 1 90 2014 24 180 42,0 4 4 2 2 2 2 1 2 1 130 1999 38 183 40,0 1 2 4 5 3 2 2 1 2 130 2015 46 175 39,0 3 4 4 2 4 2 1 1 2 35 2014 28 170 38,5 3 1 4 4 5 2 1 1 2 35 2015 24 165 38,0 3 2 4 5 6 1 2 1 2 80 2014 27 174 42,0 3 4 4 4 7 2 1 1 2 135 2015 25 175 40,0 3 3 4 4 8 2 1 1 1 60 2015 24 168 37,0 3 3 4 5 9 2 1 1 1 80 2015 21 169 38,0 5 4 2 5 10 2 2 1 2 60 2015 38 158 38,0 3 1 4 5 11 2 1 1 1 100 2013 38 170 39,0 4 5 3 5 1. Kurssikyselyaineistossa on 11 tilastoyksikköä. a) Montako muuttujaa on? b) Mitkä muuttujat ovat kvalitatiivisia eli laadullisia? Mitkä muuttujat ovat kvantitatiivisia eli määrällisiä? c) Mitä merkitsee aineiston käsittelyn kannalta se, että havaintomatriisissa kaksi saraketta vaihtaa paikkaa keskenään? d) Entä, jos kaksi vaakariviä vaihtaa paikkaa keskenään? e) Mitä merkitsee aineiston käsittelyn kannalta se, jos puuttuvan tiedon merkkinä on luku 0? f) Entä, jos puuttuvan tiedon paikalle ei laiteta mitään? 2. Mitkä ovat kurssikyselyaineiston muuttujien tilastolliset mitta-asteikot? Mitkä muuttujat ovat jatkuvia? Mitkä muuttujat ovat diskreettejä eli epäjatkuvia? Perustele vastauksesi. 3. Eräällä kurssilla opetus tapahtui toiselle ryhmälle perinteisenä luento-opetuksena ja toiselle ryhmälle verkko-opetuksena. Osallistujille tehtiin osaamista mittaava testi sekä ennen että jälkeen kurssin. Näiden testien pistemäärien erotukset (jälkeen ennen) olivat: Naiset: verkko-opetus 20.3 23.5 4.7 21.9 15.6 20.3 26.6-9.4 4.7 luento-opetus 6.2 15.6 25.0 4.7 28.1 17.2 14.1 23.4 Miehet: verkko-opetus 12.5 7.8 21.9-3.1 3.1 45.4 9.4 luento-opetus 28.1-6.2 14.1 18.8 1.5 15.6 26.7 23.3 33.2 Mikä on tilastoyksikkö? Montako tilastoyksikköä on? Mitkä ovat muuttujat? Montako muuttujaa on? Miten tilastoyksikkö- ja muuttujamäärä näkyy havaintomatriisissa? Hahmottele aineiston avulla havaintomatriisi. Mitä aineistosta avulla voidaan tutkia?

4. Esitä kurssikyselyaineiston Ydinvoima-muuttujan frekvenssijakauma taulukkona. Esitä taulukossa myös suhteelliset ja prosentuaaliset frekvenssit absoluuttisten frekvenssien lisäksi. 5. Tarkastellaan kurssikyselyaineistosta Pituus-muuttujaa. a) Määritä aineistosta pituuden vaihteluväli ja pituuden vaihteluvälin pituus. b) Mikä olisi pituuden luokitteluun sopiva luokkien lukumäärä? c) Jos pituus luokitellaan neljään tasaväliseen luokkaan, mikä on pienin mahdollinen luokkavälin pituus? d) Luokittele pituusarvot neljään tasaväliseen luokkaan siten, että luokkavälin pituus on 7 cm ja ensimmäisen luokan alaraja on 158 cm. e) Määritä pituusluokkien frekvenssit, prosentuaaliset frekvenssit, summafrekvenssit ja prosentuaaliset summafrekvenssit. 6. Tarkastellaan tehtävän 3 aineistoa. Luokittele testipisteiden erotuksien arvot järkevästi luokkiin ja esitä testipisteiden erotuksen jakauma frekvenssijakaumataulukkona. 7. Piirrä tehtävän 5 perusteella Pituus-muuttujasta a) frekvenssihistogrammi b) frekvenssimonikulmio c) prosentuaalinen summakäyrä. 8. Muodosta kurssikyselyaineistosta Ikä-muuttujan runko-lehti -kuvio. 9. Laske kurssikyselyaineiston neljän ensimmäisen tilastoyksikön ikäkeskiarvo ja -keskihajonta. 10. Laske ja/tai määritä kurssikyselyaineiston pituuden keskiarvo, moodi, mediaani, keskihajonta, variaatiokerroin, vaihteluväli ja kvartiiliväli käyttäen alkuperäisiä havaintoja (ei siis tehtävän 5 frekvenssijakaumaa) (avuksi: x i = 1887 ja x i 2 = 324189). Kuvaile em. tunnuslukujen avulla pituuden jakaumaa. Muodosta myös laatikko-viikset kuvio. 11. Tämän vuoden kesäkurssilaisten iän keskiarvo on 30.27 vuotta ja keskihajonta on 8.211 vuotta. a) Onko kesäopiskelijoiden pituuden vaihtelu suhteellisesti pienempää kuin iän vaihtelu? b) Kumman muuttujan osalta muistutat suhteellisesti enemmän keskiarvo-opiskelijaa (keskiarvo-opiskelija olkoon sellainen opiskelija, jonka pituus ja ikä vastaavat ko. muuttujien keskiarvoja). 12. Laske/määritä Ydinvoima -muuttujan mediaani, alakvartiili, yläkvartiili, suurin arvo ja pienin arvo.

13. Laske seuraavasta frekvenssijakaumasta hinnan keskiarvo, varianssi ja mediaani. Mieti myös (laskea ei tarvitse), mitä muita keskilukuja ja hajontalukuja voisit hinnasta esittää. Hinta lukumäärä 40 49 5 50 59 3 60 69 11 70 79 15 80 89 13 14. Seuraavassa taulukossa on tilastoanalyysituloksia Kuntafakta-aineistosta, jossa tilastoyksikköinä ovat Suomen kunnat v. 2003. (HUOM. Tulostuksessa desimaalimerkkinä on pilkku, ja esim. merkintä,65189 tarkoittaa lukua 0,65189.) a) Millä keskiluvulla olisi järkevä kuvata muuttujan Verotettavat tulot /asukas keskikohtaa? b) Millä muuttujalla on pienin suhteellinen vaihtelu? c) Minkä muuttujan jakauma on selvästi huipukkaampi kuin normaalijakauma? d) Minkä muuttujan jakauma on selvästi oikealle loiveneva? e) Minkä muuttujan jakauma muistuttaa eniten normaalijakaumaa? f) Vaasassa ko. muuttujien arvot olivat tuolloin 15.3, 19.00 ja 12469. Minkä muuttujan osalta Vaasa eroaa suhteellisesti ottaen vähiten keskimääräisestä Suomen kunnasta? 15. Muodosta kurssikyselyaineistosta ristiintaulukko muuttujista Asuu ja Työ. Tutki muuttujien välistä riippuvuutta kontingenssikertoimen avulla.

16. Tutkimuslaitos tutki 75 erilaisen taloustavaran hinta-laatu-suhdetta. Tavarat luokiteltiin hinnan mukaan kolmeen ryhmään ja laadun perusteella kahteen ryhmään. Saatiin ristiintaulukko Laatu Hinta Huono Hyvä Yhteensä Edullinen 15 7 22 Keskihintainen 10 14 24 Kallis 5 24 29 Yhteensä 30 45 75 Tutki muuttujien välistä riippuvuutta kontingenssikertoimen avulla. Tulkitse tuloksesi. 17. Laske kurssikyselyaineiston neljälle ensimmäiselle tilastoyksikölle pituuden ja kengännumeron välinen Pearsonin korrelaatiokerroin. Tulkitse tulos. 18. Laske kurssikyselyaineistosta Spearmanin järjestyskorrelaatio muuttujista Ikä ja Matem. Tulkitse tulos. 19. Sähkölämmitteisen loma-asunnon sähkön kulutusta ja ulkoilman lämpötilaa seurattiin viikon ajan. Piirrä aineistosta pisteparvi ja laske tunnusluku, jolla mitataan lineaarisen riippuvuuden voimakkuutta. Ulkoilman lämpötila (ºC) 5 8 12 10-1 3 7 Sähkön kulutus (kwh) 32 28 24 19 30 26 20 20. Yritys haluaa testata työnhakijansa soveltuvuustestillä. Tarjolla on kaksi eri testiä, joita kumpaakin halutaan kokeilla. Seitsemän työnhakijaa testattiin ja saatiin tulokset: testi 1 14 6 17 17 2 8 10 testi 2 162 65 81 159 90 44 123 Tutki sopivan tilastollisen tunnusluvun avulla, onko työnhakijoiden järjestyksillä yhteyttä eri testeissä. Mitä tulos tarkoittaa? 21. Suuren kauppaketjun johto suunnittelee laajentamista uusia myymälöitä avaamalla. Tätä varten se tarvitsee arvion myymälän pinta-alan (1000 m 2 ) ja myynnin (milj. ) välisestä yhteydestä. Yhdentoista jo toimivan myymälän satunnaisotos tuotti seuraavan aineiston asian selvittämiseksi. Pinta-ala 1.7 1.6 2.8 5.6 1.3 2.2 1.3 1.1 3.2 1.5 5.2 Myynti 3.7 3.9 6.7 9.5 3.4 5.6 3.7 2.7 5.5 2.9 10.7 a) Esitä aineisto tilastokuviona siten. että siitä selviää myynnin riippuvuus pinta-alasta. Kuvaa riippuvuus sanallisesti.

b) Sovita aineistoon lineaarinen regressiomalli, jossa pinta-ala on selittävä muuttuja ja tulkitse malli. (Voit käyttää hyväksesi seuraavia tunnuslukuja: pinta-alan keskiarvo on 2.5 ja keskihajonta 1.58, myynnin keskiarvo on 5.3 ja keskihajonta 2.69, sekä pinta-alan ja myynnin välinen kovarianssi 4.085.) 22. Kurssikyselyaineistossa kengännumeron ja pituuden välinen (Pearsonin) korrelaatiokerroin on arvoltaan 0.688. Pituuden keskiarvo on 171.55 cm ja keskihajonta on 6.948 cm. Vastaavat luvut kengännumerolle ovat 39.227 ja 1.6335. a) Muodosta lineaarinen regressiomalli, jossa kengännumeron vaihtelua selitetään pituudella. b) Laske mallin selitysaste. c) Arvioi mallin avulla, minkä kokoinen kenkä pitäisi jalassasi olla.