Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Samankaltaiset tiedostot
Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Harjoittele tulkintoja

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Til.yks. x y z

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Luottamusväli, määritelmä

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

pisteet Frekvenssi frekvenssi Yhteensä

Mat Tilastollisen analyysin perusteet, kevät 2007

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

4.2 Useampi selittävä muuttuja (kertausta)

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

voidaan hylätä, pienempi vai suurempi kuin 1 %?

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Kandidaatintutkielman aineistonhankinta ja analyysi

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Matemaatikot ja tilastotieteilijät

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

5 Lisa materiaali. 5.1 Ristiintaulukointi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

1. Tilastollinen malli??

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)


&idx=1&uilang=fi&lang=fi&lvv=2017

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Kvantitatiiviset menetelmät

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Til.yks. x y z

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Sovellettu todennäköisyyslaskenta B

Teema 5: Ristiintaulukointi

805306A Johdatus monimuuttujamenetelmiin, 5 op

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

Regressioanalyysi. Kuusinen/Heliövaara 1

riippumattomia ja noudattavat samaa jakaumaa.

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Ohjeita tilastollisen tutkimuksen toteuttamiseksi opintojaksolla. TILTP1 ( SPSS for Windows -ohjelmiston avulla

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

TUTKIMUSOPAS. SPSS-opas

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Esimerkki 1: auringonkukan kasvun kuvailu

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 1, Kevät 2018

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

HAVAITUT JA ODOTETUT FREKVENSSIT

Teema 8: Parametrien estimointi ja luottamusvälit

Estimointi. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

Transkriptio:

[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 = (-9,4-14,4583)/11,82505-2,02, z 2 =(-7,8-17,1)/11,6666-2,14, joten -7,8 pistettä saanut on menestynyt huonommin ollen 2,14 hajonnan päässä ryhmänsä keskiarvon alapuolella. Tässä ratkaisussa ryhmittely on tehty samanaikaisesti sukupuolen ja opetustavan mukaan. Voi tietysti tarkastella vain opetustavan tai sukupuolen ryhmissä. 2. x =(8+9+6+7+10)/5 = 8 s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) + (10 8) 2 )/4 = 10/4, s 1,58. palamisaika standardoitu arvo 8 (8 8)/1,58 = 0 9 (9 8)/1,58 = 0,63 6 (6 8)/1,58 = -1,26 (1,26 hajontaa keskiarvosta alaspäin) 7 (7 8)/1,58 = -0,63 10 (10 8) /1,58 = 1,26 (1,26 hajontaa keskiarvosta ylöspäin) Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. 3. x i = 261 (ks. harj. 2 teht. 4) x 3,7, s 2 ((0-3,7) 2 + (1 3,7) 2 6 +(2 3,7) 2 10 + + (9 3.7) 2 )/69 3,27, s 1,8, x + 1,8 = 5,5 ; x - 1,8 = 1,9. Välille 1,9 5,5 jää 50 havaintoa ( 71 %). Vrt. normaalijakauma, jossa vastaava osuus 68 %.

4. Keskiarvot muuttuvat jokin verran eri tavalla autotyypeittäin mentäessä ikäryhmästä toiseen, murtoviivat käyttäytyvät eri tavalla. Keskimäärin vähiten kulutusta on autotyypillä A ikäryhmässä 3. Ikäryhmittäin on eroja keskimääräisissä kulutuksissa. Ikäryhmässä 3 kulutus keskimäärin pienintä, ikäryhmässä 4 suurinta. Autotyypeittäin on myös eroja keskimääräisissä kulutuksissa, autotyyppi B kuluttaa keskimäärin eniten. Edellä tehtiin päätelmät vain kuvailevan analyysin keinoin, varsinainen tilastollinen päättely voitaisiin tehdä varianssianalyysin avulla (opintojakson MTTTA1 asiaa). 5. a) Ehdolliset keskiarvot 5,11 9,72 mediaanit 5 9 (ks. SPSS-tulos alla) b) Menetelmä näyttäisi paljastavan kopioijat, jotka tekevät keskimäärin enemmän virheitä. Voit verrata myös jakaumia. Jos frekvenssijakaumat haluttaisiin esittää graafisesti, niin esitykset olisivat histogrammeja, jotka piirrettäisiin samoilla luokituksilla ja prosentuaalisista frekvensseistä. Voi myös käyttää laatikko-jana-kuviota, ks. alla.

VIRHEET SPSS-tulostus ehdollisista tunnusluvuista Report VIRHEET Kopiointi? Ei Ky llä Total Mean N Std. Dev iation Median 5,11 37 2,777 5,00 9,72 39 4,696 9,00 7,47 76 4,500 7,00 Laatikko-jana-kuvio 30 20 10 0-10 N = 37 Ei 39 Kyllä Kopiointi? Edellä tehtiin päätelmät vain kuvailevan analyysin keinoin, varsinainen tilastollinen päättely voitaisiin tehdä luottamusvälin tai testin avulla (esillä myöhemmin opintojaksolla). 6. Selitettävä = tupakointi, selittäjä = sukupuoli Koska ehdolliset prosenttijakaumat näyttävät poikkeavan toisistaan, niin tupakointikäyttäytyminen saattaisi olla erilaista miehillä ja naisilla (testattaessa p = 0,028). Ei koskaan polttaneita on 0,4984x315 = 157, entisiä tupakoitsijoita on 0,3651x315 = 115 ja nykyisiä tupakoitsijoita 0,1365x315 = 43. Olkoon y = miesten lukumäärä, tällöin naisten lukumäärä 315-y. Ryhmästä ei koskaan polttanut saadaan 0,3095y+0,5275(315-y)=157, josta y = 42.

Viisivuotiskasvu Tämän jälkeen kaikki frekvenssit on laskettavissa. Saadaan 7. Selitettävä = Nuoren tupakointi, selittäjä = Vanhempien tupakointi Opiskelija polttaa Opiskelija ei polta yht. Molemmat vanhemmat polttavat 100*400/1780 22 100*1380/1780 78 1780 Toinen vanhemmista polttaa 100*416/2239 19 100*1823/2239 81 2239 Vanhemmat eivät polta 100* 188/1356 14 100*1168/1356 86 1356 Yht. 1004 4371 5375 Koska ehdolliset prosenttijakaumat näyttävät poikkeavan toisistaan, niin riippuvuutta saattaisi olla (testattaessa p <01). Näyttäisi siis siltä, että vanhempien tupakointitavat vaikuttavat lastensa tupakointiin. Esimerkiksi jos vanhemmat eivät polta, niin tarkasteltavassa aineistossa heidän lapsistaan poltti 14 %. Vastaava luku perheissä, jossa molemmat vanhemmat polttivat, oli 22 %. Toki koululaisten tupakointiin vaikuttaa monet muutkin tekijät!! 8. a) 40 30 20 10 4,00 6,00 8,00 1 12,00 Puun ikä vuosina 14,00 16,00 18,00

y Riippuvuus näyttää olevan lineaarista, koska pisteet ovat melko hyvin keskittyneet suoran ympärille. Koska pisteet ovat ryhmittyneet nousevan suoran ympärille, on kyse positiivisesta lineaarisesta riippuvuudesta. Korrelaatiokerroin 0,826. Jos ensimmäisen puun kohdalla viisivuotiskasvu olisi 700, niin korrelaatiokerroin olisi -0,133. b) 12 10 8 6 4 2 R Sq Quadratic =0,996-1 -5,00 x 5,00 1 Kyse hyvin voimakkaasta riippuvuudesta, joka ei kuitenkaan ole lineaarista. Pisteparveen voidaan sovittaa toisen asteen polynomi, joka kuvaa riippuvuutta.