Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Samankaltaiset tiedostot
Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Harjoittele tulkintoja

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Til.yks. x y z

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto Aineiston kuvaus Riippuvuustarkastelut...4

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

pisteet Frekvenssi frekvenssi Yhteensä

Mat Tilastollisen analyysin perusteet, kevät 2007

voidaan hylätä, pienempi vai suurempi kuin 1 %?

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

4.2 Useampi selittävä muuttuja (kertausta)

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP5, luento Luottamusväli, määritelmä

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Kandidaatintutkielman aineistonhankinta ja analyysi

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Matemaatikot ja tilastotieteilijät

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

5 Lisa materiaali. 5.1 Ristiintaulukointi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)


Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

&idx=1&uilang=fi&lang=fi&lvv=2017

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Til.yks. x y z

1. Tilastollinen malli??

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Sovellettu todennäköisyyslaskenta B

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Teema 5: Ristiintaulukointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

805306A Johdatus monimuuttujamenetelmiin, 5 op

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

Regressioanalyysi. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

riippumattomia ja noudattavat samaa jakaumaa.

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

tilastotieteen kertaus

Ohjeita tilastollisen tutkimuksen toteuttamiseksi opintojaksolla. TILTP1 ( SPSS for Windows -ohjelmiston avulla

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Normaalijakaumasta johdettuja jakaumia

Kvantitatiiviset menetelmät

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TUTKIMUSOPAS. SPSS-opas

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Esimerkki 1: auringonkukan kasvun kuvailu

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Transkriptio:

[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) + (10 8) 2 )/4 = 10/4, s 1,58. palamisaika standardoitu arvo 8 (8 8)/1,58 = 0 9 (9 8)/1,58 = 0,63 6 (6 8)/1,58 = -1,26 7 (7 8)/1,58 = -0,63 10 (10 8) /1,58 = 1,26 Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. 2. Suoritetaan standardointi. Standardoidut arvot ovat z1 = (-9,4-14,4583)/11,82505-2,02, z2 =(-7,8-17,1)/11,6666-2,14, joten -7,8 pistettä saanut on menestynyt huonommin ollen 2,14 hajonnan päässä ryhmänsä keskiarvon alapuolella. Tässä ratkaisussa ryhmittely on tehty samanaikaisesti sukupuolen ja opetustavan mukaan. Voi tietysti tarkastella vain opetustavan tai sukupuolen ryhmissä. 3. xi = 261 (ks. harj. 2 teht. 4) x 3,7, s 2 ((0-3,7) 2 + (1 3,7) 2 6 +(2 3,7) 2 10 + + (9 3.7) 2 )/69 3,27, s 1,8, x + 1,8 = 5,5 ; x - 1,8 = 1,9. Välille 1,9 5,5 jää 50 havaintoa ( 71 %). Vrt. normaalijakauma, jossa vastaava osuus 68 %.

4. Keskiarvot muuttuvat jokin verran eri tavalla autotyypeittäin mentäessä ikäryhmästä toiseen, murtoviivat käyttäytyvät eri tavalla. Keskimäärin vähiten kulutusta on autotyypillä A ikäryhmässä 3. Ikäryhmittäin on eroja keskimääräisissä kulutuksissa. Ikäryhmässä 3 kulutus keskimäärin pienintä, ikäryhmässä 4 suurinta. Autotyypeittäin on myös eroja keskimääräisissä kulutuksissa, autotyyppi B kuluttaa keskimäärin eniten. Edellä tehtiin päätelmät vain kuvailevan analyysin keinoin, varsinainen tilastollinen päättely voitaisiin tehdä varianssianalyysin avulla (opintojakson MTTTA1 asiaa). 5. a) Ehdolliset keskiarvot 5,11 9,72 mediaanit 5 9 (ks. SPSS-tulos alla) b) Menetelmä näyttäisi paljastavan kopioijat, jotka tekevät keskimäärin enemmän virheitä. Voit verrata myös jakaumia. Jos frekvenssijakaumat haluttaisiin esittää graafisesti, niin esitykset olisivat histogrammeja, jotka piirrettäisiin samoilla luokituksilla ja prosentuaalisista frekvensseistä. Voi myös käyttää laatikko-jana-kuviota, ks. alla. SPSS-tulostus ehdollisista tunnusluvuista

Report VIRHEET Kopiointi? Ei Kyllä Total Mean N Std. Deviation Median 5,11 37 2,777 5,00 9,72 39 4,696 9,00 7,47 76 4,500 7,00 Laatikko-jana-kuvio 30 20 10 0 VIRHEET -10 N = 37 Ei 39 Kyllä Kopiointi? Edellä tehtiin päätelmät vain kuvailevan analyysin keinoin, varsinainen tilastollinen päättely voitaisiin tehdä luottamusvälin tai testin avulla (esillä myöhemmin opintojaksolla). 6. Selitettävä = tupakointi, selittäjä = sukupuoli Koska ehdolliset prosenttijakaumat näyttävät poikkeavan toisistaan, niin tupakointikäyttäytyminen saattaisi olla erilaista miehillä ja naisilla (testattaessa p = 0,028). Ei koskaan polttaneita on 0,4984x315 = 157, entisiä tupakoitsijoita on 0,3651x315 = 115 ja nykyisiä tupakoitsijoita 0,1365x315 = 43. Olkoon x = miesten lukumäärä, tällöin naisten lukumäärä on 315-x. Ryhmästä ei koskaan polttanut saadaan 0,3095x+0,5275(315-x)=157, josta x = 42. Tämän jälkeen kaikki frekvenssit on laskettavissa. Saadaan

7. Selitettävä = Nuoren tupakointi, selittäjä = Vanhempien tupakointi Opiskelija polttaa Opiskelija ei polta yht. Molemmat vanhemmat polttavat 100*400/1780 22 100*1380/1780 78 1780 Toinen vanhemmista polttaa 100*416/2239 19 100*1823/2239 81 2239 Vanhemmat eivät polta 100* 188/1356 14 100*1168/1356 86 1356 Yht. 1004 4371 5375 Koska ehdolliset prosenttijakaumat näyttävät poikkeavan toisistaan, niin riippuvuutta saattaisi olla (testattaessa p <01). Näyttäisi siis siltä, että vanhempien tupakointitavat vaikuttavat lastensa tupakointiin. Esimerkiksi jos vanhemmat eivät polta, niin tarkasteltavassa aineistossa heidän lapsistaan poltti 14 %. Vastaava luku perheissä, jossa molemmat vanhemmat polttivat, oli 22 %. Toki koululaisten tupakointiin vaikuttaa monet muutkin tekijät!! 8. a) 40 30 Viisivuotiskasvu 20 10 4,00 6,00 8,00 1 12,00 Puun ikä vuosina 14,00 16,00 18,00 Riippuvuus näyttää olevan lineaarista, koska pisteet ovat melko hyvin keskittyneet suoran ympärille. Koska pisteet ovat ryhmittyneet nousevan suoran ympärille, on kyse positiivisesta lineaarisesta riippuvuudesta. Korrelaatiokerroin 0,826. Jos ensimmäisen puun kohdalla viisivuotiskasvu olisi 700, niin korrelaatiokerroin olisi -0,133.

b) 12 10 8 y 6 4 2 R Sq Quadratic =0,996-1 -5,00 x 5,00 1 Kyse hyvin voimakkaasta riippuvuudesta, joka ei kuitenkaan ole lineaarista. Pisteparveen voidaan sovittaa toisen asteen polynomi, joka kuvaa riippuvuutta.