A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Samankaltaiset tiedostot
Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

TESTINVALINTATEHTÄVIEN VASTAUKSET

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

dx=5&uilang=fi&lang=fi&lvv=2014

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Väliestimointi (jatkoa) Heliövaara 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

voidaan hylätä, pienempi vai suurempi kuin 1 %?

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

2. Keskiarvojen vartailua

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

riippumattomia ja noudattavat samaa jakaumaa.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Otoskoko 107 kpl. a) 27 b) 2654

pisteet Frekvenssi frekvenssi Yhteensä

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

HAVAITUT JA ODOTETUT FREKVENSSIT

10. laskuharjoituskierros, vko 14, ratkaisut

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Testejä suhdeasteikollisille muuttujille

MTTTP1, luento KERTAUSTA

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MTTTP5, luento Luottamusväli, määritelmä

Testit laatueroasteikollisille muuttujille

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Sovellettu todennäköisyyslaskenta B

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MTTTP1, luento KERTAUSTA

Perusnäkymä yksisuuntaiseen ANOVAaan

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Testit järjestysasteikollisille muuttujille

Mat Sovellettu todennäköisyyslasku A

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Vilkkumaa / Kuusinen 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 7: NCSS - Tilastollinen analyysi

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Kandidaatintutkielman aineistonhankinta ja analyysi

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Estimointi. Otantajakauma

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

tilastotieteen kertaus

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Todennäköisyyden ominaisuuksia

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Osa 2: Otokset, otosjakaumat ja estimointi

6. laskuharjoitusten vastaukset (viikot 10 11)

Sovellettu todennäköisyyslaskenta B

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Teema 8: Parametrien estimointi ja luottamusvälit

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Harjoitus 2: Matlab - Statistical Toolbox

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

2. TILASTOLLINEN TESTAAMINEN...

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Til.yks. x y z

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

&idx=2&uilang=fi&lang=fi&lvv=2015

Transkriptio:

Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien osuus on enintään 10 %. Saapuneesta erästä otetaan 250 komponentin otos, joista 35 on viallisia. Hylätäänkö erä 1 % riskitasolla? (max 10p) b) Tuhannen opiskelijan otoksen perusteella havaittiin, että kurssille ilmoittautuneista 60 % osallistuu luennoille. Opettaja haluaa olla 95 % varma siitä, että kaikki halukkaat mahtuvat luentosaliin. Kuinka monen hengen sali hänen on varattava, jos kurssille on ilmoittautunut 205 opiskelijaa? (max 10p) Tehtävä 2 Suomalaisyritysten seurantatutkimuksessa kerättiin tuhannelta satunnaisesti valitulta yritykseltä syksyllä 1999 ja uudelleen syksyllä 2009 seuraavat tiedot: 1. Liikevaihto edellisellä tilikaudella (milj., ei voida olettaa populaatiossa normaalijakautuneeksi) 2. Kokopäiväisten työntekijöiden määrä (kpl, ei voi olettaa populaatiossa normaalijakautuneeksi) 3. Kansainvälistyminen (0= ei kv toimintaa, 1= on kansainvälistynyt) 4. Toimiala (1= teollisuus, 2= kauppa, 3= muu palvelu) 5. Toimitusjohtajan arvio yrityksen menestyksestä (kouluarvosana 4 10, voidaan olettaa populaatiossa normaalijakautuneeksi) 6. Korkeakoulututkinnon suorittaneiden % -osuus kaikista työntekijöistä (voidaan olettaa normaalijakautuneeksi populaatiossa) 7. Toimitusjohtajan sukupuoli (1= mies, 2= nainen) 8. T&K menot (, ei voi olettaa populaatiossa normaalijakautuneeksi 9. Taseen loppusumma (, ei voi olettaa populaatiossa normaalijakautuneeksi) 10. Toimitusjohtajan arvio yrityksen innovatiivisuudesta (1= ei innovatiivinen, 2= jokseenkin innovatiivinen, 3=erittäin innovatiivinen) 2.1 Tunnista yllä olevien muuttujien mitta-asteikkotasot (max 10 p) 2.2 Jos tehtävänäsi olisi tutkia seuraavia asioita, niin mitä testiä käyttäisit? Mainitse myös testien oletushypoteesit. (Joka kohdassa yksi piste testin nimestä ja yksi hypoteesien kuvauksesta. max 20 p) a) onko 30% populaation yrityksistä kansainvälistynyt? b) onko yritysten liikevaihto keskimäärin kasvanut 1999-2009? c) onko toimitusjohtajan sukupuoli erilainen eri toimialoilla? d) ovatko erittäin innovatiiviset yritykset menestyneet paremmin kuin muut? e) eroavatko T&K-menot toimialoittain? f) onko innovatiivisuus tasajakautunut? g) onko v. 2009 T&K-menojen osuudella liikevaihdosta yhteyttä yrityksen menestymiseen? h) onko yritysten menestyminen parantunut 1999-2009? i) ovatko miesjohtoiset yritykset liikevaihdoltaan suurempia kuin naisjohtoiset? j) onko toimialalla yhteyttä arvioon yrityksen menestymisestä?

Tehtävä 3 Satunnaisesti valituilta kahdeksalta yritykseltä kysyttiin vuonna 2012, kuinka monta prosenttia työntekijöiden työajasta kuluu sosiaalisessa mediassa notkumiseen. Kysely toistettiin vuonna 2014. Yritysten vastaukset on kirjattu Taulukkoon 1. Onko sosiaalisen median käyttö työajalla kasvanut vuodesta 2012 vuoteen 2014? (10 % riskitaso)? Molempien muuttujien voidaan olettaa noudattavan normaalijakaumaa populaatiossa. (max 20p) Taulukko 1 Yritys Some2012 (%) Some2014 (%) 1 10 15 2 20 23 3 15 15 4 32 40 5 18 25 6 28 27 7 17 20 8 6 16 Tehtävä 4 Kahden LUT:n järjestämän kurssin opiskelijoilta kysyttiin heidän asenteistaan tuulivoimaa kohtaan. Tuloksista analysoitiin katilaisten ja enteläisten välisiä eroja sekä asenteiden välisiä yhteyksiä. Toinen käytetty muuttuja (Energia) oli väittämä Olen kiinnostunut energiakysymyksistä ja toinen (Tuuli) oli väittämä Suhtaudun tuulivoimaan myönteisesti. Molemmat muuttujat saivat arvoja 0 (Täysin eri mieltä) 100 (Täysin samaa mieltä). Molemmat muuttujat voidaan olettaa normaalijakautuneiksi populaatiossa. Alla ovat analyyseihin liittyvät SAS-tulosteet. Tarkastele tulosteita (Taulukot 2-10) ja vastaa niiden perusteella seuraaviin kysymyksiin. Vastausvaihtoehdot: kyllä, ei, ei voi päätellä tulosteesta. (2p jokaisesta, max 20p) a) Energia-muuttujan varianssit katilaisilla ja enteläisillä poikkeavat toisistaan tilastollisesti merkitsevästi kun riskitasona on 5 %. b) Tuuli-muuttujan varianssit katilaisilla ja enteläisillä eivät poikkea toisistaan tilastollisesti merkitsevästi kun riskitasona on 5 %. c) Kun testataan, onko Energia-muuttujan keskiarvoissa eroa katilaisten ja enteläisten välillä, testitulos luetaan taulukosta 4 riviltä Pooled (5 % riskitaso). d) Kun testataan onko Tuuli-muuttujan keskiarvoissa eroa katilaisten ja enteläisten välillä, testitulos luetaan taulukosta 8 riviltä Pooled (5 % riskitaso). e) Ero muuttujan Olen kiinnostunut energiakysymyksistä keskiarvoissa katilaisten ja enteläisten välillä on tilastollisesti merkitsevä 5 % riskitasolla. f) Ero muuttujan Suhtaudun tuulivoimaan myönteisesti keskiarvoissa katilaisten ja enteläisten välillä on tilastollisesti merkitsevä 10 % riskitasolla. g) Tuloksista voi päätellä, että enteläiset opiskelijat suhtautuvat tuulivoimaan keskimäärin myönteisemmin kuin katilaiset (10 % riskitaso). h) Tuloksista voi päätellä, että katilaiset opiskelijat ovat keskimäärin kiinnostuneempia energiakysymyksistä kuin enteläiset (5 % riskitaso) i) Taulukon 10 tilastollisen testin nollahypoteesi on muotoa Kiinnostuminen energiakysymyksistä korreloi sen kanssa, kuinka myönteisesti suhtautuu tuulivoimaan. j) Taulukon 10 tulosten perusteella voidaan sanoa, että ne, jotka ovat kiinnostuneempia energiakysymyksistä suhtautuvat tuulivoimaan myönteisemmin (5 % riskitaso).

Variable: Energia (Olen kiinnostunut energiakysymyksistä) Taulukko2 Kati/Ente N Mean Std Dev Std Err Minimum Maximum Ente 41 86.3171 15.7836 2.4650 30.0000 100.0 Kati 128 59.7266 27.3639 2.4186 0 100.0 Diff (1-2) 26.5905 25.0819 4.5010 Taulukko3 Kati/Ente Method Mean 95% CL Mean Std Dev 95% CL Std Dev Ente 86.3171 81.3352 91.2990 15.7836 12.9585 20.1952 Kati 59.7266 54.9405 64.5126 27.3639 24.3727 31.1987 Diff (1-2) Pooled 26.5905 17.7043 35.4767 25.0819 22.6562 28.0940 Diff (1-2) Satterthwaite 26.5905 19.7526 33.4284 Taulukko 4 Method Variances DF t Value Pr > t Pooled Equal 167 5.91 <.0001 Satterthwaite Unequal 119.28 7.70 <.0001 Taulukko 5 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F 127 40 3.01 0.0001 Variable: Tuuli (Suhtaudun tuulivoimaan myönteisesti) Taulukko 6 Kati/Ente N Mean Std Dev Std Err Minimum Maximum Ente 41 69.0000 25.9355 4.0504 0 100.0 Kati 128 76.7031 20.9312 1.8501 3.0000 100.0 Diff (1-2) -7.7031 22.2327 3.9897 Taulukko 7 Kati/Ente Method Mean 95% CL Mean Std Dev 95% CL Std Dev Ente 69.0000 60.8137 77.1863 25.9355 21.2934 33.1845 Kati 76.7031 73.0422 80.3641 20.9312 18.6432 23.8645 Diff (1-2) Pooled -7.7031-15.5798 0.1736 22.2327 20.0825 24.9025 Diff (1-2) Satterthwaite -7.7031-16.6179 1.2116 Taulukko 8

Method Variances DF t Value Pr > t Pooled Equal 167-1.93 0.0552 Satterthwaite Unequal 57.641-1.73 0.0890 Taulukko 9 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F 40 127 1.54 0.0767 Tuuli Suhtaudun tuulivoimaan myönteisesti. Energia Olen kiinnostunut energiakysymyksistä Taulukko 10 Pearson Correlation Coefficients, N = 171 Prob > r under H0: Rho=0 Tehtävä 5 Pitävätkö seuraavat väittämät paikkansa? (1p jokaisesta, max 10p) a) Kuva 1 (seuraavalla sivulla) on nimeltään sirontakuvio b) Kuvan 1 tyyppinen muuttuja soveltuu muuttujan jakauman tarkasteluun. c) Binomijakauma lähenee normaalijakaumaa (odotusarvo np ja varianssi npq) suurilla toistomäärillä d) Standardoidun normaalijakauman tiheysfunktio on symmetrinen keskiarvon molemmin puolin e) Ordinaaliasteikolliselle muuttujalle on mielekästä laskea keskiarvo f) Varianssin neliö on keskihajonta g) Arvon x i standardoitu arvo z i kuvaa, kuinka monen keskihajonnan päässä arvo x i on muuttujan keskiarvosta h) Säilyketehtaassa käytetään automaattisia laitteita purkkien täyttämiseen. Purkkien tulisi painaa 16 unssia. Laitteiden säädön tarkistamiseksi otettiin eräänä päivänä tuotannosta 100 purkin satunnaisotos, josta painon keskiarvoksi saatiin 16,10 unssia. Purkkien painon tiedetään olevan normaalijakautunut ja populaation keskihajonta on tiedossa. Otoksen perusteella keskiarvolle lasketun 99 % luottamusvälin päätepisteet ovat LCL = 15,99 unssia ja UCL = 16,29 unssia. Tuloksen perusteella purkituslaitteen säätöjä ei tarvitse muuttaa (kun = 0,01). i) Pearsonin korrelaatio kuvaa kahden muuttujan keskiarvojen eroa. j) Ristiintaulukoinnissa odotetut frekvenssit ovat sellaisia, joita aineistosta odotetaan löytyvän, jos nollahypoteesi pitää paikkansa. Tuuli Energia 1.00000 0.15950 0.0372 0.15950 0.0372 1.00000

Kuva 1