Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003



Samankaltaiset tiedostot
r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

11. laskuharjoituskierros, vko 15, ratkaisut

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Harjoitus 7: NCSS - Tilastollinen analyysi

HAVAITUT JA ODOTETUT FREKVENSSIT

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Mat Tilastollisen analyysin perusteet, kevät 2007

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Mat Sovellettu todennäköisyyslasku A

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Otoskoko 107 kpl. a) 27 b) 2654

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Sovellettu todennäköisyyslaskenta B

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

pisteet Frekvenssi frekvenssi Yhteensä

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Estimointi. Otantajakauma

Matemaatikot ja tilastotieteilijät

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Hypoteesin testaus Alkeet

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

Järvitesti Ympäristöteknologia T571SA

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Sovellettu todennäköisyyslaskenta B

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

031021P Tilastomatematiikka (5 op) viikko 5

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Testejä suhdeasteikollisille muuttujille

Lohkoasetelmat. Heliövaara 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

10. laskuharjoituskierros, vko 14, ratkaisut

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

1. Tutkitaan tavallista kahden selittäjän regressiomallia

dx=5&uilang=fi&lang=fi&lvv=2014

P5: Kohti Tutkivaa Työtapaa Kesä Aritmeettinen keskiarvo Ka KA. Painopiste Usein teoreettinen tunnusluku Vähintään välimatka-asteikko.

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Hierarkkiset koeasetelmat. Heliövaara 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

n = 100 x = %:n luottamusväli µ:lle Vastaus:

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit laatueroasteikollisille muuttujille

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Todennäköisyyden ominaisuuksia

Transkriptio:

Nimi Opiskelijanumero Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Normaalisti jakautuneiden yhdistyksessä on useita tuhansia jäseniä. Yhdistyksen sääntöjen mukaan sääntöihin tehtävää muutosta pitää kannattaa vähintään 75 % jäsenistä, jotta muutos tulisi voimaan. Kalle Keskihajonta oli päättänyt ehdottaa sääntöihin mielestään hyvän tarkennuksen, ja tarkennuksella oli Kallen mielestä hyvä läpimenomahdollisuus mikäli ehdotuksesta äänestettäisiin (kaikki jäsenet äänestävät). Varmistaakseen käsityksensä Kalle haastatteli 30 satunnaisesti valittua ritarikunnan jäsentä, joista 24 kannatti tarkennusta (6 vastusti). Kumpi seuraavista hypoteeseistä on nola- ja kumpi vastahypoteesi. Tarkennus hyväksytään (π > 0.75) Tarkennus hylätään (π <= 0.75) Suoritettuun testiin liittyvä p-arvo on 0.264. Millaisen päätöksen oletat Kalle Keskihajonnan tekevän. Voiko tehty päätös olla virheellinen? Jos voi, kuvaa millaisen virheen (virheitä) Kalle voi tehdä. Muodosta 95 %:n luottamusväli tarkennusta kannattavien osuudelle ritarikunnassa. Onko 0.75 muodostamallasi luottamusvälillä 2 Tutkimuksen tarkoituksena oli selvittää elinympäristön vaikutusta poikien fysikaaliseen kuntoon. Tätä varten testattiin 12 maalaispoikaa ja 12 kaupunkilaispoikaa, ja saadut testitulokset olivat: DATA X: 2.7 4.2 5.6 6.1 6.3 7.3 9.0 10.5 11.4 12.5 12.9 14.8 DATA Y: 2.4 6.2 7.6 9.9 10.3 12.7 14.2 15.0 15.3 16.9 17.7 18.6

Testaus päätettiin suorittaa käyttäen Mann-Whitneyn testiä. Miksi? Mitkä ovat testiin liittyvät hypoteesit. Määrää järjestyslukujen summa otoksittain. Mikä on Mann-Whitneyn testisuuren arvo Jääkö nollahypoteesi voimaan. Käytä 5 %:n riskitasoa. Perustele 3 Yritys oli hankkinut uuteen toimintaperiaatteeseen perustuvia työstökoneita. Näiden uusien koneiden käyttäjiksi yrityksellä oli mahdollisuus kouluttaa joko kokeneita, aikaisempaa työstökonemallia käyttäneitä työntekijöitä tai osaston B uusia työntekijäitä. Asiaa päätettiin selvittää kokeen avulla. Koetta varten valittiin 12 osasto B:n työntekijää ja 12 vanhan työstökoneen käyttäjää Molemmat ryhmät jaettiin satunnaisesti kahteen 6 työntekijän ryhmään, käyttämään joko vanhaa tai uutta työstökonetta. Miksi ryhmät jaettiin satunnaisesti kahteen ryhmään? Koulutusjakson päätyttyä laskettiin päivän aikana syntyneiden virhekappaleiden lukumäärä, ja saatiin seuraavat tulokset: Vanha kone Uusi kone Uusi työntekijä 4,5,7,6,8,5 5,6,5,6,5,6 Vanha työntekijä 1,2,2,3,2,3 8,9,8,8,7,9

Ruutukeskiarvot olivat: Vanha kone Uusi kone Uusi työntekijä 5.83 5.50 Vanha työntekijä 2.17 8.17 Piirrä keskiarvoihin liittyvät profiilit kumpaankin suuntaan. 5 5 4 4 3 3 2 2 1 1 0 0 1 2 3 4 5 0 0 1 2 3 4 5 Tulkitse kuvat sanallisesti. Tuloksia analysoitiin myös kaksisuuntaisen varianssianalyysin avulla. Onko menetelmä oikea? Analyysiin liittyvä varianssitaulu on Varianssitaulu Vaihtelun Neliösumma vap.ast Var estim. lähde Työntekijä 1.5000000 1 1.5000000 Kone 48.166667 1 48.166667 Työnt*Kone Jäännös 18.000000 20 0.9000000 Summa 127.833334 23 Täydennä taulukkoon puuttuvat luvut. Testaa onko yhdysvaikutus merkitsevä. Riski 5 %.

Mikä on johtopäätös kokeesta. Kannattaako kouluttaa uusia työntekijöitä uusille koneille vai uudelleenkouluttaa vanhan koneen käyttäjiä. Perustele. 4 Tutkija halusi selvittää, mitä mieltä kansalaiset ovat tehdystä lakiuudistusehdotuksesta. Tutkimusta varten haastateltiin 200 satunnaisesti valittua täysi-ikäistä kansalaista. Haastattelussa selvitettiin paitsi suhtautumien lakiehdotukseen (Puolesta - Vastaan), myös haastateltavan poliittinen asenne (Konservatiivi / Liberaali) Tulokset olivat Puolesta Vastaan Ei osaa sanoa Yhteensä Konservatiivi 78 30 12 120 Liberaali 18 50 12 80 Yhteensä 96 80 24 200 Mikä on todennäköisyys sille, että satunnaisesti valittu tutkimukseen tullut haastateltava on konservatiivi. Mikä on todennäköisyys sille, että satunnaisesti valittu tutkimukseen tullut haastateltava on lakiehdotuksen puolesta Mikä on todennäköisyys sille, että satunnaisesti valittu tutkimukseen tullut haastateltava on konservatiivi ja on lakiehdotuksen puolesta. Mikä edellä olevan todennäköisyyden pitäisi olla, mikäli ominaisuudet ovat toisistaan riippumattomia.

Kuinka paljon havaintoja eri ruuduissa pitäisi olla, mikäli ominaisuudet oletetaan toisistaan riippumattomiksi. Puolesta Vastaan Ei osaa sanoa Yhteensä Konservatiivi 120 Liberaali 80 Yhteensä 96 80 24 200 Laske χ 2 (chi^2) testisuure Miten paljon testisuureella on vapausasteita? Mikä on testisuureen kriittinen arvo? Ovatko ominaisuudet toisistaan riippumattomia. 5 Tutkijalle oli esitetty väite, että lenkkeily ei ainoastaan nosta fysikaalista kuntoa, vaan vaikuttaa myös henkisesti kohottaen hölkkääjän itsearvostusta. Tutkiakseen väitettä tutkija haastatteli 10 henkilöä, joiden perusteella hän arvioi heidän hölkkäharrastuksen ja itsearvostuksensa määrän. Tulokset olivat: Heikki 18 15 Jyrki 17 18 Jussi 15 12 Kalle 12 16 Jukka 10 6 Anssi 9 10 Janne 8 8 Otto 6 7 Ilari 5 5 Mikko 1 2 Tutki Spearmannin ρ (rho:n) avulla onko muuttujien välillä riippuvuutta.

Mitä Spearmannin ρ (rho) mittaa Miksi tutkija laski Spearmannin ρ (rho:n) eikä tavallista Pearssonin korrelaatiokerrointa?