Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op)

Koko: px
Aloita esitys sivulta:

Download "Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op)"

Transkriptio

1 Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (.5 op) Taina I. Lehtinen PL 9 Siltavuorenpenger 3A (. kerros), Helsingin yliopisto Taina.Lehtinen@Helsinki.FI Valokuva: Ida Pimenoff 1 Kuvaus ja tavoitteet Määrällisiin tutkimusmenetelmiä käsittelevässä osassa opiskelija ymmärtää tilastollisen päätöksenteon perusteita tunnistaa tilastollisia aineistohankintamenetelmiä osaa tilastollisen kuvauksen perusteita ja mittaamista sekä tutustuu tilastollisiin perusanalyysimenetelmiin Konkreettisina osaamistavoitteina on, että kurssin määrällisen tutkimuksen osuuden suoritettuasi osaat käyttää tilastotieteellisiä peruskäsitteitä... osaat muodostaa yksiulotteisen ja kaksiulotteisen frekvenssijakauman... osaat valita ja laskea soveltuvan kuvailevan tunnusluvun... ymmärrät normaalijakauman perusidean ymmärrät perusanalyysit t-testin ja riippumattomuustestin (+ niiden SPSS-analyysit tulkintoineen) 3 Taina I. Lehtinen 1

2 Sisältö Johdantoa 1. Mitä tilastotiede on. Tilastotieteellisiä peruskäsitteitä 3. Tilastollinen kuvaaminen Frekvenssijakaumat Kuvailevat tunnusluvut Kahden muuttujan välinen riippuvuus Korrelaatio Ristiintaulukko 4. Tilastollinen päättely Normaalijakauma Standardi(z-)piste Kertymäfunktioarvot Hypoteesin testaaminen Kahden tunnusluvun eron merkitsevyyden testaaminen 4 Johdantoa Tieteellinen tutkimus Kahden riippumattoman keskiarvon eron merkitsevyyden testaaminen (t-testi) -riippumattomuustesti Teoreettiskäsitteellinen tutkimus Empiirinen tutkimus -havainnot ei havaintoja perustuu loogiseen päättelyyn Kvantitatiivinen kvantiteetti määrä Kvalitatiivinen kvaliteetti laatu 6 Taina I. Lehtinen

3 Keskeistä kvantitatiivisessa tutkimuksessa (Hirsjärvi ym. 1997): Tutkimuksen suunnittelu Johtopäätökset aiemmista tutkimuksista Käsitteiden määrittely Hypoteesien esittäminen (aiemmat tutkimukset tai teoria) Aineiston hankinta Tutkittavien henkilöiden valinta (otantasuunnitelmat; perusjoukko, otos) tai koehenkilöt Aineiston kerääminen (määrällinen, numeerinen mittaaminen) tai koejärjestelyt havaintomatriisi Aineiston tilastollinen käsittely Johtopäätökset Johtopäätökset aineiston tilastollisen analyysin perusteella Raportin laadinta 7 1. Mitä tilastotiede on? Mitä tilastotiede on? Yksikköjen muodostamaan joukkoon liittyvää numeerisen tietoaineiston keräämistä, analysointia ja tulkintaa koskeva tiede Tilastotiede on oppi siitä, miten reaalimaailman tilasta tai ilmiöistä tehdään päätelmiä, tilasta tai ilmiöstä kerättyjen numeeristen tietojen perusteella Tilastotiede EI ole oppia tilastoista tai niiden laatimisesta! 9 Taina I. Lehtinen 3

4 Tilastotiede on saanut alkunsa yhteiskunnan modernisoituessa, jolloin on tarvittu yhä enemmän tilastotietoja hallinnon tarpeisiin Englannissa ja Ranskassa jo 1600-luvulla väestötilastot, maanomistustilastot, onnettomuus- ja kuolleisuustilastot, Ruotsi-Suomessa väestötilasto, alkaen v. 1749, on maailman vanhin nykyaikaan katkeamattomana jatkunut tilasto 10 Tilastotiedettä käytetään apuvälineenä kaikissa tieteissä, joissa analysoidaan numeerisia tutkimusaineistoja psykologia psykometria kansantaloustiede ekonometria biotieteet biometria väestötiede demometria kemia kemometria 11. Tilastotieteellisiä peruskäsitteitä Taina I. Lehtinen 4

5 Perusjoukko (populaatio): kaikki tutkimuksen kohteena olevat yksiköt, objektit tai tapahtumat Näyte: mikä tahansa osa perusjoukosta Jos näytteen yksiköt on poimittu käyttäen otantamenetelmää (mm. yksinkertaunen satunnaisotos, systemaattinen satunnaisotos), niin kyseessä on otos Otoksen perusteella tehdään johtopäätöksiä liittyen koko perusjoukkoon Tilastoyksikkö, havaintoyksikkö, analyysiyksikkö: perusjoukon tai otoksen alkio voivat olla konkreettisia (oppilas, luokka, kotitalous, porkkana, liikenneonnettomuus) tai abstrakteja (vuorokausi) voi saada vain yhden havaintoarvon kullakin muuttujalla 15 Taina I. Lehtinen 5

6 Muuttuja kuvaa tilastoyksikköön liittyvää ominaisuutta, jota halutaan tarkastella (mitata) Esim. pituus, paino, sukupuoli, suhtautuminen EU:iin, lujuus, asenne turvapaikanhakijoihin muuttuja on ominaisuus, suure, joka voi saada erilaisia määrällisesti tai laadullisesti vaihtelevia arvoja numeeriset muuttujat mittaavat määrällisiä ominaisuuksia (esim. lasten lukumäärä, vastaajien ikä, tulot) ja ei-numeeriset muuttujat laadullisia ominaisuuksia (esim. sukupuoli) 16 jatkuva muuttuja: arvojen lukumäärä rajaton, riippuu vain mittaustarkkuudesta; kahden muuttuja-arvon väliin voidaan lisätä arvoja halutun mittatarkkuuden mukaan epäjatkuva, diskreetti muuttuja: voi saada vain tiettyjä ennalta määrättyjä arvoja dikotominen eli -luokkainen muuttuja, ns. dummy-muuttuja 17 Muuttujatyypit riippumaton muuttuja (x-muuttuja, selittävä muuttuja, syy -muuttuja) tutkija manipuloi/varioi (kokeellisessa asetelmassa) esim. ärsyke, ohjauksen määrä, melu usein taustamuuttujat (sukupuoli, koulutus, ammatti, sos.ekonom. asema, ) riippuva muuttuja (y-muuttuja, selitettävä muuttuja, seuraus -muuttuja) riippuu (vaihtelee) x-muuttujan eri arvoilla reaktio, oppimistulos, vaikutus suoritukseen, väliintuleva muuttuja on tekijä, joka vaikuttaa x:n ja y:n väliseen suhteeseen, ja sillä on asiayhteys molempiin; oltava dataa ennen kuin voidaan konrilloida 18 Taina I. Lehtinen 6

7 Mittaaminen on sitä, että määritellään muuttujalle arvo Esim. kartoitetaan oppilaan persoonallisuutta, tarkastellaan ihmistä pituuden mukaan, tutkitaan suomalaisten asennetta turvapaikahakijoihin, 19 Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku 4. MUUTTUJA Kvalitatiivinen Kvantitatiivinen Diskreetti Jatkuva Luokitteluasteikko; SUKUPUOLI Nainen = 1 Mies = Järjestysasteikko; TENTIN ARVOSANA: 1 = Välttävä,, 5= Erinomainen Välimatka-asteikko; LÄMPÖTILA, VUOSILUKU Suhde-asteikko; IKÄ, TULOT, PITUUS 0 Mittari osio = kyselylomakkeen väittämä, kysymys (x1, x,,xk) = muuttuja asteikko = osion pisteytys (esim. skaala 1 5) summamuuttuja = muuttuja, joka saadaan laskemalla osioiden pistemäärät yhteen (esim. sum1 = x1 + x +x3) summapistemäärä = yhteenlaskettujen osioiden pistemäärä havainnoittain (5-portaisella asteikolla 3 väittämän pistemäärän vaihteluväli 3 15) 1 Taina I. Lehtinen 7

8 Havaintoarvo on se muuttujan arvo, joka saadaan tietyssä tutkimustilanteessa 39 vuotta Kato on se osa otoksesta, joka jostakin syystä jää pois tutkimuksesta ilmoitetaan %:na, esim. jos 1/4 jää pois, kato on 5% Yhteenveto Populaatio Otos Tilastoyksikkö Muuttuja ja havainto Naiset 65% Naiset 65% Miehet 35% Miehet 35% Pituus 170 cm 3 Havaintomatriisi Tilastoyksiköiden saamat mittaustulokset (numeroarvot) tallennetaan matriisimuotoon (johonkin tilasto-ohjelmistoon, esim. SPSS), jossa tilastoyksiköt (a 1,, a n ) muodostavat matriisin rivit muuttujat (x 1,,x k ) sen sarakkeet esim. 1. havainto/tilastoyksikkö on mies, depressiopisteet 7 ) 4 Taina I. Lehtinen 8

9 Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä harjoitusaineistoon, sivu 3. Muuttujat Tilastoyksikkö Sukupuoli Ikä Depressio WAIS Työmuisti Jne. Vastaaja 1 Mies Vastaaja Nainen Vastaaja 3 Nainen 98 5 Vastaaja 4 Mies Vastaaja 5 nainen Jne. = puuttuva tieto 5 Aineiston tilastollinen käsittely kuvaileva analyysi (jakaumat, tunnusluvut, graafit) muuttujien muokkaus tarpeen mukaan (skaalauksen kääntäminen, summamuuttujat, luokitukset, ) aineiston syvällisempi analyysi (riippuvuudet, hypoteesien testaaminen testit, mallit) 6 Hypoteesin testaaminen H 0 = nollahypoteesi H 1 = tutkimushypoteesi /vaihtoehtoinen hypoteesi testauksen perusteella valitaan joko H 0 tai H 1 valintaan liittyy riski tehdä virhe (mikä on todennäköisyys, että tehty valinta hypoteesien suhteen onkin väärä) = merkitsevyystaso 7 Taina I. Lehtinen 9

10 3. Tilastollinen kuvaaminen Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku. Yksiulotteinen frekvenssijakauma tavoitteena on kuvailla luokitteluasteikolla mitattua ilmiötä, antaa yleiskuva ilmiöstä taulukon avulla Sukupuoli Mies Nainen Yht. Frekv. % , , ,0 Suomalainen seksi, Valid Missing Total Ylioppilastutkinto Keski- tai peruskoulu Kansa- tai kansalaiskoulu Ei mitään näistä Total Eos System Total Peruskoulutus Cumulative Frequency Percent Valid Percent Percent 503,4,4, ,6 30,6 53, ,0 44,0 97,0 67 3,0 3,0 100, ,9 100,0 1,0 1,0, ,0 Suomalainen seksi, Taina I. Lehtinen 10

11 Frequency Graafiset esitykset Bar chart Histogram Kouluvuodet Mean = 11,03 Std. Dev. = 3,695 N = 47 3 Esimerkit perustuvat dataan: Breast cancer survival. SPSS 14.0 for Win 33 Taina I. Lehtinen 11

12 Breast cancer survival -aineisto Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku 3. Kaksiulotteinen frekvenssijakauma on taulukko, josta ilmenee kahden muuttujan arvojen luokitus ja luokkiin kuuluvien havaintojen frekvenssit Sukupuoli Neliötäydennystesti Tyttö Poika Yht Yht. n=8 n= N=50 36 Taina I. Lehtinen 1

13 Yleensä esitetään pelkkien luokkafrekvenssien sijasta luokkien prosenttiosuudet, jotka lasketaan riippumattoman/selittävän (tai sellaiseksi ajateltavissa olevan muuttujan) suuntaisesti Sukupuoli Neliötäydennystesti Tyttö Poika % 100 % n=8 n= Agecat * Pathological Tumor Size (Categories) Crosstabulation Pathological Tumor Size Total (Categories) <= cm -5 cm > 5 cm ,4% 55,6% 0,0% 100,0% ,0% 4,7% 3,% 100,0% Age- 68,7% 31,0% 0,4% 100,0% category ,0% 1,5% 1,5% 100,0% ,9% 18,3% 0,8% 100,0% ,9% 17,6% 0,5% 100,0% Total ,7% 5,% 1,1% 100,0% Mitä taulukko esittää? Mikä on N? Mihin suuntaan % on laskettu rivi vai sarake? Riippumaton? ja riippuva muuttuja? Tulkitse tulos sanallisesti, onko kasvaimen koossa eroja eri ikäluokissa? Yleiset havainnot? 39 Taina I. Lehtinen 13

14 Agecat * Pathological Tumor Size (Categories) Crosstabulation Pathological Tumor Size Total (Categories) <= cm -5 cm > 5 cm ,4% 55,6% 0,0% 100,0% ,0% 4,7% 3,% 100,0% Age ,7% 31,0% 0,4% 100,0% category ,0% 1,5% 1,5% 100,0% ,9% 18,3% 0,8% 100,0% ,9% 17,6% 0,5% 100,0% Total ,7% 5,% 1,1% 100,0% 40 Kuvailevat tilastolliset tunnusluvut Sijaintiluvut Moodi Mo Mediaani Md Hajontaluvut Vaihteluväli Keskihajonta s Keskiarvo x 41 Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku 5. Sijaintiluvut (jakauman sijainti, keskiluvut) Moodi Mo Tyyppiarvo, tyypillisin arvo aineistossa Sopii kaikille asteikoille Esim. jos aineiston N=150, josta 70 on naisia ja 80 miehiä Mo = Mies 4 Taina I. Lehtinen 14

15 Mediaani Md Aineiston keskimmäinen havaintoarvo, kun arvot on asetettu suuruusjärjestykseen Sopii vähintään järjestysasteikolle Md x n1 Esim. jos aineiston (N=9) henkilöiden pituudet ovat 16 cm, 167 cm, 168 cm, 170 cm, 180 cm, 181 cm, 18 cm 184 cm ja 186 cm keskimmäinen havainto on 5. pituusarvo eli Md=180 cm 43 Aritmeettinen keskiarvo painopiste usein teoreettinen tunnusluku vähintään välimatka-asteikko Esim. jos aineiston (N=9) henkilöiden iät ovat 18, 19, 4,,, 5, 1, ja 95 vuotta x 9. 8 vuotta x n i 1 n x i 44 Keskilukujen vertailua Keskiarvo hyvä tunnusluku symmetrisissä jakaumissa Monet standardimenetelmät perustuvat keskiarvoon Keskiarvo on herkkä poikkeaville havainnoille Mediaani kuvaavampi vinoissa jakaumissa 45 Taina I. Lehtinen 15

16 Iän keskiluvut ika N Mean Median Mode Valid Missing 47 4, 41,0 34 Suomalainen seksi, a. Vasemmalle vino jakauma (negatiivinen vinous) b. Symmetrinen jakauma c. Oikealle vino jakauma (positiivinen vinous) a b c x x 47 Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku 6. Hajontaluvut Vaihteluväli W = max min Vähintään järjestysasteikko Keskihajonta s SD Tärkein hajontaluku Vaihtelu keskiarvon ympärillä Käytetään empiirisessä tutkimuksessa Vähintään välimatka-asteikko s n i1 ( x i x) n 1 48 Taina I. Lehtinen 16

17 Keskihajonnan yleisiä ominaisuuksia s 0 mitä suurempi s:n arvo, sitä enemmän havaintoarvot ovat hajallaan aritmeettisen keskiarvon ympärillä erikoistapaus: s = 0 eli ei hajontaa vaan kaikki havaintoarvot ovat samoja 49 N(, s) x kertoo jakauman sijainnin lukusuoralla s kertoo jakauman huipukkuuden (kapea korkea; leveä litteä) 50 Breast cancer survival -aineisto Taulukko. Iän tunnuslukuja Age (years) N Valid 107 Missing puuttuvat 0 Mean keskiarvo 56,39 Median mediaani 56,00 Mode moodi 49 Std. Deviation keskihajonta 13,38 Range vaihteluvälin pituus 66 Minimum minimi Maximum maksimi 88 Percentiles 5 persentiili 46,00 eli 50 prosentti- 56,00 piste 75 67,00 51 Taina I. Lehtinen 17

18 Mo = 49 Md = 56 = Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku 8. Kahden muuttujan välinen riippuvuus Riippuvuus x y kausaalisuus? x y asiayhteys 53 Tunnusluvut Korrelaatiokertoimet Spearmanin järjestyskorrelaatio Pearsonin (tulomomentti)korrelaatio Khiin neliö (chi square) Kontingenssikerroin Taulukot, kuviot Ristiintaulukot, hajontakuviot 54 Taina I. Lehtinen 18

19 y-muuttuja R Sq Linear = 0, x-muuttuja Riippuvuus? Hukkumiskuolemat Jäätelönmyynti x y USA 1970-luku: Nopeusrajoitukset x Auto-onnettomuudet (kuolemantapaukset) vähenivät y 55 Riippuvuus/riippumattomuus määritelmä : jos x ja y ovat toisistaan riippumattomia, niin muuttujan x arvojen vaihtelu ei lisää informaatiota muuttujan y arvojen vaihtelusta (ei myöskään päinvastoin) 56 Positiivinen korrelaatio Negatiivinen korrelaatio Ei riippuvuutta (korrelaatiota) Riippuvuus voi myös olla epälineaarista 57 Taina I. Lehtinen 19

20 Spearmanin järjestyskorrelaatiokerroin rho (r s ) ei-parametrinen korrelaatio vaihteluväli 1 r s +1 Pearsonin tulomomenttikorrelaatiokerroin (r xy ) parametrinen korrelaatio vaihteluväli 1 r xy Spearmanin rho (r s ) r s n 6 i n( n 1 1 di 1) d i = järjestyspisteiden erotus n = havaintojen lukumäärä 59 Esim. Lasketaan kahdessa kauneuskilpailussa x ja y mukana olleiden kaunotarkandidaattien a i (i=1,, 3, 4) sijoitusten välinen korrelaatio 60 Taina I. Lehtinen 0

21 Kilpailu_ Sijoitus 1. Sijoitus. d i (=x i y i ) d i kilpailussa kilpailussa a a a a 4 1 6* r *(4 1) 61 Kertoimen arvo osoittaa positiivista yhteyttä muuttujien x (sijoitus 1. kilpailussa) ja y (sijoitus. kilpailussa) välillä eli kaunotarkandidaatit sijoittuivat molemmissa kilpailuissa melko samalla tavalla Kilpailu_1 63 Taina I. Lehtinen 1

22 Pearsonin tulomomenttikorrelaatiokerroin (r xy ) r xy n n i1 x i n n xi yi xi yi i1 i1 i1 n i1 n x i n i n n n yi 1 i1 y i 64 Esim. Lasketaan viiden isän painon (x i ) ja pojan painon (y i ) välinen korrelaatio 65 Isän paino x i Pojan paino y i x i * y i x i y i a a a a a Taina I. Lehtinen

23 pojan paino (y) 5* *388 r (5* )*(5* ) r ( )*( ) r * Kertoimen arvo osoittaa positiivista yhteyttä muuttujien x (isän paino) ja y (pojan paino) välillä eli mitä painavampi isä on, sitä painavampi myös poika on Poika = 7 kg Isä = 79 kg isän paino (x) 69 Taina I. Lehtinen 3

24 PAINO Sukupuoli mies nainen PITUUS Suomalainen seksi, Sukupuoli Mies Nainen Paino Paino Pearson Correlation Sig. (-tailed) N Pearson Correlation Sig. (-tailed) N Pituus,406, ,46, Korrelaatiokertoimen tulkinta Nummenmaa, L. Käyttäytymistieteiden tilastolliset menetelmät, 004, r = 1.0 r.90 r.70 r.50 r.30 r = 0 muuttujien välillä täysin lineaarinen yhteys muuttujien välillä voimakas lineaarinen yhteys muuttujien välillä melko voimakas lineaarinen yhteys muuttujien välillä keskinkertainen lineaarinen yhteys muuttujien välillä heikko lineaarinen yhteys muuttujien välillä ei ole lineaarista yhteyttä Taina I. Lehtinen 4

25 Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku 3. Ristiintaulukko Kahden (yleensä) luokitteluasteikkoisen muuttujan välinen riippuvuus Asiayhteys ei kausaalisuus Esim. sukupuolen ja koulutusalan valinnan välinen asiayhteys Koulutusalan ja ammattialan välinen asiayhteys 73 Ammattikoulutus * Sukupuoli Crosstabulation Count Ammattikoulutus Total Ammatillinen koulu Ammatillinen opisto Korkeakoulututkinto Ei mitään näistä Sukupuoli mies nainen Total Suomalainen seksi, Ammattikoulutus * Sukupuoli Crosstabulation Ammattikoulutus Total Ammatillinen koulu Ammatillinen opisto Korkeakoulututkinto Ei mitään näistä Count % within Sukupuoli Count % within Sukupuoli Count % within Sukupuoli Count % within Sukupuoli Count % within Sukupuoli Sukupuoli mies nainen Total ,8% 30,0% 33,8% ,5% 17,7% 15,6% ,1% 6,6% 7,3% ,6% 45,8% 43,3% ,0% 100,0% 100,0% Suomalainen seksi, Taina I. Lehtinen 5

26 Khiin neliön (Chi-square) laskeminen k l ( f e ) ij ij i1 j1 e ij f ij =havaittu (Observed) arvo (mittauksessa saatu arvo) e ij =odotettu (Expected) arvo (teoreettinen arvo) 76 Odotetut arvot Lasketaan reunajakaumista kaavalla e ij f i e n j 77 Count Ammattikoulutus Total Ammattikoulutus * Sukupuoli Crosstabulation Ammatillinen koulu Ammatillinen opisto Korkeakoulututkinto Ei mitään näistä Sukupuoli mies nainen Total e Taina I. Lehtinen 6

27 Ammattikoulutus * Sukupuoli Crosstabulation Ammattikoulutus Total Ammatillinen koulu Ammatillinen opisto Korkeakoulututkinto Ei mitään näistä Odotettu arvo Odotettu arvo Odotettu arvo Odotettu arvo Odotettu arvo Sukupuoli mies nainen Total ,4 386,6 757, ,3 178,8 350, , 83,8 164, ,1 494,9 969, ,0 1144,0 40,0 Suomalainen seksi, Mikäli havaittujen arvojen ja odotettujen arvojen erotukset (f ij e ij ) ovat pieniä, eivät havaitut arvot ja odotetut arvot poikkea toisistaan ja -arvokin jää pieneksi Jos havaittujen arvojen ja odotettujen arvojen erotukset ovat suuria, saa suuren arvon 80 Vapausasteet Kuvaavat taulukon kokoa df = (rivien lkm 1) * (sarakkeiden lkm 1) Vapausasteet tarkoittavat ns. vapaiden havaintojen määrää eli ristiintaulukossa vapausaste ilmoittaa sen, kuinka monta lukua voidaan valita täysin vapaasti tietyn taulukon sisälle 81 Taina I. Lehtinen 7

28 Esimerkiksi sadan henkilön jakautumisesta viiteen ikäryhmään tehdyn viisiruutuisen taulukon vapausaste on 4, sillä neljän ruudun sisältö on vapaa muuttumaan itsenäisesti (viides ruutu näet määräytyy niiden perusteella) 1-30 v v v v v. 8 df = s 1 = 4 N= Tilastollinen päättely Empiirinen jakauma perustuu havaintoaineistoon muuttujan arvojen hajaantuminen muuttujan eri arvoluokkiin Mies Nainen Yht. Sukupuoli Frekv. % , , ,0 Teoreettinen jakauma liittyy todennäköisyyslaskennan teoriaan esim. normaalijakauma 84 Taina I. Lehtinen 8

29 Tutustu kirjan Tilastollisen kuvauksen perusteet käyttäytymistieteissä, Luku 7. Normaalijakauma Taulukko 3. Ikä luokiteltuna % Cumulative % ,6 1, , 1,8 Tärkein ja käytetyin todennäköisyysjakauma; monet luonnon ja ihmisten Total 100,0 ominaisuudet jakautuvat sen mukaan, mm. lämpötilat ja sademäärät, ihmisestä mitatut ominaisuudet (mm. pituus, älykkyys, ) ,4 37, ,9 60, ,8 8, ,1 100,0 x Esim. jos suomalaisten (kaikkien) miesten pituudet ( =175 cm, s = 5 cm) esitetään frekvenssikäyränä, se on normaalijakautunut: X i = 185 cm Jos muuttuja noudattaa normaalijakaumaa parametrein x=0 ja s=1, niin kyseessä on standardoitu normaalijakauma 87 Taina I. Lehtinen 9

30 Z-piste Esim: Pekka sai introversiotestissä 3 pistettä ja neuroottisuustestissä 14 pistettä. Onko hän keskimääräistä vähemmän/enemmän introvertti ja keskimääräistä vähemmän/enemmän neuroottinen? Maija sai maantiedon kokeessa 1 pistettä ja yhteiskuntaopin kokeessa 18 pistettä. Kummassa kokeessa hän menestyi paremmin? Vertailua voidaan tehdä z-pisteiden avulla 88 Standardoitua normaalijakaumaa voidaan hyödyntää monissa normaalijakaumaan liittyvissä laskutoimituksissa, jolloin normaalijakautuneen muuttujan havaintoarvot (x i ) muutetaan standardoituun muotoon laskemalla z-pisteet (standardipisteet) z-piste kertoo kuinka kaukana havaintoarvo sijaitsee keskiarvosta, kun mittayksikkönä käytetään keskihajontaa z x i s x 89 z Havaintoarvo (x i = 185 cm) sijaitsee kahden keskihajonnan (z = +) mitan päässä keskiarvon (175 cm) yläpuolella 90 Taina I. Lehtinen 30

31 z ilmaisee havaintoarvon (x i ) etäisyyden aritmeettisesta keskiarvosta x, kun mittayksikkönä käytetään keskihajontaa (s) = 175, s = 5 Pituusarvo 193 cm sijaitsee 3.6 keskihajonnan mitan päässä :n oikealla puolella Pituusarvo 06 cm sijaitsee 6. keskihajonnan mitan päässä :n oikealla puolella 91 Mittauksessa saatujen havaintoarvojen (muuttujan raaka pisteiden) muuttaminen z- pisteiksi ei hävitä tai lisää informaatiota (on sama asia kuin jos muutetaan mailit kilometreiksi) z-piste universaali normi haluttaessa vertailla normaalijakautuneista aineistoista poimittuja havaintoarvoja 9 Esim. Introversiotestin ja neuroottisuustestin tulokset olivat normaalijakautuneet Pekka sai introversiotestissä 3 pistettä. Kaikkien testiin osallistuneiden pisteiden keskiarvo oli 15 pistettä, hajonta 8 pistettä. Neuroottisuustestissä Pekka sai 14 pistettä, keskiarvon ollessa 10 pistettä ja hajonnan pistettä. Onko Pekka keskimääräistä vähemmän/enemmän introvertti ja keskimääräistä vähemmän/ enemmän neuroottinen? 93 Taina I. Lehtinen 31

32 Introversio Neuroottisuus x Pekka = 3 x Pekka = 14 x 15 y 10 s x = 8 s y = z x = (3 15)/8 = +1 z y = (14 10)/ = + Pekka sijoittuu sekä introversiotestissä että neuroottisuustestissä keskiarvon yläpuolelle, introversiotestissä yhden keskihajonnan (+1) mitan päähän keskiarvosta ja neuroottisuustestissä kahden keskihajonnan (+) mitan päähän keskiarvosta Pekka on keskimääräistä introvertimpi ja keskimääräistä neuroottisempi 94 Pekan x Introversio = +1 x Neuroottisuus = + 95 Jos pystyakselilla ovat suhteelliset frekvenssit, niin kuvaajan ja lukusuoran (vaaka-akselin) rajoittaman alueen pinta-ala on 100% Välin [ 1s, +1s] pinta-ala on noin 68% Välin [ s, + s] pinta-ala on noin 95% Miesten pituusaineistossa ( =175 cm, s=5 cm) välin [170, 180] pinta-ala on noin 68% ja välin [165, 185] pinta-ala on noin 95% 96 Taina I. Lehtinen 3

33 68 % 50 % 95 % Esim. Pekka sai introversiotestissä 3 pistettä, neuroottisuustestissä 14 pistettä. Pekan havaintoarvojen z-pisteet ovat +1 (introversio) ja + (neuroottisuus). Kuinka suuri osa testiin osallistuneista on Pekkaa vähemmän introverttejä? (Kuinka monta % testiin osallistuneista on vähemmän introvertteja kuin Pekka?) Kuinka suuri osa testiin osallistuneista on Pekkaa neuroottisempia? (Kuinka monta % on enemmän neuroottisia kuin Pekka?) 98 68% 50% 84% Pekkaa vähemmän introvertteja on 84% 50% 68% 99 Taina I. Lehtinen 33

34 95% 50% 97.5% 100% 97.5%.5% Pekkaa enemmän neuroottisia on.5% 50% 95% %.5 % 95 %.5 % 100 % 101 Kertymäfunktioarvo z-pisteen alapuolella (vasemmalla puolella) olevan pinta-alan määrä (todennäköisyys) on taulukoitu normitetun normaalijakauman N(0,1) kertymäfunktioarvojen (, PHI) taulukkoon (z) Normitetun normaalijakauman N(0,1) kertymäfunktioarvo () ~ 91 % z=1.3 (z) (+1.3) = ~ 91 % 10 Taina I. Lehtinen 34

35 Pinta-alat: Välin [ 3z, + 3z] pinta-ala noin 100 % Todennäköisyys noin 1 Välin [ z, + z] pinta-ala noin 95 % Todennäköisyys noin Välin [ 1z, + 1z] pinta-ala noin 68 % Todennäköisyys noin z-pisteeseen liittyvät todennäköisyydet (pintaalat) saadaan taulukosta (kertymäfunktio-arvot, ), jonka luvut ovat suhteellisia osuuksia eli esim. 95 % = (+1.3) = % 1 (+1.3) = % (-1.3) = % 103 Taulukon arvot ilmaisevat todennäköisyyden sille, että saadaan (muuttujan arvosta laskettua) z-pistettä pienempi arvo sitä merkitään seuraavasti: P(x z) = (z) Pekan z Introversio = +1 Kuinka monta % osallistuneista saa pienemmän arvon kuin Pekka? P(x +1) = (+1) = = 84.1% Pekan z Neuroottisuus = + Kuinka monta % osallistuneista saa suuremman arvon kuin Pekka? P(x +) = 1 (+) = = 0.08 =.3% (-3.49) = = 0.0 % (+3.49) = = % (-5.01) = = % 68.6 % 0.13 % % 0.13 % % Taina I. Lehtinen 35

36 Tilastollisessa päättelyssä otoksen perusteella pyritään tekemään johtopäätöksiä koko perusjoukosta Johtopäätösten tekoon sisältyy aina epävarmuutta, koska ei tutkita koko perusjoukkoa Kyse on tilastollisen merkitsevyyden testaamisesta (tilastollisesta päätöksenteosta), joka pohjautuu todennäköisyyksiin 106 Hypoteesien testaaminen = yksi tilastollisen päätöksenteon väline Testaamisen vaiheet hypoteesien asettaminen otoksen poiminta tilastollisen testin valinta (muuttujien mitta-asteikko) parametriset testit ei-parametriset testit testaaminen tulosten tulkinta johtopäätökset 107 Hypoteesit Muuttujien välisestä riippuvuudesta, erosta tai muutoksesta asetetaan tilastollisessa testauksessa kaksi hypoteesia: H 0 (nollahypoteesi) esittää, että muuttujien välillä ei ole riippuvuutta, ei ole eroa tai muutosta ei ole tapahtunut ( ei mitään erityistä ) H 0 = Tyttöjen ja poikien sosiaalisuudessa ei ole eroa H 1 (vaihtoehtoinen hypoteesi) esittää, että on riippuvuutta, on eroa tai muutos on tapahtunut H 1 = Tyttöjen ja poikien sosiaalisuudessa on eroa Vastakkain siis kaksi oletusta kumpi oletuksista saa tukea testissä? 108 Taina I. Lehtinen 36

37 Todellisuus H 0 H 1 Johtopäätös H 0 otoksen perusteella H 1 / / 109 Päätöksentekoon liittyvät virheet 1. lajin virhe = hylkäämisvirhe eli hylätään H 0, joka itse asiassa on tosi. lajin virhe on hyväksymisvirhe eli hyväksytään H 0, joka itse asiassa on virheellinen Merkitsevyystaso eli riskitaso ilmoittaa, kuinka suuri on riski, että teemme 1. lajin virheen eli hylkäämisvirheen [ts. että saatu tulos ero, riippuvuus, yhteys, johtuu vain sattumasta eikä ole todellinen] Merkitsevyystasosta käytetään symbolia p (ohjelman tulosteissa Sig.) 110 p-arvo mittaa tehdyn johtopäätöksen tilastollista luotettavuutta p-arvo ilmoittaa todennäköisyyden tehdä virheellinen johtopäätös (1. lajin virhe) kun H 0 hylätään 111 Taina I. Lehtinen 37

38 Käytetyt merkitsevyystasot Tilastollisesti erittäin merkitsevä, jos p *** (0.1%) Tilastollisesti merkitsevä, jos < p 0.01 ** (1%) Tilastollisesti melkein merkitsevä, jos 0.01 < p 0.05 * (5%) Tilastollisesti suuntaa antava, jos 0.05 < p Tilasto-ohjelmat antavat automaattisesti havaitun merkitsevyystason (joko p-arvona tai Sig.- arvona) Mitä pienempi merkitsevyystaso on, sitä tilastollisesti merkitsevämpi tulos, ts. Mitä pienempi riski (p-arvo tai Sig.-arvo), sitä merkitsevämpi tulos 113 Yhteenveto Nollahypoteesi H 0 vs. Vaihtoehtoinen hypoteesi H 1 Hylkäämisvirhe eli hylätään H 0, joka on tosi hylkäämisvirheelle määritellään todennäköisyys p (Sig.), jota kutsutaan riskitasoksi tai merkitsevyystasoksi Hyväksymisvirhe eli hyväksytään H 0, joka ei ole tosi (on epätosi) 114 Taina I. Lehtinen 38

39 Riskitaso (merkitsevyystaso) tarkoittaa riskiä tehdä virhe eli hylätä H 0, kun se olisi tosi tai Riskitaso (merkitsevyystaso) ilmoittaa, kuinka suuri on riski, että saatu tulos (esim. ero) johtuu vain sattumasta eli on sattuman aiheuttamaa, ei todellista (eroa) Mitä pienempi riski, sitä tilastollisesti merkitsevämpi tulos 5% (p=0.05) suurempia riskejä ei oteta 115 Esim. jos tilasto-ohjelmisto antaa Sig. = emme hylkää H 0, koska riski tehdä hylkäämisvirhe olisi 45.9% Sig. = 0.03 hylkäämme H 0 :n, mutta riski tehdä hylkäämisvirhe on 3.% Tulos on melkein merkitsevä (p=0.03) Tulos on melkein merkitsevä (p<0.05) tai 116 Tutustu kirjan Käyttäytymistieteiden tilastomenetelmien jatkokurssi, Luku 5. Kahden tunnusluvun eron merkitsevyys Tutkija joutuu tekemään päätöksen onko kahden ryhmän välillä todellista eroa Ryhmät voivat olla kokeellisen asetelman koe- ja kontrolliryhmiä tai luonnostaan olemassa olevia kuten naiset/miehet, kaupunkilaiset/maalla asuvat, jne. Ero voi tulla esille keskiarvoissa, hajonnoissa, korrelaatioissa, jne. 117 Taina I. Lehtinen 39

40 Kuvitellaan tilanne, jossa on mahdollisuus poimia samasta perusjoukosta suuri määrä otoksia, jotka olisivat samankokoisia ja muodostuisivat kahdesta ryhmästä (ryhmä 1 ja ryhmä ) Laskemme kunkin otoksen kummallekin ryhmälle keskiarvon ja kullekin otokselle kahden ryhmän keskiarvon eron x1 x Ryhmien keskiarvojen eroissa olisi hieman vaihtelua, joskus otoksen ryhmän 1 keskiarvo on suurempi, joskus ryhmän keskiarvo on suurempi, joskus eroa ei ole ollenkaan 118 Keskiarvojen eroista muodostuu jakauma, jonka keskikohta on nolla (siis ryhmissä ei eroa), vasen puoli kuvaa niitä otoksia, joissa ryhmän keskiarvo on suurempi kuin ryhmän 1, oikea puoli kuvaa niitä otoksia, joissa ryhmän 1 keskiarvo on suurempi kuin ryhmän Tämä jakauma on keskiarvojen eron otantajakauma Jakauman keskellä sijaitsevat todennäköiset, helposti sattumaltakin saatavat erot ja mitä kauemmas keskikohdasta mennään, sitä epätodennäköisempiä erot ovat 119 Kun mennään riittävän kauas jakauman reunalle, saadun eron todennäköisyys on niin pieni, että se ei ole voinut tulla sattumalta Teemme johtopäätöksen, että ero on todellinen (ryhmät eivät edusta samaa perusjoukkoa) Jos saatu ero sijoittuu jakaumassa sellaiselle alueelle, jonne sijoittumisen todennäköisyys on pieni, esimerkiksi pienempi kuin 1% (= hylkäämisalue), sanomme, että ero on tilastollisesti merkitsevä 1%:n riskitasolla ts. todennäköisyys tehdä hylkäämisvirhe on pieni 10 Taina I. Lehtinen 40

41 Hylkäämisalue - Kriittinen arvo Hyväksymisalue Kriittinen arvo 0 Hylkäämisalue 11 Jotta voisimme tietää, mihin kohtaan ero sijoittuu, on tiedettävä, kuinka laajalle alueelle teoreettinen jakauma ulottuu Tarvitsemme eron otantajakauman keskivirheen Ero jaetaan keskivirheellä, jolloin saadaan tietää, kuinka monen standardipoikkeaman päähän 0:sta (ei-eroa -tilanne) ero sijoittuu Keskiarvojen, hajontojen, prosenttilukujen, jne. eroja tarkasteltaessa, laskukaava on periaatteessa aina saatu ero eron keskivirhe 1 Erojen merkitsevyyden testauksessa käytetään kahta hieman toisistaan poikkeavaa jakaumatyyppiä pohjana Suurten otosten kyseessä ollessa testataan olettaen eron otantajakauman olevan normaali saatu ero jaetaan normaaliksi oletetun otantajakauman hajonnalla eli keskivirheellä (Z-testi) Pienten otosten kyseessä ollessa oletetaan eron otantajakauman noudattavan t-jakaumaa (Studentin jakauma) saatu ero jaetaan t-jakaumaan liittyvällä hajonnalla eli keskivirheellä (t-testi) 13 Taina I. Lehtinen 41

42 Kahden riippumattoman keskiarvon eron testaaminen t x 1 t-testisuure noudattaa t-jakaumaa vapausastein df = n 1 + n - 1 s n 1 x s n 14 Hypoteesit H 0 : Ryhmän 1 ja ryhmän keskiarvoissa ei ole eroa H 1 : Ryhmän 1 ja ryhmän keskiarvoissa on eroa 16 Taina I. Lehtinen 4

43 Suomalainen seksi, Independent Samples Test Group Statistics Keskiarvon otantajakauman keskivrhe Avioitumiskerrat Sukupuoli mies nainen Std. Error N Mean Std. Deviation Mean 877 1,3,710, ,,480,016 Numerus Keskiarvo Keskihajonta Hypoteesit: H 0 : Miesten ja naisten avioitumiskerroissa ei ole eroa H 1 : Miesten ja naisten avioitumiskerroissa on eroa 17 Avioitumiskerrat Equal variances assumed Varianssit yhtä suuret Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (-tailed) Mean Difference Std. Error Difference H 0 hylätään 4,673,031,66 183,508,019,08 Equal variances not assumed Varianssit erisuuret t-test for Equality of Means 95% Confidence Interval of the Difference t df Sig. (-tailed) Mean Difference Std. Error Difference Lower Upper -,037,074, ,169,515,019,09 95% Confidence Interval of the Difference Lower Upper Levenen testi testaa varianssien yhtä suuruutta: H 0 : varianssit yhtä suuret H 1 : varianssit erisuuret -,037, Taulukko: Miesten ja naisten avioitumiskerrat Mies Nainen Avioitumisx 1. x 1. kerrat s = 0.7 s = 0.5 N = 877 N = 957 t = 0.651, ei merkitsevä TAI p > Taina I. Lehtinen 43

44 Tutustu kirjan Käyttäytymistieteiden tilastomenetelmien jatkokurssi, ss riippumattomuustesti Testaa kahden luokitteluasteikkoisen muuttujan (x, y) riippumattomuutta H 0 : x ja y ovat riippumattomia H 1 : x ja y eivät ole riippumattomia (ovat riippuvia eli x:n ja y:n välillä yhteys) 130 k l ( f e ) ij ij i1 j1 e ij df = (k-1) * (l-1) Taina I. Lehtinen 44

45 Peruskoulutus * Sukupuoli Crosstabulation Peruskoulutus Total Ylioppilastutkinto Keski- tai peruskoulu Kansa- tai kansalaiskoulu Ei mitään näistä Count % within Sukupuoli Count % within Sukupuoli Count % within Sukupuoli Count % within Sukupuoli Count % within Sukupuoli Sukupuoli mies nainen Total ,1% 4,5%,4% ,4% 30,8% 30,6% ,% 41,9% 44,0% ,3%,7% 3,0% ,0% 100,0% 100,0% Suomalainen seksi, H 0 : x ja y ovat riippumattomia H 0 : Sukupuoli ja peruskoulutus ovat riippumattomia H 1 : x ja y eivät ole riippumattomia H 1 : Sukupuoli ja peruskoulutus eivät ole riippumattomia H 1 : Sukupuolen ja peruskoulutuksen välillä on yhteys 133 H 1 : Miesten ja naisten peruskoulutuksessa on eroja Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases Chi-Square Tests Testin ehdot täyttyvät: Asymp. Sig. Value df (-sided) 7,795 a 3,050 7,808 3,050 7,596 1, a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 3,86. - yhdessäkään solussa odotettu arvo ei ole < 5 - pienin odotettu arvo on yli H 0 hylätään 5%:n merkitsevyystasolla (5%:n riski tehdä virhe) Johtopäätös: Miesten ja naisten peruskoulutus eroaa siten, että naisista neljäsosalla (5%) on ylioppilastutkinto miehistä viidesosalla (0%) vastaava koulutus. Tulos on tilastollisesti melkein merkitsevä (p=0.05). 135 Taina I. Lehtinen 45

46 Ke-to klo Sitä ennen loput kynä+paperi -tehtävät 136 Taina I. Lehtinen 46

Tutkimusmenetelmät I

Tutkimusmenetelmät I Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op) Taina I. Lehtinen PL 9 Siltavuorenpenger 3A (2. kerros), 00014 Helsingin yliopisto E-mail:Taina.Lehtinen@Helsinki.FI Valokuva: Ida Pimenoff 1

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 Luento 2 Kuvailevat tilastolliset menetelmät Käytetyimmät tilastolliset menetelmät käyttäjäkokemuksen

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas f 332 = 3 Kvartiilit(302, 365, 413) Kvartiilit: missä sijaitsee keskimmäinen 50 % aineistosta? Kvartiilit(302, 365, 413) Keskiarvo (362.2) Keskiarvo

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10 SISÄLTÖ 1 TILASTOJEN KÄYTTÖ 7 Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10 Tilastoaineisto 11 Peruskäsitteitä 11 Tilastoaineiston luonne 13 Mittaaminen

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset)

... Vinkkejä lopputyön raportin laadintaan. Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset) LIITE Vinkkejä lopputyön raportin laadintaan Sisältö 1. Johdanto 2. Analyyseissä käytetyt muuttujat 3. Tulososa 4. Reflektio (korvaa Johtopäätökset) 1. Johdanto Kerro johdannossa lukijalle, mitä jatkossa

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15,

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

P5: Kohti Tutkivaa Työtapaa Kesä Aritmeettinen keskiarvo Ka KA. Painopiste Usein teoreettinen tunnusluku Vähintään välimatka-asteikko.

P5: Kohti Tutkivaa Työtapaa Kesä Aritmeettinen keskiarvo Ka KA. Painopiste Usein teoreettinen tunnusluku Vähintään välimatka-asteikko. Aritmeettinen keskiarvo Ka KA Painopiste Usein teoreettinen tunnusluku Vähintään välimatka-asteikko x N i 1 N x i x s SD ha HA Kh KH Vaihtelu keskiarvon ympärillä Käytetään empiirisessä tutkimuksessa Vähintään

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien

Lisätiedot

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 2. Tehtävät 2-4 sekä 6 10 liittyvät keväällä 2002 suoritettuun ammattikorkeakoulusta

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas MUITA HAJONNAN TUNNUSLUKUJA Varianssi, variance (s 2, σ 2 ) Keskihajonnan neliö Käyttöä enemmän osana erilaisia menetelmiä (mm. varianssianalyysi),

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564. POIKKEAVAN HAVAINNON VAIKUTUS PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla

Lisätiedot

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO 8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro Lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19,

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1) 20.9.2018/1 MTTTP1, luento 20.9.2018 KERTAUSTA JA TÄYDENNYSTÄ Tunnusluvut 1) Sijainnin tunnuslukuja Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1) Muita sijainnin tunnuslukuja ala- ja yläkvartiili,

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

5. Kahden tunnusluvun erotuksen merkitsevyys

5. Kahden tunnusluvun erotuksen merkitsevyys 5. Kahden tunnusluvun erotuksen merkitsevyys 85 Hyvin tavallinen tilanne on se, jossa tutkija joutuu päättämään, onko kahden ryhmän välillä todellista eroa. Hän on voinut vaikkapa järjestää kokeen, jossa

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N 11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation

Lisätiedot

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012 Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON? SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10

Lisätiedot

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on? Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä.

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. 9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas RIIPPUVUUS ALARYHMISSÄ Riippuvuus saattaa olla erilaista jos samassa aineistossa on esim. tutkittavia molemmista sukupuolista Yhteys saattaa olla erilaista

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33. Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot