Tilastollisen tutkimuksen läahtäokohtana on havaintoaineisto,

Koko: px
Aloita esitys sivulta:

Download "Tilastollisen tutkimuksen läahtäokohtana on havaintoaineisto,"

Transkriptio

1 II Havaintoaineisto ja sen kuvailu Tilastollisen tutkimuksen läahtäokohtana on havaintoaineisto, josta tavoitteena on johtaa tilastollisen päaäattelyn keinoin yleistäaviäa tuloksia esimerkiksi päaäatäoksentekoa varten. Havaintoaineiston hankintaan perehdytäaäan tarkemmin kappaleessa 4, mutta jo täassäa vaiheessa mäaäaritelläaäan joitakin peruskäasitteitäa. Tutkimusobjekti, tilastoyksikkäo, havaintoyksikkäo on yksikkäo, josta mittaukset tehdäaäan. Kaikkien tutkimuksen kohteena olevien tilastoyksikäoiden joukko muodostavat populaation eli perusjoukon. YleensÄa havaintoaineisto koostuu mittauksista, jotka on toteutettu vain osalle perusjoukon yksikäoistäa eli alkioista. Jos täamäa osajoukko on koottu tiettyjen tilastollisten periaatteiden mukaan, sanotaan sitäa otokseksi. 8

2 2.1 Havaintoaineistojen päaäatyypit Havaintoaineisto (data) voi olla numeerista tai luokitteluun perustuvaa kvalitatiivsta aineistoa. Se on tyypillisesti joko aikasarja- tai poikkileikkausaineistoa. Aineisto voi olla myäos näaiden yhdistelmäa, paneeliaineisto. Aikasarja muodostuu peräakkäaisitäa havainnoista (mittauksista), jotka on koottu samasta kohteesta(ihminen, yritys, valtio, jne) Poikkileikkaus aineisto muodostuu mittauksista, jotka on tehty tietylläa ajanhetkelläa useasta kohteesta (tilastoyksikäostäa). YhdistelmÄaaineisto Useasta tilastoyksikäostäa kootaan peräakkäaisinäa ajanjaksoina havaintomittauksia. 9

3 Esim. HEX-indeksin päaiväatuotot ajanjaksolta { on esimerkki aikasarjaaineistosta. Alla on sarjan loppupäaäa ( { ). Hex Closing Index and index returns [Aug 1, Sepember 7, 2001] Date Close Return 1-Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Aug Sep Sep Sep Sep Sep

4 Esim. PÄorssin päaäalistan hintojen muutokset edellisestäa päaiväastäa onesimerkki poikkileikkausaineistosta. Listan alku näayttäaäa seuraavlta Helsinki Stock Exchange September 7, 2001 (Prices are in Euros) Share Bid Ask Close Change(%) Volume (EUR) Alandsbanken A Ålandsbanken B CapMan Oyj B , Conventum Oyj Mandatum Pankki B , Nordea AB FDR ,673, OKO A , Sampo A ,203, Sampo A/B-opt , Pohjola A , Pohjola B ,561, Citycon Oyj ,

5 2.3 Havaintomatriisi TilastoyksikÄoiden ominaisuuksita (muuttujista) tehdyt mittaustulokset kootaan havaintomatriisiksi. Oletetaan, ettäa tutkimuksen kohteena on n tilastoyksikkäoäa a 1,a 2,...,a n, joista mitataan p muuttujaa, x 1,x 2,...,x p. TilastoyksikÄon a i mittaustulosta muuttujalla x j merkitäaäan yleisesti symbolilla x ij. Havaintomatriisi on täalläoin yleisesti muotoa a 1 a 2. a i. a n x 1 x 2... x j... x p x 11 x x 1j... x 1p x 21 x x 2j x 2p. x i1 x i2... x ij x ip. x n1 x n2... x nj... x np n p matriisi. Havaintoarvon x ij ensimmäainen indeksi i on rivi-indeksi ja toinen, j, sarakeindeksi. 12

6 Esim. Tarkastellaan aiempaa kaupankäayntipäaiväan tapahtumia. Yritysten osakkeet ovat tilastoyksikkäojäa jakaupankäayntiin liittyväat muuttujat, kuten kuten hinta, osto- ja myyntitrarjous, volyymi, jne ovat muuttujia. Esim. Oheisessa (Excel) taulukossa on kulutustilastoja Euroopan maista vuodelta Tilastollisessa tutkimuksessa mittaaminen ymmäarretäaäan laajasti. Esimerkiksi siviilsäaäadyn tai koulutustason merkitsemistäa muistiin ihmisiäa koskevassa tutkimuksessa sanotaan myäos mittaamiseksi. 13

7 2.4 Mitta-asteikoista Sen mukaan millaisia (matemaattisia) ominaisuuksia muuttujan mittaustuloksilla on mäaäaräaytyy sen mitta-asteikko. Stevensin mukaan käaytäannäoksi on tullut mäaäaritelläa neljäa asteikkotyyppiäa: nominaali-, ordinaali-, intervalli- ja suhdeasteikko. NÄamÄa ovat hierarkisia (nominaali suhde) siten, ettäa ylemmäan mitta-asteikolla on kaikki alemman asteikon ominaisuudet. Mitta-asteikko ratkaisee sen, millaisia tilastolisia menetelmiäa aineiston analysoinnissa voidaan käayttäaäa! Nominaali- eli luokitteluasteikko Jos tilastoyksikäot voidaan jakaa ominaisuuden (muuttujan) x suhteen vain luokkiin, on muuttujan x mitta-asteikkon nominaaliasteukko. Stevens, S.S. (1946). On theory of scales of measurement. Science, 103, 677{

8 TÄallÄoin 1. Jokaisesta tilastoyksikäostäa a i ja a k voidaan päaäattäaäa, ovatko ne x:n suhteen samanlaisia (kuuluvat samaan luokkaan). 2. Jokainen tilastoyksikkäo kuuluu x:n suhteen yhteen ja vain yhteen luokkaan. Nominaaliasteikon mittari ilmaisee siis vain, ovatko tilastoyksikäot samanlaisia vai erilaisia ominaisuuden x suhteen. Muita merkityksiäa lukujen tai muiden symbolien arvoilla ei ole. Esim. Auton merkki, yrityksen kotipaikkakunta ja henkiläon synnyinkunta ovat esimerkkejäa luokitteluasteikon muuttujista. 15

9 Ordinaali- eli jäarjestysasteikko Luokitteluominaisuuden lisäaksi ordinaaliasteikollisen muuttujan suhteen tilastoyksikäoiden väalilläa vallitsee myäos jokin jäarjestysrelaatio. Esim. asennemittauksessa muuttujan, jonka tuloksina ovat "parempi", "vaikeampi", "kovempi", jne, ovat jäarjestysasteikollisia mittauksia. Kuitenkaan jäarjestysasteikolliseen mittalukuun liitetty arvo ei ilmaise kvantitatiivista mäaäaräaäa, vaan ainoastaan sen suhteen voidaan tilastoyksikäot asettaa jäarjestykseen. TÄallÄoin, esimerkiksi, jos tulokset ilmaistaan luvuilla "1 = paras", "2 = toiseksi paras", jne, ei esimerkiksi lukujen erotus kerro paremmuuden mäaäaräaäa. NiinpÄa aritmeettiset laskutoimitukset eiväat johda (yleensäa) mielekkäaisiin tuloksiin ordinaaliasteikon mittaksilla. 16

10 Mielipidekysymykset, joihin vastaukset ovat muotoa "1 = täaysin samaa mieltäa", "2 = jokseenkin samaa mieltäa", "3 = en osaa sanoa", "4 = jokseenkin eri mieltäa", "5 = täaysin eri mieltäa" ovat tyypillisiäa ordinaaliasteikon mittauksia. TÄallÄoin esimerkiksi 5:n ja 4:n erotus ei kuvaa mielipiteen mäaäaräallistäa eroa siten, ettäa se voitaisiin tulkita olevan yhtäa paljon kuin henkiläoiden väalilläa, jotka ovat valinneet vaihtoehdot 2 ja 3. TÄaten erotusten verailu ei ole ole mielekäastäa. Intervalli- eli väalimatka-asteikko Edellisten ominaisuuksien lisäaksi intervalliasteikollisen mittauksen erotukset ovat vertailukelpoisia keskenäaäan. Toisin sanoen kahden tilastoyksikäon a i ja a j väallistäa eroamuuttujan x suhteen kuvaa niiden mittalukujen x i ja x j väalinen erotus. 17

11 Esim. LÄampÄotilan mittaus Celsius- tai Fahrenheitasteikolla on tyypillinen esimerkki väalimatkaasteikollisesta mittauksesta. Erotukset kuvaavat läampäotilojen eroja asteina. Asteikkojen väalilläa päatee muuntosuhde F = C, jossa C on läampäotila C-asteina ja F läampäotila F-asteina. Aritemeettiset operaatiot ja lineaariset muunnokset, muotoa y = a + bx, jossa b>0 ovat sallittuja intervalliasteikollisille muuttujille. Intervalliasteikollisilla mittauksilla ei kuitenkaan ole absoluuttista nollakohtaa, jossa kyseinen ominaisuus häaviäaäa, esimerkkinäa läampäomittarin nollakohta tai kalenteriajan nollavuosi. 18

12 Huom. Verailut, kuten "kaksikertaa suurempi", eiväat ole mielekkäaitäa intervalliasteikollisella mittarilla. Intervalliasteikolla voidaan soveltaa läahes kaikkia tilastollisia menetelmiäa. Suhde-asteikko Jos intervalliasteikon vaatimusten lisäaksi muuttujalla x on lisäaksi olemassa nollapiste, jossa tarkasteltava ominaisuus häaviäaäa, päaäastäaäan suhdeasteikolliseen mittariin. Fysikaaliset ominaisuudet, kuten paino, pituus, ikäa, palkka, jne, ovat suhdeasteikollisia muuttujia. Sallittu muunnos on muotoa y = bx, jossa b>0. Origon siirto ei siis käay päainsäa, jos mittausten fysikaalinen informaatiosisäaltäo halutaan säailyttäaäa. 19

13 Reliabiliteetti ja validiteetti Mittaamisessa esiintyy käaytäannäossäa läahes aina mittausvirheitäa. Sanotaan, ettäa mittarin reliabiliteetti (pysyvyys, luotettavuus) on huono, jos mittauksiin liittyy paljon satunnaivirhettäa (toistomittauksissa tulokset vaihtelevat paljon). Mittarin validiteetti liittyy siihen, mittaako mittari sitäa mitäa on tarkoitus mitata. Jos se ei, mittari ei ole validi. Esim. Yrityksen kannattavuutta mittaavat tilinpäaäatäostunnusluvut, kuten ROI, käayttäokateprosentti, tulosprosentti, jne. Valideja? Reliaabeleja? 20

14 2.5 Havaintoaineiston kuvailu Havaintoaineiston hankinnan jäalkeen ensimmäaisessäa vaiheessa pyritäaäan saamaan yleiskuva aineistosta muodostamalla jakaumakuvioita ja tuottamalla erilaisia tunnuslukuja (sample statistics), joilla voidaan tiivistetysti kuvailla aineiston oleellisia piirteitäa. (A) Empiiriset jakaumat Yksiulotteiset empiiriset jakaumat Ohessa on havaintoaineisto virvoitusjuomapurkkien täayttäoprosessista tehdyistäa mittauksista (data). 21

15 Tarkastellaan purkin täayttäoastetta (taytto). SilmÄamÄaÄarÄainen tarkastelu jo osoittaa, ettäa täayttäoaste vaihtelee jonkin verran. Parempi kuva täastäa saadaan tarkastelemalla sen jakaumia. Frekvenssijakauma Frekvenssijakuma saadaan luokittelemalla vaihteluväali sopivasti ja laskemalla havaintojen lukumäaäaräat kussakin luokassa. KÄasitteitÄa: Muuttujan x j arvot x 1j,...,x nj muodostavat x j :n jakaumavektorin. TilastoyksikkÄoÄon a i liittyväat havainnot x i1,...,x ip muodostavat havaintovektorin. Esimerkiksi edelläa muuttujanx 2 = "taytto" jakaumavektori on 33.38, 33.16,...,33.07, ja toiseen havaintoon a 2 liittyväa havaintovektori on 1.98, 33.16,

16 Havaintoarvojen luokittelusäaäantäojäa (tasaväalinen) 1. MÄaÄarÄaÄa luokkien lukumäaäaräa, c. ErÄas säaäantäo onc 3 n. Apuna voidaan käayttäaäa myäos oheista taulukkoa: n Luokkien lkm, c < 16 Ei riittäaväasti havaintoja Sturges, H.S. (1926). The choise of a class interval. Journal of the American Statistical Association, 21, 65{ Etsi suurin (x max )japienin(x min ) havaintoarvo ja mäaäaräaäa niiden erotus, josta saadaan havainojen vaihteluväalin pituus (range), R = x max x min. 3. MÄaÄarÄaÄa luokkaväalin pituus = R c joka pyäoristetäaäan yläospäain havaintojen mittaustarkkuuteen (mittaustarkkuus d = kahden peräakkäaisen mahdollisen havaintoarvon erotus) (jos sattuu olemaan alkujaan jo samalla tarkkuudella kuin mittaustarkkuus, niin valitaan luokkaväalin pituudeksi + d). 4. MÄaÄarÄatÄaÄan luokkarajat siten, ettäa ensimmäaisen luokan todellinen alaraja alittaa pienimmäan havainnon yhtäa paljon kuin viimeisen luokan todellinen yläaraja ylittäaäa suurimman havainnon. TÄahÄan päaäastäaäan, kun valitaan L 1 = x min (c R)/2 (HT. Osoita todeksi). Jos L 1 on samalla tarkkuudella kuin havainnot, niin kasvatetaan alarajaa d/2:lla. Huom. PyÄoristetty luokkaraja ilmoitetaan mittaustarkkuudella. TÄaten esim. L 1 = L 1 +d/2 ja U 1 = U1 d/2, jossa L 1 ensimmäaisen luokan pyäoristetty alaraja ja U 1 pyäoristetty yläaraja. Luonnollisesti päatee Uk 1 = L k. 5. Luokkarajat (todelliset) saadaan lisäaäamäalläa edellisen luokan todelliseen alarajaan. 23

17 Esim. Virvoitusjuoma purkkien täayttäoasteen frekvenssijakauma: n = 30, joten taulukon mukaan sopiva luokkien lukumäaäaräa on c = 5. Pienin ja suurin havainto ovat x min =32.4 ja x max =34.1, joten = yläospäain pyäoristettynäa. 5 Mittaustarkkuuden ollessa d = 0.1, saadaan ensimmäaisen luokan todelliseksi alarajaksi L 1 = x min d/2 = Frekvenssijakaumaksi tulee lopulta Luokka f k F k p k P k 32.4{ { { { { YhteensÄa Huom. Luokkarajat on pyäoristetty mittaustarkkuuteen (alaraja yläospäain ja yläaraja alaspäain). Todelliset luokkarjat ovat näaiden väalissäa. 24

18 Kumulatiivinen frekvenssijakauma saadaan summaamalla luokan k ja sen edeltäaväat frekvenssit F k = f f k = k j=1 f j, jossa f j on luokan j frekvenssi (havaintojen lukumäaäaräa), k =1,...,c (summausoperaattori ). Summafrekvenssi kertoo kuinka monta havaintoa saa pienemmäan tai korkeintaan yhtäasuuren arvon kuin luokan k (todellinen) yläaraja. Esim. Ks. virvoitusjuomaesimerkki. 25

19 Prosenttijakauma Prosenttijakauma saadaan muuttamalla frekvenssit prosenteiksi p k =100 f k n, jossa f k on luokan k frekvenssi (havaintojen lukumäaäaräa). Kumulatiivinen prosenttijakauma saadaan puolestaan P k = k p j j=1 joka ilmaisee prosentteina havaintojen kertymäan luokkan k yläarajaan asti. Esim. Jatkoa 26

20 Histogramma Jakaumat voidaan esittäaäa myäos usealla eri tavalla kuvioina. Yksi käaytetyimmistäa on histogramma, joka saadaan piiretäamäalläa suorakaiteet, joiden kantana on x-akselilla todelliset luokkarajat ja korkeutena vastaavat absoluuttiset (frekvenssihistogramma) tai prosentuaaliset (prosenttihistogramma) frekvenssit. TÄayttÄoasteen frekvenssihistogramma Virvoitusjuomapullojen täyttöasteen jakauma (n = 30) Havaintojen lkm Täyttöaste (cl) 27

21 Frekvenssimonikulmio saadaan yhdistäamäalläa luokkakeskuksien ja frekvenssien koordinaatit (lisäatäaäan lisäaksi jakauman molempiin päaihin nollaluokat). Luokkakeskukset saadaan luokkarajojen keskiarvona e k =(L k + U k )/2 Virvoitusjuomapullojen täyttöasteen jakauma (n = 30) Havaintojen lkm Täyttöaste (cl) 28

22 SummakÄayrÄa (prosenttisummat) saadaan yhdistäamäalläa luokkien todelliset yläarajat ja vastaavat (prosenttiset) summafrekvenssit. Virvoitusjuomapullojen täyttöasteen summakäyrä (%) Prosenttia Täyttöaste (cl) SummakÄayrÄastÄa voidaan arvioida esimerkiksi: "kuinka monessa prosentissa pulloista on yli 33.6 cl juomaa", "kuinka monessa on alle 33.0 cl" tai "minkäa mäaäaräan alle jäaäa puolet pulloista", jne. 29

23 Stem-and-leaf diagrammi ("Runko-ja-juuri" diagrammi) Stem-and-leaf kuviossa havaintoaineisto jäarjestetäaäan riveittäain siten, ettäa siitäa muodostuu myäos jakaumakuvio. Kunkin rivin ensimmäaine luku muodostaa rungon ja seuraavat ovat lehtiäa. Kuvio muodostetaan seuraavasti: 1. Valitse sopivat runkoluvut (stem numbers). Tavallisesti yksi tai kaksi ensimmäaistäa lukujen numeroa. 2. NimetÄaÄan rivit runkolukujen mukaan 3. Reprodusoidaan havaintoaineisto liittäamäalläa kunkin havaintoluvun runkoa seuraava numero lehtiosana vastaavaalle runkoriville. NÄain muodostuu jakaumaa muistuttava kuvio. Esim. Virvoitusjoumapullojen täayttäoaineiston Stem-and-leaf diagrammi. Valitaan rungoksi lukujen kokonaisosa: Saadaan Huom. TÄallÄa kertaadiagrammissaonjäaljelläa kaikki havaintoaineiston informaatio. NÄain ei aina väalttäamäattäa tapahdu. 30

24 (B) Empiirisen jakauman tunnuslukuja B.1. Keskilukuja Moodi (Mo), eli tyyppiarvo tarkoittaa lukua, joka esiintyy useimmin. Luokitellussa aineistossa moodiluokka on luokka, jolla on suurin frekvenssi. Esim. Juoma-ainestossa luku 33.1 esiintyy useimmin (viisi kertaa), joten Mo = Moodin ominaisuuksia: { soveltuu kaikille mitta-asteikoille {eioleväalttäamäattäa yksikäasitteinen {helpomäaäarittäaäa Mediaani (Md), on luku, jota pienempiäa ja suurempia havaintoarvoja on yhtäa paljon. Mediaani saadaan jäarjestäamäalläa havinnot suuruusjäarjestykseen ja valitsemalla keskimmäainen, jos n on pariton ja kahden keskimmäaisen havaintoarvon keskiarvo, jos n on parillinen. 31

25 Esim. Lukujen 390, 395, 400, 401, 406, 408, 410, 415, 450 mediaani on (9 + 1)/2 =5. havainto, eli Md = 406. Esim. Virvoitusjuoma-aineistossa n = 30, siis parillinen. Kaksi keskimmäaistäa havaintoa ovat taytto-muuttujalla molemmat 32.2, joten Md = 32.2 Ominaisuuksia: { jakaa aineiston kahteen yhtäasuureen osaan {soveltuuväahintäaäan jäarjestysasteikollisille muuttujille {eioleherkkäa poikkeaville ÄaÄarihavainnoille {helppoarvioidaprosenttikäayräastäa. Keskiarvo (Aritmeettinen keskiarvo) soveltuu väahintäaäan intervalliasteikollisille muuttujille. Havaintojen x 1,...,x n keskiarvo ¹x on ¹x = 1 n n x i. YleistyksenÄa saadaan painotettu keskiarvo ¹x w = n w i x i, jossa w i > 0 ja n w i =1. 32

26 Ominaisuuksia: 1. Jos y i = a + bx i, niin ¹y = a + b¹x. 2. n (x i ¹x) =0. 3. Okoon m ryhmäaäa, ja ryhmäastäa k on n k havaintoa muuttujasta x. OlkoonryhmÄan k keskiarvo ¹x k, silloin yhdistetyn aineiston keskiarvo on ¹x = n 1¹x n m ¹x m n n m jossa n = n n m. = 1 n m k=1 n k ¹x k, 4. Jos x i = y i + z i + + v i,niin¹x =¹y +¹z + +¹v. HT. Osoita todeksi ylläa olevat väaittäamäat. 33

27 Esim. Juoma-aineistossa täaytäon keskiarvo on ¹x =( )/30 = Geometrinen keskiarvo Geometrinen keskiarvo sopii erityisesti aikasarjaaineiston hintasarjojen keskimäaäaräaisen muutoksen kuvaamiseen. Oletetaan, ettäa x i > 0 kaikilla i =1,...,n. Havaintojen x i geometrinen keskiarvo ¹x g mäaäaritelläaäan lukuna ¹x g =(x 1 x 2 x n ) 1 n Huom. MerkitÄaÄan y i =lnx i, jolloin ¹y = 1 n n ln x i on logaritmoitujen havaintojen aritmeettinen keskiarvo, josta geometrinen keskiarvo saadaa eksponenttifunktiomuunnoksella, ¹x g = e ln ¹y. TÄassÄa ln on luonnollinen (e-kantainen) logaritmi. Huom. PÄatee ¹x ¹x g. 34

28 Esim. Osakkeen kurssin vuoden päaäatäoshinta kuudelta viimeiseltäa vuodelta oli 120, 120, 80, 60, 90, 130. MikÄa on keskimäaäaräainen vuosimuutos? MÄaÄaritelmÄan mukaan vuosimuutos on R t =100 P t P t 1 P t 1, t =2, 3,..., jossa P t on osakkeen hinta hetkelläa t. YllÄa olevista havainnoista R 1 = 100( )/120 = 0.0,R 2 = 100(80 120)/ %,...R 6 = 100(130 90)/ %. TÄaten aritmeettinen keskiarvo ¹R = 7.22%. Geometrinen keskiarvo hintamuutoksille saadaan ln( ¹R g )= (ln(p 2 /P 1 )+...+ln(p 6 /P 5 ))/5 = Joten ¹R g =100(exp(ln( R g )) 1) =1.61% Vrt. aritmeettiseen keskiarvoon! MistÄa ero johtuu? Kumpi antaa oikean kuvan keskimäaäaräaisestäa hintamuutoksesta? (Vastaus: Geometrinen keskiarvo. Miksi?) Painotettu geometrinen keskiarvo ¹x gw = x w 1 1 xw n n = n jossa w i > 0, n w i =1. x w i i, 35

29 Harmoninen keskiarvo Oletetaa, ettäa x voi saada vain positiivisia arvoja. Havaintojen x 1,...,x n harmoninen keskiarvo mäaäaritelläaäan kaavalla ¹x h = n n 1 xi, jonka yleistyksenäa painotettu harmoninen keskiarvo ¹x hw = 1 n w i, x i jossa w i > 0 ja n w i =1. Esim. Oletetaan, ettäa junakulkeeensimmäaiset 50 km nopeudella 120 km/h, seuraavat 150 km nopeudella 80 km/h ja seuraavat 150 km nopeudella 100 km/h. MikÄa onkeskinopeus? Aritmeettinen keskiarvo: ¹x = 1 ( ) = Painotettu keskiarvo: ¹x w =( )/ Geometrinen keskiarvo: ¹x g =( ) Painotettu geometrinen keskiarvo: ¹x gw =120 50/ / / Harmoninen keskiarvo: ¹x h = 3 1/ /80 + 1/ Painotettu harmoninen keskiarvo antaa oikean vastauksen (miksi?): ¹x hw = / / /

30 B.2. Hajontalukuja Hajontaluvuilla kuvataan havaintoaineistossa olevaa vaihtelua. Entropia Olkoon x luokitteluasetikon muuttuja, jolla on M luokaa. Olkoon luokan i suhteellinen frekvenssi p i. Muutujan x entropia mäaäaritelläaäan lukuna H = M jossa A =1/ ln(2). p i log 2 (p i )=0. PÄatee M p i log 2 (p i )= A M p i ln(p i ), Jos p i =0mÄaÄaritellÄaÄan M 1 p i log 2 (p i ) M log 2(1/M )=log 2 M. Skaalaamalla log 2 M:llÄa saadaan hajontaluku (suhteellinen entropia) H 1 = H log 2 M, jolle päatee 0 H

31 Esim. Teollisuuden alan kannattavuus jakaantui seuraavasti TÄallÄoin Kannattavuus Prosenttia Huono 12 Keskinkertainen 52 HyvÄa 27 Erinomainen 9 YhteensÄa 100 H 1 = [0.12 ln(0.12) ln(0.09)] ln(4) ln(4) Hajonta on kohtalaisen suuri (max = 1). 38

32 VaihteluvÄali ja vaihteluväalin pituus Olkoon x väahintäaäan jäarjestysasteikollinen. Havaintojen x 1,...,x n vaihteluväali on (x min,x max ), jossa x min =min(x 1,...,x n ) ja x max = max(x 1,...,x n ). VaihteluvÄalin pituus on R = x max x min. KvartiilivÄali ja -poikkeama Havaintojen x 1,...,x n (väahintäaäan jäarjestysasteikolisia) alakvartiili Q 1 on havaintoarvo, jota pienempiäa havaintojaon25prosenttiaja yläakvartiili Q 3 havaintoarvo, jota suurempia havaintoja on 25 prosenttia (pienempiäa 75 prosenttia). TÄaten alakvartiili, mediaani ja yläakvartiili jakavat havaintoaineiston neljäanneksiin (kvartaaleihin). KvartiilivÄali on (Q 1,Q 3 ) ja kvartiilipoikkeama mäaäaritelläaäan lukuna Q = 1 2 (Q 3 Q 1 ). 39

33 Yleisesti mäaäaritelläaäan p-prosentin fraktiili x p (havainto)arvoksi, jota pienempiäa on p prosenttia havainnoista. Esim. Juomapurkkiaineistosta saadaan (Excel-taulukko) Aika Taytto min max R Q Q Q

34 Varianssi ja keskihajonta Oletetaan, ettäa x on väahintäaäan intervalliasteikollinen. Havaintojen x 1,...,x n (n>1) varianssi on s 2 = 1 n (x i ¹x) 2. n 1 Keskihajonta mäaäaritelläaäan varianssin positiivisena neliäojuurena s =+ s 2,toisinsanoen s = 1 n 1 n (x i ¹x) 2. Se, ettäa jakajana on n 1 perustellaan myäohemmin. PÄatee: n joten (x i ¹x) 2 = n s 2 = 1 n 1 x 2 i n¹x2 = n x 2 i 1 n n x i 1 n 2 n x i. 2 n x i, 41

35 Esim. Virvoitusjuomapullojen täayttäoasteen keskiarvo ja keskihajonta (Excel-taulukko) n =30, x i =997.8 ja x 2 i = , joten ¹x = 1 n n x i = n s 2 = 1 n 1 x2 i 1 n n x 2 i ja = (997.8) s = Keskihajonta on käaytetyin hajontaluku. Huom. PÄatee n (x i ¹x) 2 n (x i a) 2 kaikilla a IR. TÄaten keskiarvo on neliäosumman (varianssin) mielessäa läahimpäanäa kaikkia havaintoja. 42

36 Ominaisuuksia: (a) s 2 0, jossa yhtäasuuruus päatee ainoastaan, kun x 1 = = x n. (b) Keskihajonta on samassa mittayksikäossäa kuinhavain- not. (c) Jos y i = a + bx i,niins 2 y = b 2 s 2 x ja s y = b s x, jossa s x on x-havaintojen keskihajonta. Huom. Jos käaytettäavissäa on kaikki perusjoukon N havaintoa, lasketaan varianssi kaavalla jossa σ 2 = 1 N N µ = 1 N on populaatiokeksiarvo. (x i µ) 2, N x i Luokitellusta aineistosta varianssi saadaan laskettua kaavalla: s 2 = 1 m f i (x i ¹x) 2, n 1 jossa f i on luokan i frekvenssi ja x i on luokan i luokkakeskus. 43

37 Keskihajonnan tulkinnasta: PÄatee: Muuttujan x arvoista korkeintaan 100/c 2 prosenttia poikkeaa keskiarvosta enemmäan kuin c s verran, missäa c on jokin annettu luku (Tsebyshevin lause). Toisin sanoen havainnoista väahintäaäan 100(1 1/c 2 )%onväalilläa ¹x ± cs. TÄamÄa tulos pitäaäa paikkansa aina. Empiirisesti kuitenkin saadaan huomattavasti kapeammat väalit. YleensÄa päatee: Havainnoista {n. 68% on väalilläa ¹x ± s {n. 95% on väalilläa ¹x ± 2s {n. 99.7% on väalilläa ¹x ± 3s Esim. Oletetaan, ettäa väaestäon keskipituus on 178cm ja keskihajonta 10cm. Silloin Tsebysevin rajojen mukaan päatee, ettäa jos valitaan c = 2, niinväahintäaäan 75% väaestäostäa on sellaisia, joiden pituus on on väalilläa 178 ± 2 10 = 178 ± 20cm. Empiirisen tuloksen mukaan täalle väalille kuitenkin melko varmsti sijoittuu 95% väaestäostäa. 44

38 Standardoidut havaintoarvot: Olkoon havaintojen x 1,...,x n keskiarvo ¹x ja keskihajonta s. TekemÄallÄa muunnokset z i = x i ¹x s saadaan havainnot, joille päatee: ¹z =0ja s z = 1. TÄatÄa muunnoista sanotaan standardoinniksi. Esim. Opiskelija sai matematiikan kokeist arvosanan 8.5 ja Äaidinkielen kokeesta arvosanan 9. Matematiikassa luokan keskiarvo oli 7.7 ja keskihajonta 1.5. ÄaidinkielessÄa keskiarvo oli 8.1 ja keskihajonta 1.8. Kummassa kokeessa oppilas menestyi suhteellisesti paremmin? Standardoimalla: z 1 = =0.53 z 2 = = Menestys on ollut suhteellisesti aavistuksen parempi matematiikan kokeessa. 45

39 Variaatiokerroin Varianssi ja keskihajonta riippuvat mittayksikäostäa. Vaihtelun suhteellista suuruutta voidaan mitata tapauksissa, joissa (suhdeasteikon) muuttuja x voi saada vain positiivisia arvoja variaatiokertoimella (coe±cient of variation) V = s ¹x. TÄallÄa mitalla voidaan tutkia esimerkiksi vaihteleeko elefanttien paino suhteellisesti enemmäan kuin ihmisten paino. 46

40 B.3. Muita jakaumaa luennehtivia tunnuslukuja Keskiluvut kuvaavaat jakauman sijaintia, hajontaluvut vaihtelun suuruutta. NÄaiden lisäaksi voidaan kuvata myäos jakauman vinoutta ja huipukkuutta omilla tunnusluvuilla. Vinous (Skewness) Havaintoaineiston jakauman vinoutta voidaan mitata tunnusluvulla 1 n s 3 = n (x i ¹x) 3 s 3. Huipukkuus (Kurtosis) Jakauman huipukkuutta mitataan tunnusluvulla 1 n s 4 = n (x i ¹x) 4 s 4. 47

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33. Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2005) 1 Tilastollisten aineistojen kuvaaminen Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten muuttujien tunnusluvut

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Tilastollisten aineistojen kuvaaminen

Tilastollisten aineistojen kuvaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2007) 1 Tilastollisten aineistojen kuvaaminen >> Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten

Lisätiedot

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. 1/11 4 MITTAAMINEN Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. Mittausvirhettä johtuen mittarin tarkkuudesta tai häiriötekijöistä Mittarin

Lisätiedot

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164 86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas f 332 = 3 Kvartiilit(302, 365, 413) Kvartiilit: missä sijaitsee keskimmäinen 50 % aineistosta? Kvartiilit(302, 365, 413) Keskiarvo (362.2) Keskiarvo

Lisätiedot

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N 11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä: 22 5. Keskiluvut Kaikkein pisimmälle on informaation tiivistämisessä menty silloin, kun otosta kuvataan vain yhdellä luvulla, joka mahdollisimman hyvin edustaa kaikkia otoksen arvoja. Tällaisia lukuja

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1) 20.9.2018/1 MTTTP1, luento 20.9.2018 KERTAUSTA JA TÄYDENNYSTÄ Tunnusluvut 1) Sijainnin tunnuslukuja Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1) Muita sijainnin tunnuslukuja ala- ja yläkvartiili,

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

1 TILASTOMATEMATIIKKA... 2 2 TILASTOTIETEEN PERUSKÄSITTEITÄ... 3 3 MUUTTUJAT... 6 4 FREKVENSSIJAKAUMA... 8 5 AINEISTON LUOKITTELU...

1 TILASTOMATEMATIIKKA... 2 2 TILASTOTIETEEN PERUSKÄSITTEITÄ... 3 3 MUUTTUJAT... 6 4 FREKVENSSIJAKAUMA... 8 5 AINEISTON LUOKITTELU... SISÄLLYSLUETTELO 1 TILASTOMATEMATIIKKA... 2 1.1 JOHDANTO... 2 1.2 LINKKEJÄ... 2 1.3 LÄHTEET... 2 2 TILASTOTIETEEN PERUSKÄSITTEITÄ... 3 2.1 HAVAINTOAINEISTO... 3 2.2 POPULAATIO... 3 2.3 OTOS... 3 2.4 HAVAINTOAINEISTON

Lisätiedot

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15,

Lisätiedot

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi Tilastotiedettä Tilastotieteessä kerätään tietoja yksittäisistä asioista, ominaisuuksista tai tapahtumista. Näin saatua tietoa käsitellään tilastotieteen menetelmin ja saatuja tuloksia voidaan käyttää

Lisätiedot

Tilastolliset toiminnot

Tilastolliset toiminnot -59- Tilastolliset toiminnot 6.1 Aineiston esittäminen graafisesti Tilastollisen aineiston tallentamisvälineiksi TI-84 Plus tarjoaa erityiset listamuuttujat L1,, L6, jotka löytyvät 2nd -toimintoina vastaavilta

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas MUITA HAJONNAN TUNNUSLUKUJA Varianssi, variance (s 2, σ 2 ) Keskihajonnan neliö Käyttöä enemmän osana erilaisia menetelmiä (mm. varianssianalyysi),

Lisätiedot

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro Lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19,

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Otannasta ja mittaamisesta

Otannasta ja mittaamisesta Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA Oulun yliopisto Fysiikan opetuslaboratorio Fysiikan laboratoriotyöt 1 1 LIITE 1 VIRHEEN RVIOINNIST Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus. Virhearviointi Fysiikassa on tärkeää tietää tulosten tarkkuus. Virhelajit A. Tilastolliset virheet= satunnaisvirheet, joita voi arvioida tilastollisin menetelmin B. Systemaattiset virheet = virheet, joita

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KATO (MISSING DATA, ATTRITION) Kun otostetuista havaintoyksiköistä saavutetaan (mitataan) vain osa, tarkoittaa kato sitä osaa tutkittavista tai mittauksista,

Lisätiedot

Luento 4.9.2014 1 JOHDANTO

Luento 4.9.2014 1 JOHDANTO 1 1 JOHDANTO Luento 4.9.2014 Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät koejärjestelyt kyselylomakkeet - tietojen keruuta - tietojen esittämistä kuvailevaa

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

1.1 Tilastotieteen peruskäsitteitä

1.1 Tilastotieteen peruskäsitteitä Tilastotieteen peruskäsitteitä 1.1 Tilastotieteen peruskäsitteitä 1. Muodostetaan taulukon perusteella suhteellinen frekvenssijakauma. Lehti Levikki f % Helsingin 365994 365 994 0,13579... 13,6% Sanomat

Lisätiedot

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011 Kuvioita, taulukoita ja tunnuslukuja Aki Taanila 2.2.2011 1 Tilastokuviot Pylväs Piirakka Viiva Hajonta 2 Kuviossa huomioitavia asioita 1 Kuviolla tulee olla tarkoitus ja tehtävä (minkä tiedon haluat välittää

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Mittaustekniikka (3 op)

Mittaustekniikka (3 op) 530143 (3 op) Yleistä Luennoitsija: Ilkka Lassila Ilkka.lassila@helsinki.fi, huone C319 Assistentti: Ville Kananen Ville.kananen@helsinki.fi Luennot: ti 9-10, pe 12-14 sali E207 30.10.-14.12.2006 (21 tuntia)

Lisätiedot

7. Normaalijakauma ja standardipisteet

7. Normaalijakauma ja standardipisteet 33 7. Normaalijakauma ja standardipisteet Aiemmin olemme esittäneet joitakin variaabelin jakaumia histogrammien ja frekvenssipolygonien muodossa. Jos kuvittelemme, että mittaamme varsin tarkasti ja jatkuvaksi

Lisätiedot

TILASTO- JA TALOUSMATEMATIIKKA s. 1

TILASTO- JA TALOUSMATEMATIIKKA s. 1 TILASTO- JA TALOUSMATEMATIIKKA s. 1 Käsitteitä: Tilastoja voidaan havainnollistaa: o Tilastokuvioilla eli diagrammeilla Tavallisimmin käytettyjä tilastokuvioita ovat pylväsdiagrammit Muodostuu erillisistä

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

3 Mittaamisen taso ja tilaston keskiluvut

3 Mittaamisen taso ja tilaston keskiluvut 3 Mittaamisen taso ja tilaston keskiluvut Tämä tutkimus on sellainen, että (jos nyt jänisten laskua voidaan mittaamiseksi kutsua) mittaamisessa on eroteltavissa neljä erilaista mittaamisen tasoa, mittausasteikkoa.

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas AINEISTON TARKASTELU JA MUOKKAUS AINA ennen varsinaista analyysia suoritetaan aineiston tarkastelu ja muokkaus, data-analyysi Tavoitteena:

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 8 TILASTOT ALOITA PERUSTEISTA 33A. Keskiarvo on pituuksien summan ja lukumäärän osamäärä, joten A ja III kuuluvat yhteen. Keskihajonta mittaa havaintoarvojen ryhmittymistä keskiarvon ympärille, joten B

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 LIITE 1 VIRHEEN ARVIOINNISTA Mihin tarvitset virheen arviointia? Mittaustulokset ovat aina todellisten luonnonvakioiden ja tutkimuskohdetta kuvaavien suureiden likiarvoja, vaikka mittauslaite olisi miten

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

riippumattomia ja noudattavat samaa jakaumaa.

riippumattomia ja noudattavat samaa jakaumaa. 12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas OTOSTAMISEEN LIITTYVIÄ ONGELMIA Otostamisen ongelmat liittyvä satunnaistamisen epäonnistumiseen Ongelmat otantakehyksen määrittämisessä Väärän otantamenetelmän

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

II Tilastollisen aineiston ja analyysin edellytysten tarkistaminen

II Tilastollisen aineiston ja analyysin edellytysten tarkistaminen II Tilastollisen aineiston ja analyysin edellytysten tarkistaminen - Tietojen syöttö - Karma&Komulainen aineisto (tutustuminen) - Muuttujien jakauman tarkistus - Puuttuva tieto ja sen käsittely - Muunnokset,

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi miten uudenaikainen tai kallis tahansa ja mittaaja olisi alansa huippututkija Tästä johtuen mittaustuloksista

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Johdatus tilastotieteeseen ja mittaaminen TKK (c) Ilkka Mellin (2004) 2 ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

3.7 Todennäköisyysjakaumia

3.7 Todennäköisyysjakaumia MAB5: Todennäköisyyden lähtökohdat 4 Luvussa 3 Tunnusluvut perehdyimme jo jakauman käsitteeseen yleensä ja normaalijakaumaan vähän tarkemmin. Lähdetään nyt tutustumaan binomijakaumaan ja otetaan sen jälkeen

Lisätiedot

TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT

TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT Jouni Peltonen, 2016 jouni.peltonen@oulu.fi ktk331 Jouni Peltonen Miten kurssi suoritetaan,

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa Sisältö Kvantitatiivinen metodologia verkossa Perusteiden Kertaus Pekka Rantanen Helsingin yliopisto Tilastollinen analyysi Tilastotieteen tavoitteet Kvantitatiivisen tutkimuksen peruskäsitteitä Tilastollisten

Lisätiedot

Matematiikan johdantokurssi, syksy 2016 Harjoitus 11, ratkaisuista

Matematiikan johdantokurssi, syksy 2016 Harjoitus 11, ratkaisuista Matematiikan johdantokurssi, syksy 06 Harjoitus, ratkaisuista. Valitse seuraaville säännöille mahdollisimman laajat lähtöjoukot ja sopivat maalijoukot niin, että syntyy kahden muuttujan funktiot (ks. monisteen

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

Esimerkki 1: auringonkukan kasvun kuvailu

Esimerkki 1: auringonkukan kasvun kuvailu GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 16.11.2017/1 MTTTP5, luento 16.11.2017 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla ~,, ~,,. 16.11.2017/2 Esim. Tutkittiin uuden menetelmän käyttökelpoisuutta

Lisätiedot

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin) 1/10 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot