1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

Koko: px
Aloita esitys sivulta:

Download "1 TILASTOMATEMATIIKKA... 2 2 TILASTOTIETEEN PERUSKÄSITTEITÄ... 3 3 MUUTTUJAT... 6 4 FREKVENSSIJAKAUMA... 8 5 AINEISTON LUOKITTELU..."

Transkriptio

1 SISÄLLYSLUETTELO 1 TILASTOMATEMATIIKKA JOHDANTO LINKKEJÄ LÄHTEET TILASTOTIETEEN PERUSKÄSITTEITÄ HAVAINTOAINEISTO POPULAATIO OTOS HAVAINTOAINEISTON KERÄÄMISTAVAT MUUTTUJAT MITTA-ASTEIKOT JATKUVA VAI DISKREETTI? FREKVENSSIJAKAUMA AINEISTON LUOKITTELU DIAGRAMMIT TUNNUSLUVUT

2 1 TILASTOMATEMATIIKKA 1.1 Johdanto Tilastotiede on saanut alkunsa väestö- ja talousaloja kuvaavista tilastoista. Tilastollisilla menetelmillä on tärkeä asema yhteiskunnallisten toimintojen suunnittelussa, lääketieteen tutkimuksessa, yritysten toimintojen kehittämisessä se monilla muilla aloilla. Tietojenkäsittelyn kehittyminen on tehnyt tilastoista niin yleisiä ja jokapäiväisiä asioita, että ne ovat jatkuvasti esillä lehdissä, internetissä ja televisiossa. Tilastoja on esimerkiksi talouselämästä, urheilusta, politiikasta ja säätilojen muutoksista. Jokaisen kansalaisen perustaitoihin kuuluu tänä päivänä osata lukea ja tulkita tilastoja. Tämän vuoksi tulee tuntea tiettyjä tilastotieteen perusasioita sekä opetella tilastojen lukemista taulukoina, kuvioina ja erilaisten tunnuslukujen avulla. Pohdintatehtävä Mieti millaisia käyttötarpeita voi olla a) työttömyystilastoilla b) hintatilastoilla? 1.2 Linkkejä Suomen suurin tilastojen tuottaja on valtion ylläpitämä Tilastokeskus. Sen lisäksi virallisia tilastoja tekevät monet muut valtion virastot ja laitokset sekä kunnat, liikelaitokset ja monet järjestöt. Tilastollisia tutkimuksia tehdään myös yritysten omiin tarpeisiin. Tilastokeskus ( Väestörekisterikeskus ( Stakes ( Suomen ympäristökeskus ( Suomen elokuvasäätiö ( 1.3 Lähteet Helakorpi, Ansaharju ja Söderström (1999) Origo. WSOY oppimaterialit. Hemmo, Taskinen ja Vahviainen (2004) Sigma, Tilastot ja todennäköisyys. TAMMI oppimateriaalit. Karjalainen Leila (2001) Liiketalouden matematiikka 1. Gummerus. 2

3 Karvonen, Käenniemi, Möller ja Poskela (2001) ProbleMatikka. Otava oppimateriaalit. Kettunen, Laakkonen ja Salminen (2007) Numerotaito. WSOY oppimateriaalit. Peltola ja Vuorenmaa (2006) Näppärästi numeroilla. WSOY oppimateriaalit. 2 TILASTOTIETEEN PERUSKÄSITTEITÄ 2.1 Havaintoaineisto Tilastot eivät synny itsestään vaan ne täytyy kerätä. Useimmiten tilastot muodostuvat suuresta määrästä numerotietoja. Tilastollista tutkimusta varten kerättyä tietoa kutsutaan havaintoaineistoksi tai tilastoaineistoksi. Havainnollisuuden vuoksi aineisto esitetään yleensä taulukoituna tai kuvioiden avulla. Havaintoaineisto koostuu havaintoyksiköistä (tilastoyksiköistä) ja niiden ominaisuuksista eli muuttujista. Jos tutkitaan esimerkiksi luokan oppilaiden koulumatkojen pituuksia ja kengän numeroa, oppilaat ovat havaintoyksikköjä, ja koulumatkan pituus ja kengän numero ovat muuttujia. 2.2 Populaatio Se joukko, johon tutkimus kohdistuu, on nimeltään perusjoukko eli populaatio. Populaatio voi olla esimerkiksi kaupungin asukkaat, Kajaanin Ammattikorkeakoulun opiskelijat, radiossa soitetut kappaleet, tietokoneiden sovellusohjelmat, esikouluiässä olevat lapset jne. Jos havaintoaineistoon kuuluu kaikki perusjoukon havaintoyksiköt, sitä kutsutaan kokonaisaineistoksi. 2.3 Otos Koko perusjoukkoa on usein mahdotonta tai ainakin kovin työlästä tutkia. Tästä syystä kokonaisaineiston sijasta tutkitaan usein otosta. Otos on sellainen osa perusjoukon havaintoyksiköistä, jotka on kerätty jollain otantamenetelmällä. Otantamenetelmät ovat erilaisia tapoja poimia havaintoyksiköitä perusjoukosta niin, että otos kuvaisi perusjoukkoa 3

4 mahdollisimman hyvin. Jos havaintoyksiköt poimitaan perusjoukosta jollain muulla tavalla kuin otantamenetelmällä, kerättyä aineistoa kutsutaan näytteeksi Yksinkertainen satunnaisotanta arvonta Otannan perusmenetelmä on yksinkertainen satunnaisotanta. Yksinkertaisessa satunnaisotannassa jokaisella alkiolla on yhtä suuri todennäköisyys tulla poimituksi otokseen. Yksinkertainen satunnaisotanta valitaan arpomalla Systemaattinen otanta - joka k:s Systemaattinen otanta sopii käytettäväksi silloin, kun perusjoukkoa ei tarkkaan pystytä määrittämään, esimerkiksi liikkeen asiakastutkimus ovensuukyselynä, liikennetutkimus maantiellä jne.. Systemaattisessa otannassa valitaan ensin poimintaväli. Jos perusjoukon koko on tiedossa, niin poimintaväli saadaan jakamalla perusjoukon koko halutulla otoskoolla. Jos poimintaväliksi valitaan k, niin seuraavaksi arvotaan k:n ensimmäisen tilastoyksikön joukosta yksi ja sen jälkeen poimitaan järjestyksessä joka k:s. tilastoyksikkö. Menetelmä sopii käytettäväksi myös silloin, jos käytettävissä on luettelo perusjoukon jäsenistä. Luettelosta voidaan poimia otos systemaattista otantaa käyttäen Ositettu otanta - avainryhmien edustus taattu 4

5 Esimerkki Jos tutkimuksen tarkoituksena on vertailla Suomessa asuvia suomenkielisiä ja ruotsinkielisiä, niin yksinkertaisella satunnaisotannalla arvottu otos luultavasti sisältäisi aika vähän ruotsinkielisiä. Vertailua varten ruotsinkielisiä pitäisi kuitenkin olla niin paljon, että voitaisiin tehdä kaikkia Suomessa asuvia ruotsinkielisiä koskevia päätelmiä. Ratkaisu on ositettu otanta, jossa arvotaan otos erikseen suomenkielisistä ja erikseen ruotsinkielisistä. Jos halutaan nimenomaan verrata kyseisiä ryhmiä toisiinsa, niin käytetään tasaista kiintiöintiä: suomenkielisiä arvotaan mukaan yhtä monta kuin ruotsinkielisiäkin. Tällöin otoksesta ei tietenkään suoraan voi tehdä kaikkia Suomessa asuvia koskevia päätelmiä, ainoastaan päätelmiä suomenkielisistä ja ruotsinkielisistä. Ositetussa otannassa voidaan osittavana muuttujana käyttää mitä tahansa tutkimuksen kannalta tärkeää muuttujaa, kuten ikäryhmä, sukupuoli, asuinseutu jne Ryväsotanta Ryväsotannassa perusjoukon alkiot ryhmitellään ryppäisiin. Vain osa ryppäistä pääsee mukaan otokseen. Esimerkki Oppilaitoksen opiskelijoista voidaan poimia otos arpomalla ensin otos luokkahuoneista, jolloin luokkahuoneet ovat nk. ryppäitä. Arvotuissa luokkahuoneissa käydään sitten suorittamassa kysely. Otoksessa pitäisi myös huomioida päivä ja iltaopiskelijat. Tämän voisi toteuttaa arpomalla otos luokkahuoneista päiväsaikaan ja toinen otos ilta-aikaan. Tässä yhdistetään ryväsotantaan ositettu otanta, jolla taataan päivä- ja iltaopiskelijoiden edustus. 5

6 Esimerkki Jos tutkitaan tänä vuonna peruskoulun aloittavia, niin voidaan poimia ensin otos kouluista, jolloin koulut ovat ryppäitä. Tämän jälkeen arvotaan kustakin otokseen tulleesta koulusta tietty määrä tutkimuksen kohderyhmään kuuluvia oppilaita. Jos poimituista ryppäistä tutkitaan kaikki ryppäisiin kuuluvat alkiot, puhutaan yksiasteisesta ryväsotannasta. Jos poimituista ryppäistä valitaan vain osa alkioista tutkittavaksi, niin kyseessä on kaksiasteinen ryväsotanta. 2.4 Havaintoaineiston keräämistavat Havaintoaineistoa voidaan kerätä monella eri tavalla: kyselyllä, haastattelulla, havainnoimalla, systemaattisella koejärjestelyllä ja valmiista tietokannasta. Tavan valitseminen riippuu siitä, millaista tietoa halutaan kerätä. 3 MUUTTUJAT Tilastollinen muuttuja on kvantitatiivinen (eli määrällinen) jos sen luonnollinen kuvaustapa on reaaliluku. Jos muuttujaa ei kuvata reaaliluvulla (tai luku on vain tietty koodiarvo), muuttujaa sanotaan kvalitatiiviseksi (eli laadulliseksi) muuttujaksi. Esimerkki 3.1. Seuraavan lomakkeen muuttujista ovat kvalitatiivisia ikä ja pituus sekä kvantitatiivisia sukupuoli ja mielipide kouluruoasta. Sukupuoli mies nainen Ikä Pituus Mielipide kouluruoasta 1 Ruoka on huonoa. 2 Ruoka on melko hyvää. 3 Ruoka on erinomaista 6

7 3.1 Mitta-asteikot Muuttujat voidaan jaotella neljään luokkaan mitta-asteikon mukaan: 1) laatu- eli nominaaliasteikko 2) järjestys- eli ordinaaliasteikko, 3) välimatka- eli intervalliasteikko sekä 4) suhdelukuasteikko Nominaali- eli laatuasteikko Nominaali- eli laatuasteikolla havainnot luokitellaan kahteen tai useampaan luokkaan samanlaisuutensa tai erilaisuutensa perusteella. Mittauksen kohteet ovat siinä mielessä tasaarvoisia, ettei millään luokalla ole enempää mitattavaa ominaisuutta kuin toisella luokalla. Luokkia ei siis voi laittaa järjestykseen mitattavan ominaisuuden suhteen. Esimerkkejä: työllinen/työtön/ työvoimaan kuulumaton, kaupunki/maalaiskunta, suomalainen/ruotsalainen/norjalainen Ordinaali- eli järjestysasteikko Ordinaali- eli järjestysasteikolla mitattavasta kohteesta voidaan sanoa, onko sillä mitattavaa ominaisuutta enemmän, yhtä paljon vai vähemmän kuin toisella kohteella. Järjestysasteikko on kuin venyvä mittanauha. Nauhan pituudesta riippumatta kohteet ovat oikeassa järjestyksessä. Kohteiden välisillä etäisyyksillä ei sen sijaan ole merkitystä. Esimerkkinä ordinaaliasteikosta ovat paljon käytetyt asenneskaalat: täysin eri mieltä/jokseenkin eri mieltä/ei osaa sanoa/jokseenkin samaa mieltä/täysin samaa mieltä Intervalli- eli välimatka-asteikko Järjestyksen lisäksi intervalli-asteikolla on mielekästä verrata välimatkoja. Lämpömittari sisältää tällaisen asteikon. 0-piste on mielivaltainen: Celsiuksen nolla on Fahrenheitin 32 astetta. Kuitenkin lämpötilan nousu -20 asteesta -10 asteeseen on yhtä suuri kuin nousu +10 asteesta +20 asteeseen. Toinen esimerkki intervalliasteikosta on kalenteri, jolla mitataan aikaa päivissä Suhdeasteikko 7

8 Lisäämällä intervalliasteikkoon absoluuttinen nollapiste päästään suhdeasteikkoon. Tähän luokkaan kuuluvia muuttujia ovat pituus, paino, perheen tulot, yleensä raha- ja lukumäärämitat. 3.2 Jatkuva vai diskreetti? Välimatka- ja suhdelukuasteikolliset muuttujat voivat olla jatkuvia tai epäjatkuvia eli diskreettejä. Jatkuva muuttuja voi saada mitä tahansa arvoja tietyllä välillä, esimerkkinä henkilön pituus. Diskreetti muuttuja, esimerkiksi kengän numero, voi saada vain tiettyjä arvoja. 4 FREKVENSSIJAKAUMA Havaintoaineiston keräämisen jälkeen aineisto käsitellään niin, että kaikki olennainen tieto saadaan näkyviin. Aineiston käsittely aloitetaan yleensä frekvenssien laskemisella. 4.1 Frekvenssi Frekvenssi on muuttujan arvojen esiintymiskertojen lukumäärä. Esimerkki 4.1. Opettaja kerää havaintoaineiston kysymällä luokan oppilailta heidän sisarustensa lukumäärän. Kahdenkymmenenkahden oppilaan sisarusten lukumäärät olivat Opettaja laskee muuttujan arvojen esiintymiskerrat tukkimiehen kirjanpidolla frekvenssien määrittämiseksi. Sisarusten Frekvenssi f 0 3 lukumäärä Tällä tavalla laadittu taulukko, jossa esiintyvät muuttujien arvot ja niihin liittyvät frekvenssit, on nimeltään frekvenssijakauma. 8

9 4.2 Suhteellinen frekvenssi Suhteellinen frekvenssi kertoo esiintymiskertojen määrän prosentteina. Esimerkki 4.2. Edellisen esimerkin suhteelliset frekvenssit. Sisarusten Frekvenssi f Suhteellinen frekvenssi f lukumäärä 0 3 % 3/22 = 0, % /22 = 0,5 = 50 % 2 6 6/22 = 0, % 3 2 2/22 = 0, % Havaintoyksiköitä yhteensä 22 Suhteellisten frekvenssien avulla on helpompi vertailla keskenään aineistoja, joissa havaintoyksiköitä on eri määrä. 5 AINEISTON LUOKITTELU 5.1 Luokittelu Kun muuttujien arvoja on niin paljon, että niitä ei ole mielekästä ilmoittaa frekvenssitaulukossa yksittäisinä arvoina, ne luokitellaan sopiviin luokkiin. Luokkien määrä on harkinnanvarainen. Teknisillä aloilla luokkien määrä lasketaan kaavalla 3 n eli otetaan havaintojen lukumäärästä kuutiojuuri ja pyöristetään se ylempään kokonaislukuun. Jos luokkia on paljon, saadaan tarkempi tulos kuin harvalla luokkavälillä. Esimerkki 5.1. Seuraavassa on erään luokan oppilaiden pituudet senttimetreinä: Lukusuoralle sijoitetuista pisteistä nähdään, mille välille pituudet asettuvat ja moneenko luokkaan aineisto kannattaa jakaa. 9

10 Sitten aineisto luokitellaan ja lasketaan sen frekvenssit. Luokka f f % % % % % 5.2 Todelliset luokkarajat Luokitellun jatkuvan muuttujan luokkarajat eivät ole todellisia luokkarajoja. Todellisissa luokkarajoissa otetaan huomioon mahdolliset lukuarvon pyöristykset. Esimerkki 5.2. Pituus 161 cm voi todellisuudessa olla 160,5 cm - 161,4 cm. Kaikki nämä pituudet pyöristyvät 161 senttimetriin. Esimerkin 5.1 todelliset luokkarajat siis ovat Luokka Todellinen alaraja Todellinen yläraja ,5 160, ,5 170, ,5 180, ,5 190,5 5.3 Luokkakeskus Luokitellussa aineistossa tarvitaan usein yksi lukuarvo edustamaan kutakin luokkaa. Tällainen arvo on luokan keskimmäinen arvo eli luokan todellisen alarajan ja todellisen ylärajan keskiarvo: 10

11 Luokkakeskus = (todellinen alaraja + todellinen yläraja) / 2 Esimerkki 5.3. Esimerkin 5.1 luokan luokkakeskus on siis (160, ,5) / 2 = 165, Luokkavälin pituus Luokkavälin pituus on todellisten luokkarajojen erotus. Esimerkki 5.4. Luokkavälin pituus esimerkissä 5.1 on 170,5-160,5 = 10,0. 6 DIAGRAMMIT Frekvenssijakauman perusteella voi olla hankala muodostaa kokonaiskuvaa tarkasteltavasta tilanteesta. Tilastokuvaajilla eli diagrammeilla on tarkoitus havainnollistaa tietoa. 6.1 Pylväsdiagrammi Pylväsdiagrammilla kuvataan diskreettiä muuttujaa. Pylvään korkeus määräytyy frekvenssin tai suhteellisen frekvenssin mukaan. Pylväät piirretään erillisinä. Pystypylväitä käytetään silloin, kun molemmat muuttujat ovat määrää mittaavia. 6.2 Palkkidiagrammi 11

12 Pylväsdiagrammin sijasta voidaan diskreettiä muuttujaan kuvata myös palkkidiagrammilla. Palkin pituus määräytyy frekvenssin tai suhteellisen frekvenssin mukaan. Palkit piirretään erillisinä. Vaakapylväitä suositellaan käytettäväksi silloin, kun toinen kuvattava muuttuja on tyypiltään laadullinen. 6.3 Sektoridiagrammi Sektoridiagrammilla kuvataan diskreetin muuttujan suhteellisia frekvenssejä. Sektorin keskuskulman suuruus määräytyy suhteellisen frekvenssin mukaan. 6.4 Histogrammi Histogrammilla voidaan esittää jatkuvien muuttujien jakaumia. Ne soveltuvat yhden muuttujan jakauman kuvailuun. Pylvään korkeus ilmaisee pylvään luokkaan kuuluvien havaintojen määrän 12

13 (eli frekvenssin). Pylväät piirretään yhteen siten, että pylvään keskikohdassa on luokkakeskus ja reunoilla todelliset luokkarajat. 6.5 Viivadiagrammi Viivadiagrammissa yhdistetään viivalla luokkakeskusten kohdalle merkityt frekvenssipisteet. Jakauman hännät päätyvät 0-tasolle. Viivadiagrammit soveltuvat parhaiten vaihtelun tai kehityssuunnan esittämiseen tietyn ajanjakson aikana. Viivadiagrammia kutsutaan myös frekvenssimonikulmioksi. 13

14 7 TUNNUSLUVUT Frekvenssit ja diagrammit eivät aina riitä tilastojen havainnollistamiseksi. Tämän vuoksi havaintoaineistoa voidaan kuvata erilaisilla tunnusluvuilla. 7.1 Keskiarvo, Keskiarvo ilmaisee muuttujan arvojen keskimääräisen suuruuden. Se lasketaan jakamalla muuttujan arvojen summa arvojen lukumäärällä. Esimerkki 7.1. Kokkiopiskelijan päästötodistuksessa oli äidinkieli 3, englanti 4, matematiikka 5, tietotekniikka 5 ja liikunta 1. Mikä oli näiden aineiden keskiarvo? = ( ) / 5 = 3,6 Luokitellussa aineistossa käytetään keskiarvonlaskemisessa luokkakeskuksia. Esimerkki 7.2. Esimerkin 5.1 oppilaiden pituuksien keskiarvo lasketaan kertomalla kunkin luokan luokkakeskus sen frekvenssillä ja jakamalla frekvenssien summalla: Luokka (cm) f luokkakeskus (cm) 155, , , ,5 Yhteensä, n 22 = (5 155, , , ,5)/22 = 169,1 (cm). 14

15 7.2 Mediaani, Md Mediaani ilmaisee keskimmäisen muuttujan arvon. Aineisto on laitettava suuruusjärjestykseen ennen mediaanin määrittämistä, joten muuttujan on oltava vähintään järjestysasteikollinen. Jos muuttujan arvoja on parillinen määrä, käytetään mediaanina kahden keskimmäisen muuttujan arvon keskiarvoa. Esimerkki 7.3. Esimerkin 7.1 kokkiopiskelijan arvosanojen 1, 3, 4, 5, 5 keskimmäinen arvo eli mediaani Md = 4. Luokitellussa aineistossa mediaani on sen luokan luokkakeskus, joka jakaa muuttujan arvot kahteen yhtä suureen osaan. Esimerkki 7.4. Esimerkin 5.1 oppilaiden pituudet olivat Luokka (cm) f luokkakeskus (cm) 155, , , ,5 n 22 Koska muuttujan arvoja on yhteensä 22 (ts. n = 22), keskimmäiset muuttujan arvot ovat yhdestoista ja kahdestoista arvo. Nämä muuttujan arvot ovat mediaaniluokassa cm, joten mediaani Md = 165,5 cm. 7.3 Moodi, Mo Tyyppiarvo eli moodi (Mo) on muuttujan yleisin arvo. Moodin frekvenssi on siis suurin. Esimerkki 7.5. Opiskelijan todistuksen arvosanat jakautuivat seuraavasti: 15

16 Eniten on arvosanoja 3 (6 kpl), joten se on moodi: Mo = Vaihteluvälin pituus, R Hajontaluvut kertovat, kuinka lähellä keskiarvoa muuttujan arvot ovat. Kahdella muuttujalla voi olla sama keskiluku (esimerkiksi keskiarvo), mutta niiden hajonta voi olla täysin erilainen. Hajontalukuja käytetään erityisesti silloin, kun halutaan vertailla kahta jakaumaa. Yksinkertaisin hajontaluku on vaihteluvälin pituus, R. Se on muuttujan suurimman ja pienimmän arvon erotus. Luokitetulla aineistolla vaihteluväli lasketaan ylimmän luokan ylärajan ja alimman luokan alarajan erotuksena. 7.5 Keskihajonta, s Tarkemmin muuttujan arvon hajontaa kuvaa keskihajonta. Se on havaintojen keskimääräinen poikkeama keskiarvosta. Keskihajontaa laskettaessa otetaan huomioon jokainen havainto ja sen erotus havaintojen keskiarvosta. Mitä lähempänä keskiarvoa ja toisiaan havaintoarvot ovat, sitä pienempi keskihajonta on. Otoksen keskihajonnan kaava on missä x i :t ovat havaintoarvoja, on keskiarvo ja n on havaintojen lukumäärä. Useimmissa laskimissa on näppäimet sekä otoksen (jaetaan arvolla n-1) että perusjoukon (jaetaan arvolla n = N) keskihajonnan laskemiseksi. Excelissä funktio keskihajonta laskee hajonnan otoksen perusteella ja funktio keskihajontap perusjoukon hajonnan. Esimerkki 7.6. Erään luokan oppilaiden arvosanat englannissa ja matematiikassa jakautuivat seuraavasti: 16

17 Keskiluvut englannissa: = 7,81, Md = 8 ja Mo = 9 Keskiluvut matematiikassa: = 7,88, Md = 8 ja Mo = 8 Englannin arvosanojen vaihteluvälin pituus R englanti = 10-4 = 6 ja matematiikan arvosanojen vaihteluvälin pituus R matematiikka = 10-5 = 5. Excelillä lasketut keskihajonnat ovat s englanti = 1,8 ja s matematiikka = 1,3. Vaikka keskiluvut eivät juuri poikkea englannin ja matematiikan arvosanojen jakaumien välillä, jakaumien hajontaluvuista huomaa, että arvosanat matematiikassa ovat jakautuneet lähemmäs jakauman keskiarvoa kuin englannissa. 17

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen

Lisätiedot

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33. Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Johdatus tilastotieteeseen ja mittaaminen TKK (c) Ilkka Mellin (2004) 2 ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet

Lisätiedot

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164 86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi Tilastotiedettä Tilastotieteessä kerätään tietoja yksittäisistä asioista, ominaisuuksista tai tapahtumista. Näin saatua tietoa käsitellään tilastotieteen menetelmin ja saatuja tuloksia voidaan käyttää

Lisätiedot

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N 11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Tilastolliset toiminnot

Tilastolliset toiminnot -59- Tilastolliset toiminnot 6.1 Aineiston esittäminen graafisesti Tilastollisen aineiston tallentamisvälineiksi TI-84 Plus tarjoaa erityiset listamuuttujat L1,, L6, jotka löytyvät 2nd -toimintoina vastaavilta

Lisätiedot

3 Mittaamisen taso ja tilaston keskiluvut

3 Mittaamisen taso ja tilaston keskiluvut 3 Mittaamisen taso ja tilaston keskiluvut Tämä tutkimus on sellainen, että (jos nyt jänisten laskua voidaan mittaamiseksi kutsua) mittaamisessa on eroteltavissa neljä erilaista mittaamisen tasoa, mittausasteikkoa.

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

TILASTO- JA TALOUSMATEMATIIKKA s. 1

TILASTO- JA TALOUSMATEMATIIKKA s. 1 TILASTO- JA TALOUSMATEMATIIKKA s. 1 Käsitteitä: Tilastoja voidaan havainnollistaa: o Tilastokuvioilla eli diagrammeilla Tavallisimmin käytettyjä tilastokuvioita ovat pylväsdiagrammit Muodostuu erillisistä

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

1.1 Tilastotieteen peruskäsitteitä

1.1 Tilastotieteen peruskäsitteitä Tilastotieteen peruskäsitteitä 1.1 Tilastotieteen peruskäsitteitä 1. Muodostetaan taulukon perusteella suhteellinen frekvenssijakauma. Lehti Levikki f % Helsingin 365994 365 994 0,13579... 13,6% Sanomat

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2005) 1 Tilastollisten aineistojen kuvaaminen Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten muuttujien tunnusluvut

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

Tilastollisten aineistojen kuvaaminen

Tilastollisten aineistojen kuvaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2007) 1 Tilastollisten aineistojen kuvaaminen >> Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten

Lisätiedot

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. 1/11 4 MITTAAMINEN Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. Mittausvirhettä johtuen mittarin tarkkuudesta tai häiriötekijöistä Mittarin

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta... JHS 160 Paikkatiedon laadunhallinta Liite III: Otanta-asetelmat Sisällysluettelo 1. Johdanto... 2 2. Todennäköisyysotanta... 2 2.1 Yksinkertainen satunnaisotanta... 3 2.2 Ositettu otanta... 3 2.3 Systemaattinen

Lisätiedot

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä: 22 5. Keskiluvut Kaikkein pisimmälle on informaation tiivistämisessä menty silloin, kun otosta kuvataan vain yhdellä luvulla, joka mahdollisimman hyvin edustaa kaikkia otoksen arvoja. Tällaisia lukuja

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011 Kuvioita, taulukoita ja tunnuslukuja Aki Taanila 2.2.2011 1 Tilastokuviot Pylväs Piirakka Viiva Hajonta 2 Kuviossa huomioitavia asioita 1 Kuviolla tulee olla tarkoitus ja tehtävä (minkä tiedon haluat välittää

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas f 332 = 3 Kvartiilit(302, 365, 413) Kvartiilit: missä sijaitsee keskimmäinen 50 % aineistosta? Kvartiilit(302, 365, 413) Keskiarvo (362.2) Keskiarvo

Lisätiedot

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 8 TILASTOT ALOITA PERUSTEISTA 33A. Keskiarvo on pituuksien summan ja lukumäärän osamäärä, joten A ja III kuuluvat yhteen. Keskihajonta mittaa havaintoarvojen ryhmittymistä keskiarvon ympärille, joten B

Lisätiedot

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

Matin alkuvuoden budjetti

Matin alkuvuoden budjetti 1 TILASTOJEN TULKINTAA 1. euroa Matin alkuvuoden budjetti 600 500 400 300 200 100 0 tammikuu helmikuu maaliskuu huhtikuu a) Milloin Matti on kuluttanut eniten rahaa ostoksiin? Arvioi, kuinka paljon vaatteisiin

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Harjoitus 2, viikko 38, syksy 2012 1. Tutustu liitteen 1 kuvaukseen Suuresta bränditutkimuksesta v. 2009. Mikä tämän kuvauksen perusteella on ko.

Lisätiedot

Luottamusvälit. Normaalijakauma johnkin kohtaan

Luottamusvälit. Normaalijakauma johnkin kohtaan Luottamusvälit Normaalijakauma johnkin kohtaan Perusjoukko ja otanta Jos halutaan tutkia esimerkiksi Suomessa elävien naarashirvien painoa, se voidaan (periaatteessa) tehdä kahdella tavalla: 1. tutkimalla

Lisätiedot

Ma8 Todennäköisyys ja tilastot

Ma8 Todennäköisyys ja tilastot Ma8 Todennäköisyys ja tilastot H1 Tilastollisen aineiston kuvaaminen 1.1 Vastaa kuvaajan perusteella kysymyksiin. a) Kuinka paljon tarvitset kuvaajan mukaan unta? b) Paljonko 20-vuotias tarvitsee unta?

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 7.11.2011 1 Muuttujat Aineiston esittämisen kannalta muuttujat voidaan jaotella kolmeen tyyppiin: Kategoriset (esimerkiksi sukupuoli, koulutus) Asteikolla

Lisätiedot

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä. Tehtävä 1 Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä Ei Hypoteesi ei ole hyvä tutkimushypoteesi, koska se on liian epämääräinen.

Lisätiedot

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

1.9 Harjoituksia. Frekvenssijakaumien harjoituksia. MAB5: Tilastotieteen lähtökohdat. a) Kaikki aakkoset b) Kirjaimet L, E, M, C, B, A ja i.

1.9 Harjoituksia. Frekvenssijakaumien harjoituksia. MAB5: Tilastotieteen lähtökohdat. a) Kaikki aakkoset b) Kirjaimet L, E, M, C, B, A ja i. MAB5: Tilastotieteen lähtökohdat 1.9 Harjoituksia 1.1 Ulkolämpömittari näytti eilen 10 C ja tänään 20 C. Onko tänään kaksi kertaa niin kylmä kuin eilen? Miksi tai miksi ei? 1.2 Minkä luokkien muuttujia

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT

TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT Jouni Peltonen, 2016 jouni.peltonen@oulu.fi ktk331 Jouni Peltonen Miten kurssi suoritetaan,

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

2.4 Muuttujien luokittelemisesta

2.4 Muuttujien luokittelemisesta MAB5: Tilastotieteen lähtökohdat 2.4 Muuttujien luokittelemisesta Eräs tapa luokitella muuttujat on seuraava jako kahteen muuttujatyyppiin: kvantitatiivinen muuttuja eli muuttuja, jonka arvo esitetään

Lisätiedot

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo. Kertaus Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Luokiteltu aineisto. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo. Hajontaluvut luokittelemattomalle

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

Teema 5: Ristiintaulukointi

Teema 5: Ristiintaulukointi Teema 5: Ristiintaulukointi Kahden (tai useamman) muuttujan ristiintaulukointi: aineiston analysoinnin ja tulosten esittämisen perusmenetelmä usein samat tiedot esitetään sekä taulukkona että kuvana mahdollisen

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin) 1/11 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas MUITA HAJONNAN TUNNUSLUKUJA Varianssi, variance (s 2, σ 2 ) Keskihajonnan neliö Käyttöä enemmän osana erilaisia menetelmiä (mm. varianssianalyysi),

Lisätiedot

TILASTOT: johdantoa ja käsitteitä

TILASTOT: johdantoa ja käsitteitä TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 24.4.2017 1 Kategoriset muuttujat Lukumääriä Prosentteja (muista n-arvot) Pylväitä 2 Yhteenvetotaulukko (frekvenssitaulukko) TAULUKKO 1. Asunnon tyyppi

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 LIITE 1 VIRHEEN ARVIOINNISTA Mihin tarvitset virheen arviointia? Mittaustulokset ovat aina todellisten luonnonvakioiden ja tutkimuskohdetta kuvaavien suureiden likiarvoja, vaikka mittauslaite olisi miten

Lisätiedot

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa Sisältö Kvantitatiivinen metodologia verkossa Perusteiden Kertaus Pekka Rantanen Helsingin yliopisto Tilastollinen analyysi Tilastotieteen tavoitteet Kvantitatiivisen tutkimuksen peruskäsitteitä Tilastollisten

Lisätiedot

Tilastoja yleisurheillen

Tilastoja yleisurheillen Koostanut Elina Viro Opettajalle Tilastoja yleisurheillen Kohderyhmä: Luokat 7-9 Esitiedot: Prosenttilaskenta Taustalla oleva matematiikka: Frekvenssi, suhteellinen frekvenssi, moodi, mediaani, keskiarvo,

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 1 Sisältö: 1. Kvantitatiivisen tutkimuksen perusteita.2 2. Määrällisen tutkimusprosessin vaiheet..3

Lisätiedot

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa? 21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä

Lisätiedot

1 Jalkapallo 100 0,806 81 % Vastaus: 81 % Esimerkki 1. Desimaaliluvun muuntaminen prosenttiluvuksi: 0,81 = 81 % 2 Prosentti- ja potenssilaskenta

1 Jalkapallo 100 0,806 81 % Vastaus: 81 % Esimerkki 1. Desimaaliluvun muuntaminen prosenttiluvuksi: 0,81 = 81 % 2 Prosentti- ja potenssilaskenta 1 Jalkapallo Esimerkki 1 Desimaaliluvun muuntaminen prosenttiluvuksi: 0,81 = 81 % Tampere Utd:n maalivahti Mikko Kavén torjui 100 maalia kaudella 2004. Kohti maalia laukauksia oli 124. Kuinka monta prosenttia

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi TOD.NÄK JA TILASTOT, MAA0 Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi Kuten tilastojakaumia voitiin esittää tunnuslukujen (keskiarvo, moodi, mediaani, jne.) avulla, niin vastaavasti

Lisätiedot

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO 8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 1 Sisältö: 1. Kvantitatiivisen tutkimuksen perusteita.2 2. Määrällisen tutkimusprosessin vaiheet..3

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi miten uudenaikainen tai kallis tahansa ja mittaaja olisi alansa huippututkija Tästä johtuen mittaustuloksista

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut TILASTO-OPPIA Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut Diskreetit jakaumat ja niiden esittäminen frekvenssitauluna ja kaaviona Jakauma on diskreetti jos tilastomuuttuja voi saada vain

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 1 Sisältö: 1. Kvantitatiivisen tutkimuksen perusteita.2 2. Määrällisen tutkimusprosessin vaiheet..3

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Esimerkki 1: auringonkukan kasvun kuvailu

Esimerkki 1: auringonkukan kasvun kuvailu GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA Oulun yliopisto Fysiikan opetuslaboratorio Fysiikan laboratoriotyöt 1 1 LIITE 1 VIRHEEN RVIOINNIST Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

2. a- ja b-kohdat selviä, kunhan kutakuinkin tarkka, niin a-kohta 1 p b-kohta 1 p

2. a- ja b-kohdat selviä, kunhan kutakuinkin tarkka, niin a-kohta 1 p b-kohta 1 p LYHYT MATEMATIIKKA PRELIMINÄÄRIKOE 2.2.2018 RATKAISUT 1. a) 3,50 b) 56 c) 43300 km d) 15 e) 21.08 f) 23.9. kukin oikea vastaus a-kohdassa pelkkä 3,50 ilman yksikköä kelpuutetaan, samoin c-kohdassa pelkkä

Lisätiedot