MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
|
|
- Katariina Laine
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi Periodi III
2 Sisältö Johdanto Tilastollisen datan kuvaileminen Histogrammi Tunnusluvut
3 Mitä tilastotiede on? Tilastotiede soveltaa sekä kehittää metodeja ja malleja, joita voidaan käyttää tutkittaessa reaalimaailman satunnaisilmiöitä. Menetelmät ja mallit perustuvat todennäköisyysteorian lainalaisuuksiin.
4 Mitä tilastotiede on? Tilastotiede soveltaa sekä kehittää metodeja ja malleja, joita voidaan käyttää tutkittaessa reaalimaailman satunnaisilmiöitä. Menetelmät ja mallit perustuvat todennäköisyysteorian lainalaisuuksiin. Tilastotiedettä voidaan soveltaa aina, kun saatavilla on kvantifioitavaa dataa. Mikä tahansa datajoukko, joka kuvaa jotakin reaalimaailman ilmiötä on potentiaalinen tilastotieteen tutkimuskohde.
5 Tilastollinen data Populaatio on joukko, joka sisältää kaikki mahdolliset tilastollisen kokeen kohteet eli yksiköt Havainto on havaittu arvo, joka liitetään yksikköön. Tilastollinen datajoukko on kaikista havainnoista koostuva kokoelma.
6 Tilastollinen data Populaatio on joukko, joka sisältää kaikki mahdolliset tilastollisen kokeen kohteet eli yksiköt Havainto on havaittu arvo, joka liitetään yksikköön. Tilastollinen datajoukko on kaikista havainnoista koostuva kokoelma. Esim: Tutkitaan suomalaisten pituuksia ja mitataan sitä varten 2000 satunnaisesti valittua suomalaista. Silloin
7 Tilastollinen data Populaatio on joukko, joka sisältää kaikki mahdolliset tilastollisen kokeen kohteet eli yksiköt Havainto on havaittu arvo, joka liitetään yksikköön. Tilastollinen datajoukko on kaikista havainnoista koostuva kokoelma. Esim: Tutkitaan suomalaisten pituuksia ja mitataan sitä varten 2000 satunnaisesti valittua suomalaista. Silloin Populaatio on kaikki suomalaiset.
8 Tilastollinen data Populaatio on joukko, joka sisältää kaikki mahdolliset tilastollisen kokeen kohteet eli yksiköt Havainto on havaittu arvo, joka liitetään yksikköön. Tilastollinen datajoukko on kaikista havainnoista koostuva kokoelma. Esim: Tutkitaan suomalaisten pituuksia ja mitataan sitä varten 2000 satunnaisesti valittua suomalaista. Silloin Populaatio on kaikki suomalaiset. Yksikkö on kuka tahansa suomalainen.
9 Tilastollinen data Populaatio on joukko, joka sisältää kaikki mahdolliset tilastollisen kokeen kohteet eli yksiköt Havainto on havaittu arvo, joka liitetään yksikköön. Tilastollinen datajoukko on kaikista havainnoista koostuva kokoelma. Esim: Tutkitaan suomalaisten pituuksia ja mitataan sitä varten 2000 satunnaisesti valittua suomalaista. Silloin Populaatio on kaikki suomalaiset. Yksikkö on kuka tahansa suomalainen. Havainto on kenen tahansa mitatun suomalaisen pituus.
10 Tilastollinen data Populaatio on joukko, joka sisältää kaikki mahdolliset tilastollisen kokeen kohteet eli yksiköt Havainto on havaittu arvo, joka liitetään yksikköön. Tilastollinen datajoukko on kaikista havainnoista koostuva kokoelma. Esim: Tutkitaan suomalaisten pituuksia ja mitataan sitä varten 2000 satunnaisesti valittua suomalaista. Silloin Populaatio on kaikki suomalaiset. Yksikkö on kuka tahansa suomalainen. Havainto on kenen tahansa mitatun suomalaisen pituus. Tilastollinen aineisto koostuu kaikista mitatuista pituuksista.
11 Yleiskatsaus Datan kuvailemiseen käytettäviä menetelmiä: Taulukot Kuvaajat Tunnusluvut (esim. keskiarvo, kvantiilit, korrelaatio)
12 Yleiskatsaus Datan kuvailemiseen käytettäviä menetelmiä: Taulukot Kuvaajat Tunnusluvut (esim. keskiarvo, kvantiilit, korrelaatio) Tilastolliseen päättelyyn käytettäviä menetelmiä Stokastiset mallit Parametrien estimointi Merkitsevyyden testaus
13 Sisältö Johdanto Tilastollisen datan kuvaileminen Histogrammi Tunnusluvut
14 Tilastollinen data Tilastollisen analyysin kohteena oleva data on usein tapana tallettaa taulukkoon eli datakehikkoon, jonka rivit vastaavat kohteesta tehtyjä havaintoja sarakkeet vastaavat tutkittavan ilmiön muuttujia
15 Tilastollinen data Tilastollisen analyysin kohteena oleva data on usein tapana tallettaa taulukkoon eli datakehikkoon, jonka rivit vastaavat kohteesta tehtyjä havaintoja sarakkeet vastaavat tutkittavan ilmiön muuttujia Muuttujat voivat olla laadullisia tai määrällisiä laadullisen muuttujan arvot jaotellaan luokkiin (esim. aurinkoista, sateista, pilvistä )
16 Tilastollinen data Tilastollisen analyysin kohteena oleva data on usein tapana tallettaa taulukkoon eli datakehikkoon, jonka rivit vastaavat kohteesta tehtyjä havaintoja sarakkeet vastaavat tutkittavan ilmiön muuttujia Muuttujat voivat olla laadullisia tai määrällisiä laadullisen muuttujan arvot jaotellaan luokkiin (esim. aurinkoista, sateista, pilvistä ) määrällisen muuttujan arvot ovat lukuja
17 Tilastollinen aineisto Hav. X 1 X 2 X m 1 X 1,1 X 1,2 X 1,m 2 X 2,1 X 2,2 X 1,m 3 X 3,1 X 3,2 X 1,m n X n,1 X n,2 X n,m Taulukko: Datakehikko, jossa on n havaintoa ja m muuttujaa.
18 Laadullinen muuttuja Arvot jaotellaan luokkiin, jotka toisinaan numeroidaan kokonaisluvuilla (vaikkapa tietokoneelle tallentamisen helpottamiseksi tai muusta syystä). Esim. Miten kuljet työmatkat? 1 = Bussilla 2 = Polkupyörällä 3 = Muulla tavoin
19 Laadullinen muuttuja Arvot jaotellaan luokkiin, jotka toisinaan numeroidaan kokonaisluvuilla (vaikkapa tietokoneelle tallentamisen helpottamiseksi tai muusta syystä). Esim. Miten kuljet työmatkat? 1 = Bussilla 2 = Polkupyörällä 3 = Muulla tavoin Huom Numeroidun laadullisen muuttujan keskiarvo ei yleensä tarkoita mitään.
20 Laadullinen muuttuja Arvot jaotellaan luokkiin, jotka toisinaan numeroidaan kokonaisluvuilla (vaikkapa tietokoneelle tallentamisen helpottamiseksi tai muusta syystä). Esim. Miten kuljet työmatkat? 1 = Bussilla 2 = Polkupyörällä 3 = Muulla tavoin Huom Numeroidun laadullisen muuttujan keskiarvo ei yleensä tarkoita mitään. Numeroidun laadullisen muuttujan mediaanilla voi olla merkitys, mikäli arvot voidaan järjestää.
21 Esimerkki: Laadullinen muuttuja Hav. Matkustustapa 1 Bussi 2 Joku muu 3 Joku muu 4 Bussi 5 Polkupyörä
22 Esimerkki: Laadullinen muuttuja Hav. Matkustustapa 1 Bussi 2 Joku muu 3 Joku muu 4 Bussi 5 Polkupyörä Edellä valitulla numeroinnilla muuttujan keskiarvo olisi 1 ( ) = 2, 5 mutta tässä ei ole järkeä, koska muuten bussin ja jonkun muun keskiarvo olisi polkupyörä.
23 Määrällinen muuttuja Määrällinen muuttuja saa arvoja reaalilukujen osajoukossa. Määrällinen muuttuja voidaan muuntaa laadulliseksi jakamalla arvot luokkiin.
24 Määrällinen muuttuja Määrällinen muuttuja saa arvoja reaalilukujen osajoukossa. Määrällinen muuttuja voidaan muuntaa laadulliseksi jakamalla arvot luokkiin. Esim Satunnaisesti valitun suomalaisen työssäkäyvän työaika (min/vrk) on määrällinen muuttuja, joka saa arvoja joukossa [0, 1440].
25 Määrällinen muuttuja Määrällinen muuttuja saa arvoja reaalilukujen osajoukossa. Määrällinen muuttuja voidaan muuntaa laadulliseksi jakamalla arvot luokkiin. Esim Satunnaisesti valitun suomalaisen työssäkäyvän työaika (min/vrk) on määrällinen muuttuja, joka saa arvoja joukossa [0, 1440]. Tämä voidaan jakaa luokkiin esim. L 1 = (0, 60] L 2 = (60, 120]... L 24 = (1380, 1440]
26 Esimerkki: Määrällinen datajoukko Hav. Aika (min/päivä) Ryhmä L L L L L8 Taulukko: Datakehikko, jossa on 5 havaintoa ja määrällinen muuttuja aika. Viimeisessä sarakkeessa on luokitellut arvot.
27 Esimerkki: Määrällinen datajoukko Hav. Aika (min/päivä) Ryhmä L L L L L8 Taulukko: Datakehikko, jossa on 5 havaintoa ja määrällinen muuttuja aika. Viimeisessä sarakkeessa on luokitellut arvot. Havaittujen aikojen keskiarvo on 1 ( ) = min 5 eli noin 8 tuntia 5 minuuttia.
28 Sisältö Johdanto Tilastollisen datan kuvaileminen Histogrammi Tunnusluvut
29 Luokittelu ja histogrammi Esim. Suomalaisten ikärakenne
30 Luokittelu ja histogrammi Esim. Suomalaisten ikärakenne n = miljoonaa datapistettä
31 Luokittelu ja histogrammi Esim. Suomalaisten ikärakenne n = miljoonaa datapistettä Ei ole järkeä piirtää jokaista pistettä kuvaajaan
32 Luokittelu ja histogrammi Esim. Suomalaisten ikärakenne n = miljoonaa datapistettä Ei ole järkeä piirtää jokaista pistettä kuvaajaan Jaetaan datapisteet luokkiin.
33 Luokittelu ja histogrammi Esim. Suomalaisten ikärakenne n = miljoonaa datapistettä Ei ole järkeä piirtää jokaista pistettä kuvaajaan Jaetaan datapisteet luokkiin. Ikä (v) Lukumäärä
34 Luokittelu ja histogrammi Histogrammi piirretään yleensä näin: Yksi palkki per luokka Palkin leveys = luokkavälin leveys (yksikkönä vuosi) Palkin korkeus = datapisteiden suhteellinen osuus jaettuna palkin leveydellä (yksikkönä % per vuosi) Esim: Suomalaiset 1. palkki käsittää suomalaiset, joiden ikä on 0 14 vuotta 1. palkin leveys = 15 v Datapisteiden lkm luokassa 1 on ja suhteellinen osuus / % Palkin korkeus = 16.3/ (yksikkönä % per vuosi).
35 Luokittelu ja histogrammi Suomen väestörakenne ikäluokittain [Lähde: Tilastokeskus] prosenttia per v % 11.7% 24.8% 26.7% 11.7% 8.8% Ikä (v) Lukumäärä v
36 Luokittelu ja histogrammi Suomen väestörakenne ikäluokittain [Lähde: Tilastokeskus] prosenttia per v % 11.7% 24.8% 26.7% 11.7% 8.8% Ikä (v) Lukumäärä Mikä osuus väestöstä kuuluu ikäluokkaan v? v
37 Luokittelu ja histogrammi Suomen väestörakenne ikäluokittain [Lähde: Tilastokeskus] prosenttia per v % 11.7% 24.8% 26.7% 11.7% 8.8% Ikä (v) Lukumäärä Mikä osuus väestöstä kuuluu ikäluokkaan v? Entä ikäluokkaan v? v
38 Luokittelu ja histogrammi Suomen väestörakenne ikäluokittain [Lähde: Tilastokeskus] prosenttia per v % 11.7% 24.8% 26.7% 11.7% 8.8% Ikä (v) Lukumäärä Mikä osuus väestöstä kuuluu ikäluokkaan v? Entä ikäluokkaan v? Entä ikäluokkaan v? v
39 Esim. Kimblen heittosarja Kuvaile seuraavaa datajoukkoa: x = (2,3,4,6,3,3,3,3,1,6,5,4,1,2,1,3,2,6,1,4,4,3,5,4,6,6,4,5,3,2,5,6,4,5,6,5, 6,5,5,6,5,5,1,4,6,2,4,6,1,1,3,1,5,6,5,6,3,4,4,4,4,2,3,5,1,1,3,2,5,1,6,4, 5,4,3,5,2,1,5,2,5,4,2,5,1,3,4,6,1,3,4,4,1,3,3,3,3,1,3,6,6,6,5,6,5,1,6,3, 2,6,4,6,4,1,3,4,6,6,5,4,1,6,1,2,3,3,3,3,2,5,1,2,4,5,2,3,1,6,2,6,4,3,5,1, 6,6,1,6,1,4,2,5,2,5,6,4,3,2,5,2,3,5,2,1,5,4,3,4,2,4,3,5,5,5,5,2,5,4,4,3, 4,6,1,3,6,6,5,3,2,5,5,3,4,3,1,5,5,4,4,2,3,2,5,4,1,2,3,6,5,3,1,4,1,3,4,6, 1,5,1,4,1,3,1,6,6,5,6,1,2,6,1,2,5,1,6,2,3,5,6,4,4,6,1,1,3,5,1,6,4,3,5,2, 5,4,4,6,1,5,3,3,3,6,4,5,2,4,6,3,3,6,6,5,4,4,4,5,2,1,3,5,6,1,2,3,5,3,1,2, 3,3,1,5,6,6,3,1,6,6,1,6,1,3,2,2,6,6,3,6,6,2,5,5,3,4,3,3,5,2,3,3,1,5,3,2, 5,3,6,5,1,5,4,3,6,1,3,4,2,5,1,6,2,5,2,3,1,4,6,3,3,5,4,4,2,4,6,2,2,3,6,2, 5,1,4,1,6,2,5,2,2,4,2,3,6,1,3,4,6,4,6,4,4,2,5,5,3,4,1,5,5,5,1,2,4,4,3,2, 2,3,6,5,3,1,6,4,2,4,6,6,1,5,3,2,3,5,1,2,3,4,2,3,2,1,3,3,6,1,4,3,6,2,6,2, 3,3,2,4,3,2,5,1,6,6,5,4,1,3,2,3,6,1,1,5,4,1,3,6,1,2,5,3,4,1,6,5,1,6,5,3, 6,1,3,1,3,2,1,1,2,6,5,5,3,5,6,2,4,5,4,4,4,5,3,5,2,4,2,3,5,1,2,1,5,6,2,3)
40 Esim. Kimblen heittosarja x = (2,3,4,6,3,3,3,3,1,6,5,4,1,2,1,3,2,6,1,4,4,3,5,4,6,6,4,5,3,2,5,6,4,5,6,5,6,5,5,6,5,5,1,4,6,2,4,6,1,1,3,1,5,6,5,6,3, 4,4,4,4,2,3,5,1,1,3,2,5,1,6,4,5,4,3,5,2,1,5,2,5,4,2,5,1,3,4,6,1,3,4,4,1,3,3,3,3,1,3,6,6,6,5,6,5,1,6,3,2,6,4,6,4,1,3, 4,6,6,5,4,1,6,1,2,3,3,3,3,2,5,1,2,4,5,2,3,1,6,2,6,4,3,5,1,6,6,1,6,1,4,2,5,2,5,6,4,3,2,5,2,3,5,2,1,5,4,3,4,2,4,3,5,5, 5,5,2,5,4,4,3,4,6,1,3,6,6,5,3,2,5,5,3,4,3,1,5,5,4,4,2,3,2,5,4,1,2,3,6,5,3,1,4,1,3,4,6,1,5,1,4,1,3,1,6,6,5,6,1,2,6,1, 2,5,1,6,2,3,5,6,4,4,6,1,1,3,5,1,6,4,3,5,2,5,4,4,6,1,5,3,3,3,6,4,5,2,4,6,3,3,6,6,5,4,4,4,5,2,1,3,5,6,1,2,3,5,3,1,2,3, 3,1,5,6,6,3,1,6,6,1,6,1,3,2,2,6,6,3,6,6,2,5,5,3,4,3,3,5,2,3,3,1,5,3,2,5,3,6,5,1,5,4,3,6,1,3,4,2,5,1,6,2,5,2,3,1,4,6, 3,3,5,4,4,2,4,6,2,2,3,6,2,5,1,4,1,6,2,5,2,2,4,2,3,6,1,3,4,6,4,6,4,4,2,5,5,3,4,1,5,5,5,1,2,4,4,3,2,2,3,6,5,3,1,6,4,2, 4,6,6,1,5,3,2,3,5,1,2,3,4,2,3,2,1,3,3,6,1,4,3,6,2,6,2,3,3,2,4,3,2,5,1,6,6,5,4,1,3,2,3,6,1,1,5,4,1,3,6,1,2,5,3,4,1,6, 5,1,6,5,3,6,1,3,1,3,2,1,1,2,6,5,5,3,5,6,2,4,5,4,4,4,5,3,5,2,4,2,3,5,1,2,1,5,6,2,3)
41 Esim. Kimblen heittosarja x = (2,3,4,6,3,3,3,3,1,6,5,4,1,2,1,3,2,6,1,4,4,3,5,4,6,6,4,5,3,2,5,6,4,5,6,5,6,5,5,6,5,5,1,4,6,2,4,6,1,1,3,1,5,6,5,6,3, 4,4,4,4,2,3,5,1,1,3,2,5,1,6,4,5,4,3,5,2,1,5,2,5,4,2,5,1,3,4,6,1,3,4,4,1,3,3,3,3,1,3,6,6,6,5,6,5,1,6,3,2,6,4,6,4,1,3, 4,6,6,5,4,1,6,1,2,3,3,3,3,2,5,1,2,4,5,2,3,1,6,2,6,4,3,5,1,6,6,1,6,1,4,2,5,2,5,6,4,3,2,5,2,3,5,2,1,5,4,3,4,2,4,3,5,5, 5,5,2,5,4,4,3,4,6,1,3,6,6,5,3,2,5,5,3,4,3,1,5,5,4,4,2,3,2,5,4,1,2,3,6,5,3,1,4,1,3,4,6,1,5,1,4,1,3,1,6,6,5,6,1,2,6,1, 2,5,1,6,2,3,5,6,4,4,6,1,1,3,5,1,6,4,3,5,2,5,4,4,6,1,5,3,3,3,6,4,5,2,4,6,3,3,6,6,5,4,4,4,5,2,1,3,5,6,1,2,3,5,3,1,2,3, 3,1,5,6,6,3,1,6,6,1,6,1,3,2,2,6,6,3,6,6,2,5,5,3,4,3,3,5,2,3,3,1,5,3,2,5,3,6,5,1,5,4,3,6,1,3,4,2,5,1,6,2,5,2,3,1,4,6, 3,3,5,4,4,2,4,6,2,2,3,6,2,5,1,4,1,6,2,5,2,2,4,2,3,6,1,3,4,6,4,6,4,4,2,5,5,3,4,1,5,5,5,1,2,4,4,3,2,2,3,6,5,3,1,6,4,2, 4,6,6,1,5,3,2,3,5,1,2,3,4,2,3,2,1,3,3,6,1,4,3,6,2,6,2,3,3,2,4,3,2,5,1,6,6,5,4,1,3,2,3,6,1,1,5,4,1,3,6,1,2,5,3,4,1,6, 5,1,6,5,3,6,1,3,1,3,2,1,1,2,6,5,5,3,5,6,2,4,5,4,4,4,5,3,5,2,4,2,3,5,1,2,1,5,6,2,3) Silmäluvun k absoluuttinen esiintyvyys: n k = n i=1 1(x i = k)
42 Esim. Kimblen heittosarja x = (2,3,4,6,3,3,3,3,1,6,5,4,1,2,1,3,2,6,1,4,4,3,5,4,6,6,4,5,3,2,5,6,4,5,6,5,6,5,5,6,5,5,1,4,6,2,4,6,1,1,3,1,5,6,5,6,3, 4,4,4,4,2,3,5,1,1,3,2,5,1,6,4,5,4,3,5,2,1,5,2,5,4,2,5,1,3,4,6,1,3,4,4,1,3,3,3,3,1,3,6,6,6,5,6,5,1,6,3,2,6,4,6,4,1,3, 4,6,6,5,4,1,6,1,2,3,3,3,3,2,5,1,2,4,5,2,3,1,6,2,6,4,3,5,1,6,6,1,6,1,4,2,5,2,5,6,4,3,2,5,2,3,5,2,1,5,4,3,4,2,4,3,5,5, 5,5,2,5,4,4,3,4,6,1,3,6,6,5,3,2,5,5,3,4,3,1,5,5,4,4,2,3,2,5,4,1,2,3,6,5,3,1,4,1,3,4,6,1,5,1,4,1,3,1,6,6,5,6,1,2,6,1, 2,5,1,6,2,3,5,6,4,4,6,1,1,3,5,1,6,4,3,5,2,5,4,4,6,1,5,3,3,3,6,4,5,2,4,6,3,3,6,6,5,4,4,4,5,2,1,3,5,6,1,2,3,5,3,1,2,3, 3,1,5,6,6,3,1,6,6,1,6,1,3,2,2,6,6,3,6,6,2,5,5,3,4,3,3,5,2,3,3,1,5,3,2,5,3,6,5,1,5,4,3,6,1,3,4,2,5,1,6,2,5,2,3,1,4,6, 3,3,5,4,4,2,4,6,2,2,3,6,2,5,1,4,1,6,2,5,2,2,4,2,3,6,1,3,4,6,4,6,4,4,2,5,5,3,4,1,5,5,5,1,2,4,4,3,2,2,3,6,5,3,1,6,4,2, 4,6,6,1,5,3,2,3,5,1,2,3,4,2,3,2,1,3,3,6,1,4,3,6,2,6,2,3,3,2,4,3,2,5,1,6,6,5,4,1,3,2,3,6,1,1,5,4,1,3,6,1,2,5,3,4,1,6, 5,1,6,5,3,6,1,3,1,3,2,1,1,2,6,5,5,3,5,6,2,4,5,4,4,4,5,3,5,2,4,2,3,5,1,2,1,5,6,2,3) Silmäluvun k absoluuttinen esiintyvyys: n k = n i=1 1(x i = k) Silmäluvun k suhteellinen esiintyvyys: f k = n k n
43 Esim. Kimblen heittosarja x = (2,3,4,6,3,3,3,3,1,6,5,4,1,2,1,3,2,6,1,4,4,3,5,4,6,6,4,5,3,2,5,6,4,5,6,5,6,5,5,6,5,5,1,4,6,2,4,6,1,1,3,1,5,6,5,6,3, 4,4,4,4,2,3,5,1,1,3,2,5,1,6,4,5,4,3,5,2,1,5,2,5,4,2,5,1,3,4,6,1,3,4,4,1,3,3,3,3,1,3,6,6,6,5,6,5,1,6,3,2,6,4,6,4,1,3, 4,6,6,5,4,1,6,1,2,3,3,3,3,2,5,1,2,4,5,2,3,1,6,2,6,4,3,5,1,6,6,1,6,1,4,2,5,2,5,6,4,3,2,5,2,3,5,2,1,5,4,3,4,2,4,3,5,5, 5,5,2,5,4,4,3,4,6,1,3,6,6,5,3,2,5,5,3,4,3,1,5,5,4,4,2,3,2,5,4,1,2,3,6,5,3,1,4,1,3,4,6,1,5,1,4,1,3,1,6,6,5,6,1,2,6,1, 2,5,1,6,2,3,5,6,4,4,6,1,1,3,5,1,6,4,3,5,2,5,4,4,6,1,5,3,3,3,6,4,5,2,4,6,3,3,6,6,5,4,4,4,5,2,1,3,5,6,1,2,3,5,3,1,2,3, 3,1,5,6,6,3,1,6,6,1,6,1,3,2,2,6,6,3,6,6,2,5,5,3,4,3,3,5,2,3,3,1,5,3,2,5,3,6,5,1,5,4,3,6,1,3,4,2,5,1,6,2,5,2,3,1,4,6, 3,3,5,4,4,2,4,6,2,2,3,6,2,5,1,4,1,6,2,5,2,2,4,2,3,6,1,3,4,6,4,6,4,4,2,5,5,3,4,1,5,5,5,1,2,4,4,3,2,2,3,6,5,3,1,6,4,2, 4,6,6,1,5,3,2,3,5,1,2,3,4,2,3,2,1,3,3,6,1,4,3,6,2,6,2,3,3,2,4,3,2,5,1,6,6,5,4,1,3,2,3,6,1,1,5,4,1,3,6,1,2,5,3,4,1,6, 5,1,6,5,3,6,1,3,1,3,2,1,1,2,6,5,5,3,5,6,2,4,5,4,4,4,5,3,5,2,4,2,3,5,1,2,1,5,6,2,3) Silmäluvun k absoluuttinen esiintyvyys: n k = n i=1 1(x i = k) Silmäluvun k suhteellinen esiintyvyys: f k = n k n k n k k f k Huom. (f k ) on todennäköisyysjakauma
44 Esim. Kimblen heittosarja x = (2,3,4,6,3,3,3,3,1,6,5,4,1,2,1,3,2,6,1,4,4,3,5,4,6,6,4,5,3,2,5,6,4,5,6,5,6,5,5,6,5,5,1,4,6,2,4,6,1,1,3,1,5,6,5,6,3, 4,4,4,4,2,3,5,1,1,3,2,5,1,6,4,5,4,3,5,2,1,5,2,5,4,2,5,1,3,4,6,1,3,4,4,1,3,3,3,3,1,3,6,6,6,5,6,5,1,6,3,2,6,4,6,4,1,3, 4,6,6,5,4,1,6,1,2,3,3,3,3,2,5,1,2,4,5,2,3,1,6,2,6,4,3,5,1,6,6,1,6,1,4,2,5,2,5,6,4,3,2,5,2,3,5,2,1,5,4,3,4,2,4,3,5,5, 5,5,2,5,4,4,3,4,6,1,3,6,6,5,3,2,5,5,3,4,3,1,5,5,4,4,2,3,2,5,4,1,2,3,6,5,3,1,4,1,3,4,6,1,5,1,4,1,3,1,6,6,5,6,1,2,6,1, 2,5,1,6,2,3,5,6,4,4,6,1,1,3,5,1,6,4,3,5,2,5,4,4,6,1,5,3,3,3,6,4,5,2,4,6,3,3,6,6,5,4,4,4,5,2,1,3,5,6,1,2,3,5,3,1,2,3, 3,1,5,6,6,3,1,6,6,1,6,1,3,2,2,6,6,3,6,6,2,5,5,3,4,3,3,5,2,3,3,1,5,3,2,5,3,6,5,1,5,4,3,6,1,3,4,2,5,1,6,2,5,2,3,1,4,6, 3,3,5,4,4,2,4,6,2,2,3,6,2,5,1,4,1,6,2,5,2,2,4,2,3,6,1,3,4,6,4,6,4,4,2,5,5,3,4,1,5,5,5,1,2,4,4,3,2,2,3,6,5,3,1,6,4,2, 4,6,6,1,5,3,2,3,5,1,2,3,4,2,3,2,1,3,3,6,1,4,3,6,2,6,2,3,3,2,4,3,2,5,1,6,6,5,4,1,3,2,3,6,1,1,5,4,1,3,6,1,2,5,3,4,1,6, 5,1,6,5,3,6,1,3,1,3,2,1,1,2,6,5,5,3,5,6,2,4,5,4,4,4,5,3,5,2,4,2,3,5,1,2,1,5,6,2,3) Silmäluvun k absoluuttinen esiintyvyys: n k = n i=1 1(x i = k) Silmäluvun k suhteellinen esiintyvyys: f k = n k n k n k k f k Huom. (f k ) on todennäköisyysjakauma (minkä satunnaismuuttujan?)
45 Sisältö Johdanto Tilastollisen datan kuvaileminen Histogrammi Tunnusluvut
46 Datajoukon tunnusluvut Lukuarvoisen datajoukon x = (x 1,..., x n ) tunnuslukuja: Keskiarvo m(x) = 1 n n i=1 x i
47 Datajoukon tunnusluvut Lukuarvoisen datajoukon x = (x 1,..., x n ) tunnuslukuja: Keskiarvo m(x) = 1 n n i=1 x i Varianssi σ 2 (x) = 1 n n i=1 (x i m(x)) 2
48 Datajoukon tunnusluvut Lukuarvoisen datajoukon x = (x 1,..., x n ) tunnuslukuja: Keskiarvo m(x) = 1 n n i=1 x i Varianssi σ 2 (x) = 1 n n i=1 (x i m(x)) 2 Keskihajonta σ(x) = σ 2 (x)
49 Datajoukon tunnusluvut Lukuarvoisen datajoukon x = (x 1,..., x n ) tunnuslukuja: Keskiarvo m(x) = 1 n n i=1 x i Varianssi σ 2 (x) = 1 n n i=1 (x i m(x)) 2 Keskihajonta σ(x) = σ 2 (x) Otosvarianssi s 2 (x) = 1 n n 1 i=1 (x i m(x)) 2
50 Datajoukon tunnusluvut Lukuarvoisen datajoukon x = (x 1,..., x n ) tunnuslukuja: Keskiarvo m(x) = 1 n n i=1 x i Varianssi σ 2 (x) = 1 n n i=1 (x i m(x)) 2 Keskihajonta σ(x) = σ 2 (x) Otosvarianssi s 2 (x) = 1 n n 1 i=1 (x i m(x)) 2 Otoskeskihajonta s(x) = s 2 (x)
51 Datajoukon tunnusluvut Lukuarvoisen datajoukon x = (x 1,..., x n ) tunnuslukuja: Keskiarvo m(x) = 1 n n i=1 x i Varianssi σ 2 (x) = 1 n n i=1 (x i m(x)) 2 Keskihajonta σ(x) = σ 2 (x) Otosvarianssi s 2 (x) = 1 n n 1 i=1 (x i m(x)) 2 Otoskeskihajonta s(x) = s 2 (x) Huom Yo. luvut lasketaan suoraan havaitusta datasta, joten niillä ei ole mitään tekemistä minkään todennäköisyysjakauman kanssa. R: mean(x), var(x), ((n-1)/n)*var(x), sd(x)
52 Järjestystunnuslukuja Järjestetyn muuttujan (määrällinen tai järjestetty laadullinen) havainnoista x = (x 1,..., x n ), voidaan laskea tason p (0, 1) kvantiili Q(p): Q(0.25) on alakvartiili Q(0.5) on mediaani Q(0.75) on yläkvartiili
53 Järjestystunnuslukuja Järjestetyn muuttujan (määrällinen tai järjestetty laadullinen) havainnoista x = (x 1,..., x n ), voidaan laskea tason p (0, 1) kvantiili Q(p): Q(0.25) on alakvartiili Q(0.5) on mediaani Q(0.75) on yläkvartiili Tällöin
54 Järjestystunnuslukuja Järjestetyn muuttujan (määrällinen tai järjestetty laadullinen) havainnoista x = (x 1,..., x n ), voidaan laskea tason p (0, 1) kvantiili Q(p): Q(0.25) on alakvartiili Q(0.5) on mediaani Q(0.75) on yläkvartiili Tällöin 25 % havainnoista on alakvartiilin alapuolella
55 Järjestystunnuslukuja Järjestetyn muuttujan (määrällinen tai järjestetty laadullinen) havainnoista x = (x 1,..., x n ), voidaan laskea tason p (0, 1) kvantiili Q(p): Q(0.25) on alakvartiili Q(0.5) on mediaani Q(0.75) on yläkvartiili Tällöin 25 % havainnoista on alakvartiilin alapuolella Puolet havainnoista sijaitsee mediaanin alapuolella
56 Järjestystunnuslukuja Järjestetyn muuttujan (määrällinen tai järjestetty laadullinen) havainnoista x = (x 1,..., x n ), voidaan laskea tason p (0, 1) kvantiili Q(p): Q(0.25) on alakvartiili Q(0.5) on mediaani Q(0.75) on yläkvartiili Tällöin 25 % havainnoista on alakvartiilin alapuolella Puolet havainnoista sijaitsee mediaanin alapuolella 25 % havainnoista on yläkvartiilin yläpuolella
57 Järjestystunnuslukuja Järjestetyn muuttujan (määrällinen tai järjestetty laadullinen) havainnoista x = (x 1,..., x n ), voidaan laskea tason p (0, 1) kvantiili Q(p): Q(0.25) on alakvartiili Q(0.5) on mediaani Q(0.75) on yläkvartiili Tällöin 25 % havainnoista on alakvartiilin alapuolella Puolet havainnoista sijaitsee mediaanin alapuolella 25 % havainnoista on yläkvartiilin yläpuolella R: quantile(x,p), summary(x), median(x)
58 Kvantiilifunktio Datajoukon (x 1,..., x n ) kvantiilifunktio voidaan määrittää näin: Järjestetään datapisteet muotoon x (1) x (2) x (n) Jaetaan vaaka-akselin yksikköväli tasamittaisiin väleihin, reunapisteinä luvut p k = (k 1)/(n 1), k = 1,..., n Piirretään tasoon pisteet (p k, x (k) ) ja yhdistetään ne viivoilla
59 Kvantiilifunktio Datajoukon (x 1,..., x n ) kvantiilifunktio voidaan määrittää näin: Järjestetään datapisteet muotoon x (1) x (2) x (n) Jaetaan vaaka-akselin yksikköväli tasamittaisiin väleihin, reunapisteinä luvut p k = (k 1)/(n 1), k = 1,..., n Piirretään tasoon pisteet (p k, x (k) ) ja yhdistetään ne viivoilla Esim. Neljä bruttopalkkaa (eur/kk): 3800, 1800, 2100,
60 Kvantiilifunktio Datajoukon (x 1,..., x n ) kvantiilifunktio voidaan määrittää näin: Järjestetään datapisteet muotoon x (1) x (2) x (n) Jaetaan vaaka-akselin yksikköväli tasamittaisiin väleihin, reunapisteinä luvut p k = (k 1)/(n 1), k = 1,..., n Piirretään tasoon pisteet (p k, x (k) ) ja yhdistetään ne viivoilla Esim. Neljä bruttopalkkaa (eur/kk): 3800, 1800, 2100, Kvartiilit = Kvantiilifunktion arvot pisteissä 0.25, 0.50, 0.75
61 Esimerkki: Kolme datajoukkoa Esim. Piirrä seuraavien datajoukkojen kvantiilifunktiot ja määritä niiden mediaanit ja keskiarvot: x = (1800, 2100, 3800, 4000) y = (1800, 2100, 3800, 6000) z = (1800, 2100, 3800, 6000, 6000)
62 Esimerkki: Kolme datajoukkoa Esim. Piirrä seuraavien datajoukkojen kvantiilifunktiot ja määritä niiden mediaanit ja keskiarvot: x = (1800, 2100, 3800, 4000) y = (1800, 2100, 3800, 6000) z = (1800, 2100, 3800, 6000, 6000) Q x (0.50) = 2950, m(x) = 2925
63 Esimerkki: Kolme datajoukkoa Esim. Piirrä seuraavien datajoukkojen kvantiilifunktiot ja määritä niiden mediaanit ja keskiarvot: x = (1800, 2100, 3800, 4000) y = (1800, 2100, 3800, 6000) z = (1800, 2100, 3800, 6000, 6000) Q x (0.50) = 2950, m(x) = 2925 Q y (0.50) = 2950, m(x) = 3425
64 Esimerkki: Kolme datajoukkoa Esim. Piirrä seuraavien datajoukkojen kvantiilifunktiot ja määritä niiden mediaanit ja keskiarvot: x = (1800, 2100, 3800, 4000) y = (1800, 2100, 3800, 6000) z = (1800, 2100, 3800, 6000, 6000) Q x (0.50) = 2950, m(x) = 2925 Q y (0.50) = 2950, m(x) = 3425 Q z (0.50) = 3800, m(x) = 3940
65 Kahden muuttujan datajoukot
66 Esimerkki: Isien ja poikien pituudet I P I P I P I P I P I P I P I P I P I P I P I P I P I P I P I P I P I P I P I P Taulukko: 1000 havaintoparia Pearsonin isä-poika pituusaineistosta.
67 Hajontakuvio Height Son Father
68 Density Histogram of Fathers Height
69 Histogram of Sons Density Height
70 Seuraavalla kerralla puhutaan parametrien estimoinnista...
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4 Tilastollisen aineiston kuvaileminen, mallintaminen ja estimointi Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4 Tilastollisen datan kuvaileminen, mallintaminen ja estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotOpiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3
Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto. lokakuuta 207 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
Lisätiedot1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
LisätiedotGeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotKuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011
Kuvioita, taulukoita ja tunnuslukuja Aki Taanila 2.2.2011 1 Tilastokuviot Pylväs Piirakka Viiva Hajonta 2 Kuviossa huomioitavia asioita 1 Kuviolla tulee olla tarkoitus ja tehtävä (minkä tiedon haluat välittää
LisätiedotMiten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?
21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotEsimerkki 1: auringonkukan kasvun kuvailu
GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
Lisätiedot1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotLuento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja
1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu
LisätiedotKURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotOPETUSSUUNNITELMALOMAKE
OPETUSSUUNNITELMALOMAKE Tällä lomakkeella dokumentoit opintojaksoasi koskevaa opetussuunnitelmatyötä. Lomake on suunniteltu niin, että se palvelisi myös Oodia varten tehtävää tiedonkeruuta. Voit siis dokumentoida
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotKäytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:
8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)
LisätiedotTil.yks. x y z
Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Lisätiedot7. laskuharjoituskierros, vko 10, ratkaisut
7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 2 Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 6 Tilastollinen riippuvuus ja lineaarinen regressio Kalle Kytölä, Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos
LisätiedotTutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
LisätiedotOPETUSSUUNNITELMALOMAKE
OPETUSSUUNNITELMALOMAKE Tällä lomakkeella dokumentoit opintojaksoasi koskevaa opetussuunnitelmatyötä. Lomake on suunniteltu niin, että se palvelisi myös Oodia varten tehtävää tiedonkeruuta. Voit siis dokumentoida
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
LisätiedotJohdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2005) 1 Tilastollisten aineistojen kuvaaminen Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten muuttujien tunnusluvut
LisätiedotTeema 5: Ristiintaulukointi
Teema 5: Ristiintaulukointi Kahden (tai useamman) muuttujan ristiintaulukointi: aineiston analysoinnin ja tulosten esittämisen perusmenetelmä usein samat tiedot esitetään sekä taulukkona että kuvana mahdollisen
LisätiedotMäärällisen aineiston esittämistapoja. Aki Taanila
Määrällisen aineiston esittämistapoja Aki Taanila 7.11.2011 1 Muuttujat Aineiston esittämisen kannalta muuttujat voidaan jaotella kolmeen tyyppiin: Kategoriset (esimerkiksi sukupuoli, koulutus) Asteikolla
LisätiedotJärvi 1 Valkjärvi. Järvi 2 Sysijärvi
Tilastotiedettä Tilastotieteessä kerätään tietoja yksittäisistä asioista, ominaisuuksista tai tapahtumista. Näin saatua tietoa käsitellään tilastotieteen menetelmin ja saatuja tuloksia voidaan käyttää
LisätiedotMäärällisen aineiston esittämistapoja. Aki Taanila
Määrällisen aineiston esittämistapoja Aki Taanila 24.4.2017 1 Kategoriset muuttujat Lukumääriä Prosentteja (muista n-arvot) Pylväitä 2 Yhteenvetotaulukko (frekvenssitaulukko) TAULUKKO 1. Asunnon tyyppi
LisätiedotTilastolliset toiminnot
-59- Tilastolliset toiminnot 6.1 Aineiston esittäminen graafisesti Tilastollisen aineiston tallentamisvälineiksi TI-84 Plus tarjoaa erityiset listamuuttujat L1,, L6, jotka löytyvät 2nd -toimintoina vastaavilta
LisätiedotTeema 3: Tilastollisia kuvia ja tunnuslukuja
Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin
LisätiedotJohdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 20. syyskuuta 2007 Antti Rasila () TodB 20. syyskuuta 2007 1 / 17 1 Kolmogorovin aksioomat σ-algebra Tapahtuman todennäköisyys 2 Satunnaismuuttujat Todennäköisyysjakauma
LisätiedotTilastolliset jakaumat, niiden esittäminen ja tunnusluvut
TILASTO-OPPIA Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut Diskreetit jakaumat ja niiden esittäminen frekvenssitauluna ja kaaviona Jakauma on diskreetti jos tilastomuuttuja voi saada vain
LisätiedotTilastollisten aineistojen kuvaaminen
Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2007) 1 Tilastollisten aineistojen kuvaaminen >> Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas f 332 = 3 Kvartiilit(302, 365, 413) Kvartiilit: missä sijaitsee keskimmäinen 50 % aineistosta? Kvartiilit(302, 365, 413) Keskiarvo (362.2) Keskiarvo
LisätiedotKvantitatiiviset tutkimusmenetelmät maantieteessä
Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi
LisätiedotTehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)
1/11 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise
LisätiedotHannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164
86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna
LisätiedotMat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,
LisätiedotTilastollisia peruskäsitteitä ja Monte Carlo
Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
LisätiedotTilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
LisätiedotTilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1
Tilastolliset menetelmät Osa 1: Johdanto Johdanto tilastotieteeseen KE (2014) 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä ja malleja, joiden avulla reaalimaailman ilmiöistä voidaan
LisätiedotMatematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
Lisätiedot30A02000 Tilastotieteen perusteet
30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi
Lisätiedot3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?
Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,
LisätiedotPOPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).
KÄSITTEITÄ POPULAATIO Joukko, jota tutkitaan (äärellinen, ääretön). Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut). Näiden välillä ei aina tehdä eroa, kun puhutaan
Lisätiedot4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:
Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15,
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
LisätiedotEnnen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.
Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Aineistoihin tutustutaan mm. erilaisten
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotMetsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
LisätiedotTil.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.
Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)
Lisätiedot2. Aineiston kuvailua
2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien
LisätiedotNormaalijakaumasta johdettuja jakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2007) 1 Normaalijakaumasta johdettuja jakaumia >> Johdanto χ 2 -jakauma F-jakauma
Lisätiedot