Tilastollisten menetelmien perusteet I,TILTP2 Luentorunko, syksy 2000

Koko: px
Aloita esitys sivulta:

Download "Tilastollisten menetelmien perusteet I,TILTP2 Luentorunko, syksy 2000"

Transkriptio

1 1 Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh , sähköposti Tilastollisten menetelmien perusteet I,TILTP2 Luentorunko, syksy 2000 Opintojakson www-sivu: Ks. Huom. 4.!!! Huom. 1. Luentomateriaali on tarkoitettu ko. opintojakson opiskelijoille. Huom. 2. Dokumentin lopussa on kirjallisuusluettelo, jonka sisältäviä teoksia on käytetty tukena tämän luentorungon kirjoittamisessa. Huom. 3. Käyttäessäsi verkkomateriaalia kaikki erikoismerkit eivät välttämättä näy/tulostu koneellasi oikein. Informoithan tekijää jos teknisiä ongelmia esiintyy. Huom. 4. Jos haluat tulostaa tämän dokumentin, saat sopivan kokoista tekstiä, kun tulostat 4 sivua yhdelle arkille. MUTTA tarkista (kokeile) ensin, että pdf-tiedoston tulostuksen pienennys onnistuu koneeltasi. Jos tulostus ei onnistu, voit käyttää samassa hakemistossa olevaa Wordtiedostoa (luennot.doc). Informoithan tekijää (raija.leppala@uta.fi) tulostusongelmista. Huom. 5. Halutessasi voit kopioida luentorungon myös mapista, joka on Matematiikan, tilastotieteen ja filosofian laitoksen toimiston edessä olevassa hyllykössä. Huom. 6. Dokumentin lopussa kansilehti.

2 2 SISÄLLYSLUETTELO sivu 1. JOHDANTO 3 2. TODENNÄKÖISYYSLASKENTAA SATUNNAISILMIÖ JA TAPAHTUMA KLASSINEN TODENNÄKÖISYYS TODENNÄKÖISYYSLASKENNAN 11 AKSIOOMAT JA LASKUSÄÄNTÖJÄ 2.4. KOMBINATORIIKKAA KOKONAISTODENNÄKÖISYYS 22 JA BAYESIN KAAVA 3. TODENNÄKÖISYYSJAKAUMIA SATUNNAISMUUTTUJA JA 23 TODENNÄKÖISYYSJAKAUMA 3.2. DISKREETTI SATUNNAISMUUTTUJA JATKUVA SATUNNAISMUUTTUJA ODOTUSARVON JA VARIANSSIN 33 OMINAISUUKSIA 3.5. YLEISESTI SOVELLETTUJA 37 TODENNÄKÖISYYSJAKAUMIA 4. OTOS, OTOSSUURE, OTANTAJAKAUMA SATUNNAISOTOS OTOSSUUREET JA OTOSJAKAUMAT PARAMETRIEN ESTIMOINTI PISTE-ESTIMOINTI LUOTTAMUSVÄLEJÄ HYPOTEESIEN TESTAUS 86 KIRJALLISUUTTA 111

3 3 1. JOHDANTO Tilastollinen analyysi voidaan jakaa karkeasti kuvailevaan (descriptive) analyysiin ja tilastolliseen päättelyyn (statistical inference). Kuvaileva tilastotiede pyrkii kuvailemaan tietoaineiston sisältöä erilaisten graafisten esitysten ja tunnuslukujen sekä taulukoiden avulla.kuvailevaan tilastotieteeseen tutustuttiin johdantokurssilla. TILTP2-opintojaksolla tutustutaan tilastolliseen päättelyyn. Empiirisissä tutkimuksissa on käytössä satunnaisotos populaatiosta. Otoksen perusteella pyritään tekemään johtopäätelmiä koko populaatiosta. Pyritään selvittämään esim. milloin voidaan sanoa ehdollisten otoskeskiarvojen perusteella, että populaatioissa keskiarvot poikkeavat toisistaan (Esim. 2). Voidaan myös haluta arvioida vaikkapa populaation keskiarvoa (Esim. 1).

4 Esim. 1. Tietyssä yskänlääkkeessä pitäisi tuoteselostuksen mukaan olla alkoholia 5 %. Tiedetään, että alkoholipitoisuus vaihtelee jonkin verran pullosta toiseen. Tietyssä laboratorioissa halutaan tutkia voidaanko valmistajan ilmoittamaa lukua pitää sopivana keskiarvona eri pullojen alkoholipitoisuudelle. Lähdetään oletuksesta, että alkoholipitoisuuden vaihtelu pullosta toiseen on luonnehdittavissa normaalijakauman avulla. Suoritettiin koe, jossa kymmenen pullon alkoholipitoisuus mitattiin ja saatiin seuraavat tulokset: 5.01, 4.87, 5.11, 5.21, 5.03, 4.96, 4.78, 4.98, 4.88 ja Onko valmistajan väittämään uskomista? (Helenius)... Quantiles maximum 100.0% 5, % 5, % 5, % 5,2000 quartile 75.0% 5,0725 median 50.0% 4,9950 quartile 25.0% 4, % 4, % 4, % 4,7800 minimum 0.0% 4,7800 4

5 5 Moments Mean 4,98900 Std Dev 0,12530 Std Err Mean 0,03962 upper 95% Mean 5,07863 lower 95% Mean 4,89937 N 10 Test Mean=value Hypothesized Value 5 Actual Estimate 4,989 t Test Test Statistic -0,278 Prob > t 0,788 Prob > t 0,606 Prob < t 0, Esim. 2. Ovatko tytöt ja pojat syntyessään keskimäärin samanpituisia? Eräästä aineistosta (SAIDIT- aineisto, n = 120) laskettuna poikien pituuden keskiarvo oli 50,95 ja tyttöjen 50,24. Otoskeskiarvojen erotus oli siis Voidaanko tämän perusteella yleistää ja sanoa, että pojat ovat syntyessään keskimäärin tyttöjä pitempiä?

6 6 Analyysin tuloksia: Means and Std Deviations Level Number Mean Std Dev pojat 65 50,9538 1,97192 tytöt 55 50,2364 2,02726 t-test DF Prob> t 1, ,0523 Ks. myös jaettu moniste SPSS:n tulostuksesta. Tilastollisten päätelmien teko perustuukin satunnaisotoksesta määriteltyjen tunnuslukujen (kuten esim. otoskeskiarvojen) todennäköisyysjakaumiin. Johtopäätelmät tehdään erilaisten tilastollisten testien ja analysointimenetelmien avulla. Tällaiseen päättelyyn sisältyy tiettyä epävarmuutta, jota pyritään hallitsemaan käyttäen hyväksi todennäköisyyslaskentaa ja erilaisia todennäköisyysjakaumia. Opintojaksolla tutustutaankin aluksi lyhyesti todennäköisyyslaskentaa ja

7 todennäköisyysjakaumiin. Pääpaino on kuitenkin tilastollisen päättelyn peruskäsitteiden esittelyssä. Perehdytään otosjakaumiin ja niiden käyttöön tilastollisessa päättelyssä. Käydään läpi estimointiin liittyviä käsitteitä sekä tutustutaan joihinkin tilastollisiin testeihin. 2. TODENNÄKÖISYYSLASKENTAA 2.1. SATUNNAISILMIÖ JA TAPAHTUMA Esim Heitettäessä rahaa ei tiedetä saadaanko kruunu vai klaava. Tiedetään, että molemmat vaihtoehdot ovat yhtä todennäköisiä. Heitettäessä noppaa tiedetään, että saadaan silmäluku 1, 2, 3, 4, 5 tai 6, mutta ei tiedetä etukäteen silmälukua. Tiedetään, että jokaisen silmäluvun todennäköisyys on sama. Kortin vetäminen sekoitetusta korttipakasta, lottoaminen, veikkaaminen, bussin saapuminen pysäkille ja päivän sää ovat myös esimerkkejä ilmiöistä, joihin liittyy epävarmuutta. 7

8 8 Satunnaisilmiö on mikä tahansa ilmiö, johon liittyy useita eri tulosmahdollisuuksia sekä epävarmuutta ilmiön tuloksesta. Puhutaan myös satunnaiskokeesta. Satunnaisilmiöön liittyvien kaikkien mahdollisten tulosten joukkoa kutsutaan perusjoukoksi (otosavaruudeksi) E. Käytännössä ollaan kiinnostuneita joistain perusjoukon osajoukoista (sekä niiden esiintymistodennäköisyyksistä). Perusjoukon osajoukko on nimeltään tapahtuma. Tapahtumia merkitään A, B, C,... Esim Rahanheitto E = kaikki mahdolliset tulokset ={kruunu, klaava} tapahtumia: A = saadaan kruunu ={kruunu} B = saadaan klaava ={klaava} Nopanheitto E ={1,2,3,4,5,6} tapahtumia: A = saadaan parillinen = {2,4,6}

9 B = {1} C = {1,2,3} D = saadaan suurempi kuin 4 ={5,6} Kortin vetäminen sekoitetusta korttipakasta E= kaikki kortit tapahtumia: A = saadaan pata B = saadaan kuningas C = saadaan punainen ässä Lottoaminen (39 palloa, joista arvotaan palauttamatta 7) E = kaikki mahdolliset lottorivit, joita on (ks. kombinatoriikka) tapahtumia: A = saadaan 7 oikein B = saadaan 6 oikein C = ei saada yhtään oikein Veikkaaminen (13 kohdetta, joissa jokaisessa 3 vaihtoehtoa) E = kaikki mahdolliset rivit, joita on (ks. kombinatoriikka) tapahtumia: A = saadaan 13 oikein B = saadaan 12 oikein C = ei saada yhtään oikein 9

10 KLASSINEN TODENNÄKÖISYYS Olkoon tarkasteltavan satunnaisilmiön perusjoukossa n tulosta, jotka ovat kaikki yhtä mahdollisia. Olkoon tapahtumaan A liittyviä tuloksia k kappaletta (0 k n). Tällöin tapahtuman A todennäköisyys P(A) = k/n. Esim Rahanheitto A = saadaan kruunu P(A) = 1/2 Nopanheitto A = saadaan parillinen ={2,4,6} P(A) = 3/6 B = {1}, P(B) = 1/6 D = suurempi kuin 4 ={5,6}, P(D) = 2/6. Lottoaminen A = saadaan 7 oikein P(A) = 1/kaikkien rivien lkm = 1/ B = saadaan 6 oikein P(B) = rivien lkm, joissa 6 oik./kaikkien rivien lkm

11 11 Klassisen todennäköisyyden (voidaan liittää vain äärellisiin perusjoukkoihin) yhteydessä lukujen n ja k määrittäminen ei aina ole yksinkertaista. Joudutaan usein käyttämään hyväksi kombinatoriikkaa. Tapahtuman A todennäköisyys voidaan myös määritellä arvoksi, jota tapahtuman suhteellinen frekvenssi lähestyy satunnaiskoetoistojen määrää kasvatettaessa TODENNÄKÖISYYSLASKENNAN AKSIOOMAT JA LASKUSÄÄNTÖJÄ Matemaattisesti määriteltynä todennäköisyys on joukkofunktio P, joka liittää jokaiseen satunnaisilmiön tapahtumaan A reaaliluvun P(A), jota sanotaan tapahtuman A todennäköisyydeksi ja joka toteuttaa tietyt aksioomat. Aksiooma 1. Jos A on mikä tahansa satunnaisilmiön tapahtuma, niin 0 P(A) 1.

12 Aksiooma 2. P(E) = 1. Tällöin kyseessä varma tapahtuma. Jos A ja B ovat kaksi saman satunnaisilmiön tapahtumaa, niin määritellään niiden yhdiste A B = A tai B tai molemmat tapahtuvat ja leikkaus A B = A ja B molemmat tapahtuvat. Sanotaan, että tapahtumat A ja B ovat erillisiä, jos ne molemmat eivät voi tapahtua samanaikaisesti eli A B = (mahdoton tapahtuma). Aksiooma 3. Jos tapahtumat A ja B ovat erillisiä, eli A B =, niin P(A B ) = P(A)+P(B) Esim Nopanheitto A = saadaan parillinen ={2,4,6} P(A) = 3/6 B = saadaan ykkönen ={1} P(B) = 1/6 A B = saadaan parillinen tai ykkönen A B =, joten P(A B) = P(A)+P(B) 12

13 13 Laskusääntö 1. P( )=0,eli mahdottoman tapahtuman, todennäköisyys on nolla. Määritellään A:n komplementtitapahtuma A C = A ei tapahdu Laskusääntö 2. P(A C ) = 1- P(A). Esim Nopanheitto A = silmäluku pienempi kuin 6 A C = silmäluku 6 P(A) = 1-P(A C ) = 1-1/6 Esim Heitetään rahaa kaksi kertaa. Olkoon A= saadaan ainakin yksi kruunu. P(A)=1-P(A C ) = 1-1/4. Laskusääntö 3. Jos tapahtumat A 1, A 2,..., A k ovat pareittain erillisiä eli mitkään kaksi tapahtumaa eivät voi esiintyä samanaikaisesi, niin P(A 1 A 2... A k )= P(A 1 )+P(A 2 )+...+ P(A k ).

14 14 Esim Vedetään kortti sekoitetusta pakasta. Laske tn, että kortti on ruutu-, hertta- tai ristikortti. (Vast. 16/52) Laskusääntö 4 (yleinen yhteenlaskusääntö). Jos A ja B ovat satunnaisilmiön tapahtumia, niin P(A B ) = P(A)+P(B)-P(A B). Esim Vedetään kortti sekoitetusta pakasta. Laske tn, että kortti on patakortti tai ässä. Määritellään A:n ehdollinen todennäköisyys ehdolla B: Olkoon A ja B saman satunnaisilmiön tapahtumia siten, että P(B)>0. Tällöin tapahtuman A ehdollinen todennäköisyys ehdolla, että tiedetään tapahtuman B esiintyneen on P(A B)=P(A B)/P(B).

15 Esim Tarkastellaan sadasta henkilöstä muodostuvaa populaatiota. Henkilöiltä tiedusteltiin heidän mielipidettään verouudistukseen (puolesta tai vastaan). Saatiin seuraava frekvenssitaulukko: puolesta vastaan mies nainen Valitaan satunnaisesti yksi henkilö ko. populaatiosta. Määritä todennäköisyys sille, että valittu on uudistuksen puolesta, kun tiedetään valitun olleen mies. (Vast. 1/4) (Helenius) Laskusääntö 5 (yleinen kertolaskusääntö). Jos P(B)>0, niin P(A B) = P(B)P(A B). Tapahtumat A ja B ovat (tilastollisesti, stokastisesti) riippumattomia (merk.æ), jos P(A B)=P(A). Tällöin siis B:n tapahtuminen tai tapahtumatta jääminen ei vaikuta A:n tapahtumisen todennäköisyyteen ja A:n 15

16 tapahtuminen tai tapahtumatta jääminen ei vaikuta B:n tapahtumisen todennäköisyyteen. Jos tapahtumat A ja B ovat riippumattomia, niin P(A B ) = P(A)P(B). Tapahtumien riippumattomuus voidaan yleistää: Tapahtumat A 1, A 2,..., A k ovat riippumattomia, jos minkään niistä tapahtuminen tai tapahtumatta jääminen ei vaikuta muiden tapahtumien todennäköisyyksiin. Tällöin P(A 1 A 2... A k ) =P(A 1 )P(A 2 )...P(A k ). Riippumattomuuskäsite ja esitetty todennäköisyyden laskukaava voidaan yleistää myös eri satunnaisilmiöiden välille, jolloin tapahtumat voivat olla eri satunnaisilmiöistä. Puhutaan yhdistetystä satunnaisilmiöstä. 16

17 Esim Heitetään noppaa kaksi kertaa. A = 1. heiton silmäluku 5 B = 2. heiton silmäluku 5, A Æ B, joten P( saadaan 5 molemmilla heitoilla ) =P( 1. heiton silmäluku 5 ) P( 2. heiton silmäluku 5 ) = (1/6)(1/6) Esim Heitetään noppaa kolme kertaa (toistetaan samaa satunnaisilmiötä) A 1 = 1. heiton silmäluku pariton A 2 = 2. heiton silmäluku pariton A 3 = 3. heiton silmäluku pariton P( saadaan kaikilla heitoilla pariton ) =P( 1. heitolla pariton ) P( 2. heitolla pariton )P( 3. heitolla pariton ) = 1/8 17

18 Esim Olkoon laatikossa neljä palloa, joista yksi musta, yksi punainen ja loput kaksi valkoisia. Poimitaan umpimähkään laatikosta kaksi palloa peräkkäin siten, että ensin saatu pallo palautetaan takaisin ennen jälkimmäisen poimintaa (yksinkertainen satunnaisotanta palauttaen). Millä todennäköisyydellä molemmat pallot ovat valkoisia? P( molemmat pallot valkoisia ) =P(1.pallo valk.)p(2.pallo valk.) = (2/4)(2/4) = 1/4. Suoritetaan kahden pallon poiminta siten, että ensin poimittua ei palauteta laatikoon ennen jälkimmäisen valintaa (yksinkertainen satunnaisotanta palauttamatta). Millä todennökäisyydellä molemmat pallot nyt ovat valkoisia? P( molemmat pallot valkoisia ) =P(1.pallo valk.)p(2.pallo valk. 1. valk.) = (2/4)(1/3) = 1/6. (Helenius s. 196) 18

19 Esim Olet tulossa kotiin. Avainnipussasi on 5 avainta, joista yhdellä pääset sisään. Valitset satunnaisesti avaimen, jolla koetat avata ovet. Jollei ovi aukea, valitset jäljellä olevista satunnaisesti uuden avaimen ja koetat avata oven, jne. Laske todennäköisyydet, että 1. yrityksellä saat oven auki, 2. yrityksellä saat oven auki,..., 5. yrityksellä saat oven auki. (Vast. 1/5; (4/5)(1/4)=1/5;...; (4/5)(3/4)...(1/2)(1/1)=1/5). (Liski & Puntanen) 2.4. KOMBINATORIIKKAA Tarkastellaan satunnaisilmiötä, jonka voidaan ajatella syntyvän K:ssa eri vaiheessa (yhdistetty satunnaisilmiö). Oletetaan, että i:nnessä vaiheessa on n i eri tulosmahdollisuutta. Tällöin yhdistetyllä satunnaisilmiöllä on n 1 n 2...n K eri tulosta. 19 Esim Kuinka monta vakioveikkausriviä voidaan muodostaa? Montako sellaista, joissa ei yhtään oikeaa? (Vast = , 2 13 = 8192)

20 Esim Kuinka moneen erilaiseen jonoon henkilöt A, B ja C voidaan järjestää? (Vast ) Edellä muodostettiin kirjainten permutaatiot. Jonon mitä tahansa uutta järjestystä sanotaan permutaatioksi. Kuinka moneen erilaiseen järjestykseen n erilaista alkiota voidaan asettaa? Erilaisia järjestyksiä (permutaatioita) on n(n-1)(n-2) = n! (n-kertoma). Määritellään 0! = 1. Kuinka moneen erilaiseen järjestykseen n:stä erilaisesta alkiosta valitut k alkiota voidaan järjestää? Erilaisia järjestyksiä (permutaatioita) on n(n-1)(n-2)...(n-k+1)=n!/(n-k)! 20

21 21 Olkoon n erilaista alkiota. Tällöin k:n alkion osajoukkoja eli kombinaatioita voidaan muodostaa n! merkitään n = (lue: n yli k:n) k!(n k)! k kappaletta. Tämä luku on ns. binomikerroin. Kombinaatio on siis alkioiden joukko, jossa järjestyksellä ei ole väliä. Esim Kuinka monta erilaista lottoriviä? Kuinka monta sellaista, jossa kaikki väärin? (Vast , ) Esim Kuinka monta erilaista jonoa 5 henkilöä voi muodostaa? Entä 20 henkilöä? (Vast. 5!=120, 20!= ) Esim Kuinka moneen eri järjestykseen korttipakan 52 korttia voi asettaa? (Vast. 52!) Esim Valitaan luvuista 1,2,3,4,5,6 kaksi lukua satunnaisesti palauttamatta lukua valinnan jälkeen. Kyse siis yksinkertaisesta satunnaisotonnasta (YSO) palauttamatta.

22 22 Muodosta kaikki mahdolliset otokset (populaation osajoukkoja, jossa järjestyksellä ei merkitystä) ja määritä otoksen suurin alkio sekä sen eri arvojen todennäköisyydet. (Vast. Otoksia 15, P(Max=2)=1/15, P(Max=3)=2/15...) Esim Kuten edellä, mutta otanta systemaattisella otannalla. (Ohje: Otoksia 3) 2.5. KOKONAISTODENNÄKÖISYYS JA BAYESIN KAAVA Esim Tuotetta A valmistetaan koneilla K 1 ja K 2. Kone K 1 tekee 1000 kappaletta aikayksikössä ja virheellisten osuus on keskimäärin 2%. Kone K 2 tekee 2000 kappaletta ja virheellisten osuus 5%. Laske todennäköisyys, että tuotannosta satunnaisesti valittu tuote on virheellinen. (Vast. 4%) (Huuhtanen & Kallinen, Matemaattinen tilastotiede) Esim (jatkoa esim ) On löytynyt virheellinen tuote. Mikä on todennäköisyys, että tuote on valmistettu koneella K 1. (Vast. 1/6)

23 23 3. TODENNÄKÖISYYSJAKAUMIA 3.1. SATUNNAISMUUTTUJA JA TODENNÄKÖISYYSJAKAUMA Funktiota, joka liittää yksikäsitteisen reaaliluvun jokaiseen tarkasteltavan satunnaisilmiön perusjoukon tulokseen, sanotaan satunnaismuuttujaksi. Eri tuloksiin liittyviä reaalilukuja sanotaan satunnaismuuttujan arvoksi. Jatkossa merkitään (useimmiten) satunnaismuuttujia isoin kirjaimin (X, Y, Z,...) ja satunnaismuuttujan arvoja pienin kirjaimin (x, y, z,...). Esim Satunnaisilmiö nopanheitto. Satunnaismuuttuja X = saatu silmäluku.

24 Esim Heitetään kolikkoa neljä kertaa. Määritellään satunnaismuuttuja X=klaavojen lukumäärä heittosarjassa. Etukäteen ei tiedetä montako klaavaa saadaan, mutta voidaan laskea eri arvojen todennäköisyydet. Tässä satunnaismuuttujan X mahdolliset arvot ovat 0, 1, 2, 3 ja 4. Erilaisia heittosarjoja on kaikkiaan 16. klaavojen klaavojen lkm lkm Kl,Kl,Kl,Kl 4 Kr,Kl,Kl,Kr 2 Kr,Kl,Kl,Kl 3 Kl,Kr,Kl,Kr 2 Kl,Kr,Kl,Kl 3 Kr,Kl,Kr,Kl 2 Kl,Kl,Kr,Kl 3 Kl,Kr,Kr,Kr 1 Kl,Kl,Kl,Kr 3 Kr,Kl,Kr,Kr 1 Kl,Kl,Kr,Kr 2 Kr,Kr,Kl,Kr 1 Kr,Kr,Kl,Kl 2 Kr,Kr,Kr,Kl 1 Kl,Kr,Kr,Kl 2 Kr,Kr,Kr,Kr 0 24 P(X=0)= P(X=1)= P(X=2)= P(X=3)= P(X=4)=

25 Esim Satunnaisilmiönä veikkaaminen (13 kohdetta, joissa jokaisessa 3 vaihtoehtoa). Tällöin voidaan määritellä satunnaismuuttuja X = oikein veikattujen kohteiden lukumäärä. X voi saada arvoja 0,1,2,...,13. Näiden arvojen todennäköisyydet voidaan laskea (ks. binomijakauma). Esimerkissä ilmoitettiin satunnaismuuttujan mahdolliset arvot ja eri arvojen todennäköisyydet. Tällöin muodostettiin satunnaismuuttujan todennäköisyysjakauma. Satunnaismuuttuja voi olla joko jatkuva tai diskreetti. Edellisissä esimerkeissä satunnaismuuttujat olivat diskreettejä. Satunnaismuuttujaa sanotaan diskreetiksi, jos se voi saada arvokseen äärellisen määrän erisuuria arvoja tai äärettömän määrän siten, että arvot ovat numeroitavissa positiivisia kokonaislukuja käyttäen. Muulloin satunnaismuuttuja on jatkuva. 25

26 Diskreetin satunnaismuuttujan todennäköisyysjakauma voidaan usein (ainakin periaatteessa) muodostaa kuten esimerkissä Jatkuvien muuttujien yhteydessä todennäköisyysjakauma määritellään jatkuvan funktion avulla. Funktiota, joka määrittää satunnaismuuttujan todennäköisyysjakauman kutsutaan tiheysfunktioksi, merk. f(x). Diskreetin muuttujan yhteydessä puhutaan myös pistetodennäköisyyksistä. Tarkemmat kuvaukset tiheysfunktioista kohdissa 3.2. ja 3.3. Tiheysfunktion voidaan ajatella kuvaavan populaation jakaumaa (vrt. frekvenssimonikulmio empiiristen (otos)jakaumien yhteydessä). Esim Esimerkin todennäköisyysjakauma graafisesti. 26

27 27 Satunnaismuuttujan X kertymäfunktio F määritellään F(x) = P(X x). Kertymäfunktion arvo pisteessä x kertoo siis todennäköisyyden sille, että satunnaismuuttujan X arvo on x. Kertymäfunktion ominaisuuksia: 1) F(- )=0, F( )=1 2) P(a<X b)=f(b)-f(a), (a<b) 3) Jos X jatkuva, niin F(a)=P(X a)=p(x<a). 4) P(X>a)=1-P(X a)=1-f(a) 5) Jos X jatkuva satunnaismuuttuja, niin F (x)=f(x). Esim Heitetään kolikkoa neljä kertaa. Olkoon X = klaavojen lukumäärä heittosarjassa. Määritä ja piirrä X:n kertymäfunktio. Laske P(X<0),P(X 0),P(X<2.5), P(X 4). (Vast. 0, 1/16, 11/16, 1/16)

28 DISKREETTI SATUNNAISMUUTTUJA Olkoon diskreetin satunnaismuuttujan X mahdolliset arvot x 1, x 2,..., ja näiden arvojen todennäköisyydet p 1, p 2,..., Tällöin satunnaismuuttujan X todennäköisyysjakauma määritellään pistetodennäköisyyksien P(X=x i ) = p i, i = 1, 2,..., 0, muulloin missä p 1 + p = 1, perusteella. Esim Heitetään noppaa. Määritellään X = saatu silmäluku. Piirrä X:n todennäköisyysjakauma sekä kertymäfunktio. Samalla tavalla kuin empiiristen jakaumien yhteydessä jakaumaa voitiin kuvailla tunnuslukujen avulla, voidaan myös teoreettisia todennäköisyysjakaumin kuvata samantyyppisillä tunnusluvuilla, jotka määritellään todennäköisyysjakauman avulla.

29 29 Empiirisen jakauman keskiarvoa vastaavaksi tunnusluvuksi todennäköisyysjakauman (populaation) yhteydessä määritellään jakauman odotusarvo (populaation keskiarvo) sekä otosvarianssia ja keskihajontaa vastaaviksi (populaation) varianssi ja keskihajonta. Olkoon diskreetin satunnaismuuttujan X mahdolliset arvot x 1, x 2,..., x k ja näiden arvojen todennäköisyydet p 1, p 2,..., p k. Tällöin satunnaismuuttujan X odotusarvo E(X) määritellään E(X) =p 1 x 1 +p 2 x 2 +p 3 x p k x k = µ sekä varianssi Var(X) Var(X) =E[(X-µ) 2 ] = Sp i (x i - E(X)) 2 =Sp i (x i - µ) 2 =σ 2

30 30 ja keskihajonta Sd(X)= Var(X) = σ. Huom. Edellä k voi siis olla myös ääretön. Esim Heitetään noppaa. Määritellään X = saatu silmäluku. Määritä E(X) ja Var(X). (Vast. 3.5, 35/12) Esim Määritellään rahanheitossa X = 1, jos saadaan kruunu 0, muulloin. Laske E(X) ja Var(X). (Vast. 0.5, 0.25) Esim (jatkoa Esim ) Olet tulossa kotiin. Avainnipussasi on 5 avainta, joista yhdellä pääset sisään. Valitset satunnaisesti avaimen, jolla koetat avata ovet. Jollei ovi aukea, valitset jäljellä olevista satunnaisesti uuden avaimen ja koetat avata oven, jne. Määritellään X = sen yrityksen järjestysnumero, jolla ovi aukeaa. Määritä E(X) ja Var(X). (Vast. 3; 2)

31 JATKUVA SATUNNAISMUUTTUJA Olkoon jatkuvan satunnaismuuttujan X tiheysfunktio f. Jotta f olisi tiheysfunktio on f(x) 0, jokaisella x:n arvolla sekä f(x)dx = 1 eli f(x):n ja x-akselin väliin jäävä pinta-ala = 1. Tiheysfunktio kuvaa siis ykkösen suuruisen todennäköisyysmassan jakaumaa.tällöin X:n odotusarvo E(X) määritellään E(X) = sekä varianssi Var(X) xf(x)dx = µ, Var(X) =E[(X-µ) 2 ] = (x-e(x)) 2 f(x)dx =σ 2 ja keskihajonta Sd(X)= Var(X) = σ. Odotusarvo kuvaa jakauman keskikohtaa ja varianssi mittaa miten tiiviisti todennäköisyysmassa on keskittynyt odotusarvon ympärille (vrt. empiiriset jakaumat).

32 Olkoon X jatkuva satunnaismuuttuja sekä a ja b reaalilukuja (a b), tällöin P(X a) = P(X<a) = F(a) = a f(x)dx P(X a) = P(X>a) = 1-P(X a) = 1-F(a) P(a<X<b)= P(a X<b) = P(a<X b) = P(a X b) = F(b)-F(a) Graafisesti: Esim Olkoon X= satunnaisesti väliltä [0,1] valittu reaaliluku. Määritä X:n tiheysfunktio sekä kertymäfunktio. Laske lisäksi P(X>0.25), P(0.5 X 0.75),P(X a). Laske vielä E(X) ja Var(X) (Vast. f(x)=1, 0 x 1; E(X)=0,Var(X)= 1/12). Olkoon E(X)=µ ja Var(X)=σ 2. Tällöin muuttuja X standardoidaan tekemällä muunnos Z=(X-µ)/σ 32

33 ODOTUSARVON JA VARIANSSIN OMINAISUUKSIA Odotusarvon ominaisuuksia 1. E(a)=a, a vakio 2. E(aX+b)=aE(X)+b, X sat. muuttuja ja a,b vakioita (ax+b myös satunnaismuuttuja) 3. Olkoon X 1, X 2,..., X n satunnaismuuttujia, jolloin myös X 1 +X X n on satunnaismuuttuja ja E(X 1 +X X n )=E(X 1 )+E(X 2 )+...+E(X n ) 4. Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin E(XY)=E(X)E(Y). Satunnaismuuttujien riippumattomuus määritellään vastaavalla tavalla kuin tapahtumien riippumattomuuskin. Diskreetin satunnaismuuttujan yhteydessä: Satunnaismuuttujat ovat riippumattomia, joss P(X=x i ja Y=y i )=P(X=x i )P(Y=y i ), i,j

34 Varianssin ominaisuuksia 1. Var(a)=0, a vakio 2. Var(X)=E(X 2 )-(E(X)) 2 3. Var(aX+b)=a 2 Var(X), a,b vakioita 4. Sd(aX+b)= a Sd(X), a,b vakioita 5. Jos satunnaismuuttujat X 1,X 2,...,X n ovat riippumattomia, niin Var(X 1 +X X n ) =Var(X 1 )+Var(X 2 )+...+Var(X n ) 6. Olkoon X ja Y satunnaismuuttujia. Tällöin Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y), missä Cov(X,Y)=E((X-E(X))(Y-E(Y)) = σ XY on satunnaismuuttujien X ja Y välinen kovarianssi, joka on nolla, jos X ja Y ovat riippumattomia. Kovarianssi liittyy muuttujien X ja Y yhteisjakaumaan. Satunnaismuuttujien X ja Y välinen korrelaatiokerroin ρ XY = Cov (X,Y)/Sd(X)Sd(Y). 34 Esim Olkoon E(X)=µ ja Var(X)=σ 2. Määritellään Z=(X-µ)/σ Laske E(Z) ja Var(Z). (Vast. 0; 1)

35 Esim Olkoon X ja Y riippumattomia satunnaismuuttujia sekä määritellään Z=X-Y. Olkoon Sd(X) = σx ja Sd(Y) = σy sekä E(X) = µx ja E(Y) = µy. Laske Z:n odotusarvo ja keskihajonta. 35 Esim Olkoon X 1,X 2,..., X n riippumattomia satunnaismuuttujia siten, että E(X i ) = µ ja Var(X i ) = σ 2. Määritellään Y=(X 1 +X X n )/n. Laske E(Y) ja Var(Y). (Vast. µ, σ 2 /n) Esim Sijoitat 1000 mk. Mahdollisia sijoituskohteita A ja B, joissa molemmissa pienin sijoitusmäärä 500 mk. Olkoon X=tuotto 100 mk:n sijoituksesta A:han, Y= tuotto 100 mk:n sijoituksesta B:hen. Olkoon lisäksi P(X=-5)=0.4, P(X=20)=0.6, P(Y=0)=0.6, P(Y=25)=0.4 sekä sijoitukset toisistaan riippumattomia. Miten sijoittaisit? (Ohje: Paras sijoitus sellainen, jonka tuotolla suurin odotusarvo ja pienin varianssi) (Newbold)

36 Esim Sijoitetaan 1000 mk. Mahdollisia kohteita A ja B. Olkoon X=1 mk:n tuotto kohteesta A, Y=1 mk:n tuotto kohteesta B. Olkoon X ja Y riippumattomia sekä E(X)=E(Y)=µ ja Var(X)=Var(Y)=σ 2. Miten sijoitat? (Newbold) Esim Tarkastellaan kahta satunnaismuuttujaa X ja Y. Olkoon P(X=6, Y=1) = P(X=6, Y=3)= P(X=8, Y=2) = P(X=10, Y=1) = P(X=10, Y=3) = 0.2. Laske Cov(X,Y) sekä ρ. (Vast. 0; 0) 36

37 YLEISESTI SOVELLETTUJA TODENNÄKÖISYYSJAKAUMIA 1. BERNOULLI-JAKAUMA Tarkastellaan satunnaisilmiötä, jossa joko onnistutaan (A) tai epäonnistutaan (A C ). Määritellään satunnaismuuttuja X siten, että X = 1, jos onnistutaan 0, jos epäonnistutaan. Olkoon lisäksi P(A)=P(X=1)=p ja P(A C )=P(X=0)=q=1-p. Tällöin sanotaan, että X noudattaa Bernoullijakaumaa parametrillä p. Merkitään X~ Ber(p). Jos X~ Ber(p), niin E(X)= p ja Var(X) = p(1-p) = pq. Esim Rahanheitto, veikkauksessa yhden kohteen arvaaminen, nopanheitto onnistumisena silmäluvun 6 saaminen,...

38 38 2. BINOMIJAKAUMA Tarkastellaan vakioveikkausta. Määritellään satunnaismuuttuja X = oikein arvattujen kohteiden kokonaislukumäärä. Tehtävänä on määrittää X:n todennäköisyysjakauma. Tällöin päädytään nk. binomijakaumaan. Olkoon satunnaisilmiössä onnistumisen todennäköisyys p. Toistetaan tätä satunnaisilmiötä n kertaa. Määritellään X= onnistumisten kokonaislukumäärä. Tällöin sanotaan, että X noudattaa binomijakaumaa parametrein n ja p. Merkitään X~ Bin(n,p). Jos X~ Bin(n,p), niin ja P(X=k)= n p k k E(X)=np sekä Var(X)=np(1-p)=npq. ( 1 p) n k, k=0,1,2,...n Binomijakaumaa noudattava satunnaismuuttuja määritellään siis itse asiassa Bernoulli-jakaumaa noudattavien satunnaismuuttujien summana. Olkoon

39 39 X i ~ Ber(p), jolloin toistettaessa Bernoullikoetta n kertaa, onnistumisten kokonaislukumäärä voidaan määritellä X=X 1 +X X n ja tällöin siis X~ Bin(n,p). Tämän summamuuttujan avulla saadaan laskettua binomijakauman odotusarvo ja varianssi. Esim Veikataan satunnaisesti yksi rivi. Määritellään X=oikein arvattujen kohteiden kokonaislukumäärä. Määritä X:n jakauma sekä sen odotusarvo. Laske P(X=0), P(X=13), P(X>11), P(X>3). (Ohje: X ~ Bin(13, 1/3)) Esim Pelaat ystäväsi kanssa peliä, jossa heitetään rahaa. Jos tulee klaava saat ystävältäsi markan, jos tulee kruunu annat ystävällesi markan. On heitetty rahaa 20 kertaa ja olet tappiolla 14 markkaa eli on tullut 17 kruunua ja 3 klaavaa. Onko syytä tutkia rahaa tarkemmin? Jos raha harhaton, niin X=klaavojen lukumäärä 20 heitossa ~ Bin(20,1/2). Millä todennäköisyydellä olet

40 vähintään 14 mk tappiolla? P(X 3) =P(X=0)+P(X=1)+P(X=2)+P(X=3) =... = On siis sattunut tapahtuma, jonka todennäköisyys on hiukan yli 1/1000 tai pelissä oleva raha on harhainen ja antaa kruunun useammin kuin klaavan. 3. HYBERGEOMETRINEN JAKAUMA Tarkastellaan lottoamista. Määritellään satunnaismuuttuja X = lottorivissä oikeitten lukumäärä. Lotossa populaation koko on 39, josta arvotaan palauttamatta 7 oikeaa. Kun täytetään lottorivi, niin siinä voi olla oikein 0, 1, 2,... tai 7. Kun halutaan selvittää näiden arvojen todennäköisyydet, voidaan käyttää hyväksi nk. hypergeometrista jakaumaa. Populaatiossa on N alkiota, joista K kpl on "viallisia". Tehdään tästä populaatiosta palauttamatta yksinkertainen satunnaisotos, jonka koko on n. Määritellään X= viallisten 40

41 lukumäärä otoksessa. Tällöin X noudattaa nk. hypergeometrista jakaumaa parametrein N, K, n. Merkitään X~ Hyp(N,K,n). Jos X~ Hyp(N,K,n), niin K N K k n k P(X=k)=, k=0,1,2,...n N n E(X)=n(K/N), Var(X)=n(K/N)(1-K/N)((N-n)/(N-1)) Esim Laske todennäköisyys sille, että lotossa saa k oikein. Määritä myös odotusarvo oikeitten lukumäärälle. (Vast. E(X)=1.26) Esim Olkoon 15 tuotteen joukossa 5 virheellistä. Valitaan tästä joukosta satunnaisesti 3 tuotetta. Laske todennäköisyys, että valittujen kolmen tuotteen joukossa on korkeintaan yksi virheellinen, kun valinta tehty a) palauttaen b) palauttamatta. (Vast , 0.758) (Helenius) 41

42 42 4. POISSON JAKAUMA Esimerkiksi tarkasteltaessa hirvikolareiden (harvinaisten tapahtumien) lukumäärää viikoittain (tietyllä aikavälillä) voidaan lukumäärän todennäköisyysjakaumana käyttää nk. Poisson-jakaumaa. Olkoon satunnaismuuttujan X mahdolliset arvot 0, 1, 2,... ja P(X=k)= λk k! e λ, k=0,1,2,... Tällöin sanotaan X:n noudattavan Poissonjakaumaa parametrilla λ. Merkitään X~ Poi(λ). Tällöin E(X)=λ, Var(X)=λ. Tällaisiin satunnaismuuttujiin törmää, kun on kiinnostunut harvinaisten tapahtumien lukumäärästä tietyllä aikavälillä, tietyllä matkalla... vaikkapa liikenneonnettomuuksien lkm päivässä, painovirheitten lkm sivulla jne.

43 Esim Puhelinlaitokselle tulee satunnaisesti vikailmoituksia, keskimäärin kolme viikossa. Millä todennäköisyydellä tietyllä viikolla a) ei tule yhtään vikailmoitusta b) tulee yksi vikailmoitus? (Oletetaan Poissonjakauma) (Vast. 0.05, 0.15) (Helenius) Esim Sairaalainfektioiden lkm/kk. Poisson-jakauma soveltuu harvinaisten tapahtumien yhteydessä binomijakauman approksimointiin, kun n on riittävän suuri. Esim Suuressa populaatiossa tiedetään aiemmin olleen 4% värisokeita. Nykyisen tilanteen selvittämiseksi valitaan populaatiosta satunnaisesti 200 henkilöä. Millä todennäköisyydellä 200 valitun joukossa on korkeitaan viisi värisokeaa, jos populaatiossa edelleen on 4% värisokeita? (Vast. Poisson-jakauman avulla approksimoitu 0.191) (Helenius) 43

44 44 5. GEOMETRINEN JAKAUMA Avainnipussa on 5 avainta, joista yksi avaa oven. Valitaan satunnaisesti avaimen, jolla koetetaan avata ovi. Jollei ovi aukea, palautetaan avain nippuun ja valitaa avain satunnaisesti uudellee. Nyt halutaan selvittää todennäköisyys sille, että k. kerralla onnistutaan. Tässä siis toistetaan satunnaiskoetta, jossa onnistutaan todennäköisyydellä 1/5. Seuraavassa jakaumassa on tilanne yleistettynä. Toistetaan satunnaiskoetta, jossa onnistutaan todennäköisyydellä p, kunnes onnistutaan 1. kerran. Olkoon X sen kerran järjestysnumero. Tällöin sanotaan, että X noudattaa geometrista jakaumaa parametrillä p. Merkitään X~ Geo(p). Jos X~ Geo(p),niin P(X=k)= (1-p) k-1 p, k=1, 2,... ja E(X)=1/p ja Var(X)= (1-p)/p 2. Esim Kotiavaimen valinta nipusta palauttaen. Montako kertaa keskimäärin yrityksiä on tehtävä?

45 45 6. DISKREETTI TASAJAKAUMA Noppaa heitettäessä voidaan määritellä satunnaismuuttuja X = silmäluku. X:n mahdolliset arvot ovat 1, 2, 3, 4, 5, 6 ja jokaisen esiintymistodennäköisyys 1/6. Tätä jakaumaa kutsutaan diskreetiksi tasajakaumaksi välillä (1,6). Jos satunnaismuuttujan X arvot ovat kokonaislukuja a, a+1, a+2, a+3,...,a+(n-1)=b ja kukin n:stä arvo yhtä todennäköinen, niin sanotaan, että X noudattaa diskreettiä tasajakaumaa välillä (a,b). Merkitään X~ Tasd(a,b). Tällöin E(X)= (a+b)/2 ja Var(X)= (n 2-1)/12. Esim Nopanheitto. Esim Olkoon X yksinumeroinen satunnaisluku. Mahdolliset arvot ovat siis 0,1,2,...,9 ja jokaisen arvon todennäköisyys

46 46 1/10. Tällöin X~ Tasd(0,9), E(X)= (0+9)/2 ja Var(X)=(10 2-1)/ JATKUVA TASAJAKAUMA Satunnaismuuttuja noudattaa jatkuvaa tasajakaumaa välillä [a,b], jos sen tiheysfunktio f on f(x)=1/(b-a), kun a x b 0, muulloin. Merkitään X~ Tas(a,b). Tällöin E(X)= (a+b)/2 Var(X)=(b-a) 2 /12. Esim Aiemmat esim. 8. NORMAALIJAKAUMA Seuraava todennäköisyysjakauma on tilastotieteessä hyvin keskeinen. Tarkastellaan jatkuvaa satunnaismuuttujaa X, joka voi saada arvokseen kaikki reaaliluvut. Satunnaismuuttuja X noudattaa normaalijakaumaa parametrein µ ja σ 2 (σ>0), jos sen tiheysfunktio on

47 47 f(x) = 1 σ 2π e 1 2 x µ σ 2 - x Tällöin E(X)= µ ja Var(X) = σ 2. Merkitään X~ N(µ,σ 2 ). Jos X~ N(µ,σ 2 ), niin sen tiheysfunktio on yksihuippuinen jakauma, symmetrinen odotusarvon suhteen varianssin kertoessa jakauman levittäytymisestä odotusarvon ympärille. Esim Erilaisia normaalijakaumia graafisesti. Jos X~ N(0,1), niin sen tiheysfunktio on f(x) = 1 2π e 1 2 x2 - x Kyseessä nk. standardoitu normaalijakauma. Usein merk. Z~ N(0,1), f(z)=φ(z) ja

48 48 F(z)=P(Z z)=φ(z). Standardoidun normaalijakauman kertymäfunktion Φ(z)=P(Z z) arvoja on taulukoitu. Taulukoiden avulla voidaan laske erilaisia todennäköisyyksiä. Normaalijakauman symmetrisyydestä seuraa, että Φ(z)=1-Φ(-z). Graafisesti: Esim Olkoon Z~ N(0,1). Laske P(Z 1), P(Z 1.1), P(Z 1.14), P(Z -1), P(Z 0), P(-1 Z 1), P(-2 Z 2), P(-3 Z 3). Esim Olkoon Z~ N(0,1). Määritä z, kun a) Φ(z)=0.75 b) Φ(z)=0.26. Jos X~ N(µ,σ 2 ), niin P(X a) voidaan laskea käyttäen standardoitua normaalijakaumaa, sillä on osoitettavissa, että jos X~ N(µ,σ 2 ), niin Z=(X-µ)/σ ~ N(0,1).

49 49 Jos siis X~ N(µ,σ 2 ), niin P(X a) =P((X-µ)/σ (a-µ)/σ ) = Φ((a-µ)/σ), ja P(X a)=1-p(x a) =1-P((X-µ)/σ (a-µ)/σ ) = 1-Φ((a-µ)/σ) P(a X b)=p(x b)-p(x a) =P((X-µ)/σ (b-µ)/σ) -P((X-µ)/σ (a-µ)/σ) = Φ((b-µ)/σ)-Φ((a-µ)/σ).

50 Esim Tehdas valmistaa sähkölamppuja, joiden käyttöikä vaihtelee tavalla, joka on hyvin luonnehdittavissa normaalijakauman avulla. Valmistettavien lamppujen keskimääräinen kestoikä on 800 tuntia ja vaihtelua esiintyy niin, että keskihajonta on 40 tuntia. a) Millä todennäköisyydellä valmistettavien lamppujen joukosta satunnaisesti valittu lamppu kestää vähintään 700 tuntia mutta korkeintaan 850 tuntia? b) Mikä on sellainen arvo, jonka alle lampun kestoikä jää 0.25 suuruisella todennäköisyydellä? c) Mikä on sellainen arvo, jonka yli lamppu kestää 0.25 suuruisella todennäköisyydellä? (Vast , 826.8, 773.2) (Helenius) 50

51 Esim Laske todennäköisyydet, että normaalijakaumassa satunnaismuuttujan arvo on korkeitaan a) hajonnan päässä odotusarvosta,b) kahden hajonnan päässä odotusarvosta, c) kolmen hajonnan päässä odotusarvosta. Normaalijakaumaan liittyviä keskeisiä teoreettisia tuloksia 1) Jos X~ N(µ,σ 2 ), niin ax+b~ N(aµ+b,a 2 σ 2 ), (a,b vakioita) 2) Jos X 1, X 2,..., X n ovat riippumattomia ja Xi~ N(µ i,σ i 2 ), niin X 1 + X X n ~ N(µ 1 +µ µ n,σ 1 2 +σ σn 2 ) 51 3) Keskeinen raja-arvolause: Olkoon X 1, X 2,..., X n riippumattomia satunnaismuuttujia, joista kukin noudattaa omaa jakaumaansa. Olkoon E(X i )=µ i ja Var(X i ) = σ i 2, i=1,2,...,n. Tällöin (hyvin

52 yleisten ehtojen vallitessa) satunnaismuuttuja X 1 + X X n noudattaa likimain normaalijakaumaa (kun n riittävän iso) parametrein µ 1 +µ µ n ja σ 1 2 +σ σn Esim Olkoon X 1, X 2, X 3, X 4 riippumattomia ja kukin X i ~ N(0,1). Määritellään U=(X 1 + X 2 + X 3 +X 4 )/4. Laske P(U 1). Olkoon X 1, X 2,..., X n riippumattomia ja kukin X i ~ N(µ,σ 2 ), niin tällöin U=(X 1 + X X n )/n~ N(µ,σ 2 /n). Otoskeskiarvon jakauma on siis normaalijakauma (ks.. otosjakaumat)! Vaikka X i :t eivät olisikaan normaalisti jakautuneita, niin U olisi likimain normaalisti jakautunut keskeisen raja-arvolauseen perusteella.

53 Binomijakaumaa voidaan approksimoida normaalijakaumalla. Jos X~ Bin(n,p), niin silloinhan X=X 1 + X X n, missä X i ~ Ber(p). Keskeisen raja-arvolauseen mukaan (jos n on riittävän suuri) X noudattaa likimain normaalijakaumaa parametrein np ja npq. Approksimaatio on hyvä, jos n on suuri ja p ei ole kovin pieni eikä suuri. Esim Henkilö osallistuu tenttiin, jossa sataan väitteeseen vastataan väitteen olevan tosi tai epätosi ja vain toinen vaihtoehto on oikea. Jos henkilö vastaa kaikkiin kohtiin valitsemalla vaihtoehdon aina täysin satunnaisesti, niin millä todennäköisyydellä hän saa korkeintaan 60 oikeaa vastausta? (Helenius) Jatkuvuuskorjaus. Ks. Helenius s.252 Esim Levykaupan omistaja arvioi, että 20% asiakkaista suorittaa ostoksen. Laske todennäköisyys, että 180 asiakkaan joukosta ainakin 45 suorittaa ostoksen (binomijakaumaa voidaan approksimoida normaalijakaumalla). (Newbold) 53

54 Esim Muutaman vähäsateisen vuoden jälkeen tietyllä alueella epäillään sääolosuhteissa tapahtuneen pysyvänluonteinen muutos. Vuotuisen sademäärän keskiarvoksi 100 vuoden ajalta oli saatu tuumaa ja keskihajonnaksi 6.11 tuumaa. Lisäksi vuotuinen sademäärä oli vaihdellut tavalla, jota voidaan luonnehtia normaalijakaumalla. Viimeisen viiden vuoden sademäärän keskiarvoksi oli saatu tuumaa. Millä todennäköisyydellä näin paljon lukua pienempi keskiarvo olisi odotettavissa, mikäli viiden viimeisen vuoden havainnon tulkitaan olevan yksinkertainen satunnaisotos normaalijakaumasta odotusarvona ja keskihajontana 6.11? (Helenius) 54 Esim Oletetaan, että opiskelijoiden älykkyysosamäärä ~ N(µ,225). Kuinka suuri otos tarvitaan, kun halutaan, että otoskeskiarvo poikkeaa µ:stä korkein ±2 pistettä todennäköisyydellä 0.99?

55 55 4. OTOS, OTOSSUURE, OTANTAJAKAUMA Kun populaation on hyvin suuri tai ääretön ei tietenkään voida tutkia koko populaatiota. Tällöin tilastolliset johtopäätelmät, jotka koskevat populaation l. perusjoukon (äärellinen tai ääretön) ominaisuuksia tehdään otoksen avulla. Jotta erilaisten otoksesta laskettujen tunnuslukujen luotettavuutta voidaan arvioida otos valitaan poimimalla se todennäköisyysotannalla. Todennäköisyysotannassa kaikki mahdolliset n alkion otokset voidaan luetella, tunnetaan jokaisen mahdollisen otoksen poimintatodennäköisyys ja otokset poimitaan näiden todennäköisyyksien mukaan sekä tiedetään, miten otoksen perusteella yleistetään tulokset koko populaatioon. Jatkossa tarkastellaan pääosin vain yksinkertaisella satunnaisotannalla tehtyyn otokseen liittyviä tuloksia. Lisäksi ollaan kiinnostuneita vain yhdestä populaation alkioihin liittyvästä ominaisuudesta,

56 56 muuttujasta. Yksinkertainen satunnaisotos (YSO) poimitaan siten, että jokaisella n alkion suuruisella otoksella on yhtä suuri todennäköisyys tulla poimituksi. Käytännössä ei muodosteta kaikkia n alkion osajoukkoja, joista sitten satunnaisesti valitaan yksi, vaan alkiot poimitaan yksi kerrallaan kunnes otoskoko on n. YSO voidaan tehdä joko palauttamatta tai palauttaen SATUNNAISOTOS Olkoon X 1, X 2,..., X n n:n satunnaismuuttujan jono. Tätä jonoa sanotaan satunnaisotokseksi, jos X i :t ovat riippumattomia (merk.æ) ja noudattavat samaa jakaumaa. Sanonta X 1, X 2,..., X n on satunnaisotos N(µ,σ 2 ):sta tarkoittaa sitä, että jokainen X i ~ N(µ,σ 2 ) ja X i :t ovat riippumattomia.

57 57 Kun äärettömästä populaatiosta tehdään otanta yksinkertaisella satunnaisotannalla (palauttaen tai palauttamatta) ja tarkastellaan yhtä tiettyä muuttujaa (tilastoyksikön ominaisuutta), on kyse satunnaisotoksesta. Jos populaatio on äärellinen YSO palauttaen johtaa satunnaisotokseen, mutta palauttamatta ei, koska riippumattomuusoletus ei ole voimassa. Kuitenkin, jos populaatio on suuri YSO palauttamattakin johtaa lähes riippumattomiin satunnaismuuttujiin. Satunnaisotos määritellään siis satunnaismuuttujien perusteella. Nämä satunnaismuuttujat saavat arvot, kun otos on tehty. Siis otoksen tekemisen jälkeen satunnaisotokselle saadaan arvot, jotka vaihtelevat otoksesta toiseen. Satunnaismuuttujista muodostetut funktiot kuten summat, tulot, jne. ovat myös satunnaismuuttujia (esim. otoskeskiarvo, otosmaksimi, kruunujen lukumäärä

58 heittosarjassa). Täten myös satunnaisotoksesta muodostetut funktiot ovat satunnaismuuttujia. Esim Otoskeskiarvo X =(X 1 +X X n )/n on satunnaismuuttuja, joka saa arvon kun otos on tehty. Arvo vaihtelee otoksesta toiseen. Esim Olkoon X~ N(1,25). Mikä on 10X:n jakauma? Laske P(0 X 5) ja P(0 10X 5). Esim Mutterin halkaisija X~ N(100,1). Valmistuvat mutterit saavat poiketa odotusarvosta korkeintaan yhden yksikön verran. Laske todennäköisyys, että 10 alkion satunnaisotoksessa kaikki alkiot ovat hyväksyttäviä. (Liski&Puntanen) 4.2. OTOSSUUREET JA OTOSJAKAUMAT Satunnaisotoksen avulla määriteltyä funktiota, joka siis on satunnaismuuttuja, kutsutaan otossuureeksi. Koska otossuure on 58

59 59 satunnaismuuttuja, liittyy siihen todennäköisyysjakauma. Otossuureen todennäköisyysjakaumasta käytetään nimitystä otanta- tai otosjakauma. Käyttökelpoisia otossuureita esim. otoskeskiarvo, otosvarianssi, otosmaksimi, prosenttiosuus otoksessa... Tarkasteltavan otossuureen todennäköisyysjakauma pyritään määrittämään, jolloin saadaan selville miten otossuure voi vaihdella otoksesta toiseen. Tämä auttaa taas, kun olemme kiinnostuneita populaatioon liittyvistä arvioista perustaen arviot otokseen. Joidenkin otossuureiden otosjakaumia: 1) Otoskeskiarvon jakauma riippuen otantamenetelmästä ja populaatiosta. 2) Viallisten %-osuus otoksessa 3) Olkoon satunnaisotos X 1, X 2,..., X n Tas(0,1):sta (siis jokainen X i ~ Tas(0,1) ja X i :t ovat riippumattomia). Määritellään otossuure

60 60 U= max{x i }. Tässä tilanteessa voidaan otosjakauma määrittää täsmällisesti. 4) Olkoon X 1, X 2,..., X n satunnaisotos jakaumasta, jonka odotusarvo µ on ja varianssi σ 2. Tällöin tiedetään, että E(X ) = µ ja Var (X ) =σ 2 /n. Otoskeskiarvon jakauma tunnetaan esim. silloin kun, otos on normaalijakaumasta. Jos X 1, X 2,..., X n on satunnaisotos N(µ,σ 2 ):sta, niin tällöin X ~ N(µ,σ 2 /n). Lisäksi voidaan keskeisen raja-arvolauseen perusteella sanoa, että (otoskoon ollessa riittävän suuri) otoskeskiarvo on likimain normaalisti jakautunut, vaikka satunnaisotos olisi peräisin jostain muusta kuin normaalijakaumasta. Otoskeskiarvon hajontaa sanotaan otoskeskiarvon keskivirheeksi.

61 Esim Olkoon satunnaisotos X 1, X 2,..., X 10 normaalijakaumasta parametrien 0 ja 1. Laske P(-1 X 1 1) ja P(-1 X 1). 61 Esim Olkoon tentin tulos sekä miesettä naisopiskelijoilla ~ N(20,25). Tehdään mies- ja naisopiskelijoista 25 alkion sat. otokset. Laske todennäköisyys, että naisten pistekeskiarvo on ainakin 2 pistettä suurempi kuin miesten. (Liski&Puntanen) Esim Olkoon X 1, X 2,..., X n satunnaisotos N(µ 1,σ 2 1 ):sta ja Y1, Y 2,..., Y m on satunnaisotos N(µ 2,σ 2 2 ) :sta. Määritä X Y :n jakauma.

62 62 5. PARAMETRIEN ESTIMOINTI 5.1. PISTE-ESTIMOINTI Estimointi on populaation tuntemattoman parametrin arviointia sopivan otossuureen avulla. Näin tehtäessä puhutaan pisteestimoinnista. Esimerkiksi voidaan estimoida populaation odostusarvoa otoskeskiarvolla, populaation varianssia otosvarianssilla. Esim Olkoon populaatiossa π % viallisia. Pyritään arvioimaan π:tä otoksen perusteella. Olkoon X 1, X 2,..., X n satunnaisotos ko. populaatiosta. Määritellään X i = 1, jos alkio viallinen = 0, jos alkio viaton. Näin siis X i ~ Ber(π/100), jolloin E(X i )=π/100 ja Var(X i ) =(1-π/100)π/100. Viallisten kokonaislukumäärä otoksessa on X=X 1 +X X n. Luonnollinen arvio π:lle olisi vastaava luku

63 63 otoksessa eli viallisten prosenttiosuus otoksessa p =100X/n=100(X 1 +X X n )/n. Kun p on otossuure, jolla estimoidaan π:tä; sanotaan, että p on π:n estimaattori. Kun otos on tehty, voidaan p:lle laskea arvo eli estimaatti. Otossuureen p odotusarvo ja varianssi: E(p)= Var(p)= Koska E(p)=π, niin sanotaan, että p on π:n harhaton estimaattori. Harhattomuus tarkoittaa siis sitä, että estimaattori antaa keskimäärin oikeita arvoja. Otossuureen p hajontaa sanotaan otoksen prosenttiosuuden keskivirheeksi. Keskeisen raja-arvolauseen perusteella voidaan sanoa, että p ~ N(π,(π(100-π)/n),likimain. Saatiin siis selville otossuureen p otosjakauma.

64 Esim Tehdään 205 alkion satunnaisotos aikuisopiskelijoista. Heistä 53% aikoo ostaa autoon renkaat seuraavan vuoden kuluessa. Jos populaatiossa renkaiden ostajien osuus oletetaan olevan 50%, niin mikä on todennäköisyys sille, että satunnaisotoksessa ostajien osuus on 53% tai suurempi. (Newbold) Yksi tapa estimoida populaation parametri onkin tehdä se otoksesta lasketun vastaavan tunnusluvun avulla (analogiaperiaate): 64 estimoitava parametri odotusarvo populaation varianssi populaation mediaani viallisten %-osuus populaatiossa estimaattori otoskeskiarvo otosvarianssi otosmediaani viallisten %-osuus otoksessa On tietysti monenlaisia muitakin otossuureita, joita voidaan käyttää parametrien estimoinnissa. Estimaattorille voidaan asettaa erilaisia vaatimuksia. Harhattomuus on usein toivottu ominaisuus.

65 65 Olkoon θ populaation tuntematon, estimoitava parametri ja θ ˆ sen estimaattori. Tällöin sanotaan, että θ ˆ on θ:n harhaton estimaattori, jos E( θ ˆ )=θ. Harhattomuuden lisäksi estimaattorilla toivotaan olevan pienin mahdollinen varianssi. Jos estimaattori on harhaton ja sillä on pienin varianssi parametrin kaikkien harhattomien estimaattoreiden joukossa, sanotaa estimaattoria harhattomaksi minimivarianssiseksi estimaattoriksi eli tehokkaimmaksi estimaattoriksi. Kahdesta parametrin harhattomasta estimaattorista on tehokkaampi se, jolla on pienempi varianssi. Otoskoon kasvaessa toivotaan estimoinnin tarkentuvan eli estimaattorin jakauman keskittyvän yhä tiiviimmin estimoitavan parametrin ympärille. Jos estimaattorin varianssi lähenee nollaa otoskoon kasvaessa rajatta, sanotaan, että estimaattori on tarkentuva. Luonnollinen vaatimus tietenkin estimaattorille on myös se,

66 66 että käytetään kaikki otoksessa oleva informaation hyväksi. Esim Olkoon X 1, X 2,..., X n satunnaisotos Tas(0,θ):stä. Halutaan estimoida jakauman ylärajaa θ. Tällöin 2X ja 2X 1 ovat harhattomia θ:n estimaattoreita, mutta Var(2X )<Var(2X 1 ), kun n>1. (Liski&Puntanen) Esim Otoskeskiarvo X on jakauman odotusarvon µ harhaton estimaattori, koska E(X ) = µ. Aiemmin on myös todettu, että Var (X ) =σ 2 /n. Lisäksi voidaan osoittaa, että normaalijakauman tapauksessa µ:n harhattomien estimaattoreiden joukossa, otoskeskiarvolla on pienin varianssi. Esim Olkoon X 1, X 2,..., X n satunnaisotos populaatiosta, jonka varianssi on σ 2. Voidaan osoittaa, että otosvarianssi s 2 = 1 n 1 n i=1 ( X i X ) 2 on σ 2 :n harhaton estimaattori eli E(s 2 ) =σ 2.

67 67 Vaikka otosvarianssi onkin populaation varianssin harhaton estimaattori, niin otoshajonta ei yleensä ole populaation hajonnan harhaton estimaattori. On olemassa tietysti monenlaisia estimointimenetelmiä edellä esitellyn lisäksi, mm. pienimmän neliösumman menetelmä, maximum likelihood -menetelmä LUOTTAMUSVÄLEJÄ Piste-estimointi tuottaa siis (otoksen teon jälkeen) yhden luvun, jolla arvioidaan estimoitavaa parametria. Estimointiin liittyy tietysti aina epävarmuutta. Usein halutaankin määrätä yksittäisen arvon sijaan väli, jolla arvellaan tuntemattoman parametrin olevan. Tällöin puhutaan väliestimoinnista. Väliestimoinnissa muodostetaan nk. luottamusväli vastaavan piste-estimaattorin ja piste-estimaattorin otantajakauman keskihajonnan eli estimaattorin keskivirheen avulla.

68 Olkoon A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A,B) on parametrin θ 100(1-α)%:n luottamusväli, jos P(A θ B)=1-α. Kyseessä on siis satunnaisväli, joka sisältää populaation tuntemattoman estimoitavan parametrin todennäköisyydellä 1-α. Kun otos on tehty, voidaan A:lle ja B:lle laskea arvot. Näin saadaan väli (a,b), joka joko sisältää parametrin θ tai ei sisällä. Välistä (a,b) käytetään myös nimitystä luottamusväli. Koska päättely halutaan tehdä melko suurella varmuudella, valitaan α esim. 0.10, 0.05, 0.01; on kyse 90%:n, 95%:n tai 99%:n luottamusväleistä. Määritellään käyttökelpoinen merkintä. Olkoon Z ~ N(0,1). Määritellään z α siten, että P(Z z α ) = α. Samoin z α/2 siten, että P(Z z α/2 ) = α/2. Esimerkiksi z 0.05 = 1.64 ja z 0.05/2 = z = Graafisesti: 68

69 69 1. Populaation odotusarvon luottamusväli Halutaan arvioida poikien keskimääräistä syntymäpituutta. Otoksessa 65 pojan syntymäpituuden keskiarvo oli 50,95 cm ja keskihajonta 1.97 cm (SAIDIT - aineisto). Miten voisi arvioida poikapopulaation keskiarvoa? Seuraavaksi arvioidaan normaalijakauman odotusarvoa, kun tunnetaan populaation varianssi. (Näinhän ei tietysti voitu edellä poikien keskipainon arvioinissa edellä olettaa!) Olkoon nyt X 1, X 2,..., X n satunnaisotos N(µ,σ 2 ):sta, missä σ 2 tunnettu. Tällöin Z = X µ σ / n ~ N(0,1), jolloin P 1.96 X µ σ / n 1.96 = 0.95 Kirjoittamalla lausuttu tapahtuma toiseen muotoon saadaan P X 1.96σ / n µ X σ / n Voidaan sanoa, että epäyhtälöt toteutuvat ( ) = 0.95

70 70 todennäköisyydellä Väliä ( X 1.96σ / n,x σ / n) sanotaan µ :n 95%:n luottamusväliksi. Luottamusvälin määritelmässä X on siis satunnaismuuttuja, jonka arvot vaihtelevat otoksesta toiseen. Havaitun otoksen perusteella saadaan kiinteä väli, jota myös kutsutaan luottamusväliksi. Tämän säännön mukaan laskettu väli pitää sisällään 95 %:n todennäköisyydellä tuntemattoman populaatiokeskiarvon µ. Poimittaessa monta otosta ja laskettaessa joka kerta edellä esitetty luottamusväli, niin luottamusväleistä n. 95 % on sellaisia, jotka sisältävät µ:n. Vastaavalla tavalla kuin 95 %:n luottamusväli, voidaan muodostaa vaikkapa 90 %:n ja 99 %:n luottamusvälit. Yleisesti, jos 0< α <1 ( tavallisesti 0.1, 0.05, 0.01), niin 100(1-α ) %:n luottamusväli populaation odotusarvolle µ, kun varianssi

71 71 tunnettu, on X ± z α/2 σ / n Esim Oletetaan, että henkilöltä otetusta yhdestä verinäytteestä suoritetut toistuvat kolesteroliarvojen määritykset erilaisista mittausvirheistä johtuen noudattavat likimain normaalijkaumaa, jonka odotusarvo on henkilön todellinen kolesteroliarvo. Oletetaan lisäksi, että määrittämiseen liittyen vaihtelun tiedetään keskihajonnan avulla ilmaistuna olevan 0.5 yksikön suuruusluokkaa. Neljässä määrityksessä henkilön kolesteroliarvoiksi saatiin 5.8, 5.7, 4.8, 5.9. Määritä väli, jolle henkilön kolesteroliarvon voidaan arvella kuuluvan. (Helenius) Esim Tehdään satunnaisotos N(µ,9):stä ja saadaan otoskeskiarvoksi 10. Muodostetaan 90%, 95% ja 99% luottamusvälit µ:lle, kun otoskoko 10, 50 ja 100. Edellä esitetyssä oletettiin, että meillä on

72 satunnaisotos normaalijakaumasta, jolloin otoskeskiarvon jakauma on myös normaalijakauma. Esitettyä luottamusvälin laskukaavaa voidaan kuitenkin käyttää otoskoon ollessa suuri siinäkin tapauksessa, että satunnaisotos on peräisin jostain muusta kuin normaalijakaumasta. Tällöinhän keskeisen raja-arvolauseen perusteella otoskeskiarvon jakauma on likimain normaalijakauma. Edellä esitetyssä oletettiin myös, että jakauman varianssi on tunnettu. Käytännössä harvemmin tietysti populaation varianssia tunnetaan (esim. poikien keskipainon arviointi.) Tällöin se onkin estimoitava otoksen perusteella, otosvarianssin avulla. Olkoon nyt siis X 1, X 2,..., X n satunnaisotos N(µ,σ 2 ):sta, missä σ 2 tuntematon. Tällöin satunnaismuuttuja t = X µ s / n noudattaa ns. Studentin t-jakaumaa vapausastein n-1. 72

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa? 21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä

Lisätiedot

Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, syksy Raija Leppälä

Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, syksy Raija Leppälä Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, syksy 2003 Raija Leppälä 8. tammikuuta 2004 Sisältö 1 Johdanto 4 2 Todennäköisyyslaskentaa 7 2.1 Satunnaisilmiö ja tapahtuma...................

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 12.1.2016/1 MTTTP5, luento 12.1.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

&idx=2&uilang=fi&lang=fi&lvv=2015

&idx=2&uilang=fi&lang=fi&lvv=2015 20.10.2015/1 MTTTP5, luento 20.10.2015 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, lukuvuosi 2011-2012

Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, lukuvuosi 2011-2012 Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, lukuvuosi 2011-2012 Raija Leppälä 17. lokakuuta 2011 Sisältö 1 Johdanto 3 2 Todennäköisyyslaskentaa 5 2.1 Satunnaisilmiö ja tapahtuma 5 2.2 Klassinen

Lisätiedot

Tilastollisen päättelyn perusteet, MTTTP5. Luentorunko, lukuvuosi

Tilastollisen päättelyn perusteet, MTTTP5. Luentorunko, lukuvuosi Tilastollisen päättelyn perusteet, MTTTP5 Luentorunko, lukuvuosi 2016-2017 Raija Leppälä 31. elokuuta 2016 Sisältö 1 Johdanto 2 2 Todennäköisyyslaskentaa 4 2.1 Satunnaisilmiö ja tapahtuma 4 2.2 Klassinen

Lisätiedot

1. JOHDANTO. SIS LLYSLUETTELO sivu 1. JOHDANTO 3

1. JOHDANTO. SIS LLYSLUETTELO sivu 1. JOHDANTO 3 1 2 22.10.2001 Tilastollisten menetelmien perusteet I Syksy 2001 Opintojakson www-sivu: http://www.uta.fi/~strale/p2syksy.html Huom. 1. Luentomateriaali on tarkoitettu ko. opintojakson opiskelijoille.

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 25.10.2016/1 MTTTP5, luento 25.10.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014 1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2

Lisätiedot

riippumattomia ja noudattavat samaa jakaumaa.

riippumattomia ja noudattavat samaa jakaumaa. 12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen MTTTP5, kevät 2016 4.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen 1. Laitosneuvostoon valitaan 2 professoria, 4 muuta henkilökuntaan kuuluvaa jäsentä sekä 4 opiskelijaa. Laitosneuvostoon

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&id x=2&uilang=fi&lang=fi&lvv=2016

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&id x=2&uilang=fi&lang=fi&lvv=2016 10.1.2017/1 MTTTP5, luento 10.1.2017 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585&id x=2&uilang=fi&lang=fi&lvv=2016 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

dx=2&uilang=fi&lang=fi&lvv=2015

dx=2&uilang=fi&lang=fi&lvv=2015 12.1.2016/1 MTTTP5, luento 12.1.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 16.11.2017/1 MTTTP5, luento 16.11.2017 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla ~,, ~,,. 16.11.2017/2 Esim. Tutkittiin uuden menetelmän käyttökelpoisuutta

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 25.10.2016/1 MTTTP5, luento 25.10.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 20.10.2015/1 MTTTP5, luento 20.10.2015 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025 26.3.2019/1 MTTTP1, luento 26.3.2019 7.4 Normaalijakauma (kertausta ja täydennystä) Z ~ N(0, 1), tiheysfunktion kuvaaja 0,5 0,4 0,3 0,2 0,1 Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96)

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

30A02000 Tilastotieteen perusteet

30A02000 Tilastotieteen perusteet 30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden 1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma

Lisätiedot

Todennäköisyysjakaumia

Todennäköisyysjakaumia 8.9.26 Kimmo Vattulainen Todennäköisyysjakaumia Seuraavassa esitellään kurssilla MAT-25 Todennäköisyyslaskenta esille tulleita diskreettejä todennäköisyysjakaumia Diskreetti tasajakauma Bernoullijakauma

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=14974&id x=2&uilang=fi&lang=fi&lvv=2017

https://www10.uta.fi/opas/opintojakso.htm?rid=14974&id x=2&uilang=fi&lang=fi&lvv=2017 24.10.2017/1 MTTTP5, luento 24.10.2017 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14974&id x=2&uilang=fi&lang=fi&lvv=2017 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

g=fi&lvv=2018&uilang=fi#parents

g=fi&lvv=2018&uilang=fi#parents 23.10.2018/1 MTTTP5, luento 23.10.2018 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?id=30277&lan g=fi&lvv=2018&uilang=fi#parents 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Otanta Poisson- Jakaumien tunnusluvut Diskreetit jakaumat Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 2 Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: 8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio. Todennäköisyyslaskenta I, kesä 7 Harjoitus 4 Ratkaisuehdotuksia. Satunnaismuuttujalla X on ns. kaksipuolinen eksponenttijakauma eli Laplacen jakauma: sen tiheysfunktio on fx = e x. a Piirrä tiheysfunktio.

Lisätiedot

Todennäköisyyslaskenta sivuaineopiskelijoille

Todennäköisyyslaskenta sivuaineopiskelijoille Todennäköisyyslaskenta sivuaineopiskelijoille Tentit: 4.11.2013 ja 2.12.2013. Loput kaksi tenttiä (vuonna 2014) ilmoitetaan myöhemmin. Tentissä on 4 tehtävää á 8 pistettä, aikaa 4 tuntia. Arvostelu 0 5.

Lisätiedot

D ( ) E( ) E( ) 2.917

D ( ) E( ) E( ) 2.917 Mat-2.091 Sovellettu todennäköisyyslasku 4. harjoitukset/ratkaisut Aiheet: Diskreetit jakaumat Avainsanat: Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen jakauma, Kertymäfunktio,

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

4. laskuharjoituskierros, vko 7, ratkaisut

4. laskuharjoituskierros, vko 7, ratkaisut 4. laskuharjoituskierros, vko 7, ratkaisut D1. Kone valmistaa kuulalaakerin kuulia, joiden halkaisija vaihtelee satunnaisesti. Halkaisijan on oltava tiettyjen rajojen sisällä, jotta kuula olisi käyttökelpoinen.

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tilastomatematiikka Kevät 2008

Tilastomatematiikka Kevät 2008 Tilastomatematiikka Kevät 2008 Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastomatematiikka p.1/19 4.3 Varianssi Satunnaismuuttuja on neliöintegroituva, jos odotusarvo

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

D ( ) Var( ) ( ) E( ) [E( )]

D ( ) Var( ) ( ) E( ) [E( )] Mat-.2620 Sovellettu todennäköisyyslaskenta B / Ratkaisut Aiheet: Diskreettejä jakaumia Avainsanat: Binomijakauma, Diskreetti tasainen jakauma, Eksponenttijakauma, Geometrinen jakauma, Hypergeometrinen

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Satunnaismuuttujat ja todennäköisyysjakaumat Mitä tänään? Jos satunnaisilmiötä halutaan mallintaa matemaattisesti, on ilmiön tulosvaihtoehdot kuvattava numeerisessa muodossa. Tämä tapahtuu liittämällä

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1 Tilastolliset menetelmät Osa 1: Johdanto Johdanto tilastotieteeseen KE (2014) 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä ja malleja, joiden avulla reaalimaailman ilmiöistä voidaan

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Todennäköisyyslaskun kertaus. Heliövaara 1

Todennäköisyyslaskun kertaus. Heliövaara 1 Todennäköisyyslaskun kertaus Heliövaara 1 Satunnaismuuttujat ja todennäköisyysjakaumat Heliövaara 2 Stunnaismuuttujat ja todennäköisyysjakaumat Jos satunnaisilmiötä halutaan mallintaa matemaattisesti,

Lisätiedot

Todennäköisyys (englanniksi probability)

Todennäköisyys (englanniksi probability) Todennäköisyys (englanniksi probability) Todennäköisyyslaskenta sai alkunsa 1600-luvulla uhkapeleistä Ranskassa (Pascal, Fermat). Nykyisin todennäköisyyslaskentaa käytetään hyväksi mm. vakuutustoiminnassa,

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 3

031021P Tilastomatematiikka (5 op) viikko 3 031021P Tilastomatematiikka (5 op) viikko 3 Jukka Kemppainen Mathematics Division Jakauman tunnusluvut Jakauman tärkeimmät tunnusluvut ovat odotusarvo ja varianssi. Odotusarvo ilmoittaa jakauman keskikohdan

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo. Kertaus Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Luokiteltu aineisto. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo. Hajontaluvut luokittelemattomalle

Lisätiedot

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen MAT-5 Todennäköisyyslaskenta Tentti.. / Kimmo Vattulainen Vastaa jokainen tehtävä eri paperille. Funktiolaskin sallittu.. a) P A). ja P A B).6. Mitä on P A B), kun A ja B ovat riippumattomia b) Satunnaismuuttujan

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja. Luku 1 Johdanto 1.1 Todennäköisyys ja tilastotiede Kurssi käsittelee todennäköisyyslaskentaa ja tilastotiedettä. Laaditaan satunnaisilmiöille todennäköisyysmalleja. Miten hyvin mallit kuvaavat todellisuutta?

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Nordlund Mat-2.090 Sovellettu todennäköisyyslasku A Harjoitus 4 (vko 41/2003) (Aihe: diskreettejä satunnaismuuttujia ja jakaumia, Laininen luvut 4.1 4.7) 1. Kone tekee

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Nordlund Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 7 (vko 44/003) (Aihe: odotusarvon ja varianssin ominaisuuksia, satunnaismuuttujien lineaarikombinaatioita,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 27. syyskuuta 2007 Antti Rasila () TodB 27. syyskuuta 2007 1 / 15 1 Diskreetit jakaumat Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen

Lisätiedot

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä Todennäköisyys 1 Klassinen todennäköisyys: p = Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä Esimerkkejä: Nopan heitto, kolikon heitto Satunnaismuuttuja Tilastollisesti vaihtelevaa

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio

Lisätiedot

Tilastollisen päättelyn perusteet

Tilastollisen päättelyn perusteet Tilastollisen päättelyn perusteet Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Motivointiako? opiskelijoiden, jotka kammoavat matematiikkaa tai eivät katso ehtivänsä tai haluavansa

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Matemaattinen tilastotiede Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Alkusanat Tämä moniste perustuu vuosina 2002-2004 pitämiini matemaattisen tilastotieteen luentoihin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot