1. JOHDANTO. SIS LLYSLUETTELO sivu 1. JOHDANTO 3

Koko: px
Aloita esitys sivulta:

Download "1. JOHDANTO. SIS LLYSLUETTELO sivu 1. JOHDANTO 3"

Transkriptio

1 Tilastollisten menetelmien perusteet I Syksy 2001 Opintojakson www-sivu: Huom. 1. Luentomateriaali on tarkoitettu ko. opintojakson opiskelijoille. Huom. 2. Dokumentin lopussa on kirjallisuusluettelo, jonka sisšltšviš teoksia on kšytetty tukena tšmšn luentorungon kirjoittamisessa. Huom. 3. KŠyttŠessŠsi verkkomateriaalia kaikki erikoismerkit eivšt všlttšmšttš nšy/tulostu koneellasi oikein. Informoithan tekijšš jos teknisiš ongelmia esiintyy. -2,0-1,0 0,0 0,5 1,0 1,5 2,0 2,5 Moments Mean -0,02174 Std Dev 0,96329 Std Err Mean 0,10770 upper 95% Mean 0,19263 lower 95% Mean -0,23611 N 80,00000 Test Mean=value Hypothesized Value 0 Test Statistic -0,202 Prob > t 0,841 Prob > t 0,580 Prob < t 0,420 Raija LeppŠlŠ (puh , sšhkšposti Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede Tampereen yliopisto SIS LLYSLUETTELO sivu 1. JOHDANTO 3 2. TODENN K ISYYSLASKENTAA SATUNNAISILMI JA TAPAHTUMA KLASSINEN TODENN K ISYYS TODENN K ISYYSLASKENNAN 11 AKSIOOMAT JA LASKUS NT J 2.4. KOMBINATORIIKKAA KOKONAISTODENN K ISYYS 22 JA BAYESIN KAAVA 3. TODENN K ISYYSJAKAUMIA SATUNNAISMUUTTUJA JA 23 TODENN K ISYYSJAKAUMA 3.2. DISKREETTI SATUNNAISMUUTTUJA JATKUVA SATUNNAISMUUTTUJA ODOTUSARVON JA VARIANSSIN 33 OMINAISUUKSIA 3.5. YLEISESTI SOVELLETTUJA 37 TODENN K ISYYSJAKAUMIA 4. OTOS, OTOSSUURE, OTANTAJAKAUMA SATUNNAISOTOS OTOSSUUREET JA OTOSJAKAUMAT PARAMETRIEN ESTIMOINTI PISTE-ESTIMOINTI LUOTTAMUSV LEJ HYPOTEESIEN TESTAUS 86 KIRJALLISUUTTA JOHDANTO Tilastollinen analyysi voidaan jakaa karkeasti kuvailevaan (descriptive) analyysiin ja tilastolliseen pššttelyyn (statistical inference). Kuvaileva tilastotiede pyrkii kuvailemaan tietoaineiston sisšltšš erilaisten graafisten esitysten ja tunnuslukujen sekš taulukoiden avulla.kuvailevaan tilastotieteeseen tutustuttiin johdantokurssilla. TILTP2-opintojaksolla tutustutaan tilastolliseen pššttelyyn. EmpiirisissŠ tutkimuksissa on kšytšssš satunnaisotos populaatiosta. Otoksen perusteella pyritššn tekemššn johtopšštelmiš koko populaatiosta. PyritŠŠn selvittšmššn esim. milloin voidaan sanoa ehdollisten otoskeskiarvojen perusteella, ettš populaatioissa keskiarvot poikkeavat toisistaan (Esim. 2). Voidaan myšs haluta arvioida vaikkapa populaation keskiarvoa (Esim. 1). 3 Esim. 1. TietyssŠ yskšnlšškkeessš pitšisi tuoteselostuksen mukaan olla alkoholia 5 %. TiedetŠŠn, ettš alkoholipitoisuus vaihtelee jonkin verran pullosta toiseen. TietyssŠ laboratorioissa halutaan tutkia voidaanko valmistajan ilmoittamaa lukua pitšš sopivana keskiarvona eri pullojen alkoholipitoisuudelle. LŠhdetŠŠn oletuksesta, ettš alkoholipitoisuuden vaihtelu pullosta toiseen on luonnehdittavissa normaalijakauman avulla. Suoritettiin koe, jossa kymmenen pullon alkoholipitoisuus mitattiin ja saatiin seuraavat tulokset: 5.01, 4.87, 5.11, 5.21, 5.03, 4.96, 4.78, 4.98, 4.88 ja Onko valmistajan všittšmššn uskomista? (Helenius)... Quantiles maximum 100.0% 5, % 5, % 5, % 5,2000 quartile 75.0% 5,0725 median 50.0% 4,9950 quartile 25.0% 4, % 4, % 4, % 4,7800 minimum 0.0% 4,7800 4

2 5 6 Moments Mean 4,98900 Std Dev 0,12530 Std Err Mean 0,03962 upper 95% Mean 5,07863 lower 95% Mean 4,89937 N 10 Test Mean=value Hypothesized Value 5 Actual Estimate 4,989 t Test Test Statistic -0,278 Prob > t 0,788 Prob > t 0,606 Prob < t 0, Esim. 2. Ovatko tytšt ja pojat syntyessššn keskimššrin samanpituisia? ErŠŠstŠ aineistosta (SAIDIT- aineisto, n = 120) laskettuna poikien pituuden keskiarvo oli 50,95 ja tyttšjen 50,24. Otoskeskiarvojen erotus oli siis Voidaanko tšmšn perusteella yleistšš ja sanoa, ettš pojat ovat syntyessššn keskimššrin tyttšjš pitempiš? Analyysin tuloksia: Means and Std Deviations Level Number Mean Std Dev pojat 65 50,9538 1,97192 tytšt 55 50,2364 2,02726 t-test DF Prob> t 1, ,0523 Ks. myšs jaettu moniste SPSS:n tulostuksesta. Tilastollisten pšštelmien teko perustuukin satunnaisotoksesta mššriteltyjen tunnuslukujen (kuten esim. otoskeskiarvojen) todennškšisyysjakaumiin. JohtopŠŠtelmŠt tehdššn erilaisten tilastollisten testien ja analysointimenetelmien avulla. TŠllaiseen pššttelyyn sisšltyy tiettyš epšvarmuutta, jota pyritššn hallitsemaan kšyttšen hyvšksi todennškšisyyslaskentaa ja erilaisia todennškšisyysjakaumia. Opintojaksolla tutustutaankin aluksi lyhyesti todennškšisyyslaskentaa ja todennškšisyysjakaumiin. PŠŠpaino on kuitenkin tilastollisen pššttelyn peruskšsitteiden esittelyssš. PerehdytŠŠn otosjakaumiin ja niiden kšyttššn tilastollisessa pššttelyssš. KŠydŠŠn lšpi estimointiin liittyviš kšsitteitš sekš tutustutaan joihinkin tilastollisiin testeihin. 2. TODENN K ISYYSLASKENTAA 2.1. SATUNNAISILMI JA TAPAHTUMA Esim HeitettŠessŠ rahaa ei tiedetš saadaanko kruunu vai klaava. TiedetŠŠn, ettš molemmat vaihtoehdot ovat yhtš todennškšisiš. HeitettŠessŠ noppaa tiedetššn, ettš saadaan silmšluku 1, 2, 3, 4, 5 tai 6, mutta ei tiedetš etukšteen silmšlukua. TiedetŠŠn, ettš jokaisen silmšluvun todennškšisyys on sama. Kortin vetšminen sekoitetusta korttipakasta, lottoaminen, veikkaaminen, bussin saapuminen pysškille ja pšivšn sšš ovat myšs esimerkkejš ilmišistš, joihin liittyy epšvarmuutta. 7 Satunnaisilmiš on mikš tahansa ilmiš, johon liittyy useita eri tulosmahdollisuuksia sekš epšvarmuutta ilmišn tuloksesta. Puhutaan myšs satunnaiskokeesta. Satunnaisilmiššn liittyvien kaikkien mahdollisten tulosten joukkoa kutsutaan perusjoukoksi (otosavaruudeksi) E. KŠytŠnnšssŠ ollaan kiinnostuneita joistain perusjoukon osajoukoista (sekš niiden esiintymistodennškšisyyksistš). Perusjoukon osajoukko on nimeltššn tapahtuma. Tapahtumia merkitššn A, B, C,... Esim Rahanheitto E =Òkaikki mahdolliset tuloksetó ={kruunu, klaava} tapahtumia: A = Òsaadaan kruunuó ={kruunu} B = Òsaadaan klaavaó ={klaava} Nopanheitto E ={1,2,3,4,5,6} tapahtumia: A = Òsaadaan parillinenó = {2,4,6} 8

3 B = {1} C = {1,2,3} D = Òsaadaan suurempi kuin 4Ó ={5,6} Kortin vetšminen sekoitetusta korttipakasta E= Òkaikki kortitó tapahtumia: A = Òsaadaan pataó B = Òsaadaan kuningasó C = Òsaadaan punainen ŠssŠÓ Lottoaminen (39 palloa, joista arvotaan palauttamatta 7) E = Òkaikki mahdolliset lottorivitó, joita on (ks. kombinatoriikka) tapahtumia: A = Òsaadaan 7 oikeinó B = Òsaadaan 6 oikeinó C = Òei saada yhtššn oikeinó Veikkaaminen (13 kohdetta, joissa jokaisessa 3 vaihtoehtoa) E = Òkaikki mahdolliset rivitó, joita on (ks. kombinatoriikka) tapahtumia: A = Òsaadaan 13 oikeinó B = Òsaadaan 12 oikeinó C = Òei saada yhtššn oikeinó KLASSINEN TODENN K ISYYS Olkoon tarkasteltavan satunnaisilmišn perusjoukossa n tulosta, jotka ovat kaikki yhtš mahdollisia. Olkoon tapahtumaan A liittyviš tuloksia k kappaletta (0 k n). TŠllšin tapahtuman A todennškšisyys P(A) = k/n. Esim Rahanheitto A = Òsaadaan kruunuó P(A) = 1/2 Nopanheitto A = Òsaadaan parillinenó ={2,4,6} P(A) = 3/6 B = {1}, P(B) = 1/6 D = Òsuurempi kuin 4Ó ={5,6}, P(D) = 2/6. Lottoaminen A = Òsaadaan 7 oikeinó P(A) = 1/kaikkien rivien lkm = 1/ B = Òsaadaan 6 oikeinó P(B) = rivien lkm, joissa 6 oik./kaikkien rivien lkm 10 Klassisen todennškšisyyden (voidaan liittšš vain ŠŠrellisiin perusjoukkoihin) yhteydessš lukujen n ja k mššrittšminen ei aina ole yksinkertaista. Joudutaan usein kšyttšmššn hyvšksi kombinatoriikkaa. Tapahtuman A todennškšisyys voidaan myšs mššritellš arvoksi, jota tapahtuman suhteellinen frekvenssi lšhestyy satunnaiskoetoistojen mššršš kasvatettaessa TODENN K ISYYSLASKENNAN AKSIOOMAT JA LASKUS NT J Matemaattisesti mššriteltynš todennškšisyys on joukkofunktio P, joka liittšš jokaiseen satunnaisilmišn tapahtumaan A reaaliluvun P(A), jota sanotaan tapahtuman A todennškšisyydeksi ja joka toteuttaa tietyt aksioomat. Aksiooma 1. Jos A on mikš tahansa satunnaisilmišn tapahtuma, niin 0 P(A) Aksiooma 2. P(E) = 1. TŠllšin kyseessš varma tapahtuma. Jos A ja B ovat kaksi saman satunnaisilmišn tapahtumaa, niin mššritellššn niiden yhdiste A B = ÒA tai B tai molemmat tapahtuvató ja leikkaus A B = ÒA ja B molemmat tapahtuvató. Sanotaan, ettš tapahtumat A ja B ovat erillisiš, jos ne molemmat eivšt voi tapahtua samanaikaisesti eli A B = (mahdoton tapahtuma). Aksiooma 3. Jos tapahtumat A ja B ovat erillisiš, eli A B =, niin P(A B ) = P(A)+P(B) Esim Nopanheitto A = Òsaadaan parillinenó ={2,4,6} P(A) = 3/6 B = Òsaadaan ykkšnenó ={1} P(B) = 1/6 A B =Òsaadaan parillinen tai ykkšnenó A B =, joten P(A B) = P(A)+P(B) 12

4 13 14 LaskusŠŠntš 1. P( )=0,eli mahdottoman tapahtuman, todennškšisyys on nolla. MŠŠritellŠŠn A:n komplementtitapahtuma A C = ÒA ei tapahduó LaskusŠŠntš 2. P(A C ) = 1- P(A). Esim Nopanheitto A = ÒsilmŠluku pienempi kuin 6Ó A C = ÒsilmŠluku 6Ó P(A) = 1-P(A C ) = 1-1/6 Esim HeitetŠŠn rahaa kaksi kertaa. Olkoon A=Òsaadaan ainakin yksi kruunuó. P(A)=1-P(A C ) = 1-1/4. LaskusŠŠntš 3. Jos tapahtumat A 1, A 2,..., A k ovat pareittain erillisiš eli mitkššn kaksi tapahtumaa eivšt voi esiintyš samanaikaisesi, niin P(A 1 A 2... A k )= P(A 1 )+P(A 2 )+...+ P(A k ). Esim VedetŠŠn kortti sekoitetusta pakasta. Laske tn, ettš kortti on ruutu-, hertta- tai ristikortti. (Vast. 39/52) LaskusŠŠntš 4 (yleinen yhteenlaskusššntš). Jos A ja B ovat satunnaisilmišn tapahtumia, niin P(A B ) = P(A)+P(B)-P(A B). Esim VedetŠŠn kortti sekoitetusta pakasta. Laske tn, ettš kortti on patakortti tai ŠssŠ. MŠŠritellŠŠn A:n ehdollinen todennškšisyys ehdolla B: Olkoon A ja B saman satunnaisilmišn tapahtumia siten, ettš P(B)>0. TŠllšin tapahtuman A ehdollinen todennškšisyys ehdolla, ettš tiedetššn tapahtuman B esiintyneen on P(A B)=P(A B)/P(B). Esim Tarkastellaan sadasta henkilšstš muodostuvaa populaatiota. HenkilšiltŠ tiedusteltiin heidšn mielipidettššn verouudistukseen (puolesta tai vastaan). Saatiin seuraava frekvenssitaulukko: puolesta vastaan mies nainen Valitaan satunnaisesti yksi henkilš ko. populaatiosta. MŠŠritŠ todennškšisyys sille, ettš valittu on uudistuksen puolesta, kun tiedetššn valitun olleen mies. (Vast. 1/4) (Helenius) LaskusŠŠntš 5 (yleinen kertolaskusššntš). Jos P(B)>0, niin P(A B) = P(B)P(A B). Tapahtumat A ja B ovat (tilastollisesti, stokastisesti) riippumattomia (merk.æ), jos P(A B)=P(A). TŠllšin siis B:n tapahtuminen tai tapahtumatta jššminen ei vaikuta A:n tapahtumisen todennškšisyyteen ja A:n 15 tapahtuminen tai tapahtumatta jššminen ei vaikuta B:n tapahtumisen todennškšisyyteen. Jos tapahtumat A ja B ovat riippumattomia, niin P(A B ) = P(A)P(B). Tapahtumien riippumattomuus voidaan yleistšš: Tapahtumat A 1, A 2,..., A k ovat riippumattomia, jos minkššn niistš tapahtuminen tai tapahtumatta jššminen ei vaikuta muiden tapahtumien todennškšisyyksiin. TŠllšin P(A 1 A 2... A k ) =P(A 1 )P(A 2 )...P(A k ). RiippumattomuuskŠsite ja esitetty todennškšisyyden laskukaava voidaan yleistšš myšs eri satunnaisilmišiden všlille, jolloin tapahtumat voivat olla eri satunnaisilmišistš. Puhutaan yhdistetystš satunnaisilmišstš. 16

5 Esim HeitetŠŠn noppaa kaksi kertaa. A = Ò1. heiton silmšluku 5Ó B = Ò2. heiton silmšluku 5Ó, A Æ B, joten P(Òsaadaan 5 molemmilla heitoillaó) =P( Ò1. heiton silmšluku 5Ó) P( Ò2. heiton silmšluku 5Ó) = (1/6)(1/6) Esim HeitetŠŠn noppaa kolme kertaa (toistetaan samaa satunnaisilmištš) A 1 = Ò1. heiton silmšluku paritonó A 2 = Ò2. heiton silmšluku paritonó A 3 = Ò3. heiton silmšluku paritonó P(Òsaadaan kaikilla heitoilla paritonó) =P( Ò1. heitolla paritonó) P( Ò2. heitolla paritonó)p( Ò3. heitolla paritonó) = 1/8 17 Esim Olkoon laatikossa neljš palloa, joista yksi musta, yksi punainen ja loput kaksi valkoisia. Poimitaan umpimšhkššn laatikosta kaksi palloa perškkšin siten, ettš ensin saatu pallo palautetaan takaisin ennen jšlkimmšisen poimintaa (yksinkertainen satunnaisotanta palauttaen). MillŠ todennškšisyydellš molemmat pallot ovat valkoisia? P(Òmolemmat pallot valkoisiaó) =P(1.pallo valk.)p(2.pallo valk.) = (2/4)(2/4) = 1/4. Suoritetaan kahden pallon poiminta siten, ettš ensin poimittua ei palauteta laatikoon ennen jšlkimmšisen valintaa (yksinkertainen satunnaisotanta palauttamatta). MillŠ todennškšisyydellš molemmat pallot nyt ovat valkoisia? P(Òmolemmat pallot valkoisiaó) =P(1.pallo valk.)p(2.pallo valk. 1. valk.) = (2/4)(1/3) = 1/6. (Helenius s. 196) 18 Esim Olet tulossa kotiin. Avainnipussasi on 5 avainta, joista yhdellš pššset sisššn. Valitset satunnaisesti avaimen, jolla koetat avata ovet. Jollei ovi aukea, valitset jšljellš olevista satunnaisesti uuden avaimen ja koetat avata oven, jne. Laske todennškšisyydet, ettš 1. yrityksellš saat oven auki, 2. yrityksellš saat oven auki,..., 5. yrityksellš saat oven auki. (Vast. 1/5; (4/5)(1/4)=1/5;...; (4/5)(3/4)...(1/2)(1/1)=1/5). (Liski & Puntanen) 2.4. KOMBINATORIIKKAA Tarkastellaan satunnaisilmištš, jonka voidaan ajatella syntyvšn K:ssa eri vaiheessa (yhdistetty satunnaisilmiš). Oletetaan, ettš i:nnessš vaiheessa on n i eri tulosmahdollisuutta. TŠllšin yhdistetyllš satunnaisilmišllš on n 1 n 2...n K eri tulosta. Esim Kuinka monta vakioveikkausriviš voidaan muodostaa? Montako sellaista, joissa ei yhtššn oikeaa? (Vast = , 2 13 = 8192) 19 Esim Kuinka moneen erilaiseen jonoon henkilšt A, B ja C voidaan jšrjestšš? (Vast. 3á2á1) EdellŠ muodostettiin kirjainten permutaatiot. Jonon mitš tahansa uutta jšrjestystš sanotaan permutaatioksi. Kuinka moneen erilaiseen jšrjestykseen n erilaista alkiota voidaan asettaa? Erilaisia jšrjestyksiš (permutaatioita) on n(n-1)(n-2)...2á1 = n! (n-kertoma). MŠŠritellŠŠn 0! = 1. Kuinka moneen erilaiseen jšrjestykseen n:stš erilaisesta alkiosta valitut k alkiota voidaan jšrjestšš? Erilaisia jšrjestyksiš (permutaatioita) on n(n-1)(n-2)...(n-k+1)=n!/(n-k)! 20

6 Olkoon n erilaista alkiota. TŠllšin k:n alkion osajoukkoja eli kombinaatioita voidaan muodostaa n! merkitään n = k!(n k)! k (lue: n yli k:n) kappaletta. TŠmŠ luku on ns. binomikerroin. Kombinaatio on siis alkioiden joukko, jossa jšrjestyksellš ei ole všliš. Esim Kuinka monta erilaista lottoriviš? Kuinka monta sellaista, jossa kaikki vššrin? (Vast , ) Esim Kuinka monta erilaista jonoa 5 henkilšš voi muodostaa? EntŠ 20 henkilšš? (Vast. 5!=120, 20!= ) Esim Kuinka moneen eri jšrjestykseen korttipakan 52 korttia voi asettaa? (Vast. 52!) Esim Valitaan luvuista 1,2,3,4,5,6 kaksi lukua satunnaisesti palauttamatta lukua valinnan jšlkeen. Kyse siis yksinkertaisesta satunnaisotonnasta (YSO) palauttamatta. 21 Muodosta kaikki mahdolliset otokset (populaation osajoukkoja, jossa jšrjestyksellš ei merkitystš) ja mššritš otoksen suurin alkio sekš sen eri arvojen todennškšisyydet. (Vast. Otoksia 15, P(Max=2)=1/15, P(Max=3)=2/15...) Esim Kuten edellš, mutta otanta systemaattisella otannalla. (Ohje: Otoksia 3) 2.5. KOKONAISTODENN K ISYYS JA BAYESIN KAAVA Esim Tuotetta A valmistetaan koneilla K 1 ja K 2. Kone K 1 tekee 1000 kappaletta aikayksikšssš ja virheellisten osuus on keskimššrin 2%. Kone K 2 tekee 2000 kappaletta ja virheellisten osuus 5%. Laske todennškšisyys, ettš tuotannosta satunnaisesti valittu tuote on virheellinen. (Vast. 4%) (Huuhtanen & Kallinen, Matemaattinen tilastotiede) Esim (jatkoa esim ) On lšytynyt virheellinen tuote. MikŠ on todennškšisyys, ettš tuote on valmistettu koneella K 1. (Vast. 1/6) TODENN K ISYYSJAKAUMIA 3.1. SATUNNAISMUUTTUJA JA TODENN K ISYYSJAKAUMA Funktiota, joka liittšš yksikšsitteisen reaaliluvun jokaiseen tarkasteltavan satunnaisilmišn perusjoukon tulokseen, sanotaan satunnaismuuttujaksi. Eri tuloksiin liittyviš reaalilukuja sanotaan satunnaismuuttujan arvoksi. Jatkossa merkitššn (useimmiten) satunnaismuuttujia isoin kirjaimin (X, Y, Z,...) ja satunnaismuuttujan arvoja pienin kirjaimin (x, y, z,...). Esim Satunnaisilmiš nopanheitto. Satunnaismuuttuja X = saatu silmšluku. 23 Esim HeitetŠŠn kolikkoa neljš kertaa. MŠŠritellŠŠn satunnaismuuttuja X=klaavojen lukumššrš heittosarjassa. EtukŠteen ei tiedetš montako klaavaa saadaan, mutta voidaan laskea eri arvojen todennškšisyydet. TŠssŠ satunnaismuuttujan X mahdolliset arvot ovat 0, 1, 2, 3 ja 4. Erilaisia heittosarjoja on kaikkiaan 16. klaavojen klaavojen lkm lkm Kl,Kl,Kl,Kl 4 Kr,Kl,Kl,Kr 2 Kr,Kl,Kl,Kl 3 Kl,Kr,Kl,Kr 2 Kl,Kr,Kl,Kl 3 Kr,Kl,Kr,Kl 2 Kl,Kl,Kr,Kl 3 Kl,Kr,Kr,Kr 1 Kl,Kl,Kl,Kr 3 Kr,Kl,Kr,Kr 1 Kl,Kl,Kr,Kr 2 Kr,Kr,Kl,Kr 1 Kr,Kr,Kl,Kl 2 Kr,Kr,Kr,Kl 1 Kl,Kr,Kr,Kl 2 Kr,Kr,Kr,Kr 0 24 P(X=0)= P(X=1)= P(X=2)= P(X=3)= P(X=4)=

7 Esim SatunnaisilmišnŠ veikkaaminen (13 kohdetta, joissa jokaisessa 3 vaihtoehtoa). TŠllšin voidaan mššritellš satunnaismuuttuja X = oikein veikattujen kohteiden lukumššrš. X voi saada arvoja 0,1,2,...,13. NŠiden arvojen todennškšisyydet voidaan laskea (ks. binomijakauma). EsimerkissŠ ilmoitettiin satunnaismuuttujan mahdolliset arvot ja eri arvojen todennškšisyydet. TŠllšin muodostettiin satunnaismuuttujan todennškšisyysjakauma. Satunnaismuuttuja voi olla joko jatkuva tai diskreetti. EdellisissŠ esimerkeissš satunnaismuuttujat olivat diskreettejš. Satunnaismuuttujaa sanotaan diskreetiksi, jos se voi saada arvokseen ŠŠrellisen mššršn erisuuria arvoja tai ŠŠrettšmŠn mššršn siten, ettš arvot ovat numeroitavissa positiivisia kokonaislukuja kšyttšen. Muulloin satunnaismuuttuja on jatkuva. 25 Diskreetin satunnaismuuttujan todennškšisyysjakauma voidaan usein (ainakin periaatteessa) muodostaa kuten esimerkissš Jatkuvien muuttujien yhteydessš todennškšisyysjakauma mššritellššn jatkuvan funktion avulla. Funktiota, joka mššrittšš satunnaismuuttujan todennškšisyysjakauman kutsutaan tiheysfunktioksi, merk. f(x). Diskreetin muuttujan yhteydessš puhutaan myšs pistetodennškšisyyksistš. Tarkemmat kuvaukset tiheysfunktioista kohdissa 3.2. ja 3.3. Tiheysfunktion voidaan ajatella kuvaavan populaation jakaumaa (vrt. frekvenssimonikulmio empiiristen (otos)jakaumien yhteydessš). Esim Esimerkin todennškšisyysjakauma graafisesti. 26 Satunnaismuuttujan X kertymšfunktio F mššritellššn F(x) = P(X x). KertymŠfunktion arvo pisteessš x kertoo siis todennškšisyyden sille, ettš satunnaismuuttujan X arvo on x. KertymŠfunktion ominaisuuksia: 1) F(- )=0, F( )=1 2) P(a<X b)=f(b)-f(a), (a<b) 3) Jos X jatkuva, niin F(a)=P(X a)=p(x<a). 4) P(X>a)=1-P(X a)=1-f(a) 5) Jos X jatkuva satunnaismuuttuja, niin F«(x)=f(x). Esim HeitetŠŠn kolikkoa neljš kertaa. Olkoon X = klaavojen lukumššrš heittosarjassa. MŠŠritŠ ja piirrš X:n kertymšfunktio. Laske P(X<0),P(X 0),P(X<2.5), P(X 4). (Vast. 0, 1/16, 11/16, 1/16) DISKREETTI SATUNNAISMUUTTUJA Olkoon diskreetin satunnaismuuttujan X mahdolliset arvot x 1, x 2,..., ja nšiden arvojen todennškšisyydet p 1, p 2,..., TŠllšin satunnaismuuttujan X todennškšisyysjakauma mššritellššn pistetodennškšisyyksien P(X=x i ) = p i, i = 1, 2,..., 0, muulloin missš p 1 + p = 1, perusteella. Esim HeitetŠŠn noppaa. MŠŠritellŠŠn X = saatu silmšluku. PiirrŠ X:n todennškšisyysjakauma sekš kertymšfunktio. Samalla tavalla kuin empiiristen jakaumien yhteydessš jakaumaa voitiin kuvailla tunnuslukujen avulla, voidaan myšs teoreettisia todennškšisyysjakaumin kuvata samantyyppisillš tunnusluvuilla, jotka mššritellššn todennškšisyysjakauman avulla. 28

8 Empiirisen jakauman keskiarvoa vastaavaksi tunnusluvuksi todennškšisyysjakauman (populaation) yhteydessš mššritellššn jakauman odotusarvo (populaation keskiarvo) sekš otosvarianssia ja keskihajontaa vastaaviksi (populaation) varianssi ja keskihajonta. Olkoon diskreetin satunnaismuuttujan X mahdolliset arvot x 1, x 2,..., x k ja nšiden arvojen todennškšisyydet p 1, p 2,..., p k. TŠllšin satunnaismuuttujan X odotusarvo E(X) mššritellššn E(X) =p 1 x 1 +p 2 x 2 +p 3 x p k x k = µ sekš varianssi Var(X) Var(X) =E[(X-µ) 2 ] = Sp i (x i - E(X)) 2 =Sp i (x i - µ) 2 =σ 2 29 ja keskihajonta Sd(X)= Var(X) = σ. Huom. EdellŠ k voi siis olla myšs ŠŠretšn. Esim HeitetŠŠn noppaa. MŠŠritellŠŠn X = saatu silmšluku. MŠŠritŠ E(X) ja Var(X). (Vast. 3.5, 35/12) Esim MŠŠritellŠŠn rahanheitossa X = 1, jos saadaan kruunu 0, muulloin. Laske E(X) ja Var(X). (Vast. 0.5, 0.25) Esim (jatkoa Esim ) Olet tulossa kotiin. Avainnipussasi on 5 avainta, joista yhdellš pššset sisššn. Valitset satunnaisesti avaimen, jolla koetat avata ovet. Jollei ovi aukea, valitset jšljellš olevista satunnaisesti uuden avaimen ja koetat avata oven, jne. MŠŠritellŠŠn X = sen yrityksen jšrjestysnumero, jolla ovi aukeaa. MŠŠritŠ E(X) ja Var(X). (Vast. 3; 2) JATKUVA SATUNNAISMUUTTUJA Olkoon jatkuvan satunnaismuuttujan X tiheysfunktio f. Jotta f olisi tiheysfunktio on f(x) 0, jokaisella x:n arvolla sekš f(x)dx = 1 eli f(x):n ja x-akselin všliin jššvš pinta-ala = 1. Tiheysfunktio kuvaa siis ykkšsen suuruisen todennškšisyysmassan jakaumaa.tšllšin X:n odotusarvo E(X) mššritellššn E(X) = xf(x)dx = µ, sekš varianssi Var(X) Var(X) =E[(X-µ) 2 ] = (x-e(x)) 2 f(x)dx =σ 2 ja keskihajonta Sd(X)= Var(X) = σ. Odotusarvo kuvaa jakauman keskikohtaa ja varianssi mittaa miten tiiviisti todennškšisyysmassa on keskittynyt odotusarvon ympšrille (vrt. empiiriset jakaumat). 31 Olkoon X jatkuva satunnaismuuttuja sekš a ja b reaalilukuja (a b), tšllšin a P(X a) = P(X<a) = F(a) = f(x)dx P(X a) = P(X>a) = 1-P(X a) = 1-F(a) P(a<X<b)= P(a X<b) = P(a<X b) = P(a X b) = F(b)-F(a) Graafisesti: Esim Olkoon X= satunnaisesti všliltš [0,1] valittu reaaliluku. MŠŠritŠ X:n tiheysfunktio sekš kertymšfunktio. Laske lisšksi P(X>0.25), P(0.5 X 0.75),P(X a). Laske vielš E(X) ja Var(X) (Vast. f(x)=1, 0 x 1; E(X)=1/2,Var(X)= 1/12). Olkoon E(X)=µ ja Var(X)=σ 2. TŠllšin muuttuja X standardoidaan tekemšllš muunnos Z=(X-µ)/σ 32

9 3.4. ODOTUSARVON JA VARIANSSIN OMINAISUUKSIA Odotusarvon ominaisuuksia 1. E(a)=a, a vakio 2. E(aX+b)=aE(X)+b, X sat. muuttuja ja a,b vakioita (ax+b myšs satunnaismuuttuja) 3. Olkoon X 1, X 2,..., X n satunnaismuuttujia, jolloin myšs X 1 +X X n on satunnaismuuttuja ja E(X 1 +X X n )=E(X 1 )+E(X 2 )+...+E(X n ) 4. Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin E(XY)=E(X)E(Y). Satunnaismuuttujien riippumattomuus mššritellššn vastaavalla tavalla kuin tapahtumien riippumattomuuskin. Diskreetin satunnaismuuttujan yhteydessš: Satunnaismuuttujat ovat riippumattomia, joss P(X=x i ja Y=y i )=P(X=x i )P(Y=y i ), i,j 33 Varianssin ominaisuuksia 1. Var(a)=0, a vakio 2. Var(X)=E(X 2 )-(E(X)) 2 3. Var(aX+b)=a 2 Var(X), a,b vakioita 4. Sd(aX+b)= a Sd(X), a,b vakioita 5. Jos satunnaismuuttujat X 1,X 2,...,X n ovat riippumattomia, niin Var(X 1 +X X n ) =Var(X 1 )+Var(X 2 )+...+Var(X n ) 6. Olkoon X ja Y satunnaismuuttujia. TŠllšin Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y), missš Cov(X,Y)=E((X-E(X))(Y-E(Y)) = σ XY on satunnaismuuttujien X ja Y všlinen kovarianssi, joka on nolla, jos X ja Y ovat riippumattomia. Kovarianssi liittyy muuttujien X ja Y yhteisjakaumaan. Satunnaismuuttujien X ja Y všlinen korrelaatiokerroin ρ XY = Cov (X,Y)/Sd(X)Sd(Y). Esim Olkoon E(X)=µ ja Var(X)=σ 2. MŠŠritellŠŠn Z=(X-µ)/σ Laske E(Z) ja Var(Z). (Vast. 0; 1) 34 Esim Olkoon X ja Y riippumattomia satunnaismuuttujia sekš mššritellššn Z=X-Y. Olkoon Sd(X) = σx ja Sd(Y) = σy sekš E(X) = µx ja E(Y) = µy. Laske Z:n odotusarvo ja keskihajonta. Esim Olkoon X 1,X 2,..., X n riippumattomia satunnaismuuttujia siten, ettš E(X i ) = µ ja Var(X i ) = σ 2. MŠŠritellŠŠn Y=(X 1 +X X n )/n. Laske E(Y) ja Var(Y). (Vast. µ, σ 2 /n) 35 Esim Sijoitetaan 1000 mk. Mahdollisia kohteita A ja B. Olkoon X=1 mk:n tuotto kohteesta A, Y=1 mk:n tuotto kohteesta B. Olkoon X ja Y riippumattomia sekš E(X)=E(Y)=µ ja Var(X)=Var(Y)=σ 2. Miten sijoitat? (Newbold) Esim Tarkastellaan kahta satunnaismuuttujaa X ja Y. Olkoon P(X=6, Y=1) = P(X=6, Y=3)= P(X=8, Y=2) = P(X=10, Y=1) = P(X=10, Y=3) = 0.2. Laske Cov(X,Y) sekš ρ. (Vast. 0; 0) 36 Esim Sijoitat 1000 mk. Mahdollisia sijoituskohteita A ja B, joissa molemmissa pienin sijoitusmššrš 500 mk. Olkoon X=tuotto 100 mk:n sijoituksesta A:han, Y= tuotto 100 mk:n sijoituksesta B:hen. Olkoon lisšksi P(X=-5)=0.4, P(X=20)=0.6, P(Y=0)=0.6, P(Y=25)=0.4 sekš sijoitukset toisistaan riippumattomia. Miten sijoittaisit? (Ohje: Paras sijoitus sellainen, jonka tuotolla suurin odotusarvo ja pienin varianssi) (Newbold)

10 3.5. YLEISESTI SOVELLETTUJA TODENN K ISYYSJAKAUMIA 1. BERNOULLI-JAKAUMA Tarkastellaan satunnaisilmištš, jossa joko onnistutaan (A) tai epšonnistutaan (A C ). MŠŠritellŠŠn satunnaismuuttuja X siten, ettš X = 1, jos onnistutaan 0, jos epšonnistutaan. Olkoon lisšksi P(A)=P(X=1)=p ja P(A C )=P(X=0)=q=1-p. TŠllšin sanotaan, ettš X noudattaa Bernoullijakaumaa parametrillš p. MerkitŠŠn X~ÊBer(p). Jos X~ÊBer(p), niin E(X)= p ja Var(X) = p(1-p) = pq. Esim Rahanheitto, veikkauksessa yhden kohteen arvaaminen, nopanheitto onnistumisena silmšluvun 6 saaminen, BINOMIJAKAUMA Tarkastellaan vakioveikkausta. MŠŠritellŠŠn satunnaismuuttuja X = oikein arvattujen kohteiden kokonaislukumššrš. TehtŠvŠnŠ on mššrittšš X:n todennškšisyysjakauma. TŠllšin pššdytššn nk. binomijakaumaan. Olkoon satunnaisilmišssš onnistumisen todennškšisyys p. Toistetaan tštš satunnaisilmištš n kertaa. MŠŠritellŠŠn X= onnistumisten kokonaislukumššrš. TŠllšin sanotaan, ettš X noudattaa binomijakaumaa parametrein n ja p. MerkitŠŠn X~ÊBin(n,p). Jos X~ÊBin(n,p), niin P(X=k)= n k p k ( 1 p) n k, k=0,1,2,...n ja E(X)=np sekš Var(X)=np(1-p)=npq. Binomijakaumaa noudattava satunnaismuuttuja mššritellššn siis itse asiassa Bernoulli-jakaumaa noudattavien satunnaismuuttujien summana. Olkoon 38 X i ~ÊBer(p), jolloin toistettaessa Bernoullikoetta n kertaa, onnistumisten kokonaislukumššrš voidaan mššritellš X=X 1 +X X n ja tšllšin siis X~ÊBin(n,p). TŠmŠn summamuuttujan avulla saadaan laskettua binomijakauman odotusarvo ja varianssi. Esim Veikataan satunnaisesti yksi rivi. MŠŠritellŠŠn X=oikein arvattujen kohteiden kokonaislukumššrš. MŠŠritŠ X:n jakauma sekš sen odotusarvo. Laske P(X=0), P(X=13), P(X>11), P(X>3). (Ohje: X ~ Bin(13, 1/3)) Esim Pelaat ystšvšsi kanssa peliš, jossa heitetššn rahaa. Jos tulee klaava saat ystšvšltšsi markan, jos tulee kruunu annat ystšvšllesi markan. On heitetty rahaa 20 kertaa ja olet tappiolla 14 markkaa eli on tullut 17 kruunua ja 3 klaavaa. Onko syytš tutkia rahaa tarkemmin? Jos raha harhaton, niin X=klaavojen lukumššrš 20 heitossa ~ÊBin(20,1/2). MillŠ todennškšisyydellš olet 39 všhintššn 14 mk tappiolla? P(X 3) =P(X=0)+P(X=1)+P(X=2)+P(X=3) =... = On siis sattunut tapahtuma, jonka todennškšisyys on hiukan yli 1/1000 tai pelissš oleva raha on harhainen ja antaa kruunun useammin kuin klaavan. 3. HYBERGEOMETRINEN JAKAUMA Tarkastellaan lottoamista. MŠŠritellŠŠn satunnaismuuttuja X = lottorivissš oikeitten lukumššrš. Lotossa populaation koko on 39, josta arvotaan palauttamatta 7 ÒoikeaaÓ. Kun tšytetššn lottorivi, niin siinš voi olla oikein 0, 1, 2,... tai 7. Kun halutaan selvittšš nšiden arvojen todennškšisyydet, voidaan kšyttšš hyvšksi nk. hypergeometrista jakaumaa. Populaatiossa on N alkiota, joista K kpl on "viallisia". TehdŠŠn tšstš populaatiosta palauttamatta yksinkertainen satunnaisotos, jonka koko on n. MŠŠritellŠŠn X= viallisten 40

11 lukumššrš otoksessa. TŠllšin X noudattaa nk. hypergeometrista jakaumaa parametrein N, K, n. MerkitŠŠn X~ÊHyp(N,K,n). Jos X~ÊHyp(N,K,n), niin K N K k n k P(X=k)=, k=0,1,2,...n N n E(X)=n(K/N), Var(X)=n(K/N)(1-K/N)((N-n)/(N-1)) Esim Laske todennškšisyys sille, ettš lotossa saa k oikein. MŠŠritŠ myšs odotusarvo oikeitten lukumššršlle. (Vast. E(X)=1.26) Esim Olkoon 15 tuotteen joukossa 5 virheellistš. Valitaan tšstš joukosta satunnaisesti 3 tuotetta. Laske todennškšisyys, ettš valittujen kolmen tuotteen joukossa on korkeintaan yksi virheellinen, kun valinta tehty a) palauttaen b) palauttamatta. (Vast , 0.758) (Helenius) POISSON JAKAUMA Esimerkiksi tarkasteltaessa hirvikolareiden (harvinaisten tapahtumien) lukumššršš viikoittain (tietyllš aikavšlillš) voidaan lukumššršn todennškšisyysjakaumana kšyttšš nk. Poisson-jakaumaa. Olkoon satunnaismuuttujan X mahdolliset arvot 0, 1, 2,... ja P(X=k)= λk k! e λ, k=0,1,2,... TŠllšin sanotaan X:n noudattavan Poissonjakaumaa parametrilla λ. MerkitŠŠn X~ÊPoi(λ). TŠllšin E(X)=λ, Var(X)=λ. TŠllaisiin satunnaismuuttujiin tšrmšš, kun on kiinnostunut harvinaisten tapahtumien lukumššršstš tietyllš aikavšlillš, tietyllš matkalla... vaikkapa liikenneonnettomuuksien lkm pšivšssš, painovirheitten lkm sivulla jne. 42 Esim Puhelinlaitokselle tulee satunnaisesti vikailmoituksia, keskimššrin kolme viikossa. MillŠ todennškšisyydellš tietyllš viikolla a) ei tule yhtššn vikailmoitusta b) tulee yksi vikailmoitus? (Oletetaan Poissonjakauma) (Vast. 0.05, 0.15) (Helenius) Esim Sairaalassa seurataan infektioiden lukumššršš. ErŠŠnŠ vuonna infektioiden lukumššrš oli 900 eli keskimššrin kuukaudessa 75. Voidaan olettaan, ettš X=infektioiden lkm kuukaudessa~ Poi(75). TŠllšin E(X)=75, Var(X)=75, P(X=k)= Poisson-jakauma soveltuu harvinaisten tapahtumien yhteydessš binomijakauman approksimointiin, kun n on riittšvšn suuri. Esim Suuressa populaatiossa tiedetššn aiemmin olleen 4% všrisokeita. Nykyisen tilanteen selvittšmiseksi valitaan populaatiosta satunnaisesti 200 henkilšš. MillŠ todennškšisyydellš 200 valitun joukossa on korkeitaan viisi všrisokeaa, jos populaatiossa edelleen on 4% všrisokeita? (Vast. Poisson-jakauman avulla approksimoitu 0.191) (Helenius) GEOMETRINEN JAKAUMA Avainnipussa on 5 avainta, joista yksi avaa oven. Valitaan satunnaisesti avaimen, jolla koetetaan avata ovi. Jollei ovi aukea, palautetaan avain nippuun ja valitaa avain satunnaisesti uudellee. Nyt halutaan selvittšš todennškšisyys sille, ettš k. kerralla onnistutaan. TŠssŠ siis toistetaan satunnaiskoetta, jossa onnistutaan todennškšisyydellš 1/5. Seuraavassa jakaumassa on tilanne yleistettynš. Toistetaan satunnaiskoetta, jossa onnistutaan todennškšisyydellš p, kunnes onnistutaan 1. kerran. Olkoon X sen kerran jšrjestysnumero. TŠllšin sanotaan, ettš X noudattaa geometrista jakaumaa parametrillš p. MerkitŠŠn X~ÊGeo(p). Jos X~ÊGeo(p),niin P(X=k)= (1-p) k-1 p, k=1, 2,... ja E(X)=1/p ja Var(X)= (1-p)/p 2. Esim Kotiavaimen valinta nipusta palauttaen. Montako kertaa keskimššrin yrityksiš on tehtšvš? 44

12 DISKREETTI TASAJAKAUMA Noppaa heitettšessš voidaan mššritellš satunnaismuuttuja X = silmšluku. X:n mahdolliset arvot ovat 1, 2, 3, 4, 5, 6 ja jokaisen esiintymistodennškšisyys 1/6. TŠtŠ jakaumaa kutsutaan diskreetiksi tasajakaumaksi všlillš (1,6). Jos satunnaismuuttujan X arvot ovat kokonaislukuja a, a+1, a+2, a+3,...,a+(n-1)=b ja kukin n:stš arvo yhtš todennškšinen, niin sanotaan, ettš X noudattaa diskreettiš tasajakaumaa všlillš (a,b). MerkitŠŠn X~ÊTasd(a,b). TŠllšin E(X)= (a+b)/2 ja Var(X)= (n 2-1)/12. Esim Nopanheitto. Esim Olkoon X yksinumeroinen satunnaisluku. Mahdolliset arvot ovat siis 0,1,2,...,9 ja jokaisen arvon todennškšisyys 1/10. TŠllšin X~ÊTasd(0,9), E(X)= (0+9)/2 ja Var(X)=(10 2-1)/ JATKUVA TASAJAKAUMA Satunnaismuuttuja noudattaa jatkuvaa tasajakaumaa všlillš [a,b], jos sen tiheysfunktio f on f(x)=1/(b-a), kun a x b 0, muulloin. MerkitŠŠn X~ÊTas(a,b). TŠllšin E(X)= (a+b)/2 Var(X)=(b-a) 2 /12. Esim Aiemmat esim. 8. NORMAALIJAKAUMA Seuraava todennškšisyysjakauma on tilastotieteessš hyvin keskeinen. Tarkastellaan jatkuvaa satunnaismuuttujaa X, joka voi saada arvokseen kaikki reaaliluvut. Satunnaismuuttuja X noudattaa normaalijakaumaa parametrein µ ja σ 2 (σ>0), jos sen tiheysfunktio on f(x) = σ 2π e 1 2 x µ σ 2 - x TŠllšin E(X)= µ ja Var(X) = σ 2. MerkitŠŠn X~ÊN(µ,σ 2 ). Jos X~ÊN(µ,σ 2 ), niin sen tiheysfunktio on yksihuippuinen jakauma, symmetrinen odotusarvon suhteen varianssin kertoessa jakauman levittšytymisestš odotusarvon ympšrille. Esim Erilaisia normaalijakaumia graafisesti. Jos X~ÊN(0,1), niin sen tiheysfunktio on f(x) = 1 2π e 1 2 x2 - x KyseessŠ nk. standardoitu normaalijakauma. Usein merk. Z~ÊN(0,1), f(z)=φ(z) ja F(z)=P(Z z)=φ(z). Standardoidun normaalijakauman kertymšfunktion Φ(z)=P(Z z) arvoja on taulukoitu. Taulukoiden avulla voidaan laske erilaisia todennškšisyyksiš. Normaalijakauman symmetrisyydestš seuraa, ettš Φ(z)=1-Φ(-z). Graafisesti: Esim Olkoon Z~ÊN(0,1). Laske P(Z 1), P(Z 1.1), P(Z 1.14), P(Z -1), P(Z 0), P(-1 Z 1), P(-2 Z 2), P(-3 Z 3). Esim Olkoon Z~ÊN(0,1). MŠŠritŠ z, kun a) Φ(z)=0.75 b) Φ(z)=0.26. Jos X~ÊN(µ,σ 2 ), niin P(X a) voidaan laskea kšyttšen standardoitua normaalijakaumaa, sillš on osoitettavissa, ettš jos X~ÊN(µ,σ 2 ), niin Z=(X-µ)/σ ~ÊN(0,1).

13 49 50 Jos siis X~ÊN(µ,σ 2 ), niin P(X a) =P((X-µ)/σ (a-µ)/σ ) = Φ((a-µ)/σ), ja P(X a)=1-p(x a) =1-P((X-µ)/σ (a-µ)/σ ) = 1-Φ((a-µ)/σ) P(a X b)=p(x b)-p(x a) =P((X-µ)/σ (b-µ)/σ) -P((X-µ)/σ (a-µ)/σ) = Φ((b-µ)/σ)-Φ((a-µ)/σ). Esim Tehdas valmistaa sšhkšlamppuja, joiden kšyttšikš vaihtelee tavalla, joka on hyvin luonnehdittavissa normaalijakauman avulla. Valmistettavien lamppujen keskimššršinen kestoikš on 800 tuntia ja vaihtelua esiintyy niin, ettš keskihajonta on 40 tuntia. a) MillŠ todennškšisyydellš valmistettavien lamppujen joukosta satunnaisesti valittu lamppu kestšš všhintššn 700 tuntia mutta korkeintaan 850 tuntia? b) MikŠ on sellainen arvo, jonka alle lampun kestoikš jšš 0.25 suuruisella todennškšisyydellš? c) MikŠ on sellainen arvo, jonka yli lamppu kestšš 0.25 suuruisella todennškšisyydellš? (Vast , 773.2, 826.8) (Helenius) Esim Laske todennškšisyydet, ettš normaalijakaumassa satunnaismuuttujan arvo on korkeitaan a) hajonnan pššssš odotusarvosta,b) kahden hajonnan pššssš odotusarvosta, c) kolmen hajonnan pššssš odotusarvosta. Normaalijakaumaan liittyviš keskeisiš teoreettisia tuloksia 1) Jos X~ÊN(µ,σ 2 ), niin ax+b~ên(aµ+b,a 2 σ 2 ), (a,b vakioita) 2) Jos X 1, X 2,..., X n ovat riippumattomia ja Xi~ÊN(µ i,σ 2 i ), niin X 1 + X X n ~ÊN(µ 1 +µ µ n,σ 2 1 +σ σn 2 ) 3) Keskeinen raja-arvolause: Olkoon X 1, X 2,..., X n riippumattomia satunnaismuuttujia, joista kukin noudattaa omaa jakaumaansa. Olkoon E(X i )=µ i ja 51 yleisten ehtojen vallitessa) satunnaismuuttuja X 1 + X X n noudattaa likimain normaalijakaumaa (kun n riittšvšn iso) parametrein µ 1 +µ µ n ja σ 1 2 +σ σn 2. Esim Olkoon X 1, X 2, X 3, X 4 riippumattomia ja kukin X i ~ÊN(0,1). MŠŠritellŠŠn U=(X 1 + X 2 + X 3 +X 4 )/4. Laske P(U 1). Olkoon X 1, X 2,..., X n riippumattomia ja kukin X i ~ÊN(µ,σ 2 ), niin tšllšin U=(X 1 + X X n )/n~ên(µ,σ 2 /n). Otoskeskiarvon jakauma on siis normaalijakauma (ks.. otosjakaumat)! Vaikka X i :t eivšt olisikaan normaalisti jakautuneita, niin U olisi likimain normaalisti jakautunut keskeisen raja-arvolauseen perusteella. 52 Var(X i ) = σ i 2, i=1,2,...,n. TŠllšin (hyvin

14 Binomijakaumaa voidaan approksimoida normaalijakaumalla. Jos X~ÊBin(n,p), niin silloinhan X=X 1 + X X n, missš X i ~ÊBer(p). Keskeisen raja-arvolauseen mukaan (jos n on riittšvšn suuri) X noudattaa likimain normaalijakaumaa parametrein np ja npq. Approksimaatio on hyvš, jos n on suuri ja p ei ole kovin pieni eikš suuri. Esim Henkilš osallistuu tenttiin, jossa sataan všitteeseen vastataan všitteen olevan tosi tai epštosi ja vain toinen vaihtoehto on oikea. Jos henkilš vastaa kaikkiin kohtiin valitsemalla vaihtoehdon aina tšysin satunnaisesti, niin millš todennškšisyydellš hšn saa korkeintaan 60 oikeaa vastausta? (Helenius) Jatkuvuuskorjaus. Ks. Helenius s.252 Esim Levykaupan omistaja arvioi, ettš 20% asiakkaista suorittaa ostoksen. Laske todennškšisyys, ettš 180 asiakkaan joukosta ainakin 45 suorittaa ostoksen (binomijakaumaa voidaan approksimoida normaalijakaumalla). (Newbold) 53 Esim Muutaman všhšsateisen vuoden jšlkeen tietyllš alueella epšillššn sššolosuhteissa tapahtuneen pysyvšnluonteinen muutos. Vuotuisen sademššršn keskiarvoksi 100 vuoden ajalta oli saatu tuumaa ja keskihajonnaksi 6.11 tuumaa. LisŠksi vuotuinen sademššrš oli vaihdellut tavalla, jota voidaan luonnehtia normaalijakaumalla. Viimeisen viiden vuoden sademššršn keskiarvoksi oli saatu tuumaa. MillŠ todennškšisyydellš nšin paljon lukua pienempi keskiarvo olisi odotettavissa, mikšli viiden viimeisen vuoden havainnon tulkitaan olevan yksinkertainen satunnaisotos normaalijakaumasta odotusarvona ja keskihajontana 6.11? (Helenius) Esim Oletetaan, ettš opiskelijoiden ŠlykkyysosamŠŠrŠ ~ N(µ,225). Kuinka suuri otos tarvitaan, kun halutaan, ettš otoskeskiarvo poikkeaa µ:stš korkein ±2 pistettš todennškšisyydellš 0.99? OTOS, OTOSSUURE, OTANTAJAKAUMA Kun populaation on hyvin suuri tai ŠŠretšn ei tietenkššn voida tutkia koko populaatiota. TŠllšin tilastolliset johtopšštelmšt, jotka koskevat populaation l. perusjoukon (ŠŠrellinen tai ŠŠretšn) ominaisuuksia tehdššn otoksen avulla. Jotta erilaisten otoksesta laskettujen tunnuslukujen luotettavuutta voidaan arvioida otos valitaan poimimalla se todennškšisyysotannalla. TodennŠkšisyysotannassa kaikki mahdolliset n alkion otokset voidaan luetella, tunnetaan jokaisen mahdollisen otoksen poimintatodennškšisyys ja otokset poimitaan nšiden todennškšisyyksien mukaan sekš tiedetššn, miten otoksen perusteella yleistetššn tulokset koko populaatioon. Jatkossa tarkastellaan pššosin vain yksinkertaisella satunnaisotannalla tehtyyn otokseen liittyviš tuloksia. LisŠksi ollaan kiinnostuneita vain yhdestš populaation alkioihin liittyvšstš ominaisuudesta, 55 muuttujasta. Yksinkertainen satunnaisotos (YSO) poimitaan siten, ettš jokaisella n alkion suuruisella otoksella on yhtš suuri todennškšisyys tulla poimituksi. KŠytŠnnšssŠ ei muodosteta kaikkia n alkion osajoukkoja, joista sitten satunnaisesti valitaan yksi, vaan alkiot poimitaan yksi kerrallaan kunnes otoskoko on n. YSO voidaan tehdš joko palauttamatta tai palauttaen SATUNNAISOTOS Olkoon X 1, X 2,..., X n n:n satunnaismuuttujan jono. TŠtŠ jonoa sanotaan satunnaisotokseksi, jos X i :t ovat riippumattomia (merk.æ) ja noudattavat samaa jakaumaa. Sanonta ÒX 1, X 2,..., X n on satunnaisotos N(µ,σ 2 ):staó tarkoittaa sitš, ettš jokainen X i ~ÊN(µ,σ 2 ) ja X i :t ovat riippumattomia. 56

15 Kun ŠŠrettšmŠstŠ populaatiosta tehdššn otanta yksinkertaisella satunnaisotannalla (palauttaen tai palauttamatta) ja tarkastellaan yhtš tiettyš muuttujaa (tilastoyksikšn ominaisuutta), on kyse satunnaisotoksesta. Jos populaatio on ŠŠrellinen YSO palauttaen johtaa satunnaisotokseen, mutta palauttamatta ei, koska riippumattomuusoletus ei ole voimassa. Kuitenkin, jos populaatio on suuri YSO palauttamattakin johtaa lšhes riippumattomiin satunnaismuuttujiin. Satunnaisotos mššritellššn siis satunnaismuuttujien perusteella. NŠmŠ satunnaismuuttujat saavat arvot, kun otos on tehty. Siis otoksen tekemisen jšlkeen satunnaisotokselle saadaan arvot, jotka vaihtelevat otoksesta toiseen. Satunnaismuuttujista muodostetut funktiot kuten summat, tulot, jne. ovat myšs satunnaismuuttujia (esim. otoskeskiarvo, otosmaksimi, kruunujen lukumššrš 57 heittosarjassa). TŠten myšs satunnaisotoksesta muodostetut funktiot ovat satunnaismuuttujia. Esim Otoskeskiarvo X=(X 1 +X X n )/n on satunnaismuuttuja, joka saa arvon kun otos on tehty. Arvo vaihtelee otoksesta toiseen. Esim Olkoon X~ÊN(1,25). MikŠ on 10X:n jakauma? Laske P(0 X 5) ja P(0 10X 5). Esim Mutterin halkaisija X~ÊN(100,1). Valmistuvat mutterit saavat poiketa odotusarvosta korkeintaan yhden yksikšn verran. Laske todennškšisyys, ettš 10 alkion satunnaisotoksessa kaikki alkiot ovat hyvšksyttšviš. (Liski&Puntanen) 4.2. OTOSSUUREET JA OTOSJAKAUMAT Satunnaisotoksen avulla mššriteltyš funktiota, joka siis on satunnaismuuttuja, kutsutaan otossuureeksi. Koska otossuure on 58 satunnaismuuttuja, liittyy siihen todennškšisyysjakauma. Otossuureen todennškšisyysjakaumasta kšytetššn nimitystš otanta- tai otosjakauma. KŠyttškelpoisia otossuureita esim. otoskeskiarvo, otosvarianssi, otosmaksimi, prosenttiosuus otoksessa... Tarkasteltavan otossuureen todennškšisyysjakauma pyritššn mššrittšmššn, jolloin saadaan selville miten otossuure voi vaihdella otoksesta toiseen. TŠmŠ auttaa taas, kun olemme kiinnostuneita populaatioon liittyvistš arvioista perustaen arviot otokseen. Joidenkin otossuureiden otosjakaumia: 1) Otoskeskiarvon jakauma riippuen otantamenetelmšstš ja populaatiosta. 2) Viallisten %-osuus otoksessa 3) Olkoon satunnaisotos X 1, X 2,..., X n Tas(0,1):sta (siis jokainen X i ~ÊTas(0,1) ja X i :t ovat riippumattomia). MŠŠritellŠŠn otossuure 59 U= max{x i }. TŠssŠ tilanteessa voidaan otosjakauma mššrittšš tšsmšllisesti. 4) Olkoon X 1, X 2,..., X n satunnaisotos jakaumasta, jonka odotusarvo µ on ja varianssi σ 2. TŠllšin tiedetššn, ettš E(X) = µ ja Var (X) =σ 2 /n. Otoskeskiarvon jakauma tunnetaan esim. silloin kun, otos on normaalijakaumasta. Jos X 1, X 2,..., X n on satunnaisotos N(µ,σ 2 ):sta, niin tšllšin X ~ÊN(µ,σ 2 /n). LisŠksi voidaan keskeisen raja-arvolauseen perusteella sanoa, ettš (otoskoon ollessa riittšvšn suuri) otoskeskiarvo on likimain normaalisti jakautunut, vaikka satunnaisotos olisi peršisin jostain muusta kuin normaalijakaumasta. Otoskeskiarvon hajontaa sanotaan otoskeskiarvon keskivirheeksi. 60

16 Esim Olkoon satunnaisotos X 1, X 2,..., X 10 normaalijakaumasta parametrien 0 ja 1. Laske P(-1 X 1 1) ja P(-1 X 1). Esim Olkoon tentin tulos sekš miesettš naisopiskelijoilla ~ÊN(20,25). TehdŠŠn mies- ja naisopiskelijoista 25 alkion sat. otokset. Laske todennškšisyys, ettš naisten pistekeskiarvo on ainakin 2 pistettš suurempi kuin miesten. (Liski&Puntanen) Esim Olkoon X 1, X 2,..., X n satunnaisotos N(µ 1,σ 1 2 ):sta ja Y1, Y 2,..., Y m on satunnaisotos N(µ 2,σ 2 2 ) :sta. MŠŠritŠ X Y :n jakauma PARAMETRIEN ESTIMOINTI 5.1. PISTE-ESTIMOINTI Estimointi on populaation tuntemattoman parametrin arviointia sopivan otossuureen avulla. NŠin tehtšessš puhutaan pisteestimoinnista. Esimerkiksi voidaan estimoida populaation odostusarvoa otoskeskiarvolla, populaation varianssia otosvarianssilla. Esim Olkoon populaatiossa π % viallisia. PyritŠŠn arvioimaan π:tš otoksen perusteella. Olkoon X 1, X 2,..., X n satunnaisotos ko. populaatiosta. MŠŠritellŠŠn X i = 1, jos alkio viallinen = 0, jos alkio viaton. NŠin siis X i ~ÊBer(π/100), jolloin E(X i )=π/100 ja Var(X i ) =(1-π/100)π/100. Viallisten kokonaislukumššrš otoksessa on X=X 1 +X X n. 62 Luonnollinen arvio π:lle olisi vastaava luku otoksessa eli viallisten prosenttiosuus otoksessa p =100X/n=100(X 1 +X X n )/n. Kun p on otossuure, jolla estimoidaan π:tš; sanotaan, ettš p on π:n estimaattori. Kun otos on tehty, voidaan p:lle laskea arvo eli estimaatti. Otossuureen p odotusarvo ja varianssi: E(p)= Var(p)= 63 Esim TehdŠŠn 205 alkion satunnaisotos aikuisopiskelijoista. HeistŠ 53% aikoo ostaa autoon renkaat seuraavan vuoden kuluessa. Jos populaatiossa renkaiden ostajien osuus oletetaan olevan 50%, niin mikš on todennškšisyys sille, ettš satunnaisotoksessa ostajien osuus on 53% tai suurempi. (Newbold) Yksi tapa estimoida populaation parametri onkin tehdš se otoksesta lasketun vastaavan tunnusluvun avulla (analogiaperiaate): 64 Koska E(p)=π, niin sanotaan, ettš p on π:n harhaton estimaattori. Harhattomuus tarkoittaa siis sitš, ettš estimaattori antaa keskimššrin oikeita arvoja. Otossuureen p hajontaa sanotaan otoksen prosenttiosuuden keskivirheeksi. estimoitava parametri odotusarvo populaation varianssi populaation mediaani viallisten %-osuus populaatiossa estimaattori otoskeskiarvo otosvarianssi otosmediaani viallisten %-osuus otoksessa Keskeisen raja-arvolauseen perusteella voidaan sanoa, ettš p ~ÊN(π,(π(100-π)/n),likimain. Saatiin siis selville otossuureen p otosjakauma. On tietysti monenlaisia muitakin otossuureita, joita voidaan kšyttšš parametrien estimoinnissa. Estimaattorille voidaan asettaa erilaisia vaatimuksia. Harhattomuus on usein toivottu ominaisuus.

17 Olkoon θ populaation tuntematon, estimoitava parametri ja ˆθ sen estimaattori. TŠllšin sanotaan, ettš ˆθ on θ:n harhaton estimaattori, jos E( ˆθ)=θ. Harhattomuuden lisšksi estimaattorilla toivotaan olevan pienin mahdollinen varianssi. Jos estimaattori on harhaton ja sillš on pienin varianssi parametrin kaikkien harhattomien estimaattoreiden joukossa, sanotaa estimaattoria harhattomaksi minimivarianssiseksi estimaattoriksi eli tehokkaimmaksi estimaattoriksi. Kahdesta parametrin harhattomasta estimaattorista on tehokkaampi se, jolla on pienempi varianssi. Otoskoon kasvaessa toivotaan estimoinnin tarkentuvan eli estimaattorin jakauman keskittyvšn yhš tiiviimmin estimoitavan parametrin ympšrille. Jos estimaattorin varianssi lšhenee nollaa otoskoon kasvaessa rajatta, sanotaan, ettš estimaattori on tarkentuva. Luonnollinen vaatimus tietenkin estimaattorille on myšs se, 65 ettš kšytetššn kaikki otoksessa oleva informaation hyvšksi. Esim Olkoon X 1, X 2,..., X n satunnaisotos Tas(0,θ):stŠ. Halutaan estimoida jakauman ylšrajaa θ. TŠllšin 2X ja 2X 1 ovat harhattomia θ:n estimaattoreita, mutta Var(2X)<Var(2X 1 ), kun n>1. (Liski&Puntanen) Esim Otoskeskiarvo X on jakauman odotusarvon µ harhaton estimaattori, koska E(X) = µ. Aiemmin on myšs todettu, ettš Var (X) =σ 2 /n. LisŠksi voidaan osoittaa, ettš normaalijakauman tapauksessa µ:n harhattomien estimaattoreiden joukossa, otoskeskiarvolla on pienin varianssi. Esim Olkoon X 1, X 2,..., X n satunnaisotos populaatiosta, jonka varianssi on σ 2. Voidaan osoittaa, ettš otosvarianssi s 2 = 1 n 1 n i=1 ( X i X) 2 on σ 2 :n harhaton estimaattori eli E(s 2 ) =σ Vaikka otosvarianssi onkin populaation varianssin harhaton estimaattori, niin otoshajonta ei yleensš ole populaation hajonnan harhaton estimaattori. On olemassa tietysti monenlaisia estimointimenetelmiš edellš esitellyn lisšksi, mm. pienimmšn nelišsumman menetelmš, maximum likelihood -menetelmš LUOTTAMUSV LEJ Piste-estimointi tuottaa siis (otoksen teon jšlkeen) yhden luvun, jolla arvioidaan estimoitavaa parametria. Estimointiin liittyy tietysti aina epšvarmuutta. Usein halutaankin mššrštš yksittšisen arvon sijaan všli, jolla arvellaan tuntemattoman parametrin olevan. TŠllšin puhutaan všliestimoinnista. VŠliestimoinnissa muodostetaan nk. luottamusvšli vastaavan piste-estimaattorin ja piste-estimaattorin otantajakauman keskihajonnan eli estimaattorin keskivirheen avulla. 67 Olkoon A ja B satunnaisotoksen perusteella mššriteltyjš satunnaismuuttujia. VŠli (A,B) on parametrin θ 100(1-α)%:n luottamusvšli, jos P(A θ B)=1-α. KyseessŠ on siis satunnaisvšli, joka sisšltšš populaation tuntemattoman estimoitavan parametrin todennškšisyydellš 1-α. Kun otos on tehty, voidaan A:lle ja B:lle laskea arvot. NŠin saadaan všli (a,b), joka joko sisšltšš parametrin θ tai ei sisšllš. VŠlistŠ (a,b) kšytetššn myšs nimitystš luottamusvšli. Koska pššttely halutaan tehdš melko suurella varmuudella, valitaan α esim. 0.10, 0.05, 0.01; on kyse 90%:n, 95%:n tai 99%:n luottamusvšleistš. MŠŠritellŠŠn kšyttškelpoinen merkintš. Olkoon Z ~ N(0,1). MŠŠritellŠŠn z α siten, ettš P(Z z ) α = α. Samoin z α/2 siten, ettš P(Z z ) α/2 = α/2. Esimerkiksi z = 1.64 ja 0.05 z 0.05/2 = z = Graafisesti: 68

18 Populaation odotusarvon luottamusvšli Halutaan arvioida poikien keskimššršistš syntymšpituutta. Otoksessa 65 pojan syntymšpituuden keskiarvo oli 50,95 cm ja keskihajonta 1.97 cm (SAIDIT - aineisto). Miten voisi arvioida poikapopulaation keskiarvoa? Seuraavaksi arvioidaan normaalijakauman odotusarvoa, kun tunnetaan populaation varianssi. (NŠinhŠn ei tietysti voitu edellš poikien keskipainon arvioinissa edellš olettaa!) Olkoon nyt X 1, X 2,..., X n satunnaisotos N(µ,σ 2 ):sta, missš σ 2 tunnettu. TŠllšin Z = X µ σ / n ~N(0,1), jolloin P X µ σ / n = 0.95 Kirjoittamalla lausuttu tapahtuma toiseen muotoon saadaan P( X 1. 96σ / n µ X σ / n) = 0.95 Voidaan sanoa, ettš epšyhtšlšt toteutuvat todennškšisyydellš VŠliŠ ( X 1. 96σ / n,x σ / n) sanotaan µ :n 95%:n luottamusvšliksi. LuottamusvŠlin mššritelmšssš X on siis satunnaismuuttuja, jonka arvot vaihtelevat otoksesta toiseen. Havaitun otoksen perusteella saadaan kiinteš všli, jota myšs kutsutaan luottamusvšliksi. TŠmŠn sššnnšn mukaan laskettu všli pitšš sisšllššn 95 %:n todennškšisyydellš tuntemattoman populaatiokeskiarvon µ. Poimittaessa monta otosta ja laskettaessa joka kerta edellš esitetty luottamusvšli, niin luottamusvšleistš n. 95 % on sellaisia, jotka sisšltšvšt µ:n. Vastaavalla tavalla kuin 95 %:n luottamusvšli, voidaan muodostaa vaikkapa 90 %:n ja 99 %:n luottamusvšlit. Yleisesti, jos 0< α <1 ( tavallisesti 0.1, 0.05, 0.01), niin 100(1-α ) %:n luottamusvšli populaation odotusarvolle µ, kun varianssi tunnettu, on X ± z α/2 σ / n Esim Oletetaan, ettš henkilšltš otetusta yhdestš verinšytteestš suoritetut toistuvat kolesteroliarvojen mššritykset erilaisista mittausvirheistš johtuen noudattavat likimain normaalijkaumaa, jonka odotusarvo on henkilšn todellinen kolesteroliarvo. Oletetaan lisšksi, ettš mššrittšmiseen liittyen vaihtelun tiedetššn keskihajonnan avulla ilmaistuna olevan 0.5 yksikšn suuruusluokkaa. NeljŠssŠ mššrityksessš henkilšn kolesteroliarvoiksi saatiin 5.8, 5.7, 4.8, 5.9. MŠŠritŠ všli, jolle henkilšn kolesteroliarvon voidaan arvella kuuluvan. (Helenius) Esim TehdŠŠn satunnaisotos N(µ,9):stŠ ja saadaan otoskeskiarvoksi 10. Muodostetaan 90%, 95% ja 99% luottamusvšlit µ:lle, kun otoskoko 10, 50 ja 100. EdellŠ esitetyssš oletettiin, ettš meillš on 71 satunnaisotos normaalijakaumasta, jolloin otoskeskiarvon jakauma on myšs normaalijakauma. EsitettyŠ luottamusvšlin laskukaavaa voidaan kuitenkin kšyttšš otoskoon ollessa suuri siinškin tapauksessa, ettš satunnaisotos on peršisin jostain muusta kuin normaalijakaumasta. TŠllšinhŠn keskeisen raja-arvolauseen perusteella otoskeskiarvon jakauma on likimain normaalijakauma. EdellŠ esitetyssš oletettiin myšs, ettš jakauman varianssi on tunnettu. KŠytŠnnšssŠ harvemmin tietysti populaation varianssia tunnetaan (esim. poikien keskipainon arviointi.) TŠllšin se onkin estimoitava otoksen perusteella, otosvarianssin avulla. Olkoon nyt siis X 1, X 2,..., X n satunnaisotos N(µ,σ 2 ):sta, missš σ 2 tuntematon. TŠllšin satunnaismuuttuja t = X µ s/ n noudattaa ns. Studentin t-jakaumaa vapausastein n-1. 72

19 73 74 Studentin t-jakauma, joka mššritellššn nk. vapausastein (df), on jatkuva, origon suhteen symmetrinen jakauma. MerkitŠŠn t df (tai t(df)). Suurilla vapausasteilla t-jakauma lšhestyy standardoitua normaalijakaumaa. Studentin t-jakauman kertymšfunktion arvoja eri vapausastein on taulukoitu. Esim P(t 10 >1.812) = 0.05 P(t ) = =0.975 P(t ) = Olkoon t df Studentin t-jakaumaa noudattava satunnaismuuttuja. MŠŠritellŠŠn tα;df siten, ettš P(t df tα;df)=α ja P(t df tα/2;df)=α/2 Graafisesti: Esim t 0.05;10 = 1.812; t 0.05;30 = 1.697; t 0.01;10 = 2.821; t 0.01;30 =2.457 Nyt 100(1- α ) %:n luottamusvšli populaation odotusarvolle µ, kun varianssi tuntematon, on X ± t α/2;n 1 s/ n Vaikka otos ei olisikaan peršisin normaalijakaumasta, voidaan taas riittšvšn suurilla n:n arvoilla luottamusvšli laskea edellš esitetyllš tavalla. Esim Halutaan arvioida poikien keskimššršistš syntymšpituutta. Otoksessa 65 pojan syntymšpituuden keskiarvo oli 50,95 cm ja keskihajonta 1.97 cm (SAIDIT - aineisto). Esim Esimerkki olettaen kolesteroliarvon mššrittšmiseen liittyvšn vaihtelun olevan tuntematon. NeljŠssŠ mššrityksessš henkilšn kolesteroliarvoiksi saatiin 5.8, 5.7, 4.8, 5.9. TŠsŠt otoksesta laskettu keskiarvo on 5.55 ja keskihajonta MŠŠritŠ všli, jolle henkilšn kolesteroliarvon voidaan arvella kuuluvan. Esim TietyssŠ yskšnlšškkeessš pitšisi tuoteselostuksen mukaan olla alkoholia 5 %. TiedetŠŠn, ettš alkoholipitoisuus vaihtelee jonkin verran pullosta toiseen. TietyssŠ laboratorioissa halutaan tutkia voidaanko valmistajan ilmoittamaa lukua pitšš sopivana keskiarvona eri pullojen alkoholipitoisuudelle. LŠhdetŠŠn oletuksesta, ettš alkoholipitoisuuden vaihtelu pullosta toiseen on luonnehdittavissa normaalijakauman avulla. Suoritettiin koe, jossa kymmenen pullon alkoholipitoisuus mitattiin ja saatiin seuraavat tulokset: 5.01, 4.87, 5.11, 5.21, 5.03, 4.96, 4.78, 4.98, 4.88 ja Onko valmistajan všittšmššn uskomista? (Helenius) Esim Luottokorttiyhtiš haluaa arvioida paljonko keskimššrin kuukaudessa ostetaan luottokortilla. Kahdentoista kuukauden kuukausiostosten keskiarvot (yhtš korttia kohden, dollareina) olivat 91.21, 98.26, , 65.93, 95.08, , 34.27, , , 53.91, , Muodosta 95%:n luottamusvšli keskimššršiselle kuukausiostoksen suuruudelle. (Vast. (77.45, )).(Newbold) Prosentuaalisen osuuden luottamusvšli Puolue haluaa arvioida kannatusprosenttinsa ja kysyy sadalta kansalaiselta mielipidettš. Sadan vastaajan joukossa on kannattajia 25%. Todellista kannatusprosenttia π ei siis tiedetš, mutta sitš voidaan arvioida muodostamalla luottamusvšli. Olkoon populaatiossa π % viallisia. Halutaan arvioida tštš lukua π satunnaisotoksen (otoskoko n) perusteella. Olkoon p = viallisten prosenttiosuus otoksessa. Nyt p ~ÊN(π,π(100-π)/n) (likimain), joten p π Z = ~N(0,1) (likimain). π(100 π)/n TŠmŠn perusteella saadaan (menetellen kuten odotusarvon luottamusvšlin yhteydessš ja korvaamalla p:n hajonnassa π estimaattorillaan p) 100(1- α ) %:n luottamusvšli π:lle: p ± z α/2 p(100 p) / n 76

20 Esim Yritys tekee tiettyš komponenttia, jota kšytetššn auton moottorissa. Yritys valvoo tuotantoaan; virheellisten komponenttien osuus ei saisi olla suurempi kuin 4 %. Laaduntarkkailussa tehtiin 500 komponentin otos, jossa 28 komponenttia osoittautui virheellisiksi. Voidaanko pšštellš, ettš prosessi tuottaa virheellisiš komponentteja yli sallitun rajan? Perustele pšštelmšsi. Esim Ruotsin EU-ŠŠnestyksen yhteydessš tehtiin nk. ovensuukysely, jossa 5000 ŠŠnestŠjŠltŠ kysyttiin miten hšn ŠŠnesti. HeidŠn joukossaan EU:hun liittymisen puolesta ŠŠnestŠneitŠ oli 57.6 %. Jos tšmšn kyselyn perusteella olisit arvioinut vaalitulosta, niin millš všlillš olisit arvellut ŠŠnestystuloksessa kannattajien osuuden olevan? KyllŠ-ŠŠniŠ annettiin 52.2 %. Miten ovensuukyselyn perusteella onnistuttiin ennustamaan kannattajien mššršš? 77 Esim Aamulehti : Aho nousee vahvasti, Uosukaisen luvut laskevat rajusti. Ò... MTV 3:n keskiviikkona julkistamassa, Research International - tutkimuslaitoksella teetetyssš gallupissa Aho noussut selvšsti presidenttikisan kšrkeen 37 prosentin kannatuksellaan. Halonen seuraa tiukasti Ahon kannoilla 32 prosentin kannatuksella.... Tutkimukseen vastasi 2012 ihmistš.... Virhemarginaali on kaksi prosenttiyksikkšš molempiin suuntiin.ó Miten virhemarginaali on laskettu? Presidentin vaalin 1. kierroksella Aho sai ŠŠnistŠ 34.6% ja Halonen 40.0%. 3. Kahden populaation odotusarvojen erotuksen luottamusvšli Jos halutaan selvittšš, ovatko pojat ja tytšt syntyessššn keskimššrin saman pituisia, niin tehdššn tyttš- ja poikapopulaatioista satunnaisotokset ja arvioidaan otoskeskiarvojen avulla kahden populaation 78 odotusarvojen yhtšsuuruutta. KŠytŠnnšssŠ populaatioiden varianssitkin ovat tuntemattomia, mutta lšhdetššn liikkeelle olettaen ne tunnetuiksi. Olkoon X 1, X 2,..., X n satunnaisotos N(µ 1,σ 2 1 ):sta ja olkoon Y 1, Y 2,..., Y m satunnaisotos N(µ 2,σ 2 2 ):sta, missš σ 1 ja σ 2 tunnettuja sekš satunnaisotokset toisistaan riippumattomia. TŠllšin X Y ~ N(µ 1 -µ 2, σ 2 1 /n+σ 2 2 /m), johon perustuen odotusarvojen erotuksen µ 1 - µ 2 100(1- α ) %:n luottamusvšli on 2 σ X Y z 1 α/2 n + σ m,x Y + z σ 1 α/2 n + σ 2 2 m KŠytŠnnšssŠ tietysti tilanne on sellainen, ettš populaatioiden variansseja ei tunneta. Olettaen varianssit tuntemattomiksi, mutta yhtš suuriksi voidaan otoskeskiarvojen erotuksen varianssia estimoida otosvarianssien avulla ja saadaan odotusarvojen erotuksen µ 1 - µ 2 100(1- α )%:n 79 luottamusvšli X Y ± t α/2;n+m 2 s 1 n + 1 m missä s 2 = (n 1)s 2 2 X + (m 1)s Y n + m 2 Suurten otosten tapauksessa tuloksia voidaan kšyttšš myšs muidenkin kuin normaalijakaumien yhteydessš. Jos populaatioiden varianssit ovat tuntemattomia eikš ole perusteltua olettaa yhtš suuruutta, niin silloin suurten otosten tapauksessa on mahdollista muodostaa odotusarvojen erotukselle luottamusvšli, jonka mššritys riippuu populaatio-oletuksista. (Ks. Helenius s ) Esim Ovatko tytšt ja pojat syntyessššn keskimššrin samanpituisia? Ks. Esim

Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, lukuvuosi 2011-2012

Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, lukuvuosi 2011-2012 Tilastollisten menetelmien perusteet I TILTP2 Luentorunko, lukuvuosi 2011-2012 Raija Leppälä 17. lokakuuta 2011 Sisältö 1 Johdanto 3 2 Todennäköisyyslaskentaa 5 2.1 Satunnaisilmiö ja tapahtuma 5 2.2 Klassinen

Lisätiedot

Todennäköisyysjakaumia

Todennäköisyysjakaumia 8.9.26 Kimmo Vattulainen Todennäköisyysjakaumia Seuraavassa esitellään kurssilla MAT-25 Todennäköisyyslaskenta esille tulleita diskreettejä todennäköisyysjakaumia Diskreetti tasajakauma Bernoullijakauma

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 27. syyskuuta 2007 Antti Rasila () TodB 27. syyskuuta 2007 1 / 15 1 Diskreetit jakaumat Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen

Lisätiedot

Todennäköisyyslaskenta sivuaineopiskelijoille

Todennäköisyyslaskenta sivuaineopiskelijoille Todennäköisyyslaskenta sivuaineopiskelijoille Tentit: 4.11.2013 ja 2.12.2013. Loput kaksi tenttiä (vuonna 2014) ilmoitetaan myöhemmin. Tentissä on 4 tehtävää á 8 pistettä, aikaa 4 tuntia. Arvostelu 0 5.

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma Diskreetit todennäköisyysjakaumat Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma Satunnaismuuttuja Satunnaisilmiö on ilmiö, jonka lopputulokseen sattuma vaikuttaa Satunnaismuuttuja on muuttuja,

Lisätiedot

Tilastomatematiikka TUDI

Tilastomatematiikka TUDI Miika Tolonen http://www.mafy.lut.fi/tilmattudi Laboratory of Applied Mathematics Lappeenranta University of Technology 10. syyskuuta 2014 Sisältö I Johdanto 1 Johdanto 2 Satunnaiskokeet ja satunnaismuuttujat

Lisätiedot

B. Siten A B, jos ja vain jos x A x

B. Siten A B, jos ja vain jos x A x Mat-1.2600 Sovellettu todennäköisyyslaskenta B / Ratkaisut Aiheet: Johdanto Joukko-opin peruskäsitteet Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat: Alkeistapahtuma,

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

031021P Tilastomatematiikka (5 op) Kurssi-info ja lukion kertausta

031021P Tilastomatematiikka (5 op) Kurssi-info ja lukion kertausta 031021P Tilastomatematiikka (5 op) Kurssi-info ja lukion kertausta Jukka Kemppainen Mathematics Division Käytännön asioita Luennot (yht. 7 4 h) ke 12-14 ja pe 8-10 (ks. tarkemmin Oodista tai Nopasta) Harjoitukset

Lisätiedot

TILASTOMATEMATIIKKA. Keijo Ruohonen

TILASTOMATEMATIIKKA. Keijo Ruohonen TILASTOMATEMATIIKKA Keijo Ruohonen 20 Sisältö I PERUSOTOSJAKAUMAT JA DATAN KUVAUKSET. Satunnaisotanta.2 Tärkeitä otossuureita 2.3 Datan esitykset ja graafiset metodit 6.4 Otosjakaumat 6.4. Otoskeskiarvon

Lisätiedot

Johdatus tn-laskentaan perjantai 17.2.2012

Johdatus tn-laskentaan perjantai 17.2.2012 Johdatus tn-laskentaan perjantai 17.2.2012 Kahden diskreetin muuttujan yhteisjakauma On olemassa myös monen muuttujan yhteisjakauma, ja jatkuvien muuttujien yhteisjakauma (jota ei käsitellä tällä kurssilla;

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Määritelmä 3.1 (Ehdollinen todennäköisyys) Olkoot A ja B otosavaruuden Ω tapahtumia. Jos P(A) > 0, niin tapahtuman B ehdollinen todennäköisyys

Määritelmä 3.1 (Ehdollinen todennäköisyys) Olkoot A ja B otosavaruuden Ω tapahtumia. Jos P(A) > 0, niin tapahtuman B ehdollinen todennäköisyys Luku 3 Satunnaismuuttujat, ehdollistaminen ja riippumattomuus Tässä luvussa käsitellään satunnaismuuttujien ominaisuuksia ja täydennetään todennäköisyyslaskennan tietoja. Erityisesti satunnaismuuttujien

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Otanta ilman takaisinpanoa

Otanta ilman takaisinpanoa Otanta ilman takaisinpanoa Populaatio, jossa N alkiota (palloa, ihmistä tms.), kahdenlaisia ( valkoinen, musta ) Poimitaan umpimähkään (= symmetrisesti) n-osajoukko eli otos Merkitään tapahtuma A k = otoksessa

Lisätiedot

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten Todennäköisyys Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten tietoliikennejärjestelmien ymmärtämisessä

Lisätiedot

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa: Lisätehtäviä (siis vanhoja tenttikysymyksiä) 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15,

Lisätiedot

TKK @ Ilkka Mellin (2008) 1/5

TKK @ Ilkka Mellin (2008) 1/5 Mat-1.2620 Sovellettu todennäköisyyslaskenta B / Tehtävät Demo-tehtävät: 1, 3, 6, 7 Pistetehtävät: 2, 4, 5, 9 Ylimääräiset tehtävät: 8, 10, 11 Aiheet: Moniulotteiset jakaumat Avainsanat: Diskreetti jakauma,

Lisätiedot

031021P Tilastomatematiikka (5 op) viikot 5 6

031021P Tilastomatematiikka (5 op) viikot 5 6 031021P Tilastomatematiikka (5 op) viikot 5 6 Jukka Kemppainen Mathematics Division Jakauman tunnusluvut Jakauman tärkeimmät tunnusluvut ovat odotusarvo ja varianssi. Odotusarvo ilmoittaa jakauman keskikohdan

Lisätiedot

Johdatus tn-laskentaan torstai 16.2.2012

Johdatus tn-laskentaan torstai 16.2.2012 Johdatus tn-laskentaan torstai 16.2.2012 Muunnoksen jakauma (ei pelkkä odotusarvo ja hajonta) Satunnaismuuttujien summa; Tas ja N Vakiokerroin (ax) ja vakiolisäys (X+b) Yleinen muunnos: neulanheittoesimerkki

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Mitä tilastollinen analyysi on?

Mitä tilastollinen analyysi on? Mitä tilastollinen analyysi on? Tilastotiede (engl. statistics) on tieteenala, jonka kohteena ovat numeerisen tilastoaineiston keräämiseen ja muokkaamiseen, esittämiseen, tilastolliseen analyysiin ja tulosten

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Todennäköisyys (englanniksi probability)

Todennäköisyys (englanniksi probability) Todennäköisyys (englanniksi probability) Todennäköisyyslaskenta sai alkunsa 1600-luvulla uhkapeleistä Ranskassa (Pascal, Fermat). Nykyisin todennäköisyyslaskentaa käytetään hyväksi mm. vakuutustoiminnassa,

Lisätiedot

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus: 1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:

Lisätiedot

A = B. jos ja vain jos. x A x B

A = B. jos ja vain jos. x A x B Mat-1.2620 Sovellettu todennäköisyyslaskenta B / Ratkaisut Aiheet: Klassinen todennäköisyys ja kombinatoriikka Kokonaistodennäköisyys ja Bayesin kaava Avainsanat: Bayesin kaava, Binomikaava, Binomikerroin,

Lisätiedot

Johdatus todennäköisyyslaskentaan ja tilastotieteeseen. Stefan Emet

Johdatus todennäköisyyslaskentaan ja tilastotieteeseen. Stefan Emet Johdatus todennäköisyyslaskentaan ja tilastotieteeseen Stefan Emet Matematiikan ja tilastotieteen lts Turun yliopisto 24 Sisältö Johdanto. Todennäköisyys..................................2 Peruskäsitteitä.................................

Lisätiedot

Todennäköisyyslaskenta

Todennäköisyyslaskenta Todennäköisyyslaskenta Opintomoniste kurssille MAT-25 Todennäköisyyslaskenta, Tampereen teknillinen yliopisto Antti Perttula, Kimmo Vattulainen, Tia Suurhasko Versio 9/212 Sisältö 1 Todennäköisyys 3 1.1

Lisätiedot

Luku 1. Johdanto. 1.1 Todennäköisyys ja tilastotiede. 1.2 Havaitut frekvenssit ja empiiriset jakaumat

Luku 1. Johdanto. 1.1 Todennäköisyys ja tilastotiede. 1.2 Havaitut frekvenssit ja empiiriset jakaumat Luku 1 Johdanto 1.1 Todennäköisyys ja tilastotiede Tämä kurssi käsittelee sekä todennäköisyyslaskentaa että tilastotiedettä. Uhkapelurien ongelmat inspiroivat todennäköisyyslaskennan uranuurtajien ajattelua,

Lisätiedot

Lukion. Calculus. Todennäköisyys ja tilastot. Paavo Jäppinen Alpo Kupiainen Matti Räsänen Otava PIKATESTIN JA KERTAUSKOKEIDEN TEHTÄVÄT RATKAISUINEEN

Lukion. Calculus. Todennäköisyys ja tilastot. Paavo Jäppinen Alpo Kupiainen Matti Räsänen Otava PIKATESTIN JA KERTAUSKOKEIDEN TEHTÄVÄT RATKAISUINEEN Calculus Lukion 3 MAA Todennäköisyys ja tilastot Paavo Jäppinen Alpo Kupiainen Matti Räsänen Otava PIKATESTIN JA KERTAUSKOKEIDEN TEHTÄVÄT RATKAISUINEEN Todennäköisyys ja tilastot (MAA) Pikatesti ja kertauskokeet

Lisätiedot

Tilastotieteen perusteet

Tilastotieteen perusteet Tilastotieteen perusteet Esim. Arvostettu juoma-asiantuntija ekonomisti E osallistuu juomien makutestiin, jossa voi saada voi saada arvonimen Melko Suuri Maistaja (MSM *), Suuri maistaja (SM**) tai Erittäin

Lisätiedot

Osa 1: Todennäköisyys ja sen laskusäännöt. Klassinen todennäköisyys ja kombinatoriikka

Osa 1: Todennäköisyys ja sen laskusäännöt. Klassinen todennäköisyys ja kombinatoriikka Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Klassinen todennäköisyys ja kombinatoriikka TKK (c) Ilkka Mellin (2007) 1 Klassinen todennäköisyys ja kombinatoriikka >> Klassinen

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen

Lisätiedot

A-Osio. Ei saa käyttää laskinta, maksimissaan tunti aikaa. Valitse seuraavista kolmesta tehtävästä kaksi, joihin vastaat:

A-Osio. Ei saa käyttää laskinta, maksimissaan tunti aikaa. Valitse seuraavista kolmesta tehtävästä kaksi, joihin vastaat: MAA6 Loppukoe 26..203 Jussi Tyni Muista merkitä vastauspaperiin oma nimesi ja tee etusivulle pisteytysruudukko. Kaikkiin tehtävien ratkaisuihin välivaiheet näkyviin! Lue ohjeet huolella! A-Osio. Ei saa

Lisätiedot

1. Matikan kurssin arvosanat jakautuivat seuraavalla tavalla:

1. Matikan kurssin arvosanat jakautuivat seuraavalla tavalla: MAA6.3 Loppukoe 9.11.01 Jussi Tyni Valitse kuusi tehtävää Muista merkitä vastauspaperiin oma nimesi ja tee etusivulle pisteytysruudukko. Kaikkiin tehtävien ratkaisuihin välivaiheet näkyviin! 1. Matikan

Lisätiedot

3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4

3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4 Ü µ ½ ¾Ü¾µ Ü¾Ê 3.11.2006 1. Satunnaismuuttujan tiheysfunktio on ¼ ļ ܽ ܾ ÜÒµ Ä Ü½ ÜÒµ Ò Ä Ü½ ܾ ÜÒµ ܽ µ ܾ µ ÜÒ µ Ò missä tietenkin vaaditaan, että ¼. Muodosta :n ¾Ä ܽ ÜÒµ Ò ½¾ ܾ Ò ½ ¾Ü¾½µ ½ ¾Ü¾Òµ

Lisätiedot

Luonnollisen kielen tilastollinen käsittely. T-61.281 (3 ov) L. Luento 2, 21.1.2003. Luentokalvot: Krista Lagus ja Timo Honkela

Luonnollisen kielen tilastollinen käsittely. T-61.281 (3 ov) L. Luento 2, 21.1.2003. Luentokalvot: Krista Lagus ja Timo Honkela Luonnollisen kielen tilastollinen käsittely T-61.281 (3 ov) L Luento 2, 21.1.2003 Luennot: Laskuharjoitukset: Timo Honkela Vesa Siivola Luentokalvot: Krista Lagus ja Timo Honkela 0.1 Laskuharjoitukset

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut TKK (c) Ilkka Mellin (2007) 1 Jakaumien tunnusluvut >> Odotusarvo Varianssi Markovin ja Tshebyshevin

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Stokastiikan perusteet

Stokastiikan perusteet Stokastiikan perusteet Lasse Leskelä 10. joulukuuta 2013 Tiivistelmä Tämä luentomoniste sisältää muistiinpanoja asioista, joita käsiteltiin Jyväskylän yliopiston kurssilla MATA280 Stokastiikan perusteet

Lisätiedot

1.1 Tilastomenetelmät luotettavan tutkimuksen perustana 1 1.1.1 Otos vs. näyte 1 1.1.2 Tilastollinen päättely ja tieteellisyyden kriteerit 2

1.1 Tilastomenetelmät luotettavan tutkimuksen perustana 1 1.1.1 Otos vs. näyte 1 1.1.2 Tilastollinen päättely ja tieteellisyyden kriteerit 2 Sisältö 1 JOHDANTO 1 1.1 Tilastomenetelmät luotettavan tutkimuksen perustana 1 1.1.1 Otos vs. näyte 1 1.1. Tilastollinen päättely ja tieteellisyyden kriteerit TEOREETTINEN JAKAUMA 3.1 Satunnaismuuttuja

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 5.-7.11.2008. 1 Tällä viikolla Sisältösuunnitelma: Ennustamisstrategioista Koneoppimismenetelmiä: k-nn (luokittelu

Lisätiedot

Muista merkitä vastauspaperiin oma nimesi ja tee etusivulle pisteytysruudukko. Kaikkiin tehtävien ratkaisuihin välivaiheet näkyviin!

Muista merkitä vastauspaperiin oma nimesi ja tee etusivulle pisteytysruudukko. Kaikkiin tehtävien ratkaisuihin välivaiheet näkyviin! MAA6 Kurssikoe 1.11.14 Jussi Tyni ja Juha Käkilehto Muista merkitä vastauspaperiin oma nimesi ja tee etusivulle pisteytysruudukko. Kaikkiin tehtävien ratkaisuihin välivaiheet näkyviin! A-OSIO: Laske kaikki

Lisätiedot

1. Matikan kurssin arvosanat jakautuivat seuraavalla tavalla:

1. Matikan kurssin arvosanat jakautuivat seuraavalla tavalla: MAA6. Loppukoe 8.11.01 Jussi Tyni Valitse kuusi tehtävää Muista merkitä vastauspaperiin oma nimesi ja tee etusivulle pisteytysruudukko. Kaikkiin tehtävien ratkaisuihin välivaiheet näkyviin! 1. Matikan

Lisätiedot

MATEMATIIKKA 5 VIIKKOTUNTIA

MATEMATIIKKA 5 VIIKKOTUNTIA EB-TUTKINTO 2010 MATEMATIIKKA 5 VIIKKOTUNTIA PÄIVÄMÄÄRÄ: 4. kesäkuuta 2010 KOKEEN KESTO: 4 tuntia (240 minuuttia) SALLITUT APUVÄLINEET: Eurooppa-koulun antama taulukkovihkonen Funktiolaskin, joka ei saa

Lisätiedot

4. Tutkittiin kolikonheittäjän virheetöntä rahaa. Suoritettiin kymmenen

4. Tutkittiin kolikonheittäjän virheetöntä rahaa. Suoritettiin kymmenen MAT-20500 Todennäköisyyslaskenta Laskuharjoituksia / Periodi 2 / 2009-2010 1.1 Peruskäsitteitä 1. Totea Venn-diagrammien avulla oikeaksi demorganin lait A B = A B, A B = A B Jos otosavaruus on ihmiset

Lisätiedot

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008. Jatkossa ratkaisuehdotukset ovat tyypillisesti paljon lakonisempia.

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008. Jatkossa ratkaisuehdotukset ovat tyypillisesti paljon lakonisempia. ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2008 Harjoitus 1 Ratkaisuehdotuksia ja selittelyjä Tämänkertaiset ratkaisuehdotukset ovat pitkähköjä, ja ne sisältävät paljon selittelyjä. Jatkossa

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta.

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 9.3.2012 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

Todennäköisyyslaskenta 1/7 Sisältö ESITIEDOT: joukko-oppi, lukumäärän laskeminen, funktiokäsite Hakemisto

Todennäköisyyslaskenta 1/7 Sisältö ESITIEDOT: joukko-oppi, lukumäärän laskeminen, funktiokäsite Hakemisto Todennäköisyyslaskenta /7 Sisältö ESITIEDOT: joukko-oppi, n laskeminen, käsite Hakemisto Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennassa tarkastelun kohteena ovat satunnaisilmiöt.esimerkkejä

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 1 1 Matemaattisesta päättelystä Matemaattisen analyysin kurssin (kuten minkä tahansa matematiikan kurssin) seuraamista helpottaa huomattavasti, jos opiskelija ymmärtää

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta Tuloperiaate Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta ja 1. vaiheessa valinta voidaan tehdä n 1 tavalla,. vaiheessa valinta voidaan tehdä n tavalla,

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta

Ilkka Mellin Todennäköisyyslaskenta Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Johdanto: Deterministisyys ja satunnaisuus Todennäköisyyden määritteleminen Todennäköisyyslaskennan peruskäsitteet TKK (c)

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Tilastollisen päättelyn kurssi

Tilastollisen päättelyn kurssi Pekka Nieminen Pentti Saikkonen Tilastollisen päättelyn kurssi Helsingin yliopisto Matematiikan ja tilastotieteen laitos 2013 1. laitos 2004 2. laitos 2005 3. laitos 2006, korjattu 2007, 2009 ja 2013 http://www.iki.fi/pjniemin/paattely.pdf

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

031021P Tilastomatematiikka (5 op)

031021P Tilastomatematiikka (5 op) 031021P Tilastomatematiikka (5 op) Jukka Kemppainen Mathematics Division Käytännön asioita Luennot (yht. 11 4 h) ti 12-14 ja to 8-10 (ks. tarkempi opetusohjelma Oodista tms.) Harjoitukset (yht. 11 2 h)

Lisätiedot

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden peruslaskusäännöt

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden peruslaskusäännöt Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Todennäköisyyden peruslaskusäännöt TKK (c) Ilkka Mellin (2007) 1 Todennäköisyyden peruslaskusäännöt >> Uusien tapahtumien muodostaminen

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

3. a) Otetaan umpimähkään reaaliluku väliltä [0,1]. Millä todennäköisyydellä tämän luvun ensimmäinen desimaali on 2 tai toinen desimaali on 9?

3. a) Otetaan umpimähkään reaaliluku väliltä [0,1]. Millä todennäköisyydellä tämän luvun ensimmäinen desimaali on 2 tai toinen desimaali on 9? MAA6 Kurssikoe 1.10.20 Jussi Tyni Muista merkitä vastauspaperiin oma nimesi ja tee etusivulle pisteytysruudukko. Muista että välivaiheet perustelevat ratkaisusi! Lue ohjeet tarkasti! A-osio. Ei saa käyttää

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

5 Osa 5: Ohjelmointikielen perusteita

5 Osa 5: Ohjelmointikielen perusteita 5 Osa 5: Ohjelmointikielen perusteita 5.1 Omat funktiot R on lausekekieli: Kaikki komennot kuten funktiokutsut ja sijoitusoperaatiot ovat lausekkeita. Lausekkeet palauttavat jonkin arvon. Lausekkeita voidaan

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

Matematiikan opiskelun esteiden analysointi logistisella regressioanalyysillä

Matematiikan opiskelun esteiden analysointi logistisella regressioanalyysillä TAMPEREEN TEKNILLINEN YLIOPISTO Teknis-luonnontieteellinen osasto HELI RAASSINA Matematiikan opiskelun esteiden analysointi logistisella regressioanalyysillä DIPLOMITYÖ Aihe hyväksytty Teknis-luonnontieteellisen

Lisätiedot

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä. HUUTOKAUPOISTA A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä. 2. Huutokauppapelejä voidaan käyttää taloustieteen

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Jos d-kohdan vasemmalla puolella perusjoukkona on X, niin oikealla puolella

Jos d-kohdan vasemmalla puolella perusjoukkona on X, niin oikealla puolella DISKREETTI MATEMATIIKKA, harjoitustehtävät Tehtäviä tulee todennäköisesti lisää. Uudet tehtävät tulevat aikanaan ladattavaksi samalle sivulle, josta tämäkin moniste löytyi. Ilmoitustaululta on nähtävissä

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Kemometriasta Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka Mistä puhutaan? Määritelmiä Määritys, rinnakkaismääritys Mittaustuloksen luotettavuus Kalibrointi Mittausten

Lisätiedot

Luento 5: Peliteoriaa

Luento 5: Peliteoriaa Luento 5: Peliteoriaa Tässä kappaleessa tutustutaan hieman peliteoriaan. Keskeisiä asioita ovat Nash-tasapaino ja sekastrategia. Cournot n duopolimalli vuodelta 1838 toimii oivallisena havainnollistuksena

Lisätiedot

Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi

Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 29-31.10.2008. 1 Tällä viikolla 1. Käytännön järjestelyistä 2. Kurssin sisällöstä ja aikataulusta 3. Johdantoa Mitä koneoppiminen

Lisätiedot

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe 11.6.2012 klo 10 13 Ratkaisut ja pisteytysohjeet

Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe 11.6.2012 klo 10 13 Ratkaisut ja pisteytysohjeet Helsingin, Itä-Suomen, Jyväskylän, Oulun, Tampereen ja Turun yliopisto Matematiikan valintakoe 11.6.01 klo 10 13 t ja pisteytysohjeet 1. Ratkaise seuraavat yhtälöt ja epäyhtälöt. (a) 3 x 3 3 x 1 4, (b)

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Approksimatiivinen päättely

Approksimatiivinen päättely 218 Approksimatiivinen päättely Koska tarkka päättely on laskennallisesti vaativaa, niin on syytä tarkastella ratkaisujen approksimointia Approksimointi perustuu satunnaiseen otantaan tunnetusta todennäköisyysjakaumasta

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON? SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10

Lisätiedot

LAAJA TILASTO- MATEMATIIKKA. Armo Pohjavirta Keijo Ruohonen

LAAJA TILASTO- MATEMATIIKKA. Armo Pohjavirta Keijo Ruohonen LAAJA TILASTO- MATEMATIIKKA Armo Pohjavirta Keijo Ruohonen 2005 Sisältö ISATUNNAISUUS JA SEN MALLINTAMINEN. Kruunan ja klaavan satunnaisuus 4.2 Jatkuvan muuttujan satunnaisuus 5.3 Peruskäsitteitä 9 II

Lisätiedot

110. 111. 112. 113. 114. 4. Matriisit ja vektorit. 4.1. Matriisin käsite. 4.2. Matriisialgebra. Olkoon A = , B = Laske A + B, 5 14 9, 1 3 3

110. 111. 112. 113. 114. 4. Matriisit ja vektorit. 4.1. Matriisin käsite. 4.2. Matriisialgebra. Olkoon A = , B = Laske A + B, 5 14 9, 1 3 3 4 Matriisit ja vektorit 4 Matriisin käsite 42 Matriisialgebra 0 2 2 0, B = 2 2 4 6 2 Laske A + B, 2 A + B, AB ja BA A + B = 2 4 6 5, 2 A + B = 5 9 6 5 4 9, 4 7 6 AB = 0 0 0 6 0 0 0, B 22 2 2 0 0 0 6 5

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9 Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9 1.1 PARAMETRITTOMIEN MENETELMIEN LYHYT HISTORIA 11 1.2 PARAMETRITTOMAT MENETELMÄT IHMISTIETEISSÄ

Lisätiedot

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1. Kotitehtävät, tammikuu 2011 Vaikeampi sarja 1. Ratkaise yhtälöryhmä w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1. Ratkaisu. Yhtälöryhmän ratkaisut (w, x, y, z)

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

T-61.281 Luonnollisen kielen tilastollinen käsittely

T-61.281 Luonnollisen kielen tilastollinen käsittely T-6.8 Luonnollisen kielen tilastollinen käsittely Ratkaisut. Ti 7..4, 8:5-: Palautellaan mieliin todennäköisyyslaskuja Versio.. Todennäköisyyksistä ensimmäinen P( sana=lyhenne sana=kolmikirjaiminen ) =.8

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa.

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa. KERTAUS Lukujono KERTAUSTEHTÄVIÄ K1. Ratkaisussa annetaan esimerkit mahdollisista säännöistä. a) Jatketaan lukujonoa: 2, 4, 6, 8, 10, 12, 14, 16, Rekursiivinen sääntö on, että lukujonon ensimmäinen jäsen

Lisätiedot

MATEMATIIKKA 5 VIIKKOTUNTIA

MATEMATIIKKA 5 VIIKKOTUNTIA EB-TUTKINTO 2008 MATEMATIIKKA 5 VIIKKOTUNTIA PÄIVÄMÄÄRÄ: 5. kesäkuuta 2008 (aamupäivä) KOKEEN KESTO: 4 tuntia (240 minuuttia) SALLITUT APUVÄLINEET: Europpa-koulun antama taulukkovihkonen Funktiolaskin,

Lisätiedot

1 TILASTOMENETELMIEN PERUSTEITA

1 TILASTOMENETELMIEN PERUSTEITA 1 TILASTOMENETELMIEN PERUSTEITA Insinööritieteissä suoritetaan usein erilaisia mittauksia tai kokeita, joiden tuloksena saadaan numeerisia havaintoaineistoja tutkittavasta ilmiöstä. Hyvinvointiteknologiassa

Lisätiedot

Mallintamisesta. Mallintamisesta

Mallintamisesta. Mallintamisesta Laajasti ymmärtäen jonkin tarkasteltavan ilmiön kuvaamista (esim. matemaattista) kuhunkin tarkoitukseen (ennustaminen, analysointi, visualisointi) parhaiten sopivalla tavalla. Ilmiön pukemista helposti

Lisätiedot

nyky-ymmärryksemme mukaan hajaantuvaan sarjaan luvun 1 2 kun n > N Huom! Määritelmä on aivan sama C:ssä ja R:ssä. (Kuva vain on erilainen.

nyky-ymmärryksemme mukaan hajaantuvaan sarjaan luvun 1 2 kun n > N Huom! Määritelmä on aivan sama C:ssä ja R:ssä. (Kuva vain on erilainen. Sarjaoppia Käsitellään kompleksi- ja reaalisarjat yhdessä. Reaalilukujen ominaisuuksista (kuten järjestys) riippuvat asiat tulevat lisämausteena mukaan. Kirjallisuutta: 1. [KRE] Kreyszig: Advanced Engineering

Lisätiedot