Tilastollisia peruskäsitteitä ja Monte Carlo

Samankaltaiset tiedostot
Tutkimustiedonhallinnan peruskurssi

Parametrin estimointi ja bootstrap-otanta

Tutkimustiedonhallinnan peruskurssi

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Harjoitus 7: NCSS - Tilastollinen analyysi

Väliestimointi (jatkoa) Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

riippumattomia ja noudattavat samaa jakaumaa.

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

Tilastollinen aineisto Luottamusväli

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Luottamusvälit. Normaalijakauma johnkin kohtaan

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Satunnaislukujen generointi

031021P Tilastomatematiikka (5 op) viikko 5

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Estimointi. Vilkkumaa / Kuusinen 1

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

10. laskuharjoituskierros, vko 14, ratkaisut

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Regressioanalyysi. Vilkkumaa / Kuusinen 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Teema 8: Parametrien estimointi ja luottamusvälit

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

2. Keskiarvojen vartailua

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Sovellettu todennäköisyyslasku A

Harjoitus 2: Matlab - Statistical Toolbox

Normaalijakaumasta johdettuja jakaumia

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

dx=5&uilang=fi&lang=fi&lvv=2014

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

6. laskuharjoitusten vastaukset (viikot 10 11)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testit järjestysasteikollisille muuttujille

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Todennäköisyyden ominaisuuksia

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Mat Tilastollisen analyysin perusteet, kevät 2007

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

031021P Tilastomatematiikka (5 op) viikko 3

5.7 Uskottavuusfunktioon perustuvia testejä II

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Transkriptio:

Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003

Tilastollisia peruskäsitteitä hypoteestin testaus merkitsevyystaso, p-arvo otosjakauma otosjakauman Monte Carlo -estimointi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 2/13 Kevät 2003

Esimerkki kaksi shakkiohjelmaa, A ja B, pelaavat 15 ottelua A voittaa niistä 10 ja B voittaa 5 A voitti siis näistä otteluista osuuden f = 0.67 f on aineistosta laskettu tunnusluku mutta mikä on A:n todennäköisyys π voittaa uusi peli B:tä vastaan? π on ilmiön "todellinen" tunnusluku (kaikille mahdollisille peleille) voi olla mahdotonta saada selville oikeaa π:n arvoa onko A varmasti parempi kuin B? Kuinka varmasti? Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 3/13 Kevät 2003

Hypoteesin testaus onko toinen shakkiohjelmista toista parempi? jos ohjelmat ovat yhtä hyviä, niin π = 0.5 = nollahypoteesi (vaihtoehtoinen) hypoteesi: A on parempi kuin B jos nollahypoteesi on voimassa, kuinka todennäköistä on havaita 15 ottelussa tulos f = 0.67 jos epätodennäköistä, hylätään nollahypoteesi π = 0.5 hypoteesi nollahypoteesi nollahypoteesin testaus nollahypoteesin hylkääminen? Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 4/13 Kevät 2003

Satunnaismuuttuja satunnaismuuttuja X on suure, joka saa eri arvoja eri todennäköisyyksillä esim. X = 1 jos A voitti pelin ja X = 0 jos A hävisi satunnaismuuttujalla voi olla tietty hyvin määritelty arvo X = x X on muuttuja, x on sen arvo kun peli on pelattu, X:llä on arvo 0 tai 1 satunnaismuuttujalla ja sen jakaumalla on erilaisia tunnuslukuja, esim. X:n odotusarvo EX X:n varianssi σ X Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 5/13 Kevät 2003

Tunnuslukujen estimointi käytettävissä oleva aineisto on otos ilmiöstä X 1 = x 1, X 2 = x 2,..., X n = x n otoskeskiarvo x, otosvarianssi σ x todellinen ilmiön keskiarvo EX, todellinen varianssi σ X kuinka hyviä arvioita otoksesta lasketut tunnusluvut ovat jakauman tunnusluvuille? Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 6/13 Kevät 2003

Iid-oletus iid-oletus (independent and identically distributed): X i :tten arvot ovat toisistaan riippumattomia kaikki X i :t noudattavat samaa jakaumaa iid-oletus joudutaan tekemään usein mutta onko se aina voimassa? jos iid-oletus on voimassa, niin erityisesti E( x) = EX E(σ x ) = σ X otoskeskiarvo ja -varianssi ovat harhattomia estimaatteja Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 7/13 Kevät 2003

Otosjakauma mielivaltainen tunnusluku t t:n otosjakauma = tunnusluvulle t tietyn kokoisissa otoksissa (iid) havaittava jakauma esim. t = f = se osuus peleistä, jotka A voittaa pelataan 15 peliä, lasketaan f toiset 15 peliä eri arvo f:lle? otostunnusluku on satunnaismuuttuja, jonka jakauma on otosjakauma esimerkissä f on satunnaismuuttuja f:n jakauma kaikissa mahdollisissa 15 pelin otteluissa on sen otosjakauma Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 8/13 Kevät 2003

Otosjakauma ja hypoteesin testaus jos shakkiohjelmat A ja B ovat yhtä hyviä niin π = 0.5 tämä on nollahypoteesi silloin f noudattaa jotain tiettyä otosjakaumaa (binomijakauma, mutta sillä ei tässä ole merkitystä) nollahypoteesin mukainen otosjakauma määrää, millä todennäköisyydellä havaitaan f 0.67 jos todennäköisyys P (f 0.67) on suuri, niin havaittu A:n kannalta suotuisa tulos voidaan saada sattumalta ei voida päätellä luotettavasti että A on parempi kuin B Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 9/13 Kevät 2003

jos todennäköisyys P (f 0.67) on pieni, on epätodennäköistä että A:n kannalta niin suotuisa tulos on saatu sattumalta hylätään nollahypoteesi π = 0.5 p = P (f 0.67) on tuloksen p-arvo mitä pienempi p-arvo, sitä tilastollisesti merkitsevämpi tulos jos p 0.05, niin A on parempi kuin B merkitsevyystasolla 0.05 tyypillisiä merkitsevyystasoja (raja-arvoja merkitsevyydelle): 0.05, 0.01, 0.001 Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 10/13 Kevät 2003

Monte Carlo -menetelmä nollahypoteesin mukainen otosjakauma on usein tuntematon p-arvon laskeminen analyyttisesti voi olla vaikeaa tai mahdotonta otosjakaumaa voidaan estimoida helposti simuloi 15 ottelun turnauksia arvo A voittajaksi nollahypoteesin mukaisesti tn:llä 0.5 laske tunnusluku f kullekin turnaukselle f:n arvot ovat otos otosjakaumasta arvojen jakauma on estimaatti otosjakaumalle Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 11/13 Kevät 2003

simuloi esim. N = 1000 turnausta, kussakin 15 ottelua arvo A ottelun voittajaksi todennäköisyydellä 0.5 laske kussakin turnauksessa f, A:n voittojen osuus laske monessako turnauksessa f 0.67, merkitään lukumäärää N 0 :lla p N 0 /N Monte Carlo -algoritmit ovat yleisesti satunnaisuutta hyväksi käyttäviä menetelmiä tilastolliset ongelmat vain yksi sovellusalue nimi tulee kuuluisasta kasinokaupungista Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 12/13 Kevät 2003

Yhteenveto hypoteestin testaus: nollahypoteesi, vaihtoehtoinen hypoteesi pieni p-arvo = tilastollisesti merkitsevä tulos p-arvo perustuu otosjakaumaan otosjakaumaa voidaan estimoida Monte Carlo -menetelmällä esimerkin tilanteessa analyyttinenkin ratkaisu olisi ollut helppo MC-menetelmää voidaan käyttää hyvin vaikeittenkin otosjakaumien estimointiin Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 13/13 Kevät 2003