Parametrin estimointi ja bootstrap-otanta

Samankaltaiset tiedostot
Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollinen aineisto Luottamusväli

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3.6 Su-estimaattorien asymptotiikka

Luottamusvälit. Normaalijakauma johnkin kohtaan

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

tilastotieteen kertaus

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Satunnaislukujen generointi

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Mat Tilastollisen analyysin perusteet, kevät 2007

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Teema 8: Parametrien estimointi ja luottamusvälit

9. laskuharjoituskierros, vko 12-13, ratkaisut

11 Raja-arvolauseita ja approksimaatioita

Harjoitus 7: NCSS - Tilastollinen analyysi

dx=5&uilang=fi&lang=fi&lvv=2014

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Batch means -menetelmä

Sovellettu todennäköisyyslaskenta B

riippumattomia ja noudattavat samaa jakaumaa.

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

1. Tilastollinen malli??

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Sovellettu todennäköisyyslaskenta B

Testit laatueroasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Mallipohjainen klusterointi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

031021P Tilastomatematiikka (5 op) viikko 4

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Harjoitus 2: Matlab - Statistical Toolbox

Sovellettu todennäköisyyslaskenta B

2. Keskiarvojen vartailua

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Otoskoko 107 kpl. a) 27 b) 2654

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Maximum likelihood-estimointi Alkeet

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

031021P Tilastomatematiikka (5 op) viikko 5

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien mittausasteikot 93

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

5.7 Uskottavuusfunktioon perustuvia testejä II

Estimointi. Otantajakauma

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

pitkittäisaineistoissa

Transkriptio:

Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003

Käytännön asioista tiistaiaamun laskuharjoituksia ei jatkossa pidetä vähäisen osallistujamäärän vuoksi harjoitustyön 1. osan esitteleminen (10-15 min) luennolla 15.4. tuo 3 pistettä viimeisellä luentokerralla 24.4. vastaava tilaisuus, jossa jälleen halukkaat voivat ilmoittautua esittelemään aihettaan ja työnsä 2. osaa noin 3 halukasta voidaan ottaa näistä sovittava Mikon kanssa etukäteen Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 2/27 Kevät 2003

Luennon runko Tilastollisia käsitteitä (lähinnä kertaus) otos ja populaatio, populaatiojakauma otosjakauma tunnusluku ja parametri Laskentaintensiivisiä menetelmiä Monte Carlo ja satunnaistaminen (kertaus) bootstrap Parametrin estimointi ja luottamusvälien määrittäminen otosestimaattorit luottamusvälien määrittäminen bootstrap-otannalla Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 3/27 Kevät 2003

Otos ja populaatio käytettävissä oleva aineisto on otos ilmiöstä koko ilmiön perusjoukkoa, josta otos on peräisin, nimitetään usein populaatioksi X 1 = x 1, X 2 = x 2,..., X n = x n satunnaismuuttujat X 1,..., X n kuvaavat koko ilmiötä niiden jakaumasta käytetään usein nimitystä populaatiojakauma Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 4/27 Kevät 2003

Otosjakauma mielivaltainen tunnusluku t tietty otoksen koko n t:n otosjakauma kuvaa tunnusluvun arvojen jakauman kaikissa mahdollisissa n-kokoisissa otoksissa perusjoukosta teoreettinen jakauma otosjakauma ei viittaa otoksen arvojen jakaumaan (engl. sampling distribution = otosjakauma, sample distribution = (yksittäisen) otoksen arvojen jakauma sanat vaarallisen lähellä toisiaan, kysymys aivan eri asioista Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 5/27 Kevät 2003

Tunnusluku ja parametri populaatiojakauman tunnuslukuja kutsutaan usein parametreiksi, tällöin tunnusluvun arvo on otoksen funktio (esim. otoskeskiarvo) parametrin arvo on koko populaation funktio ( todellinen keskiarvo = populaatiojakauman odotusarvo) mitä voidaan sanoa koko populaatiosta, kun tunnetaan otos? parametrin arvioiminen otoksen perusteella (tästä hiukan myöhemmin) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 6/27 Kevät 2003

Monte Carlo populaatiojakauma tunnettu, tunnusluvun otosjakauma ei otosjakauman approksimointi simuloimalla otantaa populaatiosta generoidaan otoksia populaatiojakaumasta Monte Carlo approksimaatio: otoksista laskettujen tunnusluvun arvojen jakauma lisäämällä otosten määrää, päästään mielivaltaisen tarkkaan approksimaatioon (Suurten lukujen laki) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 7/27 Kevät 2003

Satunnaistaminen satunnaistamismenetelmillä voidaan testata (kahta) otosta koskevia hypoteeseeja perusjoukko ei ole populaatio vaan käytettävissä oleva otos approksoimoitava nollahypoteesin mukainen otosjakauma ei ole tunnusluvun jakauma populaatiossa, vaan otoksen kaikissa mahdollisissa permutaatioissa entä jos haluttaisiin tehdä päätelmiä koko populaatiosta, mutta ei tunneta populaatiojakaumaa? Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 8/27 Kevät 2003

Bootstrap-menetelmät tunnusluvun otosjakaumaa ei tunneta, vain otos mitään oletuksia populaatiosta ei tarvitse tehdä idea: kuvitellaan että otos on koko populaatio ja tehdään otantaa otoksesta! jos otos on edustava, näin voidaan approksimoida minkä tahansa tunnusluvun otosjakaumaa engl. bootstrap = saappaan hihna ; viittaa itsensä nostamiseen kiskomalla omasta saappaasta eli bootstrap-otannan intuitiiviseen mahdottomuuteen (ensikatsomalta) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 9/27 Kevät 2003

Bootstrap ja satunnaistaminen bootstrap- ja satunnaistamisalgoritmit ovat hyvin samantapaisia satunnaistamisessa otanta (kahdesta) otoksesta tehdään ilman takaisinpanoa bootstrapissa otanta otoksesta tehdään takaisinpanolla alkuperäisen otoksen alkio voi tulla valituksi useita kertoja samaan pseudo-otokseen otanta takaisinpanolla simuloi tilannetta, että otantaa tehdään koko populaatiosta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 10/27 Kevät 2003

Bootstrap-algoritmi Olkoon S otos, jonka koko on N Toista K kertaa muodosta N:n alkion pseudo-otos S i otoksesta S seuraavasti: toista N kertaa: valitse satunnaisesti alkio S:stä ja lisää se otokseen S i laske pseudo-tunnusluvun θ i arvo S i :stä pseudo-tunnusluvun jakauma on bootstrap-otosjakauma Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 11/27 Kevät 2003

Bootstrapin intuitiivinen perustelu Helsingin yliopisto otoksen arvojen jakauma on paras arvio sille, millaisia arvoja populaatiossa on ja kuinka ne ovat jakautuneet bootstrap ei ole taikatemppu, joka toimii aina tuottaa huonon tuloksen, jos otos on huono tai harvinainen toisaalta tällöin on vaikea tehdä mitään järkevää (paitsi kerätä lisää/uutta dataa) vrt. nollahypoteesin hylkäämisen virhemahdollisuus eli p-arvo joskus menee pieleen Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 12/27 Kevät 2003

Mihin bootstrap soveltuu bootstrapia voi käyttää lukuisiin erityyppisiin tehtäviin hypoteesin testaus tilanteissa joissa populaatiojakaumaa ei tunneta estimaatin luotettavuuden arvioiminen Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 13/27 Kevät 2003

Parametrin estimointi arvioi parametrin arvoa, kun tunnetaan otos arvioinnin eli estimoinnin tulos on arvio eli estimaatti termi estimaattori viittaa estimointimenetelmään hyvä estimaattori tuottaa estimaatteja, jotka ovat mahdollisimman usein mahdollisimman lähellä estimoitavan parametrin todellista arvoa luottamusväli (confidence interval) on tapa ilmaista arvion tarkkuutta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 14/27 Kevät 2003

Otostunnusluvut estimaattoreina yksinkertaisin tapa estimoida parametrien arvoja on käyttää otoksesta laskettuja tunnuslukuja käytetään odotusarvon arviona otoskeskiarvoa, varianssin arviona otosvarianssia, korrelaation arviona otoskorrelaatiokerrointa jne. muitakin menetelmiä on (ei käsitellä tällä kurssilla) populaatiojakaumasta saattaa olla lisätietoa, jota voidaan hyödyntää esim. ns. suurimman uskottavuuden (maximum likelihood) menetelmällä Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 15/27 Kevät 2003

Esimerkki oletetaan, että populaatiojakauman odotusarvoa µ ei tunneta kerätään otos ja lasketaan otoskeskiarvo x = 10.0 käytetään otoskeskiarvoa estimoimaan todellista µ:n arvoa 10.0 saattaa olla tarkka, oikea µ:n arvo luultavasti kuitenkin µ on jossakin lähellä arvoa 10.0, eli µ = x ± ɛ jos ɛ on pieni, x on hyvä estimaatti µ:lle Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 16/27 Kevät 2003

Otostunnusluvut estimaattoreina harhattomia ja tarkentuvia estimaattoreita harhattomalle (unbiased) estimaattorille E ˇθ = θ tuottaa keskimäärin oikean tuloksen tarkentuvalle (consistent) estimaattorille lim n P { ˇθ θ > ɛ} = 0 otoksen kokoa kasvattamalla päästään mielivaltaisen lähelle parametrin todellista arvoa Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 17/27 Kevät 2003

Arvion tarkkuus: luottamusväli jos otoksen koko on kiinnitetty, kuinka lähellä todellista arvoa estimaatti sitten on? luottamusväli todennäköisyys sille, että todellinen arvo on tietyllä välillä (johon estimaatti sisältyy) esim. 95 %:n luottamusväli ei tarkoita sitä, että tiedämme 95 %:n varmuudella mikä todellinen arvo on Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 18/27 Kevät 2003

Esimerkki, jatkoa kuinka todennäköistä on, että todellinen populaation keskiarvo µ sisältyy välille µ = x ± ɛ, kun ɛ on jokin kiinnitetty arvo? oletetaan että tunnemme populaation odotusarvon, olkoon se 9.75 kerätään 10 uutta otosta asetetaan ensin ɛ = ɛ 1 = 0.1, sitten ɛ = ɛ 2 = 0.6 Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 19/27 Kevät 2003

Luottamusväli, esimerkki todellinen arvo todellinen arvo 8 9 10 11 12 8 9 10 11 12 ɛ = ɛ 1 = 0.1 vain yhdessä tapauksessa arvio on välillä [µ ɛ, µ + ɛ] ɛ = ɛ 2 = 0.6 yhdeksässä tapauksessa arvio on välillä [µ ɛ, µ + ɛ] Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 20/27 Kevät 2003

Luottamusväli bootstrapilla Olkoon S otos ja ˇθ otostunnusluku, jota käytetään estimaattina parametrille θ 1. muodosta K kappaletta bootstrap-otoksia S:stä ja laske niistä pseudo-tunnusluku θi, 1 i K 2. lajittele pseudo-tunnusluvut 3. 100(1 2α)-prosentin luottamusvälin approksimaation alaraja on lajiteltujen pseudo-tunnuslukujen Kα:s arvo ja yläraja K(1 α):s arvo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 21/27 Kevät 2003

Luottamusvälien muodostaminen luottamusvälien muodostaminen ilman simulaatiota perustuu keskeiseen raja-arvolauseeseen tarkastellaan keskiarvon otosjakaumaa otoksen koon n funktiona otoksen koon kasvaessa otosjakauma muistuttaa enemmän ja enemmän normaalijakaumaa jos populaatiojakauman odotusarvo on µ ja keskihajonta σ,normaalijakauman odotusarvo on µ ja keskihajonta σ/ N tuloksen merkittävyys: pätee kaikille mahdollisille populaatioille Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 22/27 Kevät 2003

Esimerkki, jatkoa otoskeskiarvo x = 10.0 = ˇµ jos otoskoko N on suuri, arvo 10.0 on peräisin jakaumasta, joka on likimäärin normaalijakauma odotusarvona µ x = µ ± 1.96σ/ N 95 %:n varmuudella 95 %:n luottamusväli siis kyseisen normaalijakauman 95%-fraktiiliväli σ ei välttämättä ole tunnettu joudutaan käyttämään otoskeskihajontaa Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 23/27 Kevät 2003

Estimaatin luottamusväli riippuu siitä, kuinka suuri varmuus halutaan otoksen koosta otoksen varianssista estimaattorista Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 24/27 Kevät 2003

Luottamusvälit voidaan muodostaa perinteisin menetelmin otostunnusluvuille, joiden otosjakauma on (asymptoottisesti) normaalijakauma ehto ei kuitenkaan päde edes kaikille tavallisimmille tunnusluvuille esim.korrelaatiokertoimen otosjakauma ei ole asymptoottisesti normaali bootstrapilla luottamusväli voidaan muodostaa otoskorrelaatiokertoimelle (todellisen korrelaation estimaatille) Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 25/27 Kevät 2003

Esimerkki yllä alkuperäinen otos (korrelaatiokerroin -0.552), alla yksi bootstrap-otos (-0.545) x 5 1.75 0.8 5 1.75 5 1.75 1 5 1.75 y 27.8 20.82 44.12 29.41 31.19 28.68 29.53 34.62 20 41.54 x 5 1.75 1.75 5 1 5 0.8 1.75 5 5 y 27.8 20.82 29.53 27.8 34.62 28.68 44.12 31.19 20 27.8 Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 26/27 Kevät 2003

Yhteenveto bootstrap perustuu otantaan otoksesta takaisinpanolla simuloi otantaa koko populaatiosta bootstrap-otosjakauma approksimoi tunnusluvun otosjakaumaa koko populaatiossa ei oletuksia populaatiosta otoksen täytyy vain olla edustava bootstrapia voidaan käyttää parametrin estimoinnissa luottamusvälien konstruoimiseen Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 27/27 Kevät 2003