Maximum likelihood-estimointi Alkeet

Samankaltaiset tiedostot
Tilastollinen aineisto Luottamusväli

Uskottavuuden ominaisuuksia

Estimointi. Vilkkumaa / Kuusinen 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 4

Sovellettu todennäköisyyslaskenta B

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

9. laskuharjoituskierros, vko 12-13, ratkaisut

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Tilastomatematiikka Kevät 2008

Osa 2: Otokset, otosjakaumat ja estimointi

Mallipohjainen klusterointi

3.6 Su-estimaattorien asymptotiikka

2. Uskottavuus ja informaatio

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

5.7 Uskottavuusfunktioon perustuvia testejä II

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

2. Uskottavuus ja informaatio

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Kun datasta halutaan muodostaa malleja, ne ovat yleensä tilastollisia (esim. regressio, luokittelu, ryhmittely...) F(x 0 ) = P(x x 0 ) (1)

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Sovellettu todennäköisyyslaskenta B

6.1.2 Luottamusjoukon määritelmä

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

805306A Johdatus monimuuttujamenetelmiin, 5 op

,ܾ jaü on annettu niin voidaan hakea funktion

Harjoitus 2: Matlab - Statistical Toolbox

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Sovellettu todennäköisyyslaskenta B

η i (θ)t i (x) A(θ) + c(x),

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Aikasarja-analyysi Suurimman uskottavuuden menetelmä

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät Ratkaisuehdotuksia

Luku 5. Estimointiteorian perusteita

Kertausluento. Tilastollinen päättely II - 1. kurssikoe

Tilastollinen päättely, 10 op, 4 ov

Hypoteesin testaus Alkeet

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 4

Tämän luvun sisältö. Luku 5. Estimointiteorian perusteita. Perusjakaumat 1-ulotteisina (2) Perusjakaumat 1-ulotteisina

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

Normaalijakaumasta johdettuja jakaumia

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4.0.2 Kuinka hyvä ennuste on?

Todennäköisyyden ominaisuuksia

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

, c) x = 0 tai x = 2. = x 3. 9 = 2 3, = eli kun x = 5 tai x = 1. Näistä

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Differentiaali- ja integraalilaskenta 1 Ratkaisut 5. viikolle /

Parametrin estimointi ja bootstrap-otanta

Yleistä tietoa kokeesta

Satunnaismuuttujien muunnokset ja niiden jakaumat

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ARMA mallien ominaisuudet ja rakentaminen

Sovellettu todennäköisyyslaskenta B

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

11 Raja-arvolauseita ja approksimaatioita

Tilastollisen päättelyn perusteet

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2018 Insinöörivalinnan matematiikan koe, , Ratkaisut (Sarja A)

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

ARMA(p, q)-prosessin tapauksessa maksimikohdan määrääminen on moniulotteinen epälineaarinen optimointiongelma.

Transkriptio:

Maximum likelihood-estimointi Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Maximum likelihood-estimointi p.1/20

Maximum Likelihood-estimointi satunnaismuuttujan X todennäköisyysjakauma f(x; θ) parametri θ tuntematon Havaintoaineiston x = {x 1,x 2,...,x n } avulla estimaatti ˆθ Maximum likelihood-estimointi p.2/20

Maximum likelihood-estimoinnissa Suurimman uskottavuuden-menetelmä. Parametrin θ likiarvo l. estimaatti ˆθ maksimoi todennäköisyystiheyden f(x; θ), tai maksimoi log-likelihood-funktion ln[f(x; θ)], sillä logaritmi funktio on aidosti kasvava Maximum likelihood-estimointi p.3/20

DC-komponentin estimointi Esim 1. Kohina peittää signaalin tasavirtakomponentin. Kohinaisesta signaalista on otettu näytteitä (riippumattomasti): x i = θ + w i, i = 1,...,n missä kohinan oletetaan olevan riippumatonta eri näytteissä, ja jakautunut standardisoidun normaalijakauman mukaisesti l. w i N(0, 1). Määrää näytteiden perusteella tasavirtakomponentin suuruus suurimman uskottavuuden menetelmällä. Maximum likelihood-estimointi p.4/20

Ratkaisu Satunnaismuuttujat X i N(θ, 1),i = 1,...,n Yhteisjakauman tiheysfunktio (riippumattomuus) f X (x 1,x 2,...,x n ;θ) = Log-likelihood-funktio n 1 f Xi (x i ;θ) = [ ] n P n e 1 (x 2 i θ) 2. 2π ln(f(x;θ)) = n 2 ln(2π) 1 2 n (x i θ) 2. Maximum likelihood-estimointi p.5/20

Ratkaisu jatkuu Likelihood-funktion maksimi d ln(f(x;θ)) dθ = n (x i θ) = 0. Tasavirtakomponentin maximum likelihood-estimaatti on otoskeskiarvo ˆθ = 1 n n x i = x. Maximum likelihood-estimointi p.6/20

Esim. jatkuu Esim 2. Tarkastellaan samaa tilannetta kuin edellisessä esimerkissä; mutta olettaen, ettei kohinan varianssia tunneta, ts. (riippumattomat) näytteet signaalista noudattavat normaalijakaumaa x i = θ 1 + w i N(θ 1,θ 2 ), i = 1,...,n, jonka molemmat parametrit ovat tuntemattomia. Maximum likelihood-estimointi p.7/20

Ratkaisu Satunnaismuuttujan X i tiheysfunktio on f Xi (x i ) = 1 e (x i θ 1 ) 2θ 2 2πθ2 2 satunnaismuuttujien X i yhteisjakauman tiheysfunktio on P 1 f X (x;θ 1,θ 2 ) = ( ) n 1 n 2 e 2θ 2 (x i θ 1 ) 2. 2πθ 2 Log-likelihood-funktio ln(f X (x;θ 1,θ 2 )) = n 2 ln(2πθ 2) 1 2θ 2 n (x i θ 1 ) 2. Maximum likelihood-estimointi p.8/20

Ratk. jatkuu Maksimikohta löytyy gradientin nollakohdasta Ratkaistava yhtälöpari ln f(x;θ 1,θ 2 ) θ 1 = 1 θ 2 ln f(x;θ 1,θ 2 ) θ 2 = n 2 θ ln f(x;θ 1,θ 2 ) = 0. n (x i θ 1 ) = 0 (1) 1 + 1 θ 2 2θ2 2 n (x i θ 1 ) 2 = 0 (2) Maximum likelihood-estimointi p.9/20

Ratk. jatkuu Yhtälöstä (1) estimaatti odotusarvolle θ 1 : ˆθ 1 = 1 n n x i = x. Varianssin estimaatti yhtälöstä on 1 θ 2 n (x i x) 2 n = 0, ˆθ 2 = 1 n n (x i x) 2. Maximum likelihood-estimointi p.10/20

Yleistä teoriaa Voidaan osoittaa, että jos parametreista θ = [θ 1,θ 2,...,θ k ] riippuva tiheysfunktio f X (x;θ) on riittävän "säännöllinen", niin maximum-likelihood estimaattori on tarkentuva; asymptoottisesti optimaalinen; Jos on olemassa tehokas estimaattori, niin maximum-likelihood-menetelmällä ko. estimaattori on löydettävissä. Maximum likelihood-estimointi p.11/20

Poisson-jakauma Esim 3. Olkoon X Poisson-jakautunut satunnaismuuttuja (X Poi(a)) ja x 1,x 2,...,x n riippumattomia havaintoja X:stä. Määrää maximum-likelihood menetelmällä estimointikaava parametrille a. Maximum likelihood-estimointi p.12/20

Ratk. Poisson-jakauman pistetodennäköisyysfunktio on P(X = x i ) = ax i x i! e a, x i = 0, 1, 2,.... Likelihood-funktio (l. uskottavuusfunktio) on L(x;a) = np x i a x 1!x 2! x n! e na. Uskottavuusfunktion logaritmi ln(l(x; a)) = [ n x i ] ln(a) na ln(x 1!x 2! x n!). Maximum likelihood-estimointi p.13/20

jatkuu Maksimi löytyy derivaatan nollakohdasta: d ln(l(x;â)) da = 1 ( n ) x i n = 0 â â = 1 n n x i. Maximum likelihood-estimointi p.14/20

Maximum likelihood yleisesti Tuntematon parametrivektori θ = [θ 1,θ 2,...,θ k ] T Havaintoaineisto x = [x 1,x 2,...,x n ] T Havainnot riippumattomia ja noudattavat samaa todennäköisyysjakaumaa f(x i ;θ) Uskottavuusfunktio on yksiulotteisten jakaumien tulo L(θ) = n f(x i ;θ). Maximum likelihood-estimointi p.15/20

Maksimikohta Käytännössä tarkastellaan uskottavuusfunktion logaritmia l(θ) = ln(l(θ)). Maksimikohta l(ˆθ) θ j = 0, j = 1, 2,...,k. Maximum likelihood-estimointi p.16/20

Maksimikohta Gradientin nollakohdassa uskottavuusfunktion Taylorin sarja l(θ) = l(ˆθ) + θ l(ˆθ) T (θ ˆθ) + 1 2 k i,j=1 2 l(ˆθ) θ i θ j (θ i ˆθ i )(θ j ˆθ j ) + = l(ˆθ) + 1 2 k i,j 2 l(ˆθ) θ i θ j (θ i ˆθ i )(θ j ˆθ j ) +. Gradientin nollakohdan laatu riippuu neliömuodosta 1 2 k i,j=1 2 l(ˆθ) θ i θ j (θ i ˆθ i )(θ j ˆθ j ) Maximum likelihood-estimointi p.17/20

Fisherin informaatiomatriisi Uskottavuusfunktion toiset derivaatat muodostavat ns. Fisherin informaatiomatriisin J(ˆθ) = [ 2 l(ˆθ) θ i θ j ]i,j Uskottavuusfunktio saavuttaa maksiminsa gradientin nollakohdassa, jos Fisherin informaatiomatriisi on negatiivisesti definiitti, ts. kaikki sen ominaisarvot ovat negatiivisia. Maximum likelihood-estimointi p.18/20

Teoriaa Nyt voidaan osoittaa, että maximum likelihood-estimaattori on Tarkentuva, ts. lim n P( ˆθ(n) θ > ǫ) = 0, missä ˆθ(n) on n:ään havaintoon perustuva parametrin θ estimaatti. asymptoottisesti normaalijakautunut odotusarvona θ ja kovarianssimatriisina (varianssina) 1 n J 1, missä J on Fisherin informaatiomatriisi. Maximum likelihood-estimointi p.19/20

Teoriaa - lisää asymptoottisesti tehokas, ts. jos θ(n) on mikä tahansa tarkentuva, asymptoottisesti normaalijakautunut estimaattori parametrivektorille θ kovarianssimatriisina Σ, niin J Σ on positiivisesti semidefiniitti. Näin ollen ML-estimaatti on myös asymptoottisesti optimaalinen. Invariantti kuvausten suhteen. Olkoon g( ) vektorimuuttujan vektoriarvoinen funktio. Tällöin jos ˆθ on parametrivektorin θ ML-estimaatti, niin g(ˆθ) on parametrin g(θ) ML-estimaatti. Maximum likelihood-estimointi p.20/20