Estimointiteoriaa ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 1/68 Jarmo Lundén 14. huhtikuuta 2016 Aalto SPA Kevät 2016

Koko: px
Aloita esitys sivulta:

Download "Estimointiteoriaa ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 1/68 Jarmo Lundén 14. huhtikuuta 2016 Aalto SPA Kevät 2016"

Transkriptio

1 Estimointiteoriaa ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 1/68

2 Estimaattorit ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 2/68

3 Estimointiteoriaa Esim. käytännön tietoliikenne- ja signaalinkäsittelysovelluksissa havaintoja mallinnetaan satunnaismuuttujien avulla stokastisilla (signaali)malleilla. Perustilanne: havainnot mallinnetaan sm:illa X 1, X 2,..., X n, joiden jakaumat tunnetaan jotain (joitain) joukkoon Θ kuuluvaa parametria θ lukuun ottamatta. Parametrin θ, joka voidaan ajatella joko (tuntemattomaksi) deterministiseksi tai itsessään satunnaiseksi, määrittäminen datasta on (piste- tai parametri-) estimointiongelma. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 3/68

4 Estimointiteoriaa II Yleisesti havaintosatunnaismuuttujien funktiota T n t(x 1, X 2,..., X n ) kutsutaan statistiikaksi, ja estimointiongelman yhteydessä estimaattoriksi. Estimaattori on siis itsessään satunnaismuuttuja! Estimaattori on lineaarinen estimaattori jos t on lineaarinen. Lineaarinen estimaattori on siis sm:jien lineaarikombinaatio. Yksittäistä estimaattorin arvoa t(x 1, x 2,..., x n ) jollakin sm:jien realisaatiolla x 1, x 2,..., x n sanotaan estimaatiksi. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 4/68

5 Estimointiteoriaa III Esimerkki Oletetaan että olemme kiinnostuneet signaalin keskimääräisestä arvosta (yli ajan). Signaalia ajanhetkellä i voidaan mallintaa sm:lla X i = µ + N i, missä N i on satunnaismuuttuja odotusarvolla nolla ja determistinen parametri µ on tuntematon. Kiinnostuksen kohde on siis odotusarvo E[X i ] = µ. Luonnollinen parametrin µ estimaattori on satunnaismuuttujien X i keskiarvo ˆµ 1 n n i=1 X i. Huomaa että erittäin suurella todennäköisyydellä kaikki µ:n estimaatit ˆµ (k) = 1 n n i=1 x(k) i ovat erisuuria signaalin eri reaalisaatioilla x (k) 1,... x(k) n, k = 1,..., K. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 5/68

6 Estimaattorin "hyvyys" Oleellisia kysymyksiä: Mikä estimaattori on hyvä? Onko jokin toinen estimaattori parempi? Onko jokin estimaattori peräti "optimaalinen"? Tarvitaan käsitteistöä eri estimaattorien vertailuun. Estimaattori T n on harhaton (unbiased), jos E[T n ] = θ. Estimaattorin harha (bias) on E[T n ] θ. Estimaattori T n on tarkentuva (consistent), jos se suppenee stokastisesti kohti estimoitavaa parametria θ, ts. lim n P( T n θ > ε) = 0 kaikille ε > 0. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 6/68

7 Estimaattorin "hyvyys" II Tarkentuvuuden osoittamiseen käytetään usein Tšebyšovin epäyhtälöä (Chebyshev s inequality), jolla voidaan arvoida kuinka paljon sm poikkeaa odotusarvosta. Tšebyšovin epäyhtälö Olkoon X sm odotusarvolla µ = E[X] ja varianssilla σ 2 = Var(X) <. Tällöin kaikille ε > 0: P( X µ > ε) σ2 ε 2. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 7/68

8 Odotusarvon estimointi Olkoot X 1, X 2,..., X n riippumattomia ja samoinjakautuneita satunnaismuuttujia odotusarvolla µ ja varianssilla σ 2. Yleinen odotusarvon µ = E[X] estimaattori on otoskeskiarvo (sample mean) ˆµ n = 1 n X i. (1) n Koska E[X i ] = µ, on i=1 E[ˆµ n ] = 1 n n i=1 E[X i ] = 1 nµ = µ. n ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 8/68

9 Odotusarvon estimointi II ˆµ n on näin ollen harhaton estimaattori. Tšebyšovin epäyhtälön mukaan ɛ > 0 P( ˆµ n µ > ɛ) Var(ˆµ n) ɛ 2. Koska X 1,..., X n ovat riippumattomia, on estimaattorin ˆµ n varianssi ( ) 1 n Var(ˆµ n ) = Var X i = 1 n n n 2 Var(X i ) = 1 n σ2. i=1 i=1 ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 9/68

10 Odotusarvon estimointi III Käyttämällä tätä tulosta saadaan joten P( ˆµ n µ > ɛ) σ2 nɛ 2, lim P( ˆµ n µ > ɛ) = 0 ɛ > 0. n ˆµ n on siis myös tarkentuva estimaattori. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 10/68

11 Varianssin estimointi Olkoot X 1,..., X n kuten edellä. Varianssin σ 2 estimointiin käytetään yleisesti estimaattoria missä ˆµ = 1 n n i=1 X i. ˆθ n = 1 n 1 n (X i ˆµ) 2, (2) i=1 Kaavan (2) estimaattori ˆθ n on harhaton ja tarkentuva estimaattori varianssille (tämä voidaan osoittaa vastaavalla tavalla kuin edellä otoskeskiarvolle). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 11/68

12 MMSE ja MVU estimaattorit ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 12/68

13 MMSE ja MVU estimaattorit Eräs tapa rakentaa estimaattori on minimoida keskineliövirhe (MSE) E[(T n θ) 2 ] estimaattorin T n ja parametrin θ välillä. Tällaista estimaattoria sanotaan MMSE (minimum MSE) estimaattoriksi. MMSE estimaattori on ehdollinen odotusarvo annettuna näytteet X = (X 1,..., X n ) T : ˆθ MMSE = E[θ X]. (3) ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 13/68

14 MMSE ja MVU estimaattorit II Esimerkki Olkoon X näyte tasajakaumasta välillä [0, 1] ja olkoon R:n ehdollinen jakauma ehdolla X = x tasajakauma välillä [0, x]. R:n MMSE estimaattori on ˆRMMSE = E[R X]. Nyt { 1/x, 0 r x, f R X (r x) = 0, muulloin. Tästä seuraa ˆr MMSE = E[R X = x] = joten ˆRMMSE (X) = X/2. x 0 rf R X (r x)dr = x 0 r 1 x dr = x 2, ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 14/68

15 MMSE ja MVU estimaattorit III Usein MMSE estimaattoria ei voida kuitenkaan ratkaista suljetussa muodossa, jolloin voidaan esimerkiksi rajoittua vain lineaarisiin estimaattoreihin (tällaista estimaattoria sanotaan lineaariseksi MMSE estimaattoriksi). Keskineliövirhe koostuu harhan neliöstä ja varianssista, ts. MSE(T n ) = bias 2 + Var(T n ). Voidaan myös rajoittua vain harhattomiin (bias=0) estimaattoreihin, ja hakea näiden joukosta pienimmän varianssin omaava estimaattori. Tällaista estimaattoria kutsutaan minimi varianssi harhattomaksi estimaattoriksi (minimum variance unbiased estimator, MVUE). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 15/68

16 MMSE ja MVU estimaattorit IV Jotta MVU estimaattori olisi mielekäs, täytyy varianssin minimoitua kaikille parametrin θ (joka on tuntematon!) arvoille. Siksi myös nimitystä UMVUE käytetään (ensimmäinen U= uniformly). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 16/68

17 Suurimman uskottavuuden menetelmä ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 17/68

18 Suurimman uskottavuuden estimointi Eräs merkittävimmistä estimointimenetelmistä rakentuu ajatukselle, että eri estimoitavan parametrin θ Θ arvot generoivat havaintodatan X 1,..., X n eri jakaumista. Jokaista parametria θ vastaa siis (yhteis)tiheysfunktio (diskreeteillä sm:lla pistetodennäköisyysfunktio) f X ( θ). Kun x 1,..., x n on havaittu (ja kiinnitetty), on f X (x 1,..., x n ; θ) (tuntemattoman) θ:n funktio, ja sitä kutsutaan uskottavuusfunktioksi (likelihood function) L(θ x 1,..., x n ) f X (x 1,..., x n ; θ). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 18/68

19 Suurimman uskottavuuden estimointi II Suurimman uskottavuuden estimaattori (maximum likelihood estimator, MLE) antaa estimaatiksi arvon, joka maksimoi uskottavuusfunktion: ˆθ ML = argmax {L(θ x)}. (4) θ Jos havainnot ovat riippumattomia ja samoinjakautuneita, voidaan kirjoittaa L(θ x 1,..., x n ) = f X (x 1,..., x n ; θ) = f X (x 1 ; θ)f X (x 2 ; θ) f X (x n ; θ), josta saadaan ottamalla logaritmi puolittain summalauseke ln L(θ x 1,..., x n ) = n i=1 ln f (x k; θ). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 19/68

20 Suurimman uskottavuuden estimointi III Funktiota l(θ x 1,..., x n ) ln L(θ x 1,..., x n ) kutsutaan log-uskottavuusfunktioksi, ja usein sen maksimoiminen on helpompaa kuin varsinaisen uskottavuusfunktion. Niillä on toki samat maksimit (monotoninen muunnos)! Teknisesti MLE löydetään usein hakemalla (log-)uskottavuusfunktion derivaatan nollakohdat (muistele optimoinnin perusteet!), jolloin maksimi sijaitsee joko nollakohdissa tai tarkasteluvälin päätepisteissä. MLE:lle on useita mukavia ominaisuuksia (mm. tarkentuva), mutta sen löytäminen on usein hankalaa. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 20/68

21 Uskottavuusestimointi: esimerkki Olkoon y : y 1, y 2,..., y n riippumattomia havaintoja normaalijakautuneesta satunnaismuuttujasta tunnetulla odotusarvolla µ. Määritetään varianssin suurimman uskottavuuden estimaattori. Nyt f (y; µ, σ 2 ) = n k=1 1 e 1 (y k µ) 2 ( 2 1 ) ne σ 2 = 1 n (y k µ) 2 2 k=1 σ 2 2πσ 2πσ ja siis varianssin log-uskottavuusfunktioksi saadaan l(σ 2 y 1,..., y n ) = n ln( 2πσ) 1 2 n k=1 (y k µ) 2 σ 2. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 21/68

22 Uskottavuusestimointi: esimerkki II Funktion l(σ 2 y 1,..., y n ) maksimoiva σ 2 minimoi funktion g(σ 2 ) = n ln(σ) n k=1 (y k µ) 2 σ 2. MLE:n invarianssiperiaatteen mukaan, jos ˆθ on θ:n MLE, niin h(ˆθ) on h(θ):n MLE mille tahansa funktiolle h. Siis voimme minimoida g:n σ:n suhteen ja saamme sitä kautta MLE:n varianssille (σ 2 ). Nyt g(σ 2 ) σ = n σ 1 n σ 3 (y k µ) 2. k=1 ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 22/68

23 Uskottavuusestimointi: esimerkki III Asettamalla yhtälö nollaksi g(σ2 ) σ = 0, ja ratkaisemalla σ:n suhteen saadaan ˆσ ML = 1 n (y k µ) 2 n k=1 ja siis varianssin MLE on invarianssiperiaatteen nojalla σ 2 ML = 1 n n (y k µ) 2. k=1 ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 23/68

24 MAP estimointi ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 24/68

25 MAP estimaattori MAP estimaattori (maximum a posterior, MAP) antaa estimaatiksi arvon, joka maksimoi parametrin θ a posteriori todennäköisyyden havaittuna näytteet x: ˆθ MAP = argmax θ { fx=x θ (x θ)f θ (θ) } = argmax {L(θ x)f θ (θ)} (5) θ f θ (θ) on parametrin θ priorijakauma (θ on siis satunnaismuuttuja) ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 25/68

26 Momenttimenetelmä ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 26/68

27 Momenttimenetelmä Momenttimenetelmä (Method of Moments Estimation, MME) on usein toimiva ja helppo estimointimenetelmä. Siinä yhdistetään tunnettuja statistiikoita (esim. jakauman teoreettiset momentit) niiden havainnoista laskettuihin estimaatteihin ja ratkaisemalla siitä halutut parametriestimaatit. Muut menetelmät (esim. MLE) antavat yleensä parempia estimaattoreita, mutta momenttimenetelmän vahvuus on sen yksinkertaisessa laskettavuudessa. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 27/68

28 Momenttimenetelmä II Esimerkki Olkoon X 1,..., X n i.i.d. havaintoja gamma jakaumasta (tuntemattomilla parametreilla α > 0 ja β > 0) tiheysfunktiolla f (x) = xα 1 e x/β β α Γ(α) kun x > 0 ja f (x) = 0 kun x 0. Jakauman kaksi ensimmäistä momenttia ovat µ 1 = E[X 1 ] = αβ ja µ 2 = E[X 2 1 ] = β2 α(α + 1). Yhdistämällä näihin momenttien estimaattorit ˆµ 1 1 n n i=1 X i ja ˆµ 2 1 n n i=1 X 2 i saadaan siis yhtälöt ˆµ 1 = αβ ja ˆµ 2 = β 2 α(α + 1). Ratkaisemalla näistä α ja β, saadaan estimaattoreiksi ˆα MME = ˆµ2 1 ˆµ 2 ˆµ 2 1 ja ˆβ MME = ˆµ 2 ˆµ 2 1 ˆµ 1. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 28/68

29 Ilmaisuteoriaa ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 29/68

30 Ilmaisin ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 30/68

31 Ilmaisuteoriaa Signaalien ilmaisu kuuluu tilastollisen päätöksenteorian (eng. decision theory) alueeseen. Ilmaisussa tehdään älykkäitä päätöksiä/päätelmiä "maailman tilasta"(state of nature/world) havaintodatan perusteella. Sovellusaluita ovat esim. tutkat (josta paljon terminologiaa!), sensoriverkot, laadunvarmistus, digitaalinen siirtotekniikka ja hahmontunnistus. Useimmat signaalin ilmaisuongelmat voidaan esittää hypoteesin testauksena. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 31/68

32 Hypoteesin testaus Yleisessä tilanteessa on olemassa M hypoteesia H k (k = 0,..., M 1; "maailman tilat") Havaintojen y 1, y 2,..., y n perusteella pitäisi valita "oikea"tila. Havaintoja mallinnetaan satunnaismuuttujana/-vektorina Y = (Y 1, Y 2,..., Y n ) T. Keskitymme tässä binääriseen hypoteesin testaukseen (ts. M = 2), jossa hypoteesia H 0 kutsutaan nollahypoteesiksi (null hypothesis) ja toista hypoteesia H 1 vaihtoehtoiseksi hypoteesiksi (alternative hypothesis). Ilmaisusovelluksissa H 0 on usein "vain kohinaa" -hypoteesi ja H 1 "kohina+signaali" -hypoteesi. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 32/68

33 Hypoteesin testaus II Kumpikin hypoteesi liittää havaintoihin Y oman todennäköisyysjakauman P. Ts. binäärinen hypoteesintestausongelma voidaan kirjoittaa H 0 : Y P 0 vs. H 1 : Y P 1. Havaintojen perusteella tehdään päätös D 0 tai D 1. Päätöksentekosääntö (eli hypoteesitesti eli kriittinen funktio, δ) on siis havaintojen funktio sen mukaan kumman hypoteesin uskotaan olevan voimassa (H 0 vs. H 1 ). Päätöksentekosääntö jakaa havaintoavaruuden (Y :n maaliavaruus) kahteen osa-alueeseen: hyväksymisalue R 0 (päätös D 0 ) ja hylkäysalue (eli kriittinen alue) R 1 (päätös D 1 ). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 33/68

34 Hypoteesin testaus III Esimerkki Yksi kahdesta bitistä lähetetään. Mahdolliset signaaliarvot ovat θ = { 1, 1}. Vastaanottimen pitää tehdä päätös H 0 : θ = 1 tai H 1 : θ = 1 havaitun signaalin perusteella. AWGN kanavassa vastaanotettu data voidaan mallintaa:y = S + N, missä S on lähetetty signaali ja N on kohinaa mallintava satunnaismuuttuja. Jos N noudattaa N (0, σ 2 ) jakaumaa ja S = aθ jollekin amplitudille a, tällöin Y :n jakauma ehdolla, että lähetetty signaali tunnetaan on f Y Θ (y θ) = 1 e (y aθ)2 /2σ 2. 2πσ ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 34/68

35 Hypoteesin testaus IV Ilmaisun tarkoituksena on löytää sääntö, jossa päätösvirheiden todennäköisyys olisi pieni. Eri virheillä voi olla epäsymmetriset seuraukset! Usein sääntö on formuloitu niin, että havainnoista lasketaan jokin testistatistiikka, jota verrataan kynnysarvoon. Testistatistiikkaa ja kynnysarvoa kutsutaan yhdessä ilmaisimeksi. Tehdyn päätöksen ja todellisen/oikean tilan yhteys ja käsitteistö voidaan esittää "nelikenttänä". ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 35/68

36 Binäärinen hypoteesintestaus Päätös Todellinen tila H 0 ("vain kohina") H 1 ("kohina+signaali") Tyypin II virhe D 0 Oikea päätös Menetetyn ilmaisun P(D 0 H 0 ) = 1 α (missed detection) tn β = P M P(D 0 H 1 ) Tyypin I virhe Oikea päätös D 1 Väärän hälytyksen tn Ilmaisun todennäköisyys (koko/riski(taso)/merkitsevyys): (testin voimakkuus): α = P FA P(D 1 H 0 ) P D P(D 1 H 1 ) = 1 β ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 36/68

37 Binäärinen hypoteesintestaus II Sovelluksesta riippuen signaalien ilmaisussa käytetään erilaisia päätöksentekostrategioita. Esim. tietoliikennesovelluksessa on tyypillisesti samantekevää tapahtuuko bittivirhe 0 vai 1 bitissä, ja tällöin tarkastellaankin kokonaisvirhetodennäköisyyttä P E = P FA + P M. Tutkassa puolestaan väärät hälytykset voivat tukkia koko tutkan, joten niitä täytyy rajoittaa. Toisaalta menetetty ilmaisukaan ei ole suotavaa. Riskit ja niiden painotukset voivat olla hyvin erilaiset esimerkiksi lääketieteen sovelluksissa, sotilassovelluksissa ja tavanomaisissa tietoliikennesovelluksissa. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 37/68

38 MAP-ilmaisin ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 38/68

39 MAP-ilmaisin Luonnollisesti hyvä tapa määrittää ilmaisin on minimoida virheellisten (maksimoida oikeiden) päätösten todennäköisyys. Ei ole kuitenkaan mahdollista yhtäaikaa minimoida molempia virhetyyppejä (kokonaisvirhettä) ilman lisäinformaatiota kuten hypoteesien ennakkotodennäköisyyksiä. Ennakkotodennäköisyyksien ollessa tiedossa voidaan maksimoida oikean päätöksen posterior (=havaintojen jälkeiset) todennäköisyydet ja tällaista päätössääntöä kutsutaan MAP (maximum a posteriori) -säännöksi. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 39/68

40 MAP-ilmaisin II Esimerkki MAP-säännöstä Olkoon signaali θs, missä amplitudi θ saa arvoja θ 0 ja θ 1 (esim. 0 tai 1) ja olkoon amplitudeilla a priori esiintymistodennäköisyydet P 0 ja P 1. Signaaliin summautuu Gaussista kohinaa n N(0, σ 2 n) Havaittu data noudattaa mallia y = θs + n ja prosessoimalla dataa on päätettävä kumpi signaali θ 0 vai θ 1 lähetettiin. Havaitaan riippumattomat näytteet y : y 1, y 2,..., y n. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 40/68

41 MAP-ilmaisin III Näytteiden yhteisjakaumat hypoteesien H 0 ja H 1 alla vastaavat siis kahta n-ulotteista normaalijakaumaa eri odotusarvoilla θ 0 s ja θ 1 s (missä s = s1) f Y θ (y θ) = (2πσ 2 n) n/2 exp [ 1 2σ 2 n ] n (y i θs) 2. Valitaan θ siten, että se on suuremmalla todennäköisyydellä tosi havaitun datan perusteella. θ:n a posteriori todennäköisyydeksi havaittuna näytteet y saadaan P θ y (θ y) = f Y θ(y θ)p θ. f Y (y) i=1 ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 41/68

42 MAP-ilmaisin IV MAP-säännön mukaan hypoteesi H 1 valitaan siis testillä P θ Y =y (θ 1 y) P θ Y =y (θ 0 y) = f Y =y θ(y θ 1 )P 1 f Y =y θ (y θ 0 )P 0 > 1. (6) Tämä maksimoi hypoteesien a posteriori todennäköisyyden. MAP-ilmaisu perustuu siis siihen että myös a priori todennäköisyydet otetaan huomioon ilmaisussa. MAP-ilmaisin minimoi keskimääräisen virheen P E = P FA P 0 + P M P 1. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 42/68

43 Uskottavuusosamäärä ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 43/68

44 Uskottavuusosamäärä Tyypillisesti ilmaisussa hyödynnetään ns. uskottavuusosamäärä testiä (likelihood ratio test). Nimensä mukaisesti testi vertaa eri hypoteesien uskottavuusfunktioiden L(θ y) f Y (y; θ) suhdetta LR(y) = L(θ 1 y) L(θ 0 y) > λ 0. (7) Sovelluksesta ja päätöksentekostrategiasta riippuen testissä käytettävä kynnysarvo, johon uskottavuusosamäärää verrataan, määräytyy eri tavalla. Usein uskottavuusfunktioiden sijasta käytetään log-likelihood funktiota ja testi on tällöin ln(lr(y)) > ln(λ 0 ). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 44/68

45 Uskottavuusosamäärä II Esimerkki MAP-ilmaisin voidaan esittää uskottavuusosamäärän avulla, määrittämällä λ 0 = P 0 P 1 eli vastaa MAP-sääntöä. LR(y) = L(θ 1 y) L(θ 0 y) > P 0 P 1. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 45/68

46 Neyman-Pearson -ilmaisin ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 46/68

47 Neyman-Pearson -ilmaisin Neyman-Pearson päätöksentekostrategia hyödyntää ilmaisutodennäköisyyttä P D ja väärän hälytyksen todennäköisyyttä P FA. Se sopii binääriseen hypoteesin testaukseen, jossa jakaumien parametrit ovat tunnetut. Menetelmä on hyvin tärkeä tutkaongelmissa, joissa suuri määrä vääriä hälytyksiä voisi tukkia koko järjestelmän. Menetelmässä asetetaan yläraja P FA = P(D 1 H 0 ) = α:lle ja maksimoidaan P D = P(D 1 H 1 ) (tai vaihtoehtoisesti minimoidaan P M = P(D 0 H 1 )) tämän rajoituksen vallitessa. Eli minimoidaan P(D 0 H 1 ), rajoituksella P(D 1 H 0 ) = P FA α. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 47/68

48 Neyman-Pearson -ilmaisin II Voidaan osoittaa, että uskottavuusosamäärätesti on Neyman-Pearson mielessä optimaalinen testi binäärisessa hypoteesitestausongelmassa. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 48/68

49 Neyman-Pearson -ilmaisin III Neyman-Pearson päätöksenteko Päätös tehdään seuraavasti Jos L 1(y) L 0 (y) < λ 0, valitse H 0 Jos L 1(y) L 0 (y) > λ 0, valitse H 1 Jos L 1(y) L 0 (y) = λ 0, valitse H 1 Bernoulli kokeella, jossa onnistumistodennäköisyys γ λ 0 ja γ ovat määritettäviä vakioita. Jatkuvalle satunnaismuuttujalle γ = 0 ja vain λ 0 määritetään. L i (y) on uskottavuusfunktio hypoteesin H i alla. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 49/68

50 Neyman-Pearson -ilmaisin IV Vakiot voidaan määrittää vaatimalla P(D 1 H 0 ) = P(L 1 (Y )/L 0 (Y ) > λ 0 H 0 ) + γp(l 1 (Y )/L 0 (Y ) = λ 0 H 0 ) = α annetulle P FA = P(D 1 H 0 ):n arvolle α. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 50/68

51 Neyman-Pearson -ilmaisin V Neyman-Pearson menetelmän soveltamisesta: 1. Määritetään mikä on nollahypoteesi H 0 ja mikä on vaihtoehtoinen hypoteesi H Valitaan testin koko (size) eli sallittu väärän hälytyksen todennäköisyys. Monessa sovelluksessa asetetaan α = 0.05 tai α = 0.01, joka vastaa testin merkittävyystasoa tilastotieteessä. Esimerkiksi tutkasovelluksessa nollahypoteesi on "ei kohdetta tutkassa", ja valitsemalla α = 0.05 tarkoittaa että ollaan valmiita hyväksymään 5 % mahdollisuus, että kohde ei ole tutkassa vaikka testi kertoo meille että tutkassa on kohde. 3. Lasketaan kynnysarvo λ 0 uskottavuusosamäärätestille. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 51/68

52 Neyman-Pearson -ilmaisin VI Luonnollisesti kynnysarvon on oltava testin koon α funktio. Kynnysarvon määräämiseksi on tunnettava uskottavuusosamäärän jakauma H 0 :n alla. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 52/68

53 Neyman-Pearson -ilmaisin VII Esimerkki Ilmaisutodennäköisyys P D kynnysarvolla λ 0 = γ, jakaumat normaalijakaumia f 0 (x) = N(0, 1) ja f 1 (x) = N(µ, 1). Ilmaisutodennäköisyys saadaan P D = Q 1 (γ), jossa Q() on komplementaarinen kertymäfunktio Q(x) = 1 F(x). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 53/68

54 Neyman-Pearson -ilmaisin VIII Esimerkki Väärän hälytyksen todennäköisyys P FA kynnysarvolla γ, jakaumat normaalijakaumia f 0 = N(0, 1) ja f 1 = N(µ, 1). P FA saadaan F 0 (γ) = 1 Q 0 (γ). ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 54/68

55 ROC-käyrä ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 55/68

56 ROC-käyrä Ilmaisun todennäköisyyden P D ja väärän hälytyksen todennäköisyyden P FA funktionaalista yhteyttä (kuvaajaa) ρ kutsutaan ilmaisimen ROC-käyräksi(Receiver Operating Characteristic), ts. P D = ρ(p FA ). Jokainen piste ROC-käyrällä vastaa tiettyä ilmaisimen kynnysarvoa. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 56/68

57 Sovitettu suodin ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 57/68

58 Sovitettu suodin Oletetaan että ilmaistava signaali on tunnettu aaltomuoto tai deterministinen sekvenssi johon on summautunut normaalijakautunutta kohinaa. Sovitettu suodin on lineaarinen suodatinalgoritmi, joka optimoi ilmaisuun käytettävän testistatistiikan signaali-kohinasuhteen. Itse ilmaisuun käytettävä kynnysarvo voi perustua esim. Neyman-Pearson menetelmään. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 58/68

59 Sovitettu suodin II Olkoon X = (X 1, X 2,..., X n ) T diskreettiaikaisia havaintoja signaalista. Merkitään X = θs + N, jossa s = (s 1, s 2,..., s n ) T on tunnettu reaalinen signaalivektori, N N(0, σ 2 I) Ilmaisimen tehtävänä on päättää mitä hypoteesia tilanne vastaa X:n realisaation x = (x 1, x 2,..., x n ) T perusteella. Jos meillä on tilanne, jossa on pelkästään kohinaa, niin signaalivektorin amplitudi θ = 0 ja X i ovat riippumattomia, skalaareja, nollakeskiarvoisia normaalijakautuneita kohinahavaintoja X i = N i, ja niiden varianssi σ 2 oletetaan tunnetuksi. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 59/68

60 Sovitettu suodin III Vaihtoehtoisessa tilanteessa meillä on havainnoissa X mukana tunnettu reaalinen signaalivektori s = (s 1, s 2,..., s n ) T, jolla on tunnettu amplitudi θ = a. Nyt ilmaisin käsittelee havaintoja lineaarisesti ja tuottaa ulostulona skalaarin Y = n h i X i = h T X, i=1 missä h T = (h 1, h 2,..., h n ) on lineaarinen painokertoimien vektori. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 60/68

61 Sovitettu suodin IV Ideana on tehdä Y :stä hyvä peruste päätöksentekoon, joka toteutetaan vertaamalla Y :tä johonkin kiinteään kynnysarvoon τ. Vektori h pitää suunnitella siten, että saadaan suurin mahdollinen ero tilastollisessa mielessä ulostuloihin Y signaali+kohinaa tai pelkästään kohinaa hypoteeseille. Tällainen rakenne on helppo toteuttaa ja siten hyvin käyttökelpoinen käytännön ilmaisinjärjestelmissä. Tämä rakenne osoittautuu myös globaalisti optimiksi Gaussisen kohinan tapauksessa. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 61/68

62 Sovitettu suodin V ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 62/68

63 Sovitetun suotimen suorituskyky Suorituskykymittana signaalikohinasuhde Y :n erottelukykyä hypoteesien välillä voidaan analysoida tarkastelemalla Y :n eri tapausten (S + N ja N) odotusarvojen erotuksen neliön suhdetta Y :n varianssiin pelkän kohinan tapauksessa: (E[Y S + N] E[Y N])2 SNR = Var(Y N) E[Y N] = E[h T N] = h T E[N] = 0 ja E[Y S + N] = h T (as) = a n i=1 h is i Var(Y N) = E[(h T N) 2 ] = h T E[NN T ]h = h T R N h = σ 2 n i=1 h2 i ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 63/68

64 Sovitetun suotimen suorituskyky II Lineaarisen suotimen ulostulon signaalikohinasuhteeksi saadaan siis SNR = a2 (h T s) 2 h T R N h = a2 ( n i=1 h is i ) 2 σ 2 n i=1 h2 i SNR maksimoituu kun h:n ja s:n sisätulo (projektio, pistetulo) maksimoituu, mikä tapahtuu kun h on skaalattu versio s:stä. Valkoisen kohinan tapauksessa signaalin amplitudia ja kohinan varianssia ei tarvita optimikertoimien johtamisessa. Yleisemmässä tapauksessa (mielivaltainen kohinan kovarianssimatriisi R N ) optimipainokertoimet saadaan h o = R 1 N s. (8) ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 64/68

65 Sovitetun suotimen suorituskyky III Tällaista FIR suodinta kutsutaan sovitetuksi suotimeksi. Jos Y o on normalisoitu vakiolla s T R 1 N s, sillä on yksikkövarianssi ja sen odotusarvoksi signaali+kohina tilanteessa saadaan d = a s T R 1 N s. d:n neliö on optimoitu SNR sovitetun suodattimen ulostulossa eli d = SNR. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 65/68

66 Sovitetun suotimen suorituskyky IV Esimerkki sovitetun suodattimen ROC-käyrästä eri d arvoilla. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 66/68

67 Sovitetun suotimen suorituskyky V Esimerkki Antenniryhmien signaalinkäsittelyssä tunnetaan (kompleksisen) signaalin malli s C M tulosuunnan φ funktiona s(φ), jossa vektorin M elementtiä vastaavat signaalin arvoa M:ssä eri antennissa. Oletetaan että näytteistetty signaali on muotoa X = s(φ) + N, jossa N CN(0, R N ). (Normalisoitu) sovitettu suodin suuntaan φ on tällöin h o (φ) = R 1 N s(φ) s(φ) T R 1 N s(φ) ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 67/68

68 Sovitetun suotimen suorituskyky VI Tämä on ns. keilanmuodostus (beamforming) ratkaisu, ja yhden signaalilähteen (tulosuunnan) tapauksessa sen maksimointi φ:n suhteen johtaa myös suurimman uskottavuuden estimaattoriin. Mallia voi laajentaa myös useamman parametrin ja moniulotteisen mallin tapaukseen. ELEC-C5210 Satunnaisprosessit tietoliikenteessä (5op) 68/68

4.0.2 Kuinka hyvä ennuste on?

4.0.2 Kuinka hyvä ennuste on? Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Maximum likelihood-estimointi Alkeet

Maximum likelihood-estimointi Alkeet Maximum likelihood-estimointi Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Maximum likelihood-estimointi p.1/20 Maximum Likelihood-estimointi satunnaismuuttujan X

Lisätiedot

3.6 Su-estimaattorien asymptotiikka

3.6 Su-estimaattorien asymptotiikka 3.6 Su-estimaattorien asymptotiikka su-estimaattorit ovat usein olleet puutteellisia : ne ovat usein harhaisia ja eikä ne välttämättä ole täystehokkaita asymptoottisilta ominaisuuksiltaan ne ovat yleensä

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

Suodatus ja näytteistys, kertaus

Suodatus ja näytteistys, kertaus ELEC-C7230 Tietoliikenteen siirtomenetelmät Luento 6: Kantataajuusvastaanotin AWGN-kanavassa II: Signaaliavaruuden vastaanotin a Olav Tirkkonen Aalto, Tietoliikenne- ja tietoverkkotekniikan laitos a [10.6.3-10.6.6;

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio.

Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi on lineaarinen projektio. Määritelmä 4.3. Estimaattoria X(Y ) nimitetään lineaariseksi projektioksi, jos X on lineaarinen kuvaus ja E[(X X(Y )) Y] 0 }{{} virhetermi Lause 4.2. Lineearinen pienimmän keskineliövirheen estimaattoi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin 3 Yleistä estimointiteoriaa Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin 3.1 Johdanto Tähän mennessä olemme tarkastelleet estimointia

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu 1. Tyhjentävä tunnusluku (sucient statistics ) Olkoon (P(X = x θ) : θ Θ) todennäköisyysmalli havainnolle X. Datan funktio T (X ) on Tyhjentävä tunnusluku jos ehdollinen todennäköisyys (ehdollinen tiheysfunktio)

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

2. Uskottavuus ja informaatio

2. Uskottavuus ja informaatio 2. Uskottavuus ja informaatio Aluksi käsittelemme uskottavuus- ja log-uskottavuusfunktioita Seuraavaksi esittelemme suurimman uskottavuuden estimointimenetelmän Ensi viikolla perehdymme aiheeseen lisääkö

Lisätiedot

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI 1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI Edellä esitelty Bayesiläinen luokittelusääntö ( Bayes Decision Theory ) on optimaalinen tapa suorittaa luokittelu, kun luokkien tnjakaumat tunnetaan Käytännössä tnjakaumia

Lisätiedot

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin 3 Yleistä estimointiteoriaa Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin 3.1 Johdanto Tähän mennessä olemme tarkastelleet estimointia

Lisätiedot

Mallipohjainen klusterointi

Mallipohjainen klusterointi Mallipohjainen klusterointi Marko Salmenkivi Johdatus koneoppimiseen, syksy 2008 Luentorunko perjantaille 5.12.2008 Johdattelua mallipohjaiseen klusterointiin, erityisesti gaussisiin sekoitemalleihin Uskottavuusfunktio

Lisätiedot

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

Tilastollinen päättely II, kevät 2017 Harjoitus 2A Tilastollinen päättely II, kevät 07 Harjoitus A Heikki Korpela 3. tammikuuta 07 Tehtävä. (Monisteen tehtävä.3 Olkoot Y,..., Y n Exp(λ. Kirjoita vastaava tilastollisen mallin lauseke (ytf. Muodosta sitten

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B Tilastollinen päättömyys, kevät 7 Harjoitus 6B Heikki Korpela 8. helmikuuta 7 Tehtävä. Monisteen teht. 6... Olkoot Y,..., Y 5 Nµ, σ, ja merkitään S 5 i Y i Y /4. Näytä, että S/σ on saranasuure eli sen

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI

1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI 1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI Edellä esitelty Bayesiläinen luokittelusääntö ( Bayes Decision Theory ) on optimaalinen tapa suorittaa luokittelu, kun luokkien tnjakaumat tunnetaan Käytännössä tnjakaumia

Lisätiedot

Uskottavuuden ominaisuuksia

Uskottavuuden ominaisuuksia Luku 9 Uskottavuuden ominaisuuksia 9.1 Tyhjentävyys T yhjentävyys (Fisher 1922) luonnehtii täsmällisesti havaintoihin sisältyvän informaation kvantitatiivisesti. Parametrin θ estimaatti T(x) on tyhjentävä

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi

Lisätiedot

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia

Lisätiedot

2. Teoriaharjoitukset

2. Teoriaharjoitukset 2. Teoriaharjoitukset Demotehtävät 2.1 Todista Gauss-Markovin lause. Ratkaisu. Oletetaan että luentokalvojen standardioletukset (i)-(v) ovat voimassa. Huomaa että Gauss-Markovin lause ei vaadi virhetermien

Lisätiedot

x 4 e 2x dx Γ(r) = x r 1 e x dx (1)

x 4 e 2x dx Γ(r) = x r 1 e x dx (1) HY / Matematiikan ja tilastotieteen laitos Todennäköisyyslaskenta IIA, syksy 217 217 Harjoitus 6 Ratkaisuehdotuksia Tehtäväsarja I 1. Laske numeeriset arvot seuraaville integraaleille: x 4 e 2x dx ja 1

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

η i (θ)t i (x) A(θ) + c(x),

η i (θ)t i (x) A(θ) + c(x), 288 Luku 10. Perusmallit ja niiden sovelluksia muotoa (10.9.1) log f θ (x) = p η i (θ)t i (x) A(θ) + c(x), i=1 missä θ = (θ 1,...,θ p ) ja A(θ), c(x), η i (θ) ja T i (x) ovat tunnettuja funktioita. Lisäksi

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4

3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4 Ü µ ½ ¾Ü¾µ Ü¾Ê 3.11.2006 1. Satunnaismuuttujan tiheysfunktio on ¼ ļ ܽ ܾ ÜÒµ Ä Ü½ ÜÒµ Ò Ä Ü½ ܾ ÜÒµ ܽ µ ܾ µ ÜÒ µ Ò missä tietenkin vaaditaan, että ¼. Muodosta :n ¾Ä ܽ ÜÒµ Ò ½¾ ܾ Ò ½ ¾Ü¾½µ ½ ¾Ü¾Òµ

Lisätiedot

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2 HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 208 Harjoitus 4 Ratkaisuehdotuksia Tehtäväsarja I. Satunnaismuuttuja U Exp(2) ja V = U/(3 + U). Laske f V käyttämällä muuttujanvaihtotekniikkaa.

Lisätiedot

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II G. Gripenberg Aalto-yliopisto 11. helmikuuta 2015 G. Gripenberg (Aalto-yliopisto) MS-A0502 Todennäköisyyslaskennan ja tilastotieteen

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu ilastollinen päättely 5.. Johdanto Estimointi, Joukkoestimointi, Kriittinen alue, uottamusjoukko, uottamustaso, uottamusväli, Otos, Parametri, Peittotodennäköisyys, Piste-estimointi, Väliestimaatti, Väliestimaattori,

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx. Yhteenveto: Satunnaisvektorit ovat kuvauksia tn-avaruudelta seillaiselle avaruudelle, johon sisältyy satunnaisvektorin kaikki mahdolliset reaalisaatiot. Satunnaisvektorin realisaatio eli otos on jokin

Lisätiedot

5.7 Uskottavuusfunktioon perustuvia testejä II

5.7 Uskottavuusfunktioon perustuvia testejä II 5.7 Uskottavuusfunktioon perustuvia testejä II Tässä pykälässä pohditaan edellä tarkasteltujen kolmen testisuureen yleistystä malleihin, joiden parametri on useampiulotteinen, ja testausasetelmiin, joissa

Lisätiedot

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä: 4. Tyhjentyvyys Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä: Voidaanko päätelmät perustaa johonkin tunnuslukuun t = t(y) koko aineiston y sijasta? Mitä

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4 Tilastollisen aineiston kuvaileminen, mallintaminen ja estimointi Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 4

031021P Tilastomatematiikka (5 op) viikko 4 031021P Tilastomatematiikka (5 op) viikko 4 Jukka Kemppainen Mathematics Division Tilastollinen aineisto Tilastolliset menetelmät ovat eräs keino tutkia numeerista havaintoaineistoa todennäköisyyslaskentaa

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1 Tilastolliset menetelmät Osa 1: Johdanto Johdanto tilastotieteeseen KE (2014) 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä ja malleja, joiden avulla reaalimaailman ilmiöistä voidaan

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 21. syyskuuta 2007 Antti Rasila () TodB 21. syyskuuta 2007 1 / 19 1 Satunnaismuuttujien riippumattomuus 2 Jakauman tunnusluvut Odotusarvo Odotusarvon ominaisuuksia

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH 8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4 Tilastollisen datan kuvaileminen, mallintaminen ja estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Nordlund Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 7 (vko 44/003) (Aihe: odotusarvon ja varianssin ominaisuuksia, satunnaismuuttujien lineaarikombinaatioita,

Lisätiedot

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1, Todennäköisyyslaskenta, 2. kurssikoe 7.2.22 Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu.. Satunnaismuuttujien X ja Y yhteistiheysfunktio on

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 3

031021P Tilastomatematiikka (5 op) viikko 3 031021P Tilastomatematiikka (5 op) viikko 3 Jukka Kemppainen Mathematics Division Jakauman tunnusluvut Jakauman tärkeimmät tunnusluvut ovat odotusarvo ja varianssi. Odotusarvo ilmoittaa jakauman keskikohdan

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot