Identifiointiprosessi

Samankaltaiset tiedostot
Identifiointiprosessi II

Identifiointiprosessi

Parametristen mallien identifiointiprosessi

Parametristen mallien identifiointiprosessi

Missä mennään. systeemi. identifiointi. mallikandidaatti. validointi. malli. (fysikaalinen) mallintaminen. mallin mallin käyttötarkoitus, reunaehdot

Dynaamisten systeemien identifiointi 1/2

Identifiointiprosessi

Identifiointiprosessi

Mat Systeemien identifiointi, aihepiirit 1/4

Mat Tilastollisen analyysin perusteet, kevät 2007

Batch means -menetelmä

Mat Tilastollisen analyysin perusteet, kevät 2007

Identifiointiprosessi

Sovellettu todennäköisyyslaskenta B

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

Väliestimointi (jatkoa) Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Signaalimallit: sisältö

tilastotieteen kertaus

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Estimointi. Vilkkumaa / Kuusinen 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

9. Tila-avaruusmallit

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Tilastollinen aineisto Luottamusväli

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Osa 2: Otokset, otosjakaumat ja estimointi

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit laatueroasteikollisille muuttujille

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

11. laskuharjoituskierros, vko 15, ratkaisut

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Regressioanalyysi. Vilkkumaa / Kuusinen 1

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

5.7 Uskottavuusfunktioon perustuvia testejä II

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Todennäköisyyden ominaisuuksia

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

1. Tilastollinen malli??

HAVAITUT JA ODOTETUT FREKVENSSIT

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Sovellettu todennäköisyyslaskenta B

Regressioanalyysi. Kuusinen/Heliövaara 1

Tilastotieteen aihehakemisto

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Maximum likelihood-estimointi Alkeet

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Testejä suhdeasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Nämä ovat siis minimivaatimukset, enemmänkin saa ja suositellaan

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Harha mallin arvioinnissa

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

1. Tutkitaan tavallista kahden selittäjän regressiomallia

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Erikoistyö: Alkoholin kulutusmenojen ennustaminen

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

3.6 Su-estimaattorien asymptotiikka

Transkriptio:

Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi => askel-, impulssi- ja taajuusvaste, ajatuksia esim. kertaluvuista Parametrien estimointi mallirakenteen (rakenneparametrit) valinta Mallin arviointi: - Simulointi, navat, erilaiset vasteet, jne... Mallin validointi: - Parametrien merkitsevyys, residuaalianalyysi, jne...

Mallin validointi Koe suunniteltu, data kerätty, parametrit estimoitu, mallirakenne valittu Onko malli hyvä? Onko malli käyttötarkoitukseensa tarpeeksi hyvä? (tärkein pointti) Onko malli sopusoinnussa havaitun datan kanssa? (validointi keskittyy tähän) Kuvaako malli todellista systeemiä? (mahdotonta vastata pitävästi, validoinnilla tukea antavia tuloksia) Validointi = verrataan mallia mahdollisimman suureen todellisesta systeemistä peräisin olevaan tietomäärään

Validoinnin motivaatio Usein mahdotonta, kallista tai vaarallista kokeilla tosikäytössä kaikkia mahdollisia malleja Luottamus malliin luotava off-line Tärkeä mittatikku mallin käyttötarkoitus: Voidaanko mallinnusprosessin motivaationa ollut ongelma ratkaista mallin avulla? Näkökulmia: parametriestimaattien ominaisuudet sisäänmeno-ulostulokäyttäytyminen mallin redusoinnin vaikutus simulointi ja ennustaminen residuaalianalyysi

Parametriestimaattien ominaisuudet Rakenteelliset mallit: ovatko parametriestimaatit järkeviä? esim. kitkakertoimien merkit oikein Parametrien herkkyysanalyysi: simulointi hieman poikkeutetuin parametriarvoin (esim. luottamusvälin sisällä) suuria poikkeamia => lisäidentifiointi tarpeen Black box-mallin parametriestimaattien luottamusvälit: Estimaatit asymptoottisesti normaalijakautuneet => t-testattavissa Nolla sisältyy luottamusväliin => parametri turha Kaikkien estimaattien varianssit ja kovarianssit suuria => selittäjien kovarianssimatriisi on lähes singulaarinen (liian korkea kertaluku?)

Sisäänmeno-ulostulokäyttäytyminen Black box malleilla tärkeä Lineaariset mallit => Boden diagrammi tärkeässä osassa Epälineaariset => simulointi Jos malli ei kuvaa systeemiä, saadaan estimoitaessa approksimaatio, joka riippuu Koeolosuhteista Esisuodatuksesta Mallirakenteesta =>Parametristen mallien Boden diagrammien vertailu erilaisilla datoilla, esisuodatuksilla ja mallirakenteilla datasta estimoituun taajuusvaste-estimaattiin hyvä työkalu

Simulointi ja ennustaminen Usein mallin käyttötarkoitus tärkeä rooli Simulointi riippumattoman datan ohjauksella ja riippumattoman ulostulon ennustaminen nähdään suoraan millaisia ilmiöitä malli kuvaa, millaisia ei Mallin redusointi: jos kertaluvuiltaan alennettu malli tuottaa oleellisesti saman sisäänmeno-ulostulokäytöksen, malli oli liian monimutkainen

Residuaalianalyysi Ennustevirheet kuvaavat sitä osuutta datassa, jota malli ei pysty kuvaamaan ε(t)=y(t)-y^(t,θ^) ennustevirhe ( parametrien funktio ) = residuaali ( numeroita annetulla parametrillä ) Yksinkertaiset testit: Olkoon meillä N arvoa (estimointi- tai validointidataa) max N ε(t), N N i= 2 ε ( t) arvio maksimi- tai keskivirheistä; jos asiat eivät muutu, mallin ei tulisi koskaan tuottaa suurempia poikkeamia

Oleellista on, että Residuaalien valkoisuus residuaalit eivät riipu ohjauksesta u(t) ja residuaalit eivät riipu toisistaan => Ristikovarianssit oleellisesti nollia N i= intuitio: jos ennustevirhe riippuu u(t)stä, ulostulo olisi voitu ennustaa paremmin ottamalla riippuvuus huomioon => Autokovarianssit oleellisesti nollia Rˆ Rˆ εu ε ( τ) ( τ) = = N i= intuitio: jos ennustevirhe riippuu menneistä virheistä, se olisi voitu ennustaa paremmin N N ε( t) u( t τ) ε( t) ε( t τ)

Tilastollinen testaaminen /2 Jos ohjaukset ja residuaalit ovat riippumattomia, ovat ristikorrelaatiot x ˆ τ = Rεu( τ)/ Rε(0) R u (0) asymptoottisesti normaalijakautuneita N(0,/N) Suure m 2 dist 2 y= N xi χ ( m) i= Saadaan luottamusvälit yksittäisille ristikorrelaatioille (95%: x τ <=.96/N 0.5 kaikille ristikorrelaatioille tiettyyn viiveeseen asti kerralla Huom! Korrelaatio negatiivisella τ:n arvolla voi olla merkki takaisinkytkennästä, ei väärästä mallirakenteesta

Tilastollinen testaaminen 2/2 Vastaavasti autokorrelaatioille xτ = Rˆ ε( τ)/ Rε(0) Pätee oletuksella että residuaalit ovat valkoista kohinaa: yksittäinen autokorrelaatio asymptoottisesti normaalijakautunut N(0,/N) ja = N i= Saadaan luottamusvälit y m x 2 i dist 2 χ ( m) yksittäisille autokorrelaatioille (95%: x τ <=.96/N 0.5 kaikille autokorrelaatioille tiettyyn viiveeseen asti kerralla

Muita testejä Residuaalien jakauma symmetrinen? H 0 : ε(t) riippumaton ja symmetrisesti jakautunut => X N = ε(t):n etumerkin muutosten lkm sarjassa ε(),...,ε(n) asymptoottisesti normaalijakautunut N(N/2,N/4) Vinouden laskeminen residuaalien histogrammille Onko residuaalit normaalijakautuneet? (ks. TAP, luento nro. 4) χ 2 -yhteensopivuustesti Otoksen vertaaminen annettuun (normaali) jakaumaan Bowmanin ja Shentonin testi Testisuure riippuu otoksen huipukkuudesta ja vinoudesta Wilkin ja Shapiron testi Rankit-plot kuvio ja korrelaatikertoimien neliö

Identifiointiprosessi Koesuunnittelu Identifiointikoe Datan esikäsittely Mallirakenteen valinta Parametrien estimointi Mallin validointi Mallin käyttö & ylläpito