Harjoitus 3: Regressiomallit (Matlab)

Samankaltaiset tiedostot
Harjoitus 3: Regressiomallit (Matlab)

Regressioanalyysi. Kuusinen/Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus regressioanalyysiin. Heliövaara 1

Harjoitus 9: Excel - Tilastollinen analyysi

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Dynaamiset regressiomallit

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Johdatus regressioanalyysiin

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Harha mallin arvioinnissa

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

2. Teoriaharjoitukset

Korrelaatiokertoinen määrittely 165

Kohdeyleisö: toisen vuoden teekkari

SCI-C0200 Fysiikan ja matematiikan menetelmien studio

. Kun p = 1, jono suppenee raja-arvoon 1. Jos p = 2, jono hajaantuu. Jono suppenee siis lineaarisesti. Vastaavasti jonolle r k+1 = r k, suhde on r k+1

6. Tietokoneharjoitukset

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

Harjoitus 1: Matlab. Harjoitus 1: Matlab. Mat Sovelletun matematiikan tietokonetyöt 1. Syksy 2006

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Estimointi. Vilkkumaa / Kuusinen 1

Yleistetyistä lineaarisista malleista

4. Tietokoneharjoitukset

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Yleinen lineaarinen malli

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

4. Tietokoneharjoitukset

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Ch 12-4&5 Elastisuudesta ja lujuudesta

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

1 Rajoittamaton optimointi

MS-C1340 Lineaarialgebra ja

Harjoitus 4: Differentiaaliyhtälöt (Matlab) MS-C2107 Sovelletun matematiikan tietokonetyöt 1

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

1. Tilastollinen malli??

Likimääräisratkaisut ja regularisaatio

Harjoitus 6: Symbolinen laskenta II (Mathematica)

Lämpötila Lämpölaajeneminen Ideaalikaasu. Luku 17

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiomallin valinta. TKK (c) Ilkka Mellin (2007) 1

4 / 2013 TI-NSPIRE CAS TEKNOLOGIA LUKIOSSA. T3-kouluttajat: Olli Karkkulainen ja Markku Parkkonen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Harjoitus 2: Ohjelmointi (Matlab)

3.2.2 Tikhonovin regularisaatio

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9.

Sovituskomennot GeoGebrassa

Identifiointiprosessi

Yhden selittäjän lineaarinen regressiomalli

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa.

Osa 2: Otokset, otosjakaumat ja estimointi

Ohjeita fysiikan ylioppilaskirjoituksiin

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Numeerinen analyysi Harjoitus 3 / Kevät 2017

x = ( θ θ ia y = ( ) x.

Inversio-ongelmien laskennallinen peruskurssi Luento 7 8

MS-C1340 Lineaarialgebra ja

Sovellettu todennäköisyyslaskenta B

Numeeriset menetelmät TIEA381. Luento 8. Kirsi Valjus. Jyväskylän yliopisto. Luento 8 () Numeeriset menetelmät / 35

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Yhteenveto, osa I

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Pienimmän Neliösumman Sovitus (PNS)

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

pitkittäisaineistoissa

TEKNILLINEN KORKEAKOULU Systeemianalyysin laboratorio. Kimmo Berg. Mat Optimointioppi. 9. harjoitus - ratkaisut

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Ratkaisuehdotukset LH 8 / vko 47

Matematiikan tukikurssi

Harjoitus 2: Matlab - Statistical Toolbox

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

Numeeriset menetelmät

MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 2: Usean muuttujan funktiot

Transkriptio:

Harjoitus 3: Regressiomallit (Matlab) SCI-C0200 Fysiikan ja matematiikan menetelmien studio SCI-C0200 Fysiikan ja matematiikan menetelmien studio 1

Harjoituksen aiheita Pienimmän neliösumman menetelmä mallin sovittamisessa Lineaarisen regressiomallin sovittaminen ja käyttö - Ennustamisessa - Mallin parametrien estimoimisessa Oppimistavoitteet Ymmärrät PNS-sovitteen idean Osaat muodostaa lineaarisen mallin käyttäen Matlabin valmiita työkaluja Opit joitain regressiomallien sovelluskohteita SCI-C0200 Fysiikan ja matematiikan menetelmien studio 2

Regressioanalyysi Peruskysymys: Kuinka selitettävän muuttujan havaittu arvo riippuu selittävien muuttujien arvoista? Regressioanalyysissä selittävien ja selitettävän muuttujan arvojen riippuvuudelle rakennetaan regressiomalli, joka sisältää systemaattisen osan ja satunnaisosan. Systemaattinen osa kuvaa selittävien ja selitettävän välistä tilastollista riippuvuutta. Esimerkiksi iän [25, 60] ja tulotason välillä voisi päteä tilastollinen riippuvuus: keskimäärin 5v ikäero tarkoittaa 4000e:n erotusta vuosiansioissa Satunnaisosan avulla huomioidaan se, että systemaattisen osan kuvaama riippuvuussuhde ei aina päde. Esimerkiksi: 5v ikäero tarkoittaa 4000e±3000e:n erotusta vuosiansioissa 95% tapauksista. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 3

Yhden selittäjän lineaarinen regressiomalli Olkoon annettuna havaintodata (x j, y j ), j = 1,..., n, jossa y j x j = Selitettävän muuttujan havaittu arvo havaintoyksikössä j = Selittävän muuttujan havaittu arvo havaintoyksikössä j 240 220 200 180 160 140 120 100 80 Selitettävä muuttuja y 60 0 20 40 60 80 100 Selittävä muuttuja x SCI-C0200 Fysiikan ja matematiikan menetelmien studio 4

Yhden selittäjän lineaarinen regressiomalli Regressioanalyysissä etsitään dataan parhaiten sopivaa regressiomallia tiettyjen mallien, kuten lineaaristen mallien, joukosta Yhden selittäjän lineaarinen regressiomalli on muotoa y j = β 0 + β 1 x j }{{} + ε j }{{}, j = 1, 2,..., n Systemaattinen osa Satunnaisosa β 0 = tuntematon regressiokerroin vakioselittäjälle 1 β 1 ε j = tuntematon regressiokerroin selittäjälle x = Satunnainen virhetermi havaintoyksikössä j Tyypillinen toteutustapa on pienimmän neliösumman (PNS) menetelmä. Siinä etsitään parameterien β 0 ja β 1 arvot s.e. neliösumma n j=1 ε2 j minimoituu. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 5

Yhden selittäjän lin. regressiomalli Matlabissa >> x=[16,97,96,49,80] ; >> y=[73,229,206,124,164] ; >> model1=fitlm(x,y, linear ) %luo model1-muuttujaan lineaarisen mallin Linear regression model: y ~ 1 + x1 Estimated Coefficients: Estimate SE tstat pvalue (Intercept) 39.707 15.791 2.5145 0.086594 x1 1.7676 0.21223 8.329 0.0036274 >>plot(x,y, o ), hold on >>t=[0,100] ; >>plot(t, predict(model1,t)) %predict laskee ennusteet pisteissä t >>grid on, xlabel( Selittävä muuttuja x ), ylabel( Selitettävä muuttuja y ) SCI-C0200 Fysiikan ja matematiikan menetelmien studio 6

Yhden selittäjän lin. regressiomalli Matlabissa 250 200 Selitettävä muuttuja y 150 100 50 0 0 20 40 60 80 100 Selittävä muuttuja x SCI-C0200 Fysiikan ja matematiikan menetelmien studio 7

fitlm-komennon käyttö edellisessä esimerkissä fitlm komento otti sisäänsä - x: pystyvektori selittäjän havaituista arvoista (jos useita selittäjiä niin x on matriisi) - y: pystyvektori selitettävän muuttujan havaituista arvoista - linear viittaa siihen, että luodaan lineaarinen malli (johon oletusarvoisesti kuuluu vakiotermi) model1=fitlm(x,y, linear ) loi model1 nimisen tiedoston, joka sisältää dataan sovitetun lineaarisen mallin Tulosteesta voi lukea selittäjille estimoidut regressiokertoimet Plottaamisessa käytetään komentoa predict(model1,t), joka laskee mallin ennusteet t-vektorin pisteissä SCI-C0200 Fysiikan ja matematiikan menetelmien studio 8

Termejä Kun malli on sovitettu dataan, niin tuntemattomille parametereille β 0 ja β 1 saadaan estimaatit. Niitä merkitään symboleilla b 0 ja b 1. Mallin ennuste y y = b 0 + b 1 x, on regressiosuoran arvo mielivaltaisessa pisteessä x. Sovite ŷ j = b 0 + b 1 x j, j = 1,..., n on regressiosuoran arvo havaintopisteessä x j. Residuaali e j = y j ŷ j, j = 1, 2,..., n on selitettävän muuttujan havaitun arvon y j ja sovitteen ŷ j arvon erotus. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 9

Sovitteet ja residuaalit esimerkissä 250 200 Sovite 3 Selitettävä muuttuja y 150 100 Residuaali e 3 havaintoyksikkö (x 3, y 3 ) 50 0 0 10 20 30 40 50 60 70 80 90 100 Selittävä muuttuja x SCI-C0200 Fysiikan ja matematiikan menetelmien studio 10

Lineaarisen regressioanalyysin oletuksista Lineaarinen regressiomalli olettaa, että selittävän ja selitettävän muuttujan välillä pätee lineaarinen tilastollinen riippuvuussuhde. Virhetermit ε j tulkitaan satunnaismuuttujina, joista tehdään standardioletukset: (i) E(ε j ) = 0, j = 1, 2,..., n. (ii) Var(ε j ) = σ 2, j = 1, 2,..., n. (iii) Cor(ε j, ε l ) = 0, j l. Tavallisesti myös: (iv) ε j N(0, σ 2 ), j = 1, 2,..., n. Ennusteisiin tulee aina suhtautua harkiten. Mallin oletukset eivät välttämättä päde pisteessä tai ajanhetkessä, jolle ennustetta laaditaan. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 11

PNS-menetelmä yleisemmin Yleisemmin PNS-menetelmä voidaan nähdä tapana sovittaa funktio f(x; β) annettuun pistejoukkoon (x j, y j ), j = 1,..., n Funktion f muoto riippuu parametrin β arvosta. Funktion ei tarvitse olla lineaarinen PNS-menetelmässä etsitään parametrille β PNS-estimaatti b siten, että regressiomallin y j = f(x j ; β) + ε j, j = 1, 2,..., n virhetermien ε j neliöiden summa minimoituu. Kyseessä on siis rajoittamaton (=ei rajoitusehtoja) optimointitehtävä n n min ε 2 j = min (y j f(x j ; β)) 2, β β j=1 jonka päätösmuuttuja on β. j=1 SCI-C0200 Fysiikan ja matematiikan menetelmien studio 12

PNS-menetelmä yleisemmin, Matlab esimerkki lsqcurvefit sovittaa käyrän dataan käyttäen PNS-menetelmää Sovitetaan esimerkiksi annettuun dataan käyrää y = β 0 + x β 1 Ensin tulee määritellä funktio omaan tiedostoonsa. Tuntematon parametri tulee olla ensimmäisessä argumentissa. Toisessa x-suuntainen data. function F = myfun(b,xdata) F = b(1)+xdata.^b(2); Olkoon data seuraavissa vektoreissa: xdata=[0 1 2 3 4 5 6 7 8 9 10]; ydata=[4.9 2.9 10.1 14.0 21.7 29.8 43.8 51.4 72.9 85.1 105.2]; Sitten voidaankin käyttää sovitusalgoritmia: b_est=lsqcurvefit(@(b,xdata) myfun(b,xdata),[0;0],xdata,ydata) SCI-C0200 Fysiikan ja matematiikan menetelmien studio 13

PNS-menetelmä yleisemmin, Matlab esimerkki Sovitettava funktio annetaan ensimmäisessä argumentissa. Sen eteen tulee laittaa @(b,xdata), jotta lsqcurvefit toimii. Toisessa argumentissa annetaan alkuarvaus tuntemattomien parametrien arvoille. Kuva voidaan piirtää vaikkapa näin: figure hold on plot(xdata,ydata,. ) xlabel( Selittävä muuttuja x ) ylabel( Selitettävä muuttuja y ) %piirretään funktio b_est(1)+xdata.^b_est(2); %käytetään x_akselilla tiheämpää väliä niin tulee siistimpi kuva x_akseli=[0:0.1:10]; plot(x_akseli, myfun(b_est, x_akseli), r ) SCI-C0200 Fysiikan ja matematiikan menetelmien studio 14

PNS-menetelmä yleisemmin, Matlab esimerkki 120 100 Selitettävä muuttuja y 80 60 40 20 0 0 2 4 6 8 10 Selittävä muuttuja x SCI-C0200 Fysiikan ja matematiikan menetelmien studio 15

Tehtävä A: Lineaarinen energiankulutusmalli Tehtävänäsi on muodostaa lineaarinen regressiomalli, jossa selittäjänä on kotitalouden varallisuus ja selitettävänä on kotitalouden kuluttama energia Tehtävässä käytetään Matlabin fitlm ja predict komentoja Tehtävässä käytettävä data löytyy seuraavalta sivulta ja lisäohjeita sen jälkeiseltä sivulta SCI-C0200 Fysiikan ja matematiikan menetelmien studio 16

Tehtävä A: Lineaarinen energiankulutusmalli Kotitalouden varallisuus Käytetty energia 20.0 1.8 30.5 3.0 40.0 4.8 55.1 5.0 60.3 6.5 74.9 7.0 88.4 9.0 95.2 9.1 SCI-C0200 Fysiikan ja matematiikan menetelmien studio 17

Tehtävä A: Lineaarinen energiankulutusmalli 1. Tuo tehtävänannon data Matlabiin, tallenna ne pystyvektoreihin varallisuus ja energia. 2. Plottaa tehtävänannon data, luo lineaarinen malli ja piirrä sen ennusteet välillä [10, 120] samaan kuvaan datan kanssa. Katso esimerkkiä luento-osuuden esimerkistä. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 18

Tehtävä A: Luottamusvälien laskeminen ja visualisointi Regressisuoran mukainen ennuste pätee keskimäärin. Usein on kuitenkin tarpeellista tietää kuinka tarkka ennuste on. 3. Laske ennusteille 64% luottamusvälit (=välit joiden sisään uusi havainto osuisi 64% todennäköisyydellä). Ohjeita seuraavalla sivulla. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 19

Olkoon x_akseli=[10:1:120] ja model=fitlm(varallisuus,energia, linear ) Syntaksilla [ypred,yci]=predict(model,x_akseli, alpha,p, Prediction, observation ) - ypred:iin tallentuu ennusteet, jotka vastaavat selittäjän arvoja {10, 11,..., 120}. - yci:n tallentuu kunkin ennusteen luottamusvälin ala- ja ylärajat. Yksittäinen havainto sisältyy luottamusvälin sisään todennäköisyydellä (1 p) 100%. - Kohta..., alpha,p,... kertoo predictille luottamusvälin leveyden - Kohta..., Prediction, observation,... kertoo, että luottamusvälit lasketaan yksittäisille ennusteille, ei ennusteiden odotusarvoille SCI-C0200 Fysiikan ja matematiikan menetelmien studio 20

Tehtävä A: Luottamusvälien laskeminen ja visualisointi v Piirrä kuva, jossa näkyy - punaisina rakseina tehtävänannon data, - estimoidun regressiomallin ennusteet välillä [10, 120] sekä - katkoviivalla ennusteiden 64% luottamusvälit Muista laittaa akseleille selitteet. Laita sopiva legend. Mille välille mallin mukaan varallisuustason 65 energiankulutus osuu 64% varmuudella? SCI-C0200 Fysiikan ja matematiikan menetelmien studio 21

Tehtävä B: Epälineaarisen kasvumallin sovittaminen Rukiinviljelija-systeemitietelijä Risto on havainnut, etta ruisjyvien maksimipaino ja hetki, jona tuo paino saavutetaan vaihtelevat vuosittain. Risto tuumii, että voisiko hän käyttää kasvukauden dataa ennustamaan hetkeä, jona paino on maksimissaan ja korjuu kannattaa suorittaa. Korjuuhetkea odotellessaan voisi hän vaikkapa käydä etelänmatkalla Helsingissä. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 22

Tehtävä B: Malli ruisjyvien painolle Jyvien painon w (selitettävä) kehitystä ajan t (selittäjä) funktiona voi mallintaa yhtälöllä w = f(t; w max, t max, t }{{ v ) = w } max (1 + t max t t )( ) tmax tmax tv, t max t v t max β (1) kun t max t 0. Kun t > t max, niin f(t; w max, t max, t v ) = w max. Mallin parametrien tulkinnat ovat seuraavat: - w max on maksimipaino, jonka jyvä saavuttaa, - t max on hetki jona maksimipaino saavutetaan ja - t v on hetki, jona jyvän painon kasvunopeus on suurimmillaan. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 23

Tehtävä B: Malli ruisjyvien painolle Tehtävänä on siis selvittää parametrit w max, t max ja t v, joilla malli sopii dataan mahdollisimman hyvin. Käytä PNS-menetelmää hyödyntävää lsqcurvefit-komentoa Mittaus j Jyvän paino w j (0.1 g) Päiviä 1. kukinnosta t j 1 2 2 2 8 10 3 19 18 4 32 26 5 43 31 6 45 35 SCI-C0200 Fysiikan ja matematiikan menetelmien studio 24

Tehtävä B: Ohjeita 1. Muodosta ensin funktio: function w = kasvumalli(beta,t) Funktion argumentti beta sisältää kasvumallin parametrit β = [w max, t max, t v ]. Argumentti t on vektori ajanhetkistä. Funktio tuottaa vektorin w, jossa on kasvumallilla lasketut jyvän painot, jotka vastaavat funktiolle annettuja ajanhetkiä. Vinkki: Toteuta funktio kaksivaiheisesti: Käytä ensin kaavaa (1). Huom: Voit kertoa vektoreita alkioittain käyttäen pistettä, esim: [2 2].*[1 2]=[2 4] ja [2 2].^2=[4 4] Sitten huomioi, että kun w saavuttaa maksimiarvonsa, niin sen tulee pysyä siinä. Voit esim. asettaa funktiosi loppuun w(i:end)=maxw, jossa i on indeksi, josta löytyy w:n maksimi ja maxw on tuo maksimi. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 25

Tehtävä B: Ohjeita 2. Käytä Matlabin lsqcurvefit-työkalua löytääksesi β, jolla malli sopii dataan parhaiten. Kts. help lsqcurvefit-helpin 3. kappaleen teksti ja 1. esimerkki. Käytä alkuarvausta β = [40, 40, 20]. v Piirrä kuva, jossa näkyy tehtävänannon data ja mallin ennusteet aikavälillä [0, 50], eli arvot w(t; w max, t max, t v ), kun t [0, 1, 2,..., 50] lisää kuvaan ruudukko (grid) ota kuvaajasta ylimääräinen y-suuntainen tyhjä tila pois (ylim) nimeä käppyrät (legend), nimeä akselit sopivasti. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 26

Tehtävä B: Ohjeita Kommentoi kuvaajaa: Miltä se näyttää? Tänään on 35. päivä sitten ensimmäisen kukinnon. Kuinka monta päivää malli ennustaa kuluvan siihen, että jyvät saavuttavat maksimipainonsa? SCI-C0200 Fysiikan ja matematiikan menetelmien studio 27

Kotitehtävä: Fysikaalisen systeemin parametrien estimointi Eräs lineaaristen mallien sovellus on fysikaalisten systeemien parametrien estimointi Tavallisesti lineaarinen regressiomalli olettaa, että jokaiseen havaintopisteeseen liittyvä epävarmuus on yhtä suurta Tässä tehtävässä sovitat lineaarisen mallin fysikaaliseen mittausdataan, jossa yksittäisten pisteiden tarkkuus vaihtelee SCI-C0200 Fysiikan ja matematiikan menetelmien studio 28

Kotitehtävä: Taustaa - Planckin vakion mittaaminen Haluat mitata Planckin vakion. Mittausjärjestelyssäsi irroitat katodilta valon avulla elektroneja, jotka kulkeutuvat anodille kunnes anodin ja katodin välinen pysätysjännite kasvaa niin suureksi, että se estää elektronien kulkeutumisen anodille. Katodin potentiaali pysyy maadoituksen vuoksi vakiona. Katodilta irtoavien elektroneiden energia riippuu valon taajuudesta. Fysiikan teorian pohjalta olet johtanut seuraavan yhtälön: V 0 = h f + C, (2) e jossa V 0 on pysäytysjännite, f on valon taajuus, h on Planckin vakio, e on elektronin varaus ja C on vakiotermi. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 29

Kotitehtävä: Mittausdata Vaihtelemalla valon taajuutta saat kerättyä seuraavan mittausdatan pysäytysjännitteistä Mittaus Valon Pysäytys i taajuus f (10 12 Hz) jännite V 0 (V) 1 519 1.0 ± 0.15 2 549 1.2 ± 0.40 3 688 1.9 ± 0.20 4 740 2.4 ± 0.30 5 821 2.3 ± 0.10 Arvioit, että valontaajuusdata on virheetöntä. Pysäytysjännitteille olet arvioinut virherajat. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 30

Kotitehtävä: Lineaarisen mallin sovittaminen painotetun neliösumman avulla Haluat sovittaa mittausdataan suoran, jonka kulmakertoimesta voit päätellä Planckin vakion. Koska eri havaintopisteiden tarkkuus vaihtelee, käytä menetelmää, jossa parametrit valitaan siten, että painotettu virheneliösumma minimoituu. Etsit siis vakiotermiä b 0 ja kulmakerrointa b 1 s.e. seuraava painotettu virheneliösumma minimoituu n ( y i (b 1 x i + b 0 ) ) 2, Δy i i=1 jossa Δy i on havainnon i virhetermi ja n on havaintopisteiden lukumäärä. Esim. x 1 = 519, y 1 = 1.0 ja Δy 1 = 0.15. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 31

KT: Analyyttinen ratkaisu estimaateille Painotetun neliösumman minimoiville parametrien arvoille saadaan seuraavat analyyttiset lausekkeet: ja b 1 = 1 D [( n i=1 b 0 = 1 D [( n missä i=1 D = ( 1 n (Δy i ) 2 )( i=1 x 2 n i (Δy i ) 2 )( n i=1 i=1 1 n (Δy i ) 2 )( x i y n i (Δy i ) 2 ) ( i=1 y n i (Δy i ) 2 ) ( i=1 i=1 x 2 n i (Δy i ) 2 ) ( x n i (Δy i ) 2 )( i=1 x n i (Δy i ) 2 )( i=1 i=1 x i (Δy i ) 2 )2 y i (Δy i ) 2 )] (3) x i y i (Δy i ) 2 )], (4) SCI-C0200 Fysiikan ja matematiikan menetelmien studio 32

KT: Analyyttinen ratkaisu estimaateille Lisäksi parametrien estimaateille voidaan laskea (yhden standardipoikkeaman levyiset) virheet Δb 1 = 1 n 1 D (Δy i ) 2 (5) i=1 ja Δb 0 = 1 D n i=1 x 2 i (Δy i ) 2. (6) Näiden avulla parametrien estimaateille saa alarajat b i Δb i ja ylärajat b i + Δb i. Todellinen parametrin arvo on tuon välin sisällä 64% todennäköisyydellä. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 33

Kotitehtävä: Ohjeistus Sovita mittausdataan suora käyttäen edellä kuvattua menetelmää 1. Luo function [b, bci] = sovittaja(x,y,deltay), jonka argumentteja ovat - taajuudet x = [x 1,..., x 5 ], mitatut pysäytysjännitteet y = [y 1,..., y 5 ] ja pysäytysjännitteiden virhetermit Δy = [Δy 1,..., Δy 5 ]. Funktio palauttaa vektorin b = [b 0, b 1 ], joka sisältää vakiotermin ja kulmakertoimen estimaatit (kaavat 3 ja 4), ja matriisin b ci = b 0 Δb 0 b 1 Δb 1, joka sisältää b 0 + Δb 0 b 1 + Δb 1 estimaattien ala- ja ylärajan (kts. sivu 32). SCI-C0200 Fysiikan ja matematiikan menetelmien studio 34

Kotitehtävä: Ohjeistus Vinkki: Käytä lausekkeiden 3-6 summien laskemiseen matlabin alkioittaisia vektorioperaatioita. Välituloksien laskeminen auttaa vähentämään virheitä. Esim. a i b i /c i saadaan syntaksilla sum((a.*b)./c)), jossa a,b,c ovat vektoreita. 2. Estimoi b 0 ja b 1 käyttäen omaa funktiotasi. 3. Piirrä kuva datasta ja siihen estimoidusta regressiosuorasta y = b 0 + b 1 x. Piirrä dataan myös yksittäisten pisteiden virherajat. Tähän voit käyttää komentoa errorbar. 4. Kokeile vielä fitlm-funktiota sovittaaksesi dataan suoran tavallisella PNS-menetelmällä. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 35

Kotitehtävä: Ohjeistus v Liitä kuva, jossa näkyy sovittaja ja fitlm funktioilla sovitetut suorat. Nimeä akselit ja lisää legend. Kommentoi suorien eroja. Mille välille sovittaja-funktion mukaan Planckin vakio kuuluu todennäköisyydellä 64%? Huom! Sovitteen kulmakertoimen b 1 fysikaalinen tulkinta on b 1 = h/e, jossa e on elektronin varaus 1.6 10 19 C. Huomaa myös, että tehtävänannon datassa taajuuden kertaluokka on 10 12. v Liitä Matlab-koodi funktiostasi sovittaja. SCI-C0200 Fysiikan ja matematiikan menetelmien studio 36