Biostatistiikka (3 opintopistettä)

Koko: px
Aloita esitys sivulta:

Download "Biostatistiikka (3 opintopistettä)"

Transkriptio

1

2 Bostatstkka (3 optopstettä) Opettaja lehtor Kar Maurae, sähköpost URL: Kurss kotsvu: LUENNOT: (4 tuta) lueot evät ole pakollsa. Lueolla käydää läp luetomostee aheta laajetae ja selvttäe asota. HARJOITUKSET: (4 tuta) kurss kotsvulta löytyvä tettkysymyste kaltasa tehtävä. Tehtävät kaattaa tehdä etukätee, että pystyy harjotuksssa kyselemää ja keskustelemaa ratkasusta. TENTTI : 5 tehtävää, josta max 6 pstettä. Läp 5:sta psteellä. KORVAAVUUS: Jos olet suorttaut sama ssältöse kurss muualla, vot hakea suortukse korvaavuutta optojakso korvaavuusaomuslomakkeella. Täytä lomake huolellsest oke (katso tedot kurss kuvauksesta) ja lsää ltteks todstus suortukssta sekä kuvaus korvaava suortukse (suortuste) ssällöstä. Ee ku aot korvaavuutta, tarkasta tämä kurss ssällysluettelosta, että suortukses kattaa koko kurss ssällö. Ohesmateraala, jota e tetssä vaadta, mutta saattaa auttaa ymmärtämää asaa: Krjallsuutta: Gröroos: Johdatus tlastoteteesee, Tammer-Pao Oy, Tampere 003. Vasama - Varta: Johdatus tlastoteteesee I, Gaudeamus 97. Mae: Tlastotedettä yhteskutateteljölle, Gaudeamus 978. Läärä - Lamm: Tlastotetee perusteet lääketedettä ja lähaloja varte, Kuopo ylopsto ylopplaskuta 986. Rata-Rta-Kouk: Bometra. Tlastotedettä ekologelle, Ylopstopao 989. Karjalae, Lela: Tlastotetee perusteet, 00. Alkula-Pöte-Ylöstalo: Sosaaltutkmukse kvattatvset meetelmät. Porvoo WSOY 994. Nummemaa, : Tutkmusaesto aalyys. WSOY 996 Luetomosteessa o lähdekrjallsuutta lukuje lopussa.

3 Ssällysluettelo Johdato Mtä tlastotede o Mh tlastotedettä tarvtaa... 5 Havatoaesto hakasta... 7.Otata ta koejärjestely Mttausvrhestä Mtta-astekot (scale) Yksulottese emprse jakauma esttäme Havatomatrs Frekvessjakauma (frequecy dstrbuto) Kuvot (graphcs) Tuuslukuja (statstcs) Kesklukuja Hajotalukuja Muta tuuslukuja Kaksulottee jakauma (bvarate dstrbuto) Taulukot Kuvot (graphcs) Tuuslukuja...4 -tuusluku Järjestyskorrelaatosta Pearso korrelaatokerro (correlato coeffcet) Todeäkösyyslasketaa Perusteta Alkestapaukset Todeäkösyyslaskusääöt Todeäkösyysjakauma Tlastollsesta päätökseteosta Otatajakauma Estmosta Hypotees testauksesta Keskarvotestejä Yhde otokse keskarvotest Verraollste pare t-test Rppumattome otoste t -test Ykssuutae varassaalyys Varassaalyys jatkotarkastelusta Useampsuutasesta varassaalyysstä ja kovarassaalyysstä Oletuste testaamsesta Varasstestt Jakauma tutkme Jakaumasta rppumattoma testejä Rppumattomuustestejä Suhteellse osuude testaame (bomtest) test Korrelaatokertome testaus Momuuttujameetelmä Regressoaalyysstä Logstsesta regressomallsta

4 Johdato. Mtä tlastotede o Tlastotede tarjoaa meetelmä (työkaluja) tutkmukse tekemsee. Lähtökohtaa o soveltava teteeala tutkmusogelmat, joh pyrtää vastaamaa käyttäe tlastotetee työkaluja. Tutkmukse alussa haktaa havatoaesto (mkä keräämsee aetaa myös ohjeta), joka o umeere. Yks keskee tlastotetee tehtävä o saada tuo aesto umerot elämää ste, että stä o luettavssa vastaukset tutkmusogelm. Tlasto o tvstelmä suuresta umeersesta tetomäärästä. Se estetää yleesä taulukkomuodossa, ekä yleesä sällää ole havaolle tapa esttää tutkmustuloksa. Tlastotede EI ole opp tlastosta. Tlastotede tarjoaa meetelmä tehdä emprstä (ympärstöä havaovaa) tutkmusta. Kute jäljessä olevasta esmerkstä havataa, kuuluu emprsee tutkmuksee mm. - tetoje haka suuttelu - tetoje kerääme - aesto aalysot - tuloste esttäme. Aesto aalysotosa vodaa jakaa kahtee tlastotetee osa-alueesee : - kuvalu - päättely. Kuvalu kästtää havatoaesto tvstämstapoja ja esttämsmeetelmä, kute taulukot, tuusluvut ja kuvot. Tlastollsella päättelyllä pyrtää vastaamaa tutkmusogelma kysymyks. Meetelmä käytetää hypotees testausta ja tlastollsa aalyysejä. Ne perustuvat epävarmuude systemaattsee kästtelyy. Vakka tlastotede o sällää tseäe teteeala, o sllä kteät suhteet muh teteealoh. Tlastotetee teora perustuu matemaattslle tulokslle. Vodaak saoa tlastotetee teora oleva ostta sovellettua matematkkaa. Varsk todeäkösyyslaskea tulokset ovat tlastotetee teora perusta (esm. ormaaljakauma). Tämä pävä tlastotedettä e voda ajatella lma tetokoeta, jote käytäö tlastotede tarvtsee tetojekästtelyä. Jokae teteeala, joho lttyy emprstä tutkmusta, o tlastotetee sovellusala. Nätä sovellusalueta kutsutaa er tetede metrkoks (opp mttaamsesta), ätä ovat esm. psykometra, sosometra, ekoometra, bometra, demometra, je. Määrätyssä melessä maoslause: Lopetetaa absurdella argumetella spekulot ja srrytää eksakt tetee par. kertoo tlastotetee deasta tarkkoje ja luotettave tutkmusmeetelme lähteeä. Tlastolle päättely perustuu perusteltuh faktoh ja matematkkaa, el mahdollsmma luotettavaa ja objekt tetoo ja tedo kästtelyy. 4

5 Use teteellsessä tutkmuksessa pyrtää mahdollsmma suuree objektvsuutee ja tlastotede pyrk atamaa ohjeta, jotta päästäs mahdollsmma lähelle objektvsuutta, vakka täydelle objektvsuus o mahdotota. Mttaajaa tom hme, hmse tekemllä välellä ja tetoje hakta lähtee hmse tarpesta. Saota "vale, emävale, tlasto" ptää sä melessä pakkasa, että pelkä tlasto esttäme asasta e takaa vättee todeperäsyyttä. Aoastaa, jos tlastoaesto o oke aalysotu ja aalyyst oke tulkttu ja raportotu, o tutkmustuloksella paoarvoa. Tlastotedettä tuteva lukja havatsee oke raportodusta tutkmuksesta, oko tlastoaesto kästtely tehty oke. Tlastollslla tempulla vodaa hujata aoastaa sellasa heklötä, jotka evät tue tlastollsa kästtelytapoja. Esmerkkejä tlastollssta harhaajohtamssta esttää mm. Darell Huff krjassaa Kuka tlastolla valehdellaa. Tämä kurss yks tärkemmstä päämäärstä o opettaa opplas krttseks emprste tutkmustuloste lukjaks.. Mh tlastotedettä tarvtaa Mh tavalle hme tarvtsee tlastotedettä? Tedotusvälessä estetää ja keskustelussa vtataa use tutkmustuloks. Tutkmuksssa käytetää use tlastollsa meetelmä tutkmustuloste selvlle saamseks. Jotta ätä tuloksa ymmärtäs, o heklö oltava perllä tlastollsesta termologasta (esm. prosettluvut, frekvesst, tuusluvut, tlastollset testt,...). Lsäks lukja ja kuulja o ymmärrettävä kyseste terme luoe, jotta hä vos arvoda tuloste merktykset. Mh opskelja tarvtsee tlastotedettä? Opetukse ptäs perustua uusmpaa tetoo. Uus teto e ole aa ehtyt oppkrjoh, vaa se löytyy tutkmusraportesta ja teteellsstä julkasusta. Nässä estetyt johtopäätökset o perusteltu tarko, jotta estetyt johtopäätökset hyväksyttäs. Jos tutkmuksessa o käytetty tlastollsa meetelmä, o käytetyt meetelmät raportotava tarko ja saadut tulokset estetää tlastotetee terme. Tutkmukse lukja o tuettava tlastollse tutkmukse tekemse peraatteet ja ymmärrettävä tlastollse johtopäätökse tekemse termologa ymmärtääksee luettava tutkmukse merktykse. Skeptsyys o teteellse tutkmukse lukemse lähtökohta. Mo optoh lttyy oma tutkmukse teko (esm. pro gradu, erkostyö, harjotustyö). Jos tutkmuksessa havaodaa ympärstöä ja tehdystä havaosta löydetyt johtopäätökset halutaa ylestää suurempaa joukkoo, vodaa käyttää tlastollsa tutkmusmeetelmä. Tutkmukse alkuvaheessa o pohdttava mtä (tlastollsa) tutkmusmeetelmä aotaa aestoo soveltaa. Mh tutkja tarvtsee tlastotedettä? 5

6 Kakk tutkmus e ole tlastollsta. O teteealoja, jolla tlastollsa tutkmusmeetelmä e voda käyttää laskaa (esm. matematkka). Muta tutkmustyyppejä ovat esmerkks teoreette tutkmus ja tapaustutkmus. Vakka tutkja keskttys muh tutkmusmeetelm, vo sama teteeala melektoe tutkmus olla tehty tlastolls meetelm. Seuraava kuvo esttää erää jao tutkmustyyppeh. Esmerkks matematka tutkmus o teoreettsta. Hstoratutkmus o emprstä, el ympärstöä havaovaa, mutta yleesä hstoratutkmuksessa e käytetä tlastollsa meetelmä. Use tutkmusogelma o sellae, ette tlastollse tutkmukse vaatma mttaukse tostettavuusoletus ole vomassa ta mttaus o subjektvsta havaota. Nätä tutkmuksa kutsutaa tapaustutkmuksks (myös case-study ta kvaltatve tutkmus). Teoreettsessa el aalyyttsessä tutkmuksessa pyrtää johtamaa deduktvsella päättelyllä ykstysä vättetä. Lähtökohtaa ovat hyväksytyt perusolettamukset ja aksoomat, josta johdetaa loogsest uusa vättetä, el meää ylesstä, tuetusta tapaukssta ja vättestä ykstystapauks. Emprsessä tutkmuksessa pyrtää duktvsella päättelyllä löytämää ylesä laalasuuksa. Hyv use tutkmuksee lttyy teoreette päättely, joka tulos vahvstetaa emprsellä osalla. Tutkmuksee yleesä lttyy sekä teoreette, että empre osa. O myös mahdollsta käyttää samassa tutkmuksessa sekä tlastollse- että tapaustutkmukse meetelmä. Tlastotetee asemasta tutkmukse tekemsessä selvttää ehkä seuraava kuvo -ykskertastame -tarketame -kohdstame Tlastolle päätökseteko Tlastollset hypoteest Tutkmushypoteest Tutkmuskysymykset Tutkmusogelmat Sovellusala teora mssä lähtökohtaa o sovellusaluee teora, josta ousee tutkmusogelmat, jota ykskertastetaa, tarkeetaa ja kohdstetaa, jotta tutkmusogelm votas saada vastaus (tlastollslla tutkmusmeetelmllä). Tlastollste päätöksetekomeetelme atamlla tulokslla vastataa tutkmuskysymyks ja hyvästä tutkmuksesta saadaa lsää tetoa sovellusala teoraa. 6

7 Havatoaesto hakasta.otata ta koejärjestely Tutkmus o kokeelle, ku tutkja vo määrätä jodek muuttuje arvot. Tämä tarkottaa stä, että koeykskölle aetaa kästtelyjä (esm. lääkettä, opetusta,...), joka määrä el taso vo valta. Otatatutkmuksessa e ole mukaa kästtelyä, vaa sä kakk muuttuje arvot saadaa mttaamalla. Kokeellsessa tutkmuksessa ovat yleesä syy-seuraus -suhteet luotettavampa ja koeykskötä o yleesä vähemmä Otatatutkmuksessa kausaalpäätelmät (rppuvuus) ovat horjuvampa, mutta aesto määrä o yleesä suuremp. Kokessa tarvtaa tostoja, jotta satuasvahtelu saadaa selvlle. Tämä tarkottaa stä, että sama koe o tehtävä usealle koeykskölle (esm. heklölle). Koejärjestelyssä vertallaa er kästtelyje vakutusta tutkttavaa muuttujaa. Kästtelyje järjestyksellä saattaa olla vakutusta tuloksee, jote jos koeykskölle tehdää useta er kästtelyjä, o er koeykskölle valttava er kokeetekojärjestys. Satuastame vähetää systemaattsta vrhettä. Satuastame tarkottaa, että koeyksköt jaetaa satuasest er kästtelyryhm. Samassa koeasetelmassa vodaa tutka usea er tekjä vakutusta seltettävää muuttujaa. Koeyksköt jaetaa tällö useaa ryhmää. Esmerkks, jos mellä o kaks kästtelyä, jode vakutusta halutaa tutka, jaetaa koeyksköt vähtää kolmee ryhmää: kotrollryhmä,. kästtelyryhmä ja. kästtelyryhmä. Koeykslöt (esm. koeheklöt) vodaa jakaa ryhm usea er tekjä suhtee, jotta ästä tekjöstä johtuva ylmääräe vahtelu saatas pos koeasetelmasta. Tätä jakamsta kutsutaa lohkomseks. Lohkome vähetää koeyksköde muodostame ryhme välstä vahtelua. Koejärjestely peraattes ss kuuluu muu muassa lohkome, satuastame, kaltastame sekä sokkosuus (plasebovakutukse huomomseks). Otata- el pokklekkaustutkmuksessa pomtaa perusjoukosta osa edustamaa koko perusjoukkoa. Jotta otos ols mahdollsmma edustava, pomassa käytetää harkttua satuastamsta : tlastoyksköt arvotaa perusjoukosta, mutta sä vodaa käyttää myös etukätestetoja hyväks, että otoksesta saadaa edustavamp (eemmä perusjouko kaltae). Todeäkösyysotatameetelmä ovat muu muassa ykskertae satuasotata, systemaatte otata, ostettu otata sekä ryväsotata. Jos havatoaestoa e pomta otatameetelmällä, o kyseessä äyte, joka ylestäme perusjoukkoo o kyseealasempaa 7

8 Tutkmuksssa kutek käytetää hyv use pseudo-otatameetelmä, mssä tlastoykskötä e pomta josta kattavasta reksterstä, vaa e valtaa jolla muulla perusteella. Esmerkks palvelupsteessä jaetaa kyselylomakketa, tarkkallaa tlaetta ta tehdää kyselytä jota pävä/vkkoja, je. Tällö o tutkja pohdttava mte tulos vo väärstyä verrattua otatameetelmä käyttöö. Tyytymättömät asakkaat lostavat possaolollaa (ääestävät jalollaa) ta er pävä vo olla erlae asakaskuta.. Mttausvrhestä Mttausvrhetä estyy - mttausvälede epätarkkuude - mttauksee vakuttave härötekjöde - mttausmeetelmä hekkoude - mttarede hekkoude vuoks - mtattave kästtede hakaluude taka Relablteett tarkottaa mttaukse tostettavuutta. Tutkmukse ssäe relablteett vodaa todeta mttaamalla sama tlastoykskkö useampaa kertaa. Jos mttaustulokset ovat samat, mttaus o relaabel. Jos mttaustulokset pokkeavat tosstaa, tuloste satuasvahtelu kertoo mttaukse relablteetsta. Satuasvahtelua tutktaa use laskemalla tostettuje mttauste varaatokerro. Tosaalta kahde tostetu mttaustulokse välse korrelaatokertome täytyy olla lähellä ykköstä. Nä vodaa arvoda tutkmukse ssästä relablteetta. Tutkmukse ulkoe relablteett tarkottaa stä, että tutkmus (ja mttaukset) ovat tostettavssa myös mussa tutkmuksssa ja tlatessa. Valdteett (mttaukse okeellsuus) o mtta slle, mtataako todella stä, mtä o tarkotus mtata. Valdsuus lttyy aa sovellusaluee teoraa ja se kästtes. Ssäsellä valdteetlla tarkotetaa stä, vastaako mttaukset tutkmukse teoraosassa estettyjä kästtetä. Ulkosest valdssa tutkmuksessa myös muut tutkjat tulktsevat kyseset mttaustulokset (ja tutkmustulokset) samo ku tutkmuksessa o estetty..3 Mtta-astekot (scale) ) Luokttelu- el laatuero- el omaalastekko Jos havaot vodaa jakaa muuttuja arvoje perusteella va luokk, muuttuja o luoktteluastekolle. Jokae havato kuuluu yhtee ja va yhtee luokkaa. Kahdesta havaosta vodaa päättää, kuuluvatko e samaa luokkaa va evät. Yhtäsuuruusomasuus ( = ). 8

9 Muuttuja mttar vo olla mkälae tahasa, kuha se o ykskästtee. MINKÄÄNLAINEN LASKUTOIMITUS EI OLE SALLITTU LUOKITTELUASTEIKON MUUTTUJALLA. Esmerkkejä: sukupuol, svlsääty, ammatt, vär, verryhmä,... ) Järjestys- el ordaalastekko Ku havaot vodaa jakaa muuttuja perusteella luokk ja luoklla o järjestys, muuttuja o järjestysastekolle. Järjestysomasuus ( < ). Muuttuja luokkavält evät ole kutekaa yhtä suura. ARITMEETTISILLA LASKUTOIMITUKSILLA EI OLE JÄRKEVÄÄ TULKINTAA. Esmerkkejä: sotlasarvot, koulutustaso, huoo / keskkertae / hyvä, samaa meltä / e osaa saoa / er meltä,... 3) Välmatka- el tervallastekko Ku muuttuja luoklla o järjestys ja välmatka luokasta seuraavaa o yhtä suur asteko joka kohdassa, muuttuja o välmatka-astekolle. Yhteelaskuomasuus (+). Nollapstee valta o sovttu. Yhtee- ja väheyslasku ovat sallttuja välmatka-astekolla. Esmerkkejä: leveysasteet, lämpötla o C, vuosluvut,... 4) Suhdeastekko (rato scale) Ku kahde muuttujaluoka väle etäsyys o yhtä suur asteko joka kohdassa ja muuttujalla o "absoluutte ollapste", muuttuja o suhdeastekolle. Kertolaskuomasuus (* ). Kakk laskutomtukset ovat sallttuja. Esmerkkejä: ptuudet, paot, lämpötla K, lukumäärät,... 9

10 3 Yksulottese emprse jakauma esttäme 3. Havatomatrs Mttaustulokset talleetaa yleesä havatomatrsmuotoo tetokoeelle. Havatomatrs o taulukko, jossa muuttujat kulkevat vaakasuutaa ja tlastoyksköt sjotetaa alakka. Esmerkks havatomatrs vo olla seuraavalae: Sukupuol Ptuus Pao Svlsääty Ikä mes amato 8 ae 65 6 amsssa 3 mes amsssa 4 ae amato 5 Havatomatrs rvä, joka esttää yhde tlastoykskö arvot er muuttujlla, kutsutaa proflks. Tapaus-aalyysssä el case study:ssa estetää tlastoyksköde profleja. Havatomatrs pystysaraketta, joka esttää yhde muuttuja arvot er tlastoyksköllä, kutsutaa (emprseks) jakaumaks (dstrbuto). Havatomatrs vodaa lsätä kolmatea ulottuvuutea aka. Tämä o tarpee, ku tutktaa asode kehttymstä aja suhtee. Tällasta tutkmusta kutsutaa ptkttästutkmukseks (logtudal research) ta seuruututkmukseks (repeated measuremets). Mkäl yhtä tlastoykskköä seurataa aja suhtee, vodaa tlastollsea aalysotmeetelmää käyttää akasarja-aalyysä (tme seres aalyss). Tällä kursslla kesktytää muuttuje jakaume tutkmsee ja muuttuje rppuvuukse esttelyy. Muuttuja jakaumaa vo kuvalla taulukolla, kuvolla ja tuusluvulla. Tärketä kuvalussa o kuvalu tulkta: mtä kuvalu kertoo mttaustulokssta. Kuvalusta löytyy aak kolme asaa: jakauma keskkohta, havatoarvoje vahtelu ja jakauma muoto. 3. Frekvessjakauma (frequecy dstrbuto) Frekvessjakauma el suora jakauma o yleesä esmmäe muuttuja jakauma esttämstapa. Frekvess o havatoje lukumäärä muuttuja luokassa. Jakauma muodostuu muuttuja erarvosta ja h lttyvstä frekvessestä. Frekvesstaulukossa estetää use myös summafrekvesst, prosettfrekvesst ja summaprosett. Summajakauma kutsutaa myös kumulatvsks jakaumks. 0

11 Luoktteluastekollse muuttuja jakauma vodaa esttää esmerkks seuraavalasea taulukkoa: Svlsääty frekvess % Namato 8 Namsssa 75 Erout 5 0 Lesk 0 7 Yhteesä Koska muuttuja luokke järjesty o sattumavarae, e ole järkeä esttää summa- ja summaprosettfrekvessejä. Use tutkmusraportssa estetää frekvesst ta prosett tekst ssällä, varsk jos frekvessejä e ole useta. Esmerkks kerrotaa, että tutkmusaestossa o 57% asa ja 43% mehä. Prosett tetek lasketaa tavallse prosettlasku tapaa jakamalla frekvess kokoasmäärällä ja kertomalla tulos sadalla. Esmerkks /49 *00 8. Joskus tauluko prosett evät summaudu sataa pyörstysvrhede vuoks. Tällö e pdä meä pyörstämää väär prosetteja, vaa korketaa kertoa, että summa o laskettu pyörstämättömstä prosetesta. Taulukosta vodaa tulkta luokke frekvesse suhtede perusteella, että suur osa 75% heklöstä o amsssa. Loput luokat äyttävät lkma yhtä suurlta. Järjestysastekollse muuttuja frekvesstaulukkoo vodaa ottaa mukaa myös summa- ja summaprosettfrekvesst, mutta muute estys ja tulkta ovat samalaset. Muuttuja luokttelusta Jatkuvaluotee (väl- ta suhdeastekolle) muuttuja o use (mutta e välttämättä) luokteltava ette frekvesstaulukosta tule tarpeettoma ptkä ja ä olle vakeast tulkttava. Es o todettava muuttuja mttaustarkkuus (a), luokke lukumäärä (k) ja vahteluväl (R), el väl, jolla muuttuja saa havatoarvoja. Nästä vodaa määrätä luoka ptuus (d) kaavasta d = R/k Edellse kaava käyttämse sjaa luoka ptuudeks kaattaa valta jok mukava pyöreä luku (5, 0, 0, 50, 00). Samo luokttelu kaattaa alottaa mm alapuolelta löytyvästä pyöreästä luvusta. Määrätää esmmäse luoka pyörstetty alaraja. Ku tähä lsätää luoka ptuus, saadaa tose luoka pyörstetty alaraja, je. Luoka pyörstetty yläraja o mttaustarkkuude päässä seuraava luoka pyörstetystä alarajasta. Todellset luokkarajat sjatsevat edellse luoka pyörstety yläraja ja seuraava luoka pyörstety alaraja välssä.

12 Edellse luoka pyörstetty yläraja Seuraava luoka pyörstetty alaraja Pyörstetty alaraja Pyörstetty yläraja mttaustarkkuus Todelle alaraja Luokkakeskus Todelle yläraja Luoka ptuus Pyörstetyt luokkarajat ovat sellasa arvoja, jota vodaa saavuttaa. Koska todellset luokkarajat sjatsevat mahdollste mttaustuloste välssä, jakavat e havaot luokk. Edellse luoka todelle yläraja o sama ku seuraava luoka todelle alaraja. Luokkakeskus sjatsee me mukaa luoka keskellä. Se vodaa määrätä laskemalla keskarvo luoka todellssta ta pyörstetystä luokkarajosta. Esmerkk ptuukse luokttelusta: luokkakeskus = ( yläraja + alaraja) / Pyörstetyt Todellset luokkarajat luokkarajat Luokkakeskus Taulukossa estetää pyörstetyt luokkarajat ja todellsa luokkarajoja sekä luokkakeskuksa tarvtaa kuvota ja laskutomtuksa varte. Yleesä käytetää tasavälstä luokttelua el luokke ptuudet ovat yhtä suuret. Käytäössä helpota ja tauluko luettavuude kaalta parasta o valta luokttelu alarajaks ja luoka ptuudeks jok pyöreä luku (0 ta 5).

13 3.3 Kuvot (graphcs) Kuvo o havaolle, suppea estysmuoto muuttuja ta muuttuje jakaumasta. Use kuvaa o helpomp lukea ku lukuja. Hattaa o kuvode epätarkkuus ja väärstelyt kuvode avulla ovat mahdollsa, kute luvussa estett. Mutta, ku kuvoo aa ltetää mtta-astekko ja merkke seltykset, vo lukja havata mahdollse väärstelyyrtykse. Mtää aoata okeata kuvotyyppä e ole olemassa, vaa kakk hyv perustellut kuvot ovat "oketa" kuvota. Muuttuja mtta-astekko asettaa omat rajotukset kuvolle. Ku lasketaa luokttelu- ja järjestysasteko muuttujat epäjatkuvaluotesks ja välmatka- ja suhdeasteko muuttujat jatkuvaluotesks, vodaa esttää muu muassa seuraavat kuvot: Epäjatkuvaluotee muuttuja (o-cotuous varable) Pylväskuvo vodaa prtää joko frekvessestä ta prosettfrekvessestä. Järjestysasteko muuttuja luokke järjestys o määrätty pylväskuvossa. Muuttuja epäjatkuvuutta korostetaa prtämällä pylväät erksee. Pylväskuvo vodaa prtää pystyy ta vaakaa ja kuvo vodaa esttää osajoukotta Cout amato avo- ta avoltossa SIVIILISÄÄTY erout ta asumuserossa lesk 3

14 Summafrekvessestä vodaa prtää summakäyrä. Epäjatkuvalla muuttujalla summakäyrästä tulee porrasmae. Summakäyrää e ole järkevää esttää luoktteluasteko muuttujsta, sllä luoolle järjestys puuttuu. Prakkakuvo (el sektordagramm) sekä kuvode syvyysvakutelmat ja perspektvt evät sov teteellsee esttämsee, koska e joko kadottavat estettävä asa (frekvesst) ta jopa väärstävät stä. Jatkuvaluotee muuttuja (cotuous varable) Jatkuva muuttuja kuvot prretää yleesä luoktellusta aestosta todellste luokkarajoje ta luokkakeskuste mukaa. Hstogramm o ku pylväskuvo pylväät k tosssaa. Pylväät ptäs prtää todellste luokkarajoje mukaa, mutta koska ämä use ovat hakala lukuja, estetää use lähmmät kokoasluvut. Vvakuvo prretää luokkakeskuste mukaa, mutta ek use pyörstettyä. Jotta vvakuvo e jäs "lmaa rokkumaa", lsätää use ollaluokat aesto molemp päh. 30 Frequecy ,00 5,00 30,00 35,00 40,00 45,00 kä 50,00 55,00 60,00 65,00 70,00 4

15 Esmmäe kuvo o prretty SPSS tlasto-ohjelmalla ja ohjelma määrää aka paljo kuvo omasuukssta. Jälkmmäe o prretty käs Word prto-ohjelmalla ja e ole tarkka sekä seltteet puuttuvat. 3.4 Tuuslukuja (statstcs) Tuusluvut lmottavat jok muuttuja omasuude. Tuusluvut vodaa jakaa kesk-, hajota- ja muh tuuslukuh. Keskluvut kuvaavat muuttuja jakauma sjata, hajotaluvut lmottavat jakauma "hajaatumse" ja muut tuusluvut tutkvat muta jakauma omasuuksa, kute voutta ja hupukkuutta Kesklukuja Keskarvo (mea) o tärke keskluku. Artmeette keskarvo lmottaa jakaumamassa paopstee. Artmeettse keskarvo saa laskea va välmatka- ta suhdeasteko muuttujlle. Alkuperäsestä havatoaestosta x, x,...,x lasketaa keskarvo seuraavalla kaavalla, ku o otoskoko. x x Vastaavast geometre keskarvo, joka vodaa laskea va suhdeasteko muuttujasta, saadaa kaavasta g x / x... x x Geometrsellä keskarvolla o yhteys artmeettsee keskarvoo logartmmuuokse kautta. Medaa (md) (meda) vodaa määrätä suuruusjärjestyksee järjestetystä aestosta. Medaa o keskmmäe havatoarvo, el arvo, jota suurempa ja peempä havatoja o yhtä mota. Mkäl havatoja o parlle määrä, e keskmmästä 5

16 havatoarvoa ole olemassa. Tällö medaaks vodaa valta jomp kump keskmmässtä havatoarvosta ta äde keskarvo. Medaaa e voda määrtellä luoktteluasteko muuttujasta. Fraktlt ovat prosettsummafrekvess perusteella määrättyjä pstetä jakaumasta. Medaa o 50 %: fraktl. Fraktl metää se mukaa, kuka moe osaa jakauma jaetaa, esmerkks - kvartlt 5 %, 50 % (medaa) ja 75 % - tertlt 33.3 % ja 66.7 % - kvtlt 0 %, 40 %, 60 % ja 80 % - deslt 0%, 0%, 30%, 40%, 50%, 60%, 70%, 80% ja 90%. Aoa keskluku, joka vo määrätä luoktteluasteko muuttujasta, o mood (mo) el tyypparvo. Mood o suurmma frekvess omaava luokka. Mkäl jatkuvasta muuttujasta halutaa määrätä mood, o se tehtävä luoktellusta muuttujasta. Kesklukuje omasuuksa: - artmeette keskarvo o ete käytetty ja use "paras" keskluku - mkäl muuttuja jakauma o vo ta havatoaestossa o paljo musta pokkeava havatoja, kuvaavat geometre keskarvo ja medaa "paremm" jakauma keskusta - fraktlt ja mood ovat hyv vähä käytettyjä kesklukuja Hajotalukuja Käytety hajotaluku o keskhajota (stadard devato), joka lmottaa havatoarvoje hajaatumse keskarvo ympärlle. Seuraava kaava kertoo mllae tuusluku keskhajota o s Koska ( x x) ( x x) ( x x x x ) x x x x x x x x x x saadaa keskhajoa kaava muotoo, mtä o helpomp käyttää x x s x x x Ku erksee laskee havatoje summa x ja elösumma x ja sjottaa e edellsee kaavaa, o loppu helppo laskea. Keskhajota o järkevä hajotaluku va välmatka- ja suhdeasteko muuttujlle. Varass (varace) o keskhajoa elö s. 6

17 Varaatokerro V = s/x o suhteelle keskhajota. Sllä saadaa er suuruusluokkaa oleve muuttuje hajoat vertalukelposks. Varaatokerro vodaa laskea va suhdeasteko muuttujlle. s Keskarvo keskvrhe (stadard error of mea) sem kuvaa keskarvo luotettavuutta. Käytetää use keskarvokuvossa ja taulukossa. Keskvrhee käste lttyy estmot. Vahteluväl ptuus o suurmma havatoarvo ja pemmä havatoarvo väle erotus. Jos suuruusjärjestyksee asetettua havatoaestoa merktää x(), x(),...,x(), saadaa vahteluväl ptuudelle kaava d = x() - x(). Vahteluväl (rage) vodaa esttää jo järjestysasteko muuttujasta. Tällö lmotetaa suur ja pe havatoarvo R = (x(), x()) Muta tuuslukuja Jakauma omasuuksa sja ja hajoa lsäks ovat vous (skewess) ja hupukkuus (kurtoss). Vous kuvaa jakauma symmetrsyyttä. Jos jakauma o samakaltae jakauma keskkohdasta okealle ja vasemmalle pä, o jakauma symmetre ja vous = 0. Hupukkuustuusluku kertoo jakauma maksmkohda leveydestä. Yks voustuusluvusta o Pearso vousmtta, joka perustuu kesklukuje välsee eroo x Mo P s Jos P < 0, saotaa jakauma oleva vasemmalle loveeva ja jos P > 0, saotaa jakauma oleva okealle loveeva. Toe jakauma symmetrsyyttä mttaava tuusluku perustuu kolmas potesseh (3. orgomomett): 3 ( x x) Skewess 3 s Hupukkuusluvut vertaavat jakauma huppua ormaaljakauma (Gauss kellokäyrä) huppuu. Eräs hupukkuusmtta saadaa kaavasta: k4 4 3, mssä k4 ( x x) 4 s Jos < 0, o frekvessjakauma lattea ja jos > 0, o jakauma hupukas, el usemmat havaot ovat lähellä keskarvoa. Esmerkk jatkuva muuttuja kuvalusta: 7

18 Aesto o krjasta Vasama-Varta: Johdatus tlastoteteesee II otos vuosa tapahtuesta syytyksstä (s 686). Kuvallaa äd ptuude jakaumaa (cm). Havatoaesto: Luoktellaa aesto: Pe havatoarvo o 50 ja suur 74. Havatoja o 48 (=48). Jaetaa aesto vtee luokkaa vde settmetr väle pyörstetyt luokkaraja todellset luokkarajat luokkakes kus frekvess prosettfre kvess summafrekv ess pros.summ a frekv Yhteesä Tuuslukuja varte kaattaa laskea havatoje summa ja elösumma: x = = 7746 x = = Keskarvo: x = 7746 / 48 = 6.4 Keskhajota x x 5478 (7746) 5. 6 s 48 Medaaa varte täytyy havatoaesto järjestää suuruusjärjestyksee ja poma järjestetystä havaosta keskmmäe. Medaaks saadaa 6 cm. Medaa vodaa määrätä myös taulukosta: valtaa se luoka luokkakeskus, jossa summafrekvessprosett ylttää 50 %. Esmerkssä esmmäe yl 50 oleva pros. summafrekv. o 69 luokassa Se luokkakeskus 6 cm o taulukosta määrätty medaa. Suhdeasteko muuttuja jakauma graafsee estyksee vodaa käyttää frekvesshstogramma. Tämä ptäs prtää todellste luokkakeskuste mukaa. Ykskertastamse vuoks tässä o estetty kuvo pyörstettyje luokkarajoje mukaa: 48 8

19 Jakauma o symmetre ormaaljakauma muotoe. Vahtelu o vähästä (pe varaatokerro ja vahteluväl). Keskkohta o o 6 cm. 9

20 4 Kaksulottee jakauma (bvarate dstrbuto) Kaksulottese jakauma muodostaa kaks muuttujaa. Kaksulottese jakauma avulla tutktaa muuttuje rppuvuuksa (el assosaatota, omasuukse yhdessä estymstä). Rppuvuus e aa tarkota stä, että toe muuttuja (asa) ols tose muuttuja syy. Tätä syy - seuraussuhdetta kutsutaa kausalteetks. Rppuvuussuhde e välttämättä johdu kausalteetsta. Vodaa helpost keksä esmerkkejä, jossa muuttuje välllä havattu rppuvuus e johdu kausalteetsta, vaa josta "sekottavasta tekjästä". Tlastollse rppuvuude okea tulkta o sovellusaluee asatutja vastuulla. Esmerkks kussa, jossa o suuret palokuat, syttyy paljo tulpaloja. Korrelaato o selvä, mutta tästä e voda päätellä palokua sytyttelevä tulpaloja, vaa suurssa kussa o suuret palokuat ja suur todeäkösyys syttyä tulpaloja. Sekottava tekjä tässä o kua koko. Kute yksulottesessa jakaumassa, muuttuje mtta-astekot määräävät kuvalumeetelmät. Jako jatkuvatyypps (välmatka- ja suhdeasteko) ja epäjatkuv (luokttelu- ja järjestysasteko) muuttuj o tärketä. Vahtoehtopareja jää kolme: epäjatkuva - epäjatkuva, jatkuva -jatkuva ja epäjatkuva - jatkuva. Myös rppuvuutta vo kuvalla taulukolla, kuvolla ja tuusluvulla. Tärketä kuvalussa o se tulkta: ymmärtää mtä kuvalu kertoo rppuvuussuhteesta. Rppuvuude kuvalusta o löydettävssä kaks asaa: oko rppuvuutta ja jos stä o mte muuttujat rppuvat tosstaa. 4. Taulukot Kahdesta epäjatkuvasta muuttujasta vodaa esttää rsttaulukko (crosstabulato) el kotgesstaulu. Taulukossa tose muuttuja luokat estetää vaakasuutaa ja tose muuttuja luokat pystysuutaa. Frekvesst el havatoje lukumäärät estetää tauluko solussa el ruudussa (merk. fj). Esmmäe aladeks vttaa esmmäse muuttuja (esm. x) luokkaa ja toe aladeks tose muuttuja (esm. y) luokkaa j. Tauluko reualla estetää summat (s. rv- ja sarakesummat). Nätä summa kutsutaa reuajakaumks, jotka ovat samat, ku vastaave muuttuje yksulotteset jakaumat. Seuraavassa ylee estys muuttuje x ja y kotgesstaulusta: Ku tose muuttuja arvo ktetää ja tarkastellaa tose muuttuja arvoja, saadaa ehdolle jakauma. Ehdollsa jakauma vertalle havataa muuttuje rppuvuus. Jos kyseessä o kausalteett, yleesä syy-muuttuja estetää ylhäällä sarakemuuttujaa ja seurausmuuttuja vasemmalla rveä. Tällö ehdollset jakaumat (ja de prosettosuudet) kaattaa laskea sarakketta ja ätä vertallaa rvettä, kute seuraavassa esmerkssä. Esm. Rsttaulukko luvussa.3 estetystä tutkmuksesta Kuopo sosaal- ja terveystote yhdstämse vakutukssta. Kyselylomakkeessa o kysytty heklö sukupuol ja takaavatko vastaaottotlat ykstysyyde. Jälkmmäe muuttuja o luokteltu kahtee luokkaa tulokse ykskertastamseks. 0

21 Reuajakaumsta ähdää, että 69% vastaajsta usko vastaaottotloje takaava ykstysyyde hyv. Sukupuole reuajakauma: 436 asta ja va 47 mestä kertoo, että otoksessa sukupuol ol vost jakautuut verrattua perusjoukkoo. Tämä e kutekaa hattaa tlastollse meetelmä luotettavuutta, vakkak paee mettmää otokse edustavuutta. Ehdollsa jakaumsta ähdää, että mehstä 85% pt ykstysyyde suojaa hyvää ja assta 67%. Tätä sukupuolte välstä eroa, joka o = 8 prosettykskköä, vodaa ptää melko suurea. Tämä perusteella vodaak saoa, että sukupuolella ja ykstysyyde suoja luottamuksella o rppuvuutta ste, että mehet luottvat asa eemmä she, että vastaaottotlat takaavat ykstysyyde. Tose muuttuja ollessa jatkuva, lasketaa yleesä tuuslukuja (esm. keskarvo ja keskhajota ta stte keskarvo ja keskvrhe, joskus kerrottua kahdella) epäjatkuva muuttuja määräämssä ryhmssä. Tuusluvut vodaa esttää taulukkoa. Samasta esmerkkaestosta taulukko svlsäädyttässtä taloudellse tlatee, terveydetla ja hekse vreyde (astekko 0-0) keskarvosta keskvrheee: Muttuja Namato Avoltossa Erout Lesk Taloudelle tlae Terveydetla Heke vreys Velä paremp ols esttää keskarvo luottamusväl vrhemargaalt, jotka ova o * keskvrhe. Edellä estetyt keskvrheet ss ptää es kertoa kahdella, jotta saadaa keskarvoje tarkkuus. Keskarvot, jode vält evät mee päällekkä, eroavat tosstaa. Tämä perusteella vodaa edellsestä taulukosta lukea esmerkks, että avo- ta avoltossa asuve keskarvot ovat mude ryhme keskarvoja korkeammat kakke muuttuje osalta, mutta vrhemargaalt pettävät keskarvoje välset erot moessa tapauksessa. Terveydetla kohdalta vodaa saoa, että avoltossa eläve tereveydetla o keskmäär tlastollsest merktseväst leske terveydetlaa paremp. Tulkassa o mustettava myös mahdollste sekottave tekjöde vakutus. Esmerkks leske kokema terveydetla vo johtua stä, että lesket ovat keskmäär muta äkkäämpä.

22 Kahde jatkuvaluotese muuttuja rppuvuude kuvaluu e yleesä kaata käyttää kotgesstaulua, koska jatkuve muuttuje luokttelussa meetetää formaatota. 4. Kuvot (graphcs) Kahdesta epäjatkuvatyyppsestä muuttujasta vodaa prtää yhdstetty pylväskuvo, mssä osaryhme pylväät ovat päällekkä ta rakka. Kuvot perustuvat kotgesstaulu frekvesseh ta prosettfrekvesseh. Seuraavaa esmerkk edellsessä luvussa estetystä kotgesstaulusta 500 Ykstysyys vastaaottotlossa Hyvä Huoo Cout Mes Sukupuol Nae Tästä ähdää selväst aste suur osuus, mutta myös se, että aset ovat usemm epälleet vastaaoto ykstysyyde suojaa. Edellsessä luvussa estetystä keskarvotaulukosta vodaa esttää kuvota keskarvoje ryhmttässtä vertalusta. Kuvossa yleesä estetää keskarvo 95 %: luottamusväl, mlle saadaa melko hyvä arvo kertomalla keskarvo keskvrhe s/ kahdella (tarkemm taulukkoluvulla t-jakaumasta). Seuraavaa o kuvo edellä estety svlsäädyttäste terveydetloje keskarvoje vertalusta, mstä vodaa tulkta amsssa oleve keskarvo oleva leske keskarvoa tlastollsest merktseväst

23 korkeamp. Ss jos luottamusvält evät mee päällekkä, ryhmäkeskarvot eroavat tosstaa tlastollsest merktseväst. Tos pä tulkta e olekaa ä suoravvasta, koska vakka vält mesvät päällekkä, joskus ryhmäkeskarvot vodaa osottaa eroava tosstaa tlastollsest merktseväst käyttäe hypotees testejä. Kahde jatkuvatyyppse muuttuja graafsee kuvaluu soveltuu korrelaatohajotakuvo (use pelkkä hajotakuvo), jossa havatoarvot estetää xykoordaatstossa. Ku x: arvo tutemse perusteella vodaa eustaa (melko luotettavast) y: arvo, rppuvat muuttujat tosstaa. Selke rppuvuude muoto o suoravvae el leaare rppuvuus. Muuttujat rppuvat leaarsest tosstaa, jos hajotakuvoo vodaa prtää suora, joka kuvaa hyv havatopstede jakautumsta. Muuttujat saattavat rppua tosstaa myös epäleaarsest, tällö hajotakuvoo sop parhate käyrä kuvaamaa vahtelua. 3

24 70,0 60,0 Asumsaka asualueella 50,0 40,0 30,0 0,0 0,0 0,0 0,00 0,00 30,00 40,00 kä 50,00 60,00 70,00 80, Tuuslukuja -tuusluku Kotgesstaulukosta vodaa laskea -tuusluku kuvaamaa assosaato määrää. Mtä suuremp tuusluku, stä eemmä muuttujat rppuvat tosstaa. Kerrota varte lasketaa kotgesstaulusta es odotetut frekvesst (ej). Mkäl muuttujat evät rpu tosstaa, ovat havatut frekvesst (fj) lähellä odotettuja frekvessejä. Odotetut frekvesst lasketaa reuajakaumsta kaava f f j ej avulla, el kerrotaa solua vastaavat summafrekvesst keskeää ja jaetaa tulo otoskoolla. Kaava helpomp o mustaa, että otetaa rv ja sarakkee lopusta summa, kerrotaa e keskeää ja jaetaa tulos otoskoolla. Odotetut frekvesst ymmärtää parhate laskemalla prosett seurausmuuttuja suhtee ja jakamalla kuk syymuuttuja luoka frekvess se mukaa, kute seuraava svu esmerkssä kuvataa. Tosessa vaheessa lasketaa -luku kaavasta r s ( fj ej ) e j j 4

25 mssä r ja s ovat muuttuje luokke, el rsttauluko rve ja sarakkede, lukumäärät. Kaavaa sjotetaa vastaavat ej:t ja fj:t ja lasketaa summa yl kakke tauluko soluje. Jos havatut frekvesst ovat yhtä suura ku odotetut frekvesst, tulee -arvosta olla. Mtä eemmä frekvesst eroavat, stä suuremp. -lukua käytetää hypotees testaukse (luku 7) testsuureea. Stä verrataa taulukosta saatavaa lukuu. Jos o kysestä taulukkolukua suuremp, rppuvat muuttujat tosstaa. Esmerkk aemm estetystä kotgesstaulusta sukupuole ja vastaaottotloje ykstysyyde välltä: Koska Hyvä -vastauksa o 33 kappaletta 483:sta, tekee se o 69%. Jos sukupuol e vakuttas vastauksee, 69% mehstä ptäs olla Hyvä-rvllä ja 47:stä mehestä 69% o o 3. Samo o ymmärrettävä muut odotetut frekvesst: 69% 436:sta asesta tekee o 300, 3% mehstä o o 5 ja 3% assta o o 36. Odotettuje frekvesse mustsääöllä: (rv lopusta * sarakkee lopusta)/otoskoko päästää tetek samaa lopputuloksee. Esmerkks vasempaa yläkulmaa saadaa (33*47)/483 = 3,3. Nyt lasketaa tuusluku alkae rsttaulukode vasemmasta yläkulmasta (40 3.3) (9 99.7) (7 4.7) ( ) tuusluku o kohtuullse suur 6,49, joka o jakaumataulukosta rvltä df = (-)(- ) = löytyvää lukua 3,84 selväst suuremp, mkä kertoo vomakkaasta rppuvuudesta. 5

26 4.3.. Epdemologsa tuuslukuja rsttaulukosta Ertysest epdemologsssa tutkmuksssa halutaa selvttää mtkä tekjät altstavat jollek saraudelle (ta kuolemalle). Samoja meetelmä vodaa tok käyttää mkä hyväsä -luokkase vastemuuttuja selttämsee, esmerkks ku talousteteessä seltetää ostohalukkuutta. Seltettävä muuttuja o ss -luokkae kyllä/e tyyppe muuttuja, jos altstava tekjä o jatkuvaluotee (kute esm. kä, verepae, ), vodaa käyttää logststa regressoaalyysä (katso luku 8.). Jos altstavaa tekjää o luoktteleva muuttuja, vodaa aesto kuvaluu käyttää rsttaulukkoa ja stä laskettava tuuslukuja, kute rskero, rsksuhde ja rsttulosuhde. Rskero vastaa ryhmttäste prosette vertaamsta erotuksella (ss seuraava sadalla kerrottua): sarastueet altstueet sarastueet e altstueet RD = altstueet yhteesä e altstueet yhteesä Rsksuhde o edellste suhde ja kertoo stä kuka mokertae rsk altstuella o sarastua suhteessa e-altstues: RR = sarastueetaltstueet/altstueetyhteesä sarastueet ealtstueet/ealtstueetyhteesä Rsttulosuhde (Odds Rato) o vedolyötsuhde ryhme vertaluks OR = sarastueet altstueet/esarastueet altstueet sarastueet ealtstueet/esarastueet ealtstueet Esmerkk Matt Uustuva vätöskrjasta Coroary Heart Desease ad Left Vetrcular Performace Newly Dagosed No-Isul-Depedet Dabetcs. Kyseessä o selttäjälähtökohtae tutkmus, el o pomttu dabeetkkoja ja e-dabeetkoja ja tutktaa mm. mlle saraukslle dabetes altstaa. Valtaa seltettäväks muuttujaks aga pectors ja tutkmuksesta pokete yhdstetää käluokat ja sukupuolet. Aga pectors Dabetes E-dabetes Yhteesä o e Yhteesä Edellä estetyt epdemologset tuusluvut tästä aestosta ovat: 6

27 RD = RR = OR = 6/ /5 Dabeetkolla o ss 6% (RD) eemmä aga pectorsta, mkä o.3 kertae (RR) määrä verrattua e-dabeetkoh. Vedolyötsuhtede suhteeks saadaa 3.4 (OR), jolla o suoravvae yhteys Logstse regressoaalyys (Luku 8.) parametr exp(b) = OR, mssä b o kysese selttävä muuttuja regressokerro. OR tulktaa use väär luvuks kuka mokertae rsk altstusryhmällä o verrattua vertaluryhmää, mkä tarkast ottae kertoo RR. Tässä esmerkssä tulkta e ole epäselvä: 6%: ero ja.3 kertae rsk o ettämättä selvä ja suur, mutta harvasmmssa sarauksssa pete prosettlukuje ero vo olla pe, mutta de suhde vo kasvaa harhaajohtava suureks. Esmerkks jos altstueta sarastueta o % (=0.0) ja e-altstueta sarastueta 0.% (=0.00). Rskeroks saadaa va = el 0.9%, mkä e ole suur ero, mutta rsksuhteeks saadaa %/0.% = 0 kertae rsk, el kov mokertae. Kh-tosee rppuvuustuusluvuks saadaa kysesestä aestosta (6 44) (9 46) (77 94) (5 98) Mkä o vertalulukuaa 3.84 paljo suuremp, el rppuvuus (ta ryhme ero) o tlastollsest selväst merktsevää Järjestyskorrelaatosta Järjestysasteko muuttuje välstä rppuvuutta vodaa tarkastella järjestyskorrelaatode avulla. Mkäl x-muuttuja arvoje kasvaessa y-muuttuja arvot myös kasvavat, o korrelaato postve, jos taas e peeevät o kyseessä egatve korrelaato. Spearma järjestyskorrelaatokerro lasketaa seuraavast: ) Havatoarvot korvataa järjestysluvulla (merktää R(x) ja R(y)) ste, että pe havato saa arvo, toseks pe arvo, je. Tasatulokse sattuessa sjotetaa kaklle havaolle vastaave järjestyslukuje keskarvo. Esm. jos eljä petä havatoarvoa ovat yhtä suuret, ovat R(x):t ällä keskarvo luvusta,,3,4 el.5. ) Lasketaa jokase tlastoykskö järjestyslukuje erotukse elö d = (R(x)-R(y)). 7

28 3) Edellste summa d sjotetaa kaavaa 6 d rs 3 Korrelaatokerro sjottuu aa vällle - r. Ku x: arvoje kasvaessa y: arvot kasvavat, r > 0 (postve rppuvuus). Ku x: arvoje kasvaessa y: arvot peeevät, r < 0 (egatve rppuvuus). Esmerkk Ammatllse koulutukse (x) ja taloudellse tlatee väle korrelaatokerro. Ammatlle koulutus o luokssa = E lakaa ammattkoulutusta, = Ammattkurss ta kursseja, 3 = Koulutasoe tutkto, 4 = Opstotasoe tutkto ja 5 = Korkeakoulututkto. Taloudelle tlae o kysytty astekolla 0-0, mssä 0 o huoo mahdolle ja 0 paras mahdolle Havatoaesto o parasta taulukoda seuraavast: X Y R(x) R(y) d=r(x) d R(y) Yhteesä 9.5 r S Korrelaatokerro o melko suur ja postve, jote tulos o odotetu kaltae: mtä eemmä koulutusta, stä paremp taloudelle tlae keskmäär. Toe paljo käytetty järjestyskorrelaatokerro o meltää Kedall järjestyskorrelaatokerro. Se o hema hakalamp laskea ja ataa hyv samakaltase tulokse ku Spearma kerro Pearso korrelaatokerro (correlato coeffcet) Kahde jatkuva muuttuja rppuvuude tutkmsee käytetää use Pearso tulomomettkorrelaatokerrota (yleesä pelkkä korrelaatokerro). Korrelaato mttaa aoastaa leaarsta rppuvuutta. Käyrävvase rppuvuude havatsee va 8

29 hajotakuvo prtämällä. Korrelaatokerro tulktaa kute edellä järjestyskorrelaatokerro. Korrelaato o se osa kahde muuttuja yhtesvahtelusta, mstä muuttuje omat vahtelut o postettu. Lähtökohtaa korrelaatokertomelle o kovarass, joka määrtellää kaavalla ( x x)( y y) Cov( X, Y ) Vertaa kovarass kaavaa keskhajoa kaavaa. Stä ähdää, että muuttuja kovarass tsesä kassa o keskhajoa elö el varass. Kutek kovarass vo olla myös egatve, mh päädytää, ku usempe havatoje kohdalla ( x x) o postve ja ( y y) egatve ja pävasto. Korrelaatokertome deasta (yhtesvahtelusta postetaa muuttuje omat vahtelut) saadaa määrteltyä slle kaava Cov( X, Y ) r s X s Y mssä sx o muuttuja x keskhajota ja sy o muuttuja y keskhajota. Ku keskhajotoje ja kovarass kaavat sjotetaa korrelaatokertome kaavaa ja supstetaa jakajat (-) pos, saadaa korrelaatokertomelle kaava ( x x)( y y) r ( x x) ( y y) Ku keskhajoa yhteydessä estetty tulos ( x) x x x sjotetaa edellsee kaavaa, saadaa korrelaatokertome kaava muotoo r x y x y x x y y mtä kaattaa käyttää laskettaessa korrelaatokerro käs. Vakka kaava o ptkä, o helpomp laskea havatoje summat, elösummat ja tulo summa, jotka sjotetaa kaavaa, ku laskea erksee erotukset ( x x) ja ( y y), jotka sjotettas esmmäsee kaavaa. Koska yhtesvahtelu e vo olla suurempaa ku muuttuje omat vahtelut yhteesä, o aar. El jos saat korrelaatokertomesta tsesarvoltaa yl yhde, o aa kyse laskuvrheestä. Korrelaatokertome suuruudesta vodaa tulkta rppuvuude vomakkuus. Seuraavat rajat evät ole kakssa tlatessa oketa, mutta atavat vhjee korrelaato vomakkuudesta. 9

30 Vtteellsest: vähäe korrelaato r < 0. kohtalae korrelaato 0. < r < 0.6 vomakas korrelaato r > 0.6 Korrelaato tlastolle merktsevyys vodaa testata hypotees testllä. Korrelaato tulkta rppuu myös sovellusalueesta. Jossa tlatessa rppuvuus o lmestä (esm. ekoometrsssa tutkmuksssa), että korrelaatokertome oletetaa oleva vähtää 0.6. Yhteskutateteellsssä tutkmuksssa korrelaatokertome arvo 0.3 vo olla jo suur. Myös otoskoko vakuttaa korrelaatokertome tulktaa: mtä suuremp otos, stä peemp korrelaato o merktsevä. Esmerkk Edellee samasta aestosta terveydetla (x) ja hekse vreyde (y) (astekolla 0-0) arvode korrelaatokerro x y x y xy Ku almmalla rvllä estetyt summat ja =5 sjotetaa korrelaatokertome kaavaa, saadaa korrelaatokertomeks r Pearso korrelaatokertome käyttö tässä tlateessa vo olla hema arveluttavaa, koska arvot melletää use järjestysasteko muuttujks. Use kutek ajatellaa, että ku arvossa o lukumääräsest useta vahtoehtoja, se o jatkuvaluotee. Korrelaatokerro o hyv korkea r = 0.7, jote heke vreys ja terveydetla kulkevat yhdessä. 30

31 Ku korrelaatokerro korotetaa tosee potess r, jota kutsutaa seltysasteeks. Seltysaste estetää use prosettea ja o tulkttavssa ste, että selttävä muuttuja selttää seltettävä vahtelusta seltysastee verra. Edellsessä esmerkssä terveydetla selttää (el 5%) hekse vreyde vahtelusta. Koska tässä e ole selvää kausalteetta, asa vodaa ajatella myös tos pä. Loput 48% selttyvät mulla heksee vreytee vakuttavlla tekjöllä ja satuasvahtelulla. Osttaskorrelaatokerro Jos halutaa postaa jatkuvaluotese sekottava tekjä z vakutus kahde muuttuja x ja y välsestä korrelaatokertomesta, se vodaa tehdä osttaskorrelaatokertomella. rxy rxz ryz rxy Z ( r )( r ) XZ YZ Mssä estyvät kakke kolme muuttuja keskäset korrelaatokertomet. Esmerkks rxy o muuttuje x ja y väle korrelaatokerro. Muuttuje kuvalumeetelmstä Yhde muuttuja kuvalumeetelmä Mtta-astekko Taulukot Kuvot Tuusluvut Luoktteluastekko Frekvesst ja Pylväskuvo (Mood, etropa) prosett Järjestysastekko Edellset ja Pylväskuvo (ja Medaa summafr ja porraskuvo) summafr % Välmatka-astekko Edellsee Hstogramm ta Keskarvo, medaa, luokkarajat ja vvakuvo keskhajota luokkakeskukset (summakäyrä) (keskvrhe, vous- ja hupukkuustuusluku) Suhdeastekko Kute edellä Kute edellä (Edellste lsäks geometre ka ja varaatokerro) 3

32 Kahde muuttuja (rppuvuude) kuvalumeetelmä Mtta-astekko Taulukot Kuvot Tuusluvut Ryhmttelevät Rsttaulukko Yhdstetty -tuusluku muuttujat pylväskuvo Jatkuvaluoteset Hajotakuvo Korrelaatokerro muuttujat Ryhmttelevä ja Ryhmttäset Jaakuvo Taulukotua jatkuvaluotee muuttuja tuusluvut (etek keskarvo keskvrhe ryhmttässtä tuusluvusta ryhmttäset tuusluvut Kaavossa luoktteluasteko ja järjestysasteko muuttujat melletää epäjatkuvaluotesks ja välmatka-astekko sekä suhdeastekko melletää jatkuvaluotesks muuttujks. Taulukossa e ole estetty järjestysasteko muuttujsta laskettavaa järjestyskorrelaatokerrota. Sulussa estetyt kuvalumeetelmä e tällä kursslla tarvtse osata käyttää, mutta kuvalu dea o ymmärrettävä 3

33 5 Todeäkösyyslasketaa 5. Perusteta Tlastolle päätökseteko perustuu todeäkösyyslasketaa. Tlastolls aestoh lttyy satuasuutta (el epätarkkuutta) otaa ja mttaukse kautta. Tämä kästtelyy tarvtaa todeäkösyyslasketaa. Tlastotetee kaalta erttä tärketä ovat todeäkösyysjakaumat, jotka tomvat emprste jakaume mallea. Myös hypotees test p-arvo (joka perusteella johtopäätös tehdää) o todeäkösyysluku. Todeäkösyyde dea o mallttaa tapahtumaa, mstä e tueta kakkea. Idea o sama ku otatatutkmuksessa: jos mellä ols käytössä havatoaesto koko perusjoukosta (kokoastutkmus), mttaustulokset olsvat tarkkoja, mutta koska otos o va osa perusjoukkoa, pyrtää todeäkösyyslaskea avulla arvomaa perusjoukkoa. Paljo käytetty esmerkk todeäkösyyde luoteesta o ajatuskoe meltää Schrödger kssa. Schrödger o kvattmekaakko ja tätä estystä o arvosteltu paljo, mutta se kertoo hyv todeäkösyyslaskea luoteesta. Ajatuskokeessa kssa o suljettu laatkkoo yhdessä radoaktvse aee kassa. Ae tetek tappaa jossa ajassa kssa, mutta emme tarkast tedä kuka opeast. Ku tlaetta tarkastellaa laatko (läpäkymätö) ulkopuolelta, emme tedä oko kssa elossa va kuollut. Se selvää tetek avaamalla laatkko ja tarkastamalla tlae, mutta laatko ulkopuolelta tarkasteltua vodaa va arvalla kssa tlaetta. Todeäkösyydellä pyrtää saamaa kssa tlateesee valstuut arvaus. Todeäkösyyslaskea perusteet vodaa jakaa alkestodeäkösyyks ja todeäkösyyslaskusäätöh. Lähtökohtaa o tapahtuma (väte), joka todeäkösyys halutaa laskea. Tämä tapahtuma plkotaa pe os käyttäe verbalkkaa ja logkkaa (esm. aak joku joukosta A, B tarkottaa ykskertasest A ta B). Seuraavaks katsotaa pete ose el alkestapauste todeäkösyydet, jotka joko aetaa tehtävässä ta ovat pääteltävssä symmetraa perustue. Lopuks käytetää todeäkösyyslaskusäätöjä ja lasketaa alkestapauste todeäkösyyksstä alussa estety tapahtuma todeäkösyys. Tämä vodaa esttää kuvoa: 33

34 Plkotaa os käyttäe verbalkkaa Tapahtuma ta väte Alkestapauste todeäkösyydet Lasketaa käyttäe todeäkösyyslaskusäätöjä Ogelmallseks todeäkösyyslaskea tekee se, että plkkome kaattaa tehdä ste, että todeäkösyyslaskusäätöjä vodaa käyttää. Tämä tarkottaa stä, että kaattaa hakea plkkomsessa määrättyjä saoja (ja, ta, e), jotka vodaa muuttaa suoraa laskutomtuksks (+, *, -P(A)) sekä tarkastaa, että laskusäätöje oletukset (esm. rppumattomuus) o vomassa. 5.. Alkestapaukset Alkestapauste todeäkösyydet vovat perustua: a) symmetraa. Esmerkks rahahetto, opahetto, palloosto,,, - opetuksessa käytetää paljo ätä esmerkkeä, koska lähtökohta o ykskertae, mutta e ketes atavat väärä kuva todeäkösyyslaskea käyttökohtesta. - jos kakk alkestapaukset ovat yhtä todeäkösä, lasketaa yhde alkestapaukse todeäkösyys kaavasta b) tlastoh, akasemp samalas tapahtum. Esmerkks ostumsprosett urhelussa, sytyvä lapse sukupuole todeäkösyys, ostta vekkauspelt, kakk mstä o aempa tetoja - kysese tapaukse suhteelle osuus o paras arvo ostumse todeäkösyydelle, mutta varsase todeäkösyyde ajatellaa oleva suure, joho päästää vasta äärettömä moella tostokokeella: c) ylesest hyväksyttyh arvoh. Esmerkks vekkauspelkertomet, lääkär arvo paratumsesta, yms - ämä perustuvat ostta use edellsee: tlastoh, mutta lsää o asatutemus ja äpptutuma tlatesee. - tämä o jo melko subjektve lähtökohta todeäkösyyslaskealle. Nätä käytetää myös tekoälysovelluksssa asatutjajärjestelmssä. d) omakohtasee tutumaa. Esmerkks tämä ataa mall käytäö elämä valtatlateesee. - hyv subjektve lähtökohta. - vakka käytäö elämässä e kuljeta taskulask taskussa, ataa tämä ajattelumall tlates. 34

35 - esmerkks seuraava peltlae, mssä hyökkääjäpelaaja O vo joko syöttää toselle hyökkääjälle O, ta laukasta suoraa maal, vo arvella seuraavat todeäkösyydet. Puolustaja ja maalvaht o merktty X:llä. Tlateessa suora maal tekemse todeäkösyys o arvotu 0.3:ks ja syötö ostumse todeäkösyydeks 0.5. Todeäkösyydeks, että toe hyökkääjä saa pelvälee maal o arvotu 0.7. Tästä saadaa kertolaskusääöllä 0.5*0.7 = 0.35, joka o suora laukaukse todeäkösyyttä suuremp Todeäkösyyslaskusääöt Laskusääöt perustuvat kolmee perusperaatteesee, jotka taase perustuvat she, että todeäkösyys o aa olla ja ykköse välllä ste, että varma tapahtuma todeäkösyys o ja 0 kertoo stä, ette tapahtuma vo tapahtua. Kolmas perusperaate tuo todeäkösyykslle yhteelaskettavuude. Olkoo E joukko, joka ssältää kakk mahdollset tulosvahtoehdot el alkestapaukset. Todeäkösyys P o mtta, joka lmottaa jokase tapahtuma A (joka koostuu alkestapaukssta) estymstodeäkösyyde suuruude P(A). Tällä mtalla o seuraavat omasuudet (aksoomat): ) 0 P(A) ) P(E) =, E = kakke mahdollste tuloste joukko ) jos tapahtumat A ja B ovat erllsä, P(A U B) = P(A) + P(B) Nästä aksoomsta vodaa johtaa kakk muut todeäkösyyslaskea laskusääöt. Todeäkösyydet ja laskusääöt kaattaa esttää ja ajatella kuvoa (ve-dagramm), mssä tapahtumat (A, B,...) ovat osa kakke mahdollste tuloste joukosta E. Todeäkösyydet kaattaa ajatella pta-aloks. Toe aksooma määrää E: koo ykköseks. Esmerkk Nopassa o 6 samaarvosta svua, jotka o umerotu yhdestä kuutee. Tutktaa seuraave tapahtume todeäkösyyttä: 35

36 ) tulos o jok yhdestä kuutee P(E) = ) tulos o parlle P(A) = 3/6 = / 3) tulos o 5 P(B) = /6 4) tulos o parlle ta 5 P(A U B) = P(A) + P(B) = 3/6 + /6 = 4/6 = /3, koska A ja B ovat erllsä el evät vo sattua samaa akaa 5) tulos o parlle ta alle 4 P(A U C) = P(A) + P(C) = / + / =, o väär laskettu, koska A ja C evät ole erllsä. Tlateesee sop yhteelaskusäätö: P(A U B) = P(A) + P(B) - P(A B) Jollo saadaa okea tulos 5) P(A U C) = P(A) + P(C) - P(A C) = / + / - /6 = 5/6 Komplemet (el vastakohda) todeäkösyys lasketaa kaavalla P(A C ) = - P(A) Komplemettsäätöä vodaa käyttää tlatessa, jossa o helpomp määrätä vastakohda (attees) todeäkösyys. Kertolaskusäätö: Jos tapahtumat A ja B ovat tosstaa rppumattoma, tapahtuma A ja B todeäkösyys lasketaa tapahtume tuloa: P(A B) = P(A) P(B) Esmerkk Vdellä tettjällä o todeäkösyys 0.8 läpästä tett. Mkä o todeäkösyys, että vähtää yks tettjä läpäsee tet. Todeäkösyys votas laskea summaamalla tapahtume läpäsee, läpäsee,..., 5 läpäsee todeäkösyydet. Helpomp o kutek laskea komplemet, kukaa e läpäse, todeäkösyys ja vähetää se ykkösestä. P(kukaa e läpäse) = P(. tettjä e läpäse ja. tettjä e läpäse ja...ja 5 tettjä e läpäse) = P(. e läpäse) P(. e läpäse)... P(5. e läpäse) = ( - 0.8) 5 = Kysytty todeäkösyys o ss = Esmerkk Sytymäpäväparadoks 36

37 Kuka todeäköstä o, että vähtää kaks heklöä luokasta (34 heklöä) vettää sytymäpävää samaa pävää? Vähtää saa vttaa she, että kaattaa käyttää komplemettsäätöä. Lasketaa ss todeäkösyys, että kaks heklöä e vetä sytymäpävää samaa pävää ja väheetää tulos ykkösestä. Ajatellaa, että sytymäpävät kysytää yks kerrallaa (365 mahdollsta, ku karkauspävä uohdetaa) ja esmmäsellä kakk 365 pävää ovat suotusa, tosella kakk pats esmmäse varaama pävä ovat suotusa, je. Heklöde sytymäpävät o oletettava tosstaa rppumattomks, jotta votas käyttää kertolaskusäätöä: P ( A) El o hyv todeäköstä, että luokasta löytyy vähtää kaks heklöä, jotka vettävät sytymäpävää samaa pävää. Ehdollsta todeäkösyyttä tarvtaa sllo, ku teto tose tapahtuma estymsestä vakuttaa tutkttava tapahtuma todeäkösyytee. Esmerkks, jos valtaa umpmähkää yks maalma 6 mljardsta hmsestä, o todeäkösyys slle, että hä o suomalae o 5/ Jos vala tapahduttua paljastetaa teto, että valttu heklö lukee juur tätä mostetta, o todeäkösyys olla suomalae oleasest suuremp. Ehdollstaja ss muuttaa perusjoukkoa. Ku tuetaa tapahtuma A ja ehdollstaja B todeäkösyydet ja yhtestodeäkösyys, vodaa ehdolle todeäkösyys laskea kaavasta P(AB) = P( A B) P( B) Ku kaavasta ratkastaa P(A B), saadaa kertolaskusääölle ylestys el A: ja B: välstä rppumattomuutta e tarvtse olettaa käytettäessä kaavaa P(AB) = P(B)P(AB) ta meluumm P(AB) = P(A)P(BA) Rppumattomuus määrtellääk ehdollse todeäkösyyde avulla: Tapahtumat A ja B ovat tosstaa rppumattoma, jos ja va jos P(AB) = P(A) ja P(BA) = P(B) 37

38 Esmerkk Edellsessä luvussa estett kotgesstaulu sukupuole ja vastaaottotla ykstysyyde rppuvuudesta: Ykstysyys Mes Nae Yhteesä Hyvä Huoo Yhteesä Pomttaessa otoksesta yks heklö todeäkösyys, että kysee heklö ptää ykstysyyde suojaa hyvää o P(A) = 33/483 = Jos tedetää, että heklö sukupuol o mes, kysee todeäkösyys o P( A B) 40 / P(AB) = P( B) 47 / Ehdollsesta todeäkösyydestä päästää Bayes säätöö ja kokoastodeäkösyyde laskusäätöö. Tlastotetee osa-alue meltää Bayesläe päättely perustuu tetek tähä Bayes säätöö. Bayesläsellä päättelyllä päästää jopa tarkemp tuloks ku klassslla hypotees testellä, mutta jokasta tlaetta varte o määrteltävä todeäkösyysjakauma, ehdolle todeäkösyys ja stä kautta Bayesläse päättely käyttäme o huomattavast hakalampaa ku klasse hypotees testaus. 5. Todeäkösyysjakauma Satuasmuuttujat ovat emprste muuttuje matemaattsa vasteta. Nde avulla vodaa emprse muuttuja arvossa estyvä vahtelu lmasta matemaatts terme. Todeäkösyysjakaumat atavat mall satuaskokeesee ja e kertovat kakke mahdollste tapahtume todeäkösyydet. Satuasmuuttuja lttää kakk mahdolls alkestapauks todeäkösyyde. Satuasmuuttuja X todeäkösyysjakauma muodostuu - muuttuja arvosta x - arvoh lttyvstä todeäkösyyksstä p Satuasmuuttujaa, joka saa va tettyjä arvoja (esm. kokoaslukuja), saotaa epäjatkuvaks el dskreetks satuasmuuttujaks. Vastaavast jatkuva satuasmuuttuja saa mtä tahasa reaallukuarvoja tetyllä välllä. Todeäkösyydet p vodaa kuvtella massaks, joka arvo o yks ja jakaatuu er X: arvoje keske se mukaa, mkä kuk arvo todeäkösyys o. Jos kyseessä o epäjatkuva satuasmuuttuja, keskttyy todeäkösyysmassa yksttäste x arvoje kohdalle. Todeäkösyysmassa jakauma lmottavaa fuktota saotaa theysfuktoks f(x). Epäjatkuva satuasmuuttuja theysfukto lmottaa kuk tulosmahdollsuude x todeäkösyyde. Esmerkks rahahetossa tulosmahdollsuuksa o x=kruua ja 38

39 x=klaava. Molempe tulosvahtoehtoje todeäkösyys o sama el f(x)=0.5 ja f(x)=0.5. Rahaheto tulokse X theysfukto saa ss X: arvolla x (kruua) arvo 0.5 ja X: arvolla x (klaava) arvo 0.5. Vastaavast jatkuva satuasmuuttuja theysfuktota e voda määrtellä pstettä. Koska jatkuva satuasmuuttuja vo saavuttaa äärettömä mota arvoa määrttelyvälllää, o yhde pstee todeäkösyys olla. Jatkuva satuasmuuttujaa lttyvä todeäkösyyksä kästellää väle avulla (joka johtaa summaukse korvaamse tegrolla) Satuasmuuttuja X kertymäfukto F(x) määrtellää kaavasta F(x) = P(X x) Kertymäfukto arvo kohdassa x lmasee se, mllä todeäkösyydellä satuasmuuttuja X saa arvo, joka o korketaa x. Satuasmuuttujalle X vodaa määrätä tuuslukuja el parametreja se todeäkösyysjakaumasta. Tuusluvut kuvaavat jota jakauma omasuutta, esmerkks jakauma pakkaa kute odotusarvo E(X) (ta ) ta se leveyttä, kute varass D (X) ta Var(X) (ta ). Epäjatkuva jakauma odotusarvo (expectato), joka kertoo jakauma keskkohdasta, saadaa kaavasta E ( X ) f ( x ) x Vastaavast jatkuvalle satuasmuuttujalle E ( X ) f ( x) x dx Ku odotusarvo o määrtelty, vodaa määrtellä varass kaavalla D (X) = E(X E(X)) Tästä määrtelmästä saadaa (melko suoraa) kaava varasslle epäjatkuvalle satuasmuuttujalle D ( X ) f ( x )( x E( X )) sekä jatkuvalle satuasmuuttujalle D ( X ) f ( x)( x E( X )) dx Todeäkösyyslaskeassa vodaa ajatella oleva kolme tasoa: 39

40 - mkrotaso, joka tarkottaa yksttäsä todeäkösyyksä - mesotaso koostuu todeäkösyysjakaumsta - makrotaso tarkottaa todeäkösyysjakaumsta laskettuja tuuslukuja Tlastollsessa päätökseteossa käytetää teoreettsa jakauma perusjouko (jouko, joho tutkmukse tulos ylestetää) malla. Otoksesta saadu emprse jakauma oletetaa oleva peräs tästä todeäkösyysjakaumasta ja emprse jakauma perusteella pyrtää tekemää johtopäätöksä perusjouko malla olevasta teoreettsesta todeäkösyysjakaumasta a) estmolla, perusjouko parametra arvodaa otoksesta lasketulla tuusluvulla.(esm. odotusarvoa arvodaa keskarvolla) b) hypotees testauksella, perusjouko parametreh lttyvä hypotees ja tutktaa tukeeko saatu havatoaesto hypoteesa. Esmerkkejä todeäkösyysjakaumsta Esm. Hetetää kahta oppaa ja tutktaa slmälukuje summa todeäkösyysjakaumaa, el määrätää todeäkösyydet P(X=), P(X=3), P(X=4),...,P(X=), mssä X o satuasmuuttuja, joka lmasee oppe slmäluvu summa. Nopat ovat erllsä ja tosstaa rppumattoma, jote vodaa metä toe oppa. opaks (taulukossa vaakaa) ja toe oppa. opaks (taulukossa pystyy). Noppe slmäluvusta ja de summasta vodaa esttää taulukko, jossa vaakasuoraa estetää. opa tulos ja pystysuoraa. opa tulos sekä ruuduko ssällä o slmälukuje summa Taulukossa o estetty kakk mahdollset tulokset el alkestapausavaruus. Kakk slmälukupart ovat yhtä todeäkösä. Huomaa, että esmerkks par {5,6} vodaa saada kahdella tavalla:. oppa o 5 ja. oppa o 6 sekä. oppa o 6 ja. oppa o 5, ku taas samat umerot vodaa saada va yhdellä tavalla: esmerkks par {5,5} vodaa saada va ste, että. oppa o 5 ja. oppa o 5. Symmetrsyyde perusteella saadaa määrteltyä opaheto slmäluvu todeäkösyysjakauma klassse todeäkösyyde avulla: lasketaa suotuste vahtoehtoje määrä ja jaetaa se kakke vahtoehtoje määrällä. Kakkaa ruutuja taulukossa o 6*6 = 36, joka o kakke vahtoehtoje määrä. 40

41 Todeäkösyysjakauma vodaa esttää myös vaakasuoraa taulukkoa: x f(x) /36 /36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 /36 /36 Kertymäfukto samasta jakaumasta saadaa summaamalla theysfukto todeäkösyydet kaavalla F( x) x f ( ) x F(x /3 3/3 6/3 0/3 5/3 /3 6/3 30/3 33/3 35/3 ) /3 6 Jakauma odotusarvoks saadaa E ( X ) f ( ) Tämä o tulkttavssa ste, että tostettaessa oppapar hettoa, saadaa slmälukuje summa keskarvoks 7. Tulos o ähtävssä myös theysfuktosta prretystä kuvosta symmetrse jakauma keskkohtaa. Esmerkkejä kuka theys- ja kertymäfuktota vodaa käyttää apua todeäkösyyslaskussa: ) Mllä todeäkösyydellä slmälukuje summa o 6, 7 ta 8? f(6) + f(7) + f(8) = 5/36 + 6/36 + 5/36 = 6/36 ta P(5 < X < 9) = F(8) - F(5) = 6/36-0/36 = 6/36 ) Mtä slmälukua peempä o /4 tulokssta? (=alakvartl) Ku lasketaa kertymäfuktosta murtoluvut lkarvoks saadaa F(4) = 6/36 = 0.67 ja F(5) = 0/36 = 0.78 Neljäsosa /4 = 0.5 o edellste välssä. Vastaukseks saadaa, että /4 jakaumasta kertyy tuolla välllä, ss slmälukuje summaa 5 meessä. Esm. Kolme kettäbologa ets rämeköltä mäkhyppysammakota tosstaa rppumattomast. Mäkhyppysammako havatsemstodeäkösyys yhdellä kettäbologlla o 0.3. Määrää todeäkösyysjakauma slle, kuka mo kettäbolog havatsee mäkhyppysammako. Alkestapausavaruus o {0,,,3} el 0 vastaa stä, että ykskää e havatse sammakkoa ja 3 vastaa stä, että kakk havatsevat. 4

42 Nmetää havaotsjat krjamlla A, B ja C. Olkoo X satuasmuuttuja, joka yhdstää havatsjode lukumäärä vastaav todeäkösyyks. P(X=0) = P{A e havatse ja B e havatse ja C e havatse} = P{A e havatse} P{B e havatse} P{C e havatse} = ( - 0.3)(-0.3)(-0.3) = = P(X=) = P{A havatsee ja B e havatse ja C e havatse} + P{A e havatse ja B havatsee ja C e havatse} + P{A e havatse ja B e havatse ja C havatsee} = 0.3 (-0.3) (-0.3) + (-0.3) 0.3 (-0.3) + (-0.3) (-0.3) 0.3 = 0.44 P(X=) = (-0.3) = 0.89 P(X=3) = = 0.07 Kakke tapauste yhteelaskettu todeäkösyys P(X=0)+P(X=)+P(X=)+P(X=3)= =. 4

43 f(x) x F(x) x Jakauma odotusarvoks saadaa E ( X ) 3 0 f ( ) Tämä o tulkttavssa ste, että koetta tostettaessa havatsjode lukumäärä keskarvo lähestyy lukua

44 Esm. 3 Tutktaa koe-eläme elakaa tutkmuksessa (esm. hyötee). Maksmelaka o tut ja kuolemse todeäkösyys o sama koko tutkmukse aja. Satuasest pomtu koe-eläme ä todeäkösyysjakauma o määrttely mukaa seuraava kaltae. Määrätää a, ku tedetää, että theysfukto pta-ala = (el kakke mahdollsuukse yhteelaskettu t = ). Kolmo pta-ala kaavasta saadaa ( a) / = <=> a = Pstede (0,) ja (,0) kautta kulkeva suora yhtälö o muotoa f(x) = - x, jote theysfuktoks saadaa -x, ku 0 x, muullo f(x) = 0. Kertymäfukto määrttelyvälllä 0 x saadaa theysfukto tegraala F( x) x 0 z dz x x Ku x < 0, F(x) = 0 ja ku x >, F(x) =. f(x) x Elä odotusarvoks saadaa E ( X ) x dx Odotusarvo o tulkttavssa koe-eläte keskmääräseks eläks. 44

45 Bomjakauma (dskreett jakauma) Hetetää rahaa. Tulosmahdollsuudet ovat kruua ja klaava, jode todeäkösyydet yhdessä hetossa ovat 0.5 ja 0.5. Tostetaa rahahetto k kertaa ja meleko kohteea o kuka mota klaavaa saadaa. Yhdessä hetossa (k=) olla klaava t=0.5 ja yhde klaava t=0.5. Kahdessa hetossa (k=): aa hetosta saadaa / * / = /4 olla klaavaa vodaa saada va yhdellä tavalla: (kr, kr) jote todeäkösyys o /4 yks klaava vodaa saada kahdella tavalla: (kl, kr), (kr, kl) jote todeäkösyys o /4 = / kaks klaavaa vodaa saada va yhdellä tavalla: (kl, kl) jote todeäkösyys o /4 Kolmessa hetossa (k=3): edellee / * / * / = /8 olla klaavaa saadaa va yhdellä tavalla: (kr, kr, kr) jote t = /8 yks klaava saadaa kolmella tavalla: (kl, kr, kr),(kr, kl, kr),(kr, kr, kl) jote t = 3 * /8 = 3/8 kaks klaavaa saadaa kolmella tavalla: (kl, kl, kr),(kl, kr, kl),(kr, kl, kl) jote t = 3 * /8 = 3/8 kolme klaavaa saadaa yhdellä tavalla: (kl, kl, kl) jote t = /8 Ku merktää p:llä ostumse todeäkösyyttä yhdessä tostokokeessa (rahahetossa = / ) ja tostoje lukumäärää :llä, saadaa kombatorka perusteella bomjakauma theysfuktoks x x f ( x) p ( p) B(,p) x Huomaa, että bomjakaumassa ostumse todeäkösyyde e tarvtse olla 0.5, vaa se saa olla mtä hyväsä olla ja yhde välltä. Bomjakauma tom dkotomste muuttuje malla, ku tutktaa estyykö jota asaa va e (esm. sarautta). Tostoje lukumäärää vastaa havatoje määrä ja arvotavaa o yhde heklö sarastumsalttus p, ku otoksesta saatu sarade lukumäärä o x. 45

46 Bomjakauma o tlastoteteessä tärke epäjatkuva jakauma. Muta epäjatkuva teoreettsa jakauma ovat mm. Multomjakauma, Possojakauma, Hypergeometre jakauma ja Geometre jakauma. Normaaljakauma(jatkuva jakauma) Normaaljakauma ja stä johdetut jakaumat ovat tärkemmät tlastoteteessä käytetyt jakaumat. Hyv moet asat (muuttujat) luoossa oudattavat ormaaljakaumaa ta aak lk ormaaljakaumaa. Satuasmuuttujaa saotaa ormaaljakautueeks, jos se theysfukto o muotoa f ( x) exp ( x ) Theysfuktossa estyvä parametr o ormaaljakauma odotusarvo ja se varass. Normaaljakauma theysfuktosta e tarvtse käs laskea arvoja, sllä stadardodu ormaaljakauma kertymäfukto arvoja ((z) = P(Z < z)) o taulukotu ormaaljakaumaa perustuvaa päättelyä varte. Stadardodu ormaaljakauma odotusarvo o = 0 ja varass =. Muuttuja, joka oudattaa ormaaljakaumaa parametre,, saadaa stadardotua, el oudattamaa stadardotua ormaaljakaumaa, muuoskaava Z X avulla, mssä uus muuttuja Z oudattaa stadardotua ormaaljakaumaa. Esmerkk Satuasmuuttuja X ~ N(5,6), jossa = 5 ja = 4. Lasketaa todeäkösyydet X 0 5 a) P( X 0) P P( Z.5) (.5) X 0 5 b) P( X 0) P P( Z.5) (.5) (.5) X 4 5 c) P( X 4) P P( Z 0.5) ( 0.5) 4 ( (0.5)) ( ) X 6 5 d) P( X 6) P P( 0.75 Z 0.5) (0.5) ( 0.75) 4 4 (0.5) ( (0.75)) ( ) 0.37 Normaaljakaumasta johdettuja jakauma 46

47 T-jakauma Studet t -jakauma o ormaaljakauma muotoe, mutta hema latteamp jakauma. Ku ormaaljakautuut satuasmuuttuja (esm. otoskeskarvo) X stadardodaa ja odotusarvo hajotaluku (/ ) el keskvrhe e ole tuettu ja se joudutaa korvaamaa otoksesta lasketulla keskvrheellä s/. Nä muuettu satuasmuuttuja X t t(-) s / oudattaa t -jakaumaa vapausaste -. Mtä peemp o otoskoko, stä latteamp jakauma. T -jakauma lähestyy ormaaljakaumaa, ku otoskoko kasvaa ( ). T -jakaumaa käytetää mm. keskarvo luottamusväl määräämsessä (ku < 30) ja keskarvotestessä. Tätä varte o taulukotu t -jakauma kertymäfukto arvoja. Luettaessa jakaumataulukkoa, o mustettava päätökseteo (luottamusväl ja p-arvo) oleva use -suutae. Esmerkks 95%: luottamusväl taulukkoluku ja - suutase test p = 0.05: krtte pste o luettava 0.975: fraktlsta. -jakauma -jakauma saadaa summaamalla ormaaljakautuede satuasmuuttuje elötä = X + X +...+Xk (k) mssä X:t oudattavat stadardotua ormaaljakaumaa ja oudattaa -jakaumaa vapausaste k. -jakaumaa käytetää mm. rsttaulukotuje muuttuje rppuvuude testaamsee tlastollse mall sopvuude testauksee. Tlastollsta päätöksetekoa varte o taulukkoa luettaessa osattava käyttää todeäkösyyslaskea komplemettsäätöä: p = - fraktl. F -jakauma Fsher F -jakauma saadaa johdettua kahde -jakautuee satuasmuuttuja avulla. Satuasmuuttuja ( m) / m F F(m,) ( ) / oudattaa F -jakaumaa vapausaste m,. 47

48 F -jakaumaa käytetää mm. varassaalyysssä ja varasse (el keskhajotoje) yhtäsuuruude testauksessa. Myös F -jakauma todeäkösyyksä o taulukotu tlastollsta päätöksetekoa varte. Tlastollsta päätöksetekoa varte o taulukkoa luettaessa osattava käyttää todeäkösyyslaskea komplemettsäätöä: p = - fraktl. 48

49 6 Tlastollsesta päätökseteosta Estmaattor = kaava ta säätö, jolla havaosta lasketaa tuusluku Teoreette jakauma Todeäkösyysjakauma, joka tom perusjouko malla. Esm. Normaaljakauma N(, ), bomjakauma B(,p) Parametr,, p Empre jakauma Havaosta saatu frekvessjakauma (suhteellset frekvesst) Tuusluku x, md, mo, s, f/ 6. Otatajakauma Use vodaa olettaa muuttuja oudattava perusjoukossa jota tuettua teoreettsta jakaumaa (use ormaaljakauma, bomjakauma ta multomjakauma). Nä tuetaa yhde havatoarvo teoreette jakauma. Koska tuusluvut lasketaa havatoarvoje avulla, vodaa määrtellä myös tuusluvulle otatajakauma, ku ajatellaa pomttava samasta perusjoukosta useamp otos ja jokasesta otoksesta lasketaa kysee tuusluku. Esm. Keskarvo otatajakauma Muuttuja X ~ N(, ) perusjoukossa. Ss E(X) = ja D (X) =. Pomtaa satuasotos X:ä : X,X,...,X tosstaa rppumattomast. Tällö myös X X ~ N (todeäkösyyslaskea tulos, joka todstus svuutetaa tässä) Edellee E( X ) E X E( X ) El keskarvo o odotusarvo harhato estmaattor. Keskarvo otatajakauma varassks saadaa D ( X ) D X D ( X ) mstä saadaa, ottamalla elöjuur ja korvaamalla perusjouko keskhajota otaasta lasketulla keskhajoalla s, tuttu keskvrheterm s /. Nä olle X ~ N(, / ). Tämä o keskarvo otatajakauma ja keskarvoo lttyvä päätökseteko perustuu tähä otatajakaumaa (esm. luottamusväl ja keskarvoo perustuvat testt). 49

50 Keskarvo otatajakaumaa vodaa havaollstaa tetokoesmulo lsäks vakka seuraavalla esmerkllä, mssä koko perusjoukko o tedossa ja stä pomtaa erlasa otoksa, jode keskarvoja tarkastellaa. Esmerkk Olkoo perusjouko havaot 3, 4, 5, 6 ja 7. Tästä saadaa 0 erlasta 3 5 kokosta otosta, koska 0. Nämä otokset ovat: 3 Keskarvo Keskarvo Otos : 3, 4, Otos : 3, 4, Otos 3: 3, 4, Otos 4: 3, 5, Otos 5: 3, 5, Otos 6: 3, 6, Otos 7: 4, 5, Otos 8: 4, 5, Otos 9: 4, 6, Otos 0: 5, 6, 7 6 Perusjouko keskarvo (odotusarvo) = 5 ja keskhajota.6. Perusjoukko o tasajakautuut, jote ormaaljakaumaoletus tässä e ha täyty. Ku ajatellaa edellset 0 keskarvoa havaoks, de keskarvoks saadaa x 5. Tämä o esmerkk stä, että keskarvo o odotusarvo harhato estmaattor E (X ). Tässä tlateessa edellste kymmee keskarvo hajoaks (el keskvrheeks) saadaa s Yleesä tuota keskvrhettä arvodaa jakamalla keskhajota otoskoo elöjuurella / =.6/ 3 0.9, mkä e tässä tlateessa ole tasa sama ku edelle 0.6, koska perusjoukko o tasajakautuut ekä ormaaljakautuut. Keskee raja-arvolause (Cetral Lmt Theorem) Normaaljakauma e ole tetekää aa perusjouko jakauma, mutta keskesestä rajaarvolauseesta löytyy perustelu, mks ormaaljakaumaa perustuva testejä käytetää hyv paljo. Vapaast lmastua keskee raja-arvolause kertoo että otoskoo kasvaessa keskarvo otatajakauma lähestyy ormaaljakaumaa. Kaavaa tämä vo lmasta: X N(0,), ku Jällee vapaast tulkttua tämä vodaa ymmärtää ste, että testessä ja välestmossa perusjouko ormaaljakaumaoletuksesta e tarvtse välttää suurella otoskoolla, koska jakauma kovergess hotaa tuusluvu (keskarvo) jakauma. Se, mte suur otoskoo tulee olla, e ole yksselttee. Krjallsuudesta löytyy matoja, että otoskoko > 30 rttäs, mutta aak tuhase havatoje kohdalla tämä tom, tok rppue perusjouko jakaumasta. Edellä estetty keskarvo otatajakauma o va esmerkk otatajakauma havaollstamseks. Kaklle mahdollslle tuusluvulle(esm. keskhajota, korrelaatokerro, keskarvoje erotus, je) o olemassa omat otatajakaumat, mh perustuu äh lttyvä tlastolle päätökseteko. x x 50

51 6. Estmosta Välestmossa määrätää otoksesta estmotavalle parametrlle väl, jolla se sjatsee suurella todeäkösyydellä (95%, 99% ta 99.9%). Määrääme perustuu otatajakaumaa ja tätä välä kutsutaa luottamusvälks. Keskarvo luottamusväl Edellä todett, että X ~ N(, /). Halutaa määrätä X: jakaumasta väl ste, että P ( a X b) 0.95 Stadardomalla X ja merktsemällä stadardotuja rajoja z:lla saadaa a X b X P P z z P X / / / / z X z Havataa, että epäyhtälöryhmä. (alaraja) ja vmee term (yläraja) mustuttavat tosaa. Luottamusväl jakaatuu keskarvo ympärlle symmetrsest. Sama kaava vodaa esttää lyhyest seuraavast, ku korvataa velä perusjouko parametrt ja otoksesta lasketulla estmaattorella (tuusluvulla) x ja s: x z s Keskhajoa estmota e tarvtse tehdä, jos perusjouko tuusluvut tuetaa, mutta yleesä ä e ole. Keskhajoa pste-estmossa o epätarkkuutta, jollo taulukkoluku z katsotaak t-jakaumataulukosta vapausaste df = - tetek fraktlsta, koska vaadttu 95% halutaa jakauma keskeltä, jollo yhtee hätää jää puolet lopusta 5%:sta, el 0.05 (ja 0.05 = ta = 0.975). Normaaljakauma käytetymmät taulukkoarvot ovat P(-z < X < z) = 0.95 => z =.96 P(-z < X < z) = 0.99 => z =.58 P(-z < X < z) = => z = 3.9 Nämä taulukkoluvut löytyvät ormaaljakaumataulukosta, mutta myös t-jakaumatauluko -rvltä, koska t-jakauma lähestyy ormaaljakaumaa vapausastede (otoskoo) kasvaessa. Luottamusväle kertomet ovat ss hema ätä lukuja suurempa t- jakaumatauluko arvoja. 5

52 Esmerkk Otoksesta = 5 o laskettu keskarvoks x 3. ja keskhajoaks s = 6.6. Tämä keskarvo 95%: luottamusvälks saadaa ;5.9 Keskarvo tarkkuus o ss hema alle 3 ykskköä. Jos halutaa vakka verrata keskarvoa ollaa, keskarvo 3. eroaa ollasta tlastollsest merktseväst, koska olla e kuulu keskarvo luottamusvällle. Myös mulle tuusluvulle määrtellää vastaavast luottamusvält tuusluvu otatajakaumaa perustue. Esm. varasslle ja ostumse todeäkösyydelle p bomjakaumasta. Samo vodaa tehdä er aalyyse parametrelle esmerkks regressoaalyys regressokertomelle. Ostumse todeäkösyyde luottamusväl Olkoo X ~ B(,p), mssä o tostoje lukumäärä ja p o ostumse todeäkösyys. Tällö E(X) = p ja D (X) = p(-p). Helpo tapa laskea luottamusväl p:lle o käyttää ormaaljakauma-approksmaatota: bomjakauma lähestyy ormaaljakaumaa tostoje määrä kasvaessa: B(,p) -> N(p,p(-p)), ku ->. Luottamusväl p:lle o tällö pˆ( pˆ) pˆ z mssä pˆ o otoksesta laskettu ostumste suhteelle osuus (el prosettluku lma 00:lla kertomsta) ja o otoskoko. Huomaa, että tässä taulukkoluku o aa ormaaljakaumasta, ekä t-jakaumasta, otoskoosta rppumatta. Esm. Gallupssa, jossa otoskoko ol = 000, lmott 50 heklöä ääestäväsä puoluetta x. Katsotaa kuuluuko aemp 0%: kaatus suhteellse osuude 95%: luottamusvällle pˆ( pˆ) pˆ( pˆ) 0.5( 0.5) P ˆ ˆ p z p p z P p P 0. p ( 0.5) 000 5

53 "Vrhemargaalks" ( merk jälkee osa luottamusvälstä) tässä ss saadaa o 3 prosettykskköä. Koska aemp 0% el 0.0 e kuulu luottamusvällle, puoluee kaatukse vodaa katsoa kasvaee tlastollsest merktseväst. Pste-estmosta Parametra arvodaa yhdellä luvulla. Samaa parametra vodaa estmoda usealla er estmaattorlla. Esmerkks odotusarvoa vodaa estmoda keskarvo lsäks medaalla ja moodlla. Mstä saadaa ("kekstää") estmaattort el laskukaavat? Estmotmeetelmät: - pemmä elösumma estmotmeetelmä (PNS, LSS Least Sum of Squares) - suurmma uskottavuude estmotmeetelmä (SU, ML Maxmum Lkelhood) - muta estmotmeetelmä Esm. ps-estmaattor :lle. Nelösumma (X - ) mm saavutetaa dervaata ollakohdassa D (X - ) = D (X - X + ) = - X + = 0 (asetetaa ollaks) ˆ X El keskarvo o perusjouko odotusarvo pemmä elösumma estmaattor. Esm. su-estmaattor :lle Jos satuasmuuttuja X theysfukto o fx, otokse X, X,...,X yhtestheysfukto o f ( x, x,..., x ) f X ( x ) f X ( x )... f X ( x ) f X ( x ) Ku tätä fuktota tarkastellaa estmotava parametr suhtee, kutsutaa fuktota uskottavuusfuktoks, jota merktää L(;x, x,...,x). Jos oletetaa satuasmuuttuja X oudattava ormaaljakaumaa varasslla : X~N(,), saadaa uskottavuusfukto muotoo ( x x ) ( ) L( ; x, x,..., x ) e ( ) e joka luoolle logartm o ykskertasemmassa muodossa ja helpomm dervotavssa 53

54 l ( ; x, x,..., x ) log L( ; x, x,..., x ) log( ) ( x ) Tämä maksm löytyy dervaata ollakohdasta l ( x ) 0 ˆ x Mtä estmaattora ptäs stte käyttää, mllae o "hyvä" estmaattor? Otatajakaumasta saadaa estmaattorlle seuraava omasuuksa: Harhattomuus Estmaattor odotusarvo o estmotava parametr E( Tˆ) T Esm. Tehokkuus E( X ) = E(/ X) = / E(X) = / = Kahdesta estmaattorsta T ja T se, joka otatajakauma varass o peemp, o tehokkaamp ku toe. Esm. T tehokkaamp. D Tˆ ) D ( Tˆ ) ( Varassa vodaa estmoda aemm estetyllä kaavalla ( x x) jakajaa vo olla pelkkä : s Esmmäe s o varass harhato estmaattor, koska s ( x x) ta 54

55 55 ) ( ) ( ) ( ) ( ) ( ) ( x E x x E x E x x E x x E s E Toe s o harhae, koska ) ( ) ( ) ( x x E s E Tämä o perustelu slle, mks otoskeskhajoa kaavassa jakajaa o - ekä. Tosaalta D (s ) > D (s ), jote s o s :sta tehokkaamp, mutta harhattomuutta pdetää tärkeämpää omasuutea. Kertausta: Mtä otatajakaumasta o hyötyä? - pystytää määräämää luottamusväl - vodaa arvoda estmaattor luotettavuutta - saadaa tutkttua estmaattorede omasuuksa (edellä estettyje lsäks mm. asymptootte harhattomuus, tarketuvuus, mmvarasssuus) - seuraavaa estettävä hypotees testaus perustuu myös tuuslukuje otatajakaum ja de yhdstettyh jakaum. 6.3 Hypotees testauksesta Tlastollste teste avulla vodaa tutka otatapopulaatota koskeve vättäme ta kästyste (hypoteese) pakkasaptävyyttä. Koska tehtävät päätelmät perustuvat otoksee, e täyttä varmuutta koskaa voda saada. Tlastollse test avulla o va mahdollsta arvoda kysesee päätöksetekotlateesee lttyvää rskä slle, että otokse perusteella populaatosta tehty johtopäätös o vrheelle. Lopullse päätökse teko jää aa tutkjalle tsellee. Tlastolle test ataa aoastaa apua päätöksetekotlateesee. Testattavat hypoteest koskevat aa perusjoukkoa, joka jakauma malla tomvat teoreettset todeäkösyysjakaumat. Yleesä e ovat muotoa: H0: Odotusarvo o perusjoukossa a ( = a). H0: Osajoukkoje odotusarvot ovat samat ( = ). H0: Rppuvuutta e esy el korrelaatota e ole perusjoukossa ( = 0).

56 Vastahypotees H o vastavättämä H0:lle. Attees asemesta vastahypotees vo ssältää tedo mahdollse H0:sta pokkeama suuasta. Tällae vastahypotees johtaa ykssuutasee testauksee kakssuutase asemesta. Kakssuutae: H: a H: H: 0 Ykssuutae: H: < a ta > a H: < ta > H: < 0 ta > 0 Hypoteese asettamse jälkee o perusjoukosta tehtävä oletuksa, jotta tuettas testsuuree otatajakauma. Oletukset ovat yleesä muotoa: - muuttuja X oudattaa lkma ormaaljakaumaa perusjoukossa - osajoukkoje varasst ovat yhtäsuuret - osajoukot ovat tosstaa rppumattoma Näde perusteella vodaa määrätä testsuure, joka jakauma perusjoukossa osataa määrtellä. Testsuure o eräälae tuusluku. Otoksesta lasketaa kaava avulla testsuuree arvo ja katsotaa mh osaa todeäkösyysjakaumaa otoksesta laskettu arvo asettuu. Mkäl otoksesta saatu testsuuree arvo o hyv epätodeäköe, el se asettuu todeäkösyysjakauma ladalle, hylätää ollahypotees epätodeäköseä vahtoehtoa ja hyväksytää vastahypotees. Hypotees testaukse vaheet:. Hypoteese asettame. Oletuste tutkme 3. Testsuuree laskeme otoksesta 4. Testsuuree arvo vertaame todeäkösyysjakaumaa 5. Johtopäätökse tekeme Koska hypoteest H0 ja H ovat tosesa possulkeva ja kakk tulosmahdollsuudet kattava, vodaa päättelyy lttyvät vrhetlateet esttää taulukossa: Todellsuus: Valttu hypotees: H0 H H0 Okea johtopäätös. laj vrhe H. laj vrhe Okea johtopäätös. laj vrhe el hylkäämsvrhe o yleesä meleko kohteea. Tälle vrheelle lasketaa todeäkösyys (todeäkösyys hylätä okeassa oleva ollahypotees), jota kutsutaa merktsevyystasoks ta rsktasoks (sgfcace = p). Hypotees testauksessa lasketaa. laj vrhee todeäkösyys ja mkäl vrhee tekemse todeäkösyys o pe, hylätää ollahypotees ja hyväksytää H. Rsktaso rajoa käytetää yleesä arvoja 0.05, 0.0 ja Nälle löytyvät myös mtykset: 56

57 jos 0.05 < p < 0.0 tulos o suutaa atava, jos 0.0 < p < 0.05 tulos o tlastollsest melke merktsevä (*), jos 0.00 < p < 0.0 o tulos tlastollsest merktsevä (**) ja jos p < 0.00 o tulos tlastollsest erttä merktsevä (***). Nätä rajoja e ole pakko käyttää, vaa o järkevämpää esttää tarkka merktsevyystaso arvo ja tehdä johtopäätös tlatee mukaa. Mkäl hypotees teststä saadaa pe arvo merktsevyystasolle, - vo ollahypotees olla epätos ta - o saatu hyv epätodeäköe otos tlateesta, mssä H0 o tos. Todeäkösyyde frekvesstulka mukaa rsktaso arvolle 0.05 saadaa seuraava tulkta: Jos tostuvast pomtaa ollahypotees mukasesta perusjoukosta rppumattoma otoksa ja lasketaa testsuuree arvot kaksta ästä otokssta, estyy hylkäämsalueelle osuva testsuuree arvoja keskmäär 5 %:ssa otokssta. Rsktaso o ehdolle todeäkösyys: p P testsuure otoksesta laskettu H 0 o tos Tlastollset tetokoeohjelmat (esm. SPSS, SAS, SURVO, BMDP, GLIM) lmottavat testlle tarka merktsevyystaso arvo (p ta sgfcace. Käs lasketu testsuuree merktsevyystaso vo katsoa jakaumataulukosta, jota o laadttu juur tlastollsta päätöksetekoa varte ja stä löytyvät krttset psteet aak merktsevyystasolle 0.05, 0.0 ja Krjallsuutta tlastollsesta päätökseteosta: Bartlett, M.S.(96). Esseays o Probablty ad Statstcs. Lodo: Methue. 57

58 Cheroff, H. ja Moses, L.E.(959). Elemetary Decso Treory. N.Y.:Wley. Dudewch, J. ja Mshra, S.N.(988). Moder Mathematcal Statstcs. Wley. Hultqust, R.A.(969). Itroducto to Statstcs. N.Y.: Holt, Rehart ad Wsto. Kedall, M.G. ja Stuart, A.(969). The Advaced Teory of Statstcs, Vol. 3 ed. Lodo: Grff. Ldgre (976). Statstcal Theory, MacMlla, N.Y. vo Mses, R.(964). Mathematcal Theory of Probablty ad Statstcs. N.Y.: Academc Press. 58

59 6 Keskarvotestejä Keskarvotestellä verrataa otoksesta laskettua keskarvoa vakoo ta vertallaa osajoukkoje (ryhme) keskarvoja tossa. Kakssa keskarvotestessä o luoollsest oletuksea, että tutkttavasta muuttujasta vodaa laskea keskarvo el muuttuja o oltava välmatka- ta suhdelukuastekolle. Es estettäve teste testsuurede jakaumat o määrätty sllä oletuksella, että tutkttava muuttuja oudattaa lkma ormaaljakaumaa (jakaumasta rppuvat keskarvotestt) 6. Yhde otokse keskarvotest Luvussa. Otatajakauma todett, että keskarvo estmaattor oudattaa ormaaljakaumaa lev oletuks. Ku keskarvo stadardodaa ja otetaa huomoo otoskoo vakutus päästää keskarvotest testsuureesee: H0: = a (a o vako) H: a < a ta > a Oletukset: - tutkttava muuttuja x o vähtää välmatka-astekolle - x: jakauma perusjoukossa o lkma ormaale Testsuure ja jakauma: x a ~ t( ) ku H s / t 0 o tos Esmerkk Kekstty esmerkk lahdutustutkmuksesta Lahdutustutkmuksee o valttu 0 heklöä, jode koeakaa pudottamat paot ovat 5, 3, 0,, 3, 7, 3, 4, 0 ja 5 kg. Tästä aestosta tutktaa stä, että vodaako ylesest vättää paoje pudoee, el pokkeaako tuo aesto keskarvo ollasta tlastollsest merktseväst. Aesto keskarvoks saadaa x 3. ja keskhajoaks saadaa s.. Kolmas laskussa tarvttava parametr o = 0. Hypoteest: H0: = 0 Vahtoehtosta hypotees e ole pakko asettaa, mutta tässä vodaa lähteä ajatuksesta että lahdutustutkmuksessa tusk paot ylesest ousevat, jote krjotetaa H: > 0 Oletukset: - pao muutokse oletetaa lk ormaaljakautueeks (tätä tarkastellaa myöhemm) - havaot evät rpu tosstaa, el oletetaa satuasotos 3 Testsuure: x t 4.6 s /. / 0 Noudattaa t-jakaumaa vapausaste df = - = 0 - = 9 59

60 4 P-arvo arvot. T-jakaumataulukosta rvltä df = 9 löytyy luvut.833,.6,.8, 3.5, 4.97 ja 4,78. Otoksesta laskettu testsuuree arvo sjottuu kahde vmese taulukkoluvu väl. Koska vahtoehtoseks hypoteesks pystytt asettamaa ykssuutae H: > 0, test merktsevyystaso o suoraa - tauluko p (-suutasessa testssä tämä ptäs kertoa velä kakkosella). Tässä tlateessa testsuure ol kahde vmese taulukkoluvu välssä, jote merktsevyystaso testssä o myös kahde vmese ylhäältä löytyvä luvu välssä, ku e o väheetty ykkösestä. Ss 0.00 > p > Johtopäätös: Koska p-arvo o alle tärkemmä merktsevyystasoraja 0.05, ollahypotees hylätää ja vodaa vättää paoje keskmäär pudoee tlastollsest merktseväst. 6. Verraollste pare t-test Ku havatoaestosta vodaa osottaa havatopart, jotka selväst rppuvat tosstaa, käytetää ryhmäkeskarvoje välsee vertaluu verraollste pare t -testä. Test tulee use kyseesee sllo, ku tutktaa jok muuttuja muutosta ajassa ja mttaukset tehdää samolle tlastoykskölle. Esmerkks klasssessa koejärjestelyssä vertallaa ee -mttausta jälkee -mttauksee. Tutkttavaa olevaa muutosta vodaa arvoda laskemalla havatopare välset erotukset. Mkäl erotuste keskarvo o lähellä ollaa, e muutosta ole tapahtuut. Verraollste pare keskarvotest vodaa ajatella muutokse (merk. d) keskarvo vertaamseks ollaa. Test palautuu täys edellsessä luvussa. estettyy keskarvo vertaamsee vakoo. Muuttujaks ajatellaa muutos d. Vako mh stä verrataa o olla. Test vaheet ovat seuraavat: H0 : = ta D = 0, mssä D o erotukse odotusarvo populaatossa. H :, < (D < 0) ta > (D > 0) Oletukset: - vähtää välmatka-astekko - erotukse jakauma lkma ormaale - rppuvat havatopart Testsuure: d t ~ t( ) sd / mssä d o erotuste keskarvo ja sd o erotuste keskhajota. 60

61 Esm. Edellsestä esmerkstä alkuperäsestä aestosta verraollste pare t-test SPSS-tulostus: Pared Samples Statstcs Par alkupao loppupao Std. Error Mea N Std. Dev ato Mea 80, , , ,000 0,990 4,08 Pared Samples Correlatos Par alkupao & loppupao N Correlato Sg. 0,987,000 Pared Samples Test Par alkupao - loppupao Pared Dff ereces 95% Cofdece Iterv al of the Std. Error Dff erece Mea Std. Dev ato Mea Lower Upper t df Sg. (-taled) 3,0000,00,6960,6549 4,7745 4,598 9,00 Esmmäsessä taulukossa o alkupaoje ja loppupaoje tuusluvut. Tosessa taulukossa o rppuvuusoletukse testaus (korrelaatokertome merktsevyystest, mkä käydää läp myöhemm). Vmesessä taulukossa o tulokset teststä, jotka ovat samat ku aemm lasketut. "Tarkka" p- arvo o ss Johtopäätös vodaa tehdä myös muutosmuuttuja keskarvo luottamusvälstä (.6 ; 4.8) se perusteella, että olla e kuulu tuolle luottamusvällle. 6.3 Rppumattome otoste t -test Ku vertallaa kahta täys tosstaa rppumatota osajoukkoa tossa ja halutaa tetää eroavatko ryhme keskarvot tosstaa, vodaa tlastollsea meetelmää käyttää rppumattome otoste t -testä. Testsuuree jakauma perustuu jällee ormaaljakautueesee muuttujaa ja koska yleesä otoskeskhajoat joudutaa estmomaa havatoaestosta, o testsuure t -jakautuut. H0 : = H :, < ta > Test oletuksa ovat muuttuja ormaaljakautuesuus ja rppumattomat otokset. Oletuks vodaa lttää myös testsuuree valta se mukaa vodaako ryhmttäset varasst olettaa yhtä suurks va e. Testsuuree valtaa vakuttaa ovatko varasst (keskhajoat) molemmssa osajoukossa yhtäsuuret. Varasse yhtäsuuruude testaus estetää luvussa.6. Varasstestt. Mkäl varasst ovat yhtäsuuret (Equal Varaces)): 6

62 Testsuure ja se jakauma x x ~ t( ) ku H s mssä t 0 s ( ) s ( ) s o tos Helpo arvo tuosta saa, jos laskee ryhmttäste keskhajotoje keskarvo. Arvo o tarkka va jos ryhmät ovat samasuuruset. Mkäl varasst ovat ersuuret (Equal Varaces ot assumed): Testsuure ja se jakauma x x ~ t( f ) ku H s s t 0 mssä df c ( c) ku c Esmerkk o tos s s s Kuopo kaupug kotpalvelua ja kotsaraahotoa koskevasta kyselystä kysytt mm. kumpaa ryhmää heklö kuuluu ja stä mte ptkää o tomut ykysessä tehtävässää. Tutktaa t-testllä eroavatko kotpalvelua ja kotsaraahotoa tekeve työkokemukset tosstaa tlastollsest merktseväst. Havatoaestosta saat seuraavat tuusluvut: Kotpalvelu Kotsaraahoto 03 9 Keskarvo Keskhajota Koska ha slm ähde keskhajoat eroavat tosstaa, medä täytyy valta ersuurte varasse t-test. H0: = H: 6

63 Oletukset: - tomme lkma ormaaljakautuut - rppumattomat ryhmät - ersuuret varasst Testsuure ja vapausasteet: t ( 0.458) c df P-arvo arvot: 0.05 df 80 T-jakaumatauluko rvllä df = 80 kakk taulukkoluvut ovat peempä ku aestosta laskettu t = 4.57, jote p < 0.00 (suur taulukkoluku o t.9995(80) = Tässä käytett -suutasta testä, koska vahtoehtosessa hypoteesssa e osattu eakoda kumma ryhmä keskarvo vos olla suuremp. Johtopäätös: Nollahypotees hylätää, koska p < Kotpalvelussa tomvat heklöt ovat ss työskeelleet tlastollsest merktseväst pdempää ku kotsaraahodossa työskeelleet. Keskarvot 3.5 ja 8. ss eroavat tässä tosstaa tlastollsest merktseväst. SPSS-tlasto-ohjelma tulostus kysesestä teststä: Group Statstcs TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ SOSIAALI-JA TERV.PAL. TOIMINTASEKTORI kotpalvelu kotsaraahoto Std. Error N Mea Std. Dev ato Mea 03 3,454 7,80, ,07 4,5836,85 Idepedet Samples Test TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ Equal varaces assumed Equal varaces ot assumed Levee's Test f or Equalty of Varaces F Sg. t df Sg. (-taled) t-test for Equalty of Meas Mea Df f erece 95% Cofdece Iterv al of the Std. Error Df f erece Df f erece Lower Upper 8,954,003 3,449 30,00 5,475,55,374 8,576 4,573 78,5,000 5,475,475,963 7,538 63

64 Tulostuksesta löytyvät kakk edellä käs lasketut tuusluvut ja testsuureet. P-arvo estys.000 e tarkota että merktsevyystaso ols tasa olla, vaa kolme desmaal tarkkuudella estettyä tuo verra. Samaa johtopäätöksee päädytää myös keskarvoje erotukse luottamusväl perusteella, koska olla e kuulu vällle (.96;7.53). 6.4 Ykssuutae varassaalyys Mkäl tosstaa rppumattoma verrattava ryhmä o useta, e äde vertaluu saa käyttää parettasa t -testejä, vaa soveltuva meetelmä o ykssuutae varassaalyys. Varassaalyys e mestää huolmatta testaa ryhme varasse välstä eroavasuutta, vaa keskarvoja. Nm johtuu stä, että aalyys perustuu ryhme välse ja ssäse vahtelu vertaamsee ja vahtelua arvodaa varassella. Havatoaestossa estyvä vahtelu (jota kuvataa elösumm) hajotetaa er lähtestä peräs olev os. Varassaalyys o tse asassa kokoelma er meetelmä. Koejärjestely määrää, mllase mall avulla aesto aalysodaa. Ykssuutase varassaalyys lsäks varassaalyysä vodaa käyttää useampsuutasea ja erlaste koeasetelme (esm. lohkokokessa) aalysot Ykssuutasessa varassaalyysssä kokoaselösumma jaetaa ryhme ssäsee elösummaa ja ryhme välsee elösummaa (Sum of Squares): SS(Total) = SS(Wth) + SS(Betwee) Nelösummat vodaa laskea kaavosta: Ryhme väle Ryhme ssäe Kokoas SS( Total ) SS( Betwee ) SS( Wth ) k k j ( x j k k k j ( x x) x) ( x j x ) Kaavossa x o koko aesto keskarvo, x o ryhmä keskarvo, xj o j:s havatoarvo ryhmässä, k o ryhme lukumäärä ja o ryhmä otoskoko. Otoskoko () ja ryhme lukumäärä (k) vakuttavat elösumm, jote e o jaettava vastaavlla vapausastella (df): dft = - dfw = - k dfb = k - Nä saatavat keskelösummat (MS = Mea Sum of squares)) ovat vertalukelposa. Mkäl ryhme väle keskelösumma, joka o tse asassa ryhmäkeskarvoje 64

65 varass, o huomattavast suuremp ku ryhme ssäe keskelösumma, joka o ryhme ssäste varasse ryhmäkoolla paotettu keskarvo, eroavat ryhmät tosstaa. Keskelösumme välstä suuruuseroa tarkastellaa osamäärällä: MS(betwee)/MS(Wth). Jos jakolasku tulos o suur, ryhmät eroavat tosstaa. Osamäärää merktää F -krjamella, sllä se o F -jakautuut, ku ollahypotees, ryhmäkeskarvot evät eroa, o tos. Ykssuutase varassaalyys vaheet: H0 : = =...= k = (el ryhmät evät eroa perusjoukossa) H :, jollak =,...,k (el vähtää yks ryhmä eroaa) Oletukset: - ormaaljakauma - rppumattomat otokset - osaryhme varasst yhtäsuuret Testsuure ja se jakauma F MS MS B W ~ F( k, k) ku H 0 o tos Varassaalyys tulos estetää yleesä taulukkoa: Vahtelu SS df MS F p lähde Ryhme SSB k- SSB/dfB MSB/MSW taulukosta väle B Ryhme SSW -k SSW/dfW ssäe W Kokoas SST - Useat tlasto-ohjelmstot tulostavat tarka p -arvo (sgfgace) taulukkoo, jote tulokse tulkaks rttää katsoa p -arvo ja mkäl se o alle 0.05, hylätää H0 ja ryhme keskarvot eroavat tosstaa tlastollsest. Jos varasse yhtäsuuruusoletus e täyty, vodaa käyttää "robusteja" Brow-Forsythe ta Welsh -testejä keskarvovertallu, jotka evät ole herkkä varasse yhtäsuuruude suhtee. 65

66 6.4. Varassaalyys jatkotarkastelusta Kute luvu.4 alussa todett, e ryhme parettasee vertaluu saa käyttää t -testä. Myös todeäkösyyslasketaesmerkssä.3 todett tlae ja laskett korjaus. Jos varassaalyys o osottaut ryhme välllä oleva eroja, käytetää ryhmäkeskarvoje eroje vertaluu ertysä testejä. Nätä ryhmävertalutestejä o useta, ekä ylesest hyväksyttyä "parasta testä" voda määrtellä. Nätä testejä ovat mm. Scheffe, LSD, Wer, Tukey, Studet-Newma-Keuls ja Duet testt. Nämä testt huomovat parettasessa vertalussa myös mude ku vertalussa mukaa oleve ryhme vahtelu. Jos ryhmät muodostavat joukkoja (pools), jota halutaa vertalla keskeää, vodaa käyttää kotrasteja. Esmerkk Edellee samasta kotpalvelu ja kotsaraahoto tutkmuksesta. Verrataa oko työtekjöde svlsäädyllä ja ällä yhteyttä. Verrataa er svlsäätyluokke ä keskarvoja keskeää. Test vaheet: H0: = = 3 = 4 (perusjoukossa svlsäädyttäset ä keskarvot evät eroa) Oletukset: - kä lkma ormaaljakautuut - yhtäsuuret varasst - rppumattomat satuasotokset Testsuure ja p- arvo SPSS tulostuksesta: ANOVA kä Betwee Groups Wth Groups Total Sum of Squares df Mea Square F Sg. 8, ,06 5,96,00 944, , ,993 4 Testsuure F = 5.96 vapausaste 3 ja 39. Koska tetokoe tulostaa tarka p-arvo, e taulukosta tarvtse arvoda p-arvoa, vaa se ähdää tulostuksesta suoraa, että p = Johtopäätös: Koska p = 0.00 < 0.05, ollahypotees hylätää ja havataa, että svlsäädyttäset ä keskarvot eroavat tosstaa tlastollsest merktseväst.. Jatkotarkastelua: 66

67 Multple Comparsos Depedet Varable: kä Tukey HSD (I) SIVIILISÄÄTY amato avo- ta av oltossa erout ta asumuserossa (J) SIVIILISÄÄTY avo- ta av oltossa erout ta asumuserossa lesk amato erout ta asumuserossa lesk amato avo- ta av oltossa lesk Mea Dff erece 95% Cofdece Iterv al (I-J) Std. Error Sg. Lower Boud Upper Boud -3,9074,4857,396-0,3604,5456-7,0000 3,585,6-5,334,34-4,50000* 3,735,00-4,795-4,805 3,9074,4857,396 -,5456 0,3604-3,959,476,489-9,036,6509-0,5959*,988,003-8,363 -,8 7,0000 3,585,6 -,34 5,334 3,959,476,489 -,6509 9,036-7, ,57036,67-6,6843,8843 lesk amato avo- ta av oltossa erout ta asumuserossa *. The mea dff erece s sgf cat at the.05 lev el. 4,50000* 3,735,00 4,805 4,795 0,5959*,988,003,8 8,363 7, ,57036,67 -,8843 6,6843 Tukey HSD a,b SIVIILISÄÄTY amato avo- ta av oltossa erout ta asumuserossa lesk Sg. kä Subset f or alpha =.05 N 43, , , , ,0000,0,080 Meas for groups homogeeous subsets are dsplay ed. a. Uses Harmoc Mea Sample Sze = 4,07. b. The group szes are uequal. The harmoc mea of the group szes s used. Type I error levels are ot guarateed. 67

68 65,00 60,00 55,00 95% CI kä 50,00 45,00 40,00 35,00 amato avo- ta avoltossa SIVIILISÄÄTY erout ta asumuserossa lesk Jatkotarkasteluks esmmäseä valtt Tukey test (mkä o ylesest ete käytetty). Se perusteella leske ä keskarvo (48 vuotta) eroaa amattome (43.5 vuotta) ja avota avoltossa asuve (47.4 vuotta) keskarvosta tlastollsest merktseväst (ylöspä). Toe "Homogeous Subsets" -taulukko koettaa hakea ryhmäkeskarvosta joukkoja, jode ssällä ryhmäkeskarvot evät eroa tosstaa. Vmeseä o kuvo ryhmttäste keskarvoje 95%: luottamusvälestä. Kuvosta ähdää mukavast looge yhteys ä ja svlsäädy välllä: es ollaa amattoma, meää ams (jos meää), mkä jälkee vasta vodaa erota ta puolso vo kuolla. 6.5 Useampsuutasesta varassaalyysstä ja kovarassaalyysstä Ykssuutasella varassaalyysllä halltaa aoastaa kästtelyje vakutus. Kaksta musta systä johtuva vahtelu ssältyy aalyys vrheterm. Tosaa aak jok kästtelyje ssäse vahtelu lähde osataa eakoda. Saattaa olla, että esmerkks tety ajakohda mttaukset ta tety heklö keräämät tulokset mustuttavat tosaa eemmä ku muut havaot. Samo saattaa olla jok jatkuvatyyppe taustamuuttuja, joka vakuttaa mttaustuloks. Sopvalla tlastollsella aalyysllä eakotu vahtelu lähde pystytää ottamaa huomoo ja postamaa aalyys 68

69 vrhetermstä. Tämä seurauksea selttämättömä vahtelu osuus (MSW) peeee, kokee tarkkuus paraee ja varsaste kästtelyje vakutuserot kyetää paremm paljastamaa. Tällasesta koeasetelmasta saadut tulokset ovat lsäks use kattava, sllä e o saatu vahtelevssa olosuhtessa. Ku arvellaa epäjatkuva muuttuja vakuttava koetuloksee, kutsutaa ätä ryhmä lohkoks. Varassaalyys satuasvahtelu jaetaa tällö ryhme aheuttamaa, lohkoje aheuttamaa ja jääösvahteluu: SS(Total) = SS(Betwee) + SS(Blocks) + SS (Error) Ku testsuure F lasketaa jakamalla ryhme väle keskelösumma jääösvahtelu elösummalla, saadaa lohkoje vahtelu pos tarkastelusta. Tulos estetää jällee yleesä taulukossa (k ryhmää, l lohkoa): Vahtelu SS df MS F p lähde Lohkoje SSBl l- SSBl/dfBl MSBl/MSE taulukosta väle Bl Ryhme SSB k- SSB/dfB MSB/MSE taulukosta väle B Jääös E SSE (l-)(k-) SSE/dfE Kokoas T SST - Laskukaavat elösummlle ovat samakaltaset kute ykssuutasessa varassaalyysssä. Käs e ätä laskuja yleesä tarvtse laskea, vaa tlasto-ohjelmstot laskevat e. Tauluko esmmäse rv test lohkoje välsestä erosta e yleesä ole melektoe, sllä koeasetelmasta tedetää lohkoje vakuttava lopputuloksee. Tosella rvllä testataa ryhme välstä eroa. Hypoteest ja oletukset ovat tässä testssä samat ku ykssuutasessa varassaalyysssä. Jos taas halutaa jatkuva (vähtää välmatka-astekollse) muuttuja vakutus elmoda ryhmävertaluu, vodaa käyttää kovarassaalyysä. Kovarassaalyysssä es postetaa kovaraat vakutus seltettävästä muuttujasta regressoaalyysmeetelm. Jatkuvalle muuttujalle estmodaa regressokerro ja tämä vakutus lsätää mall. Vakka mall teora o hema hakala, o kovarassaalyys tuloksea estettävä taulukko tulkttavssa samo ku varasstaulu: Vahtelu SS df MS F p lähde Kovaraatt C SSC SSC/dfBl MSC/MSE taulukosta Ryhme SSB k- SSB/dfB MSB/MSE taulukosta väle B Jääös E SSE -k- SSE/dfE Kokoas T SST - Taulukko o tulkttavssa ava samo kute lohkokokede varasstaulukko. 69

70 Ykssuutasella varassaalyysllä saadaa tutkttua aoastaa yhde tekjä (ryhmttely) vakutus vastemuuttujaa. Use halutaa aalysoda moe tekjä vakutusta ja ertysest äde tekjöde yhdysvakutusta vastemuuttujaa. Vodaa esmerkks olla kostueta stä vakuttavatko sukupuol ja ammattasema vastemuuttujaa ja koska sukupuol jakaatuu er ammattasemssa erlalla, halutaa tetää vakuttavatko e samaakasest vastemuuttuja arvoo. Kakssuutasessa varassaalyysssä satuasvahtelu jaetaa seuraav os: SS(Total) = SS(A) + SS(B) + SS(Yhd.) + SS(Error) Vastaavat hypoteest: HA0 : A = A =...= Ak (ryhmttely A e vakuta) HB0 : B = B =...= Bl (ryhmttely B e vakuta) HAB0: A:lla ja B:llä e ole yhdysvakutusta Oletukset ovat peraatteessa samat ku ykssuutasessa varassaalyysssä el ormaaljakauma, yhtäsuuret varasst ja rppumattomat ryhmät. Tulokset estetää jällee tauluko muodossa: Vahtelu SS df MS F p lähde Faktor A SSA k- SSA/dfA MSA/MSE taulukosta Faktor B SSB l- SSB/dfB MSB/MSE taulukosta Yhdysvakutus SSAB (k-)(l-) SSAB/dfE MSAB/MSE taulukosta AB Jääös E SSE -lk SSE/dfE Kokoas SST - Hypoteest ja testt vastaavat tosaa estetyssä järjestyksessä. Jos taulukosta löytyy p arvo < 0.05 vodaa tulkta kysese vakutukse oleva olemassa. Vastaavast vodaa käyttää useampsuutasa varassaalyysejä. Yhdysvakutuksa tällö tulee useta. Lsäks mosuutaste yhdysvakutuste tulkta saattaa osottautua hakalaks. Esmerkk. Aemm tarkastellusta aestoja ja muuttujsta Otetaa seltettäväks muuttujaks työssäoloaka. Esmmäseä otetaa kovaraatks kä, koska äkkäämmät heklöt ovat varmast voeet toma ammatssa pdempää ku uoremmat. Tutktaa se jälkee, mte tomala ja svlsääty vakuttavat työssäoloakaa. Tärkeää o huomoda, että ku kovaraatta o kä, es o ä vakutus postettu työssäoloajasta ja vasta se jälkee tutktaa ryhmämuuttuje vakutusta työssäoloakaa. -suutase kovarassaalyys vaheet: 70

71 Nollahypoteest: H0T: tomala e vakuta H0S: svlsääty e vakuta H0yhd: edellsllä e ole yhdysvakutusta H0I: kä e vakuta työssäoloakaa Oletukset: - ormaaljakaumat - yhtäsuuret varasst - rppumattomat ryhmät Testsuureet ja p-arvot löytyvät varassaalyystaulukosta: Tests of Betwee-Subjects Effects Depedet Varable: TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ Source Corrected Model Itercept kä mtosek m5sv saa mtosek * m5sv saa Error Total Corrected Total Type III Sum of Squares df Mea Square F Sg. 69,57 a 6 448,76,73,000 8,300 8,300 4,766,03 373, ,360 35,90,000,990,990,60,440 3, ,463,947,6 6,94 6,94 4,59,04 455, , , ,80 5 a. R Squared =,37 (Adjusted R Squared =,340) Tauluko esmmästä rvä evät lty edellä estettyh hypoteeseh. Esmmäe rv kertoo stä selttävätkö mallssa olevat muuttujat tlastollsest merktsevä osa seltettävästä muuttujasta. Tässä tlateessa ä o (p < 0.00). Tosella rvllä o seltettävä muuttuja keskarvo vertalu ollaa, mkä myöskää e ole tässä tarpeelle. Kolmaelta rvltä ähdää, että alkuoletus ä vakutuksesta työssäoloakaa ol okea (p < 0.00). Vakutukse suuta äkyy erksee otettavasta regressokertomesta, mkä tässä o b = 0.4. Postve kerro kertoo stä, että ä kasvaessa työssäolovuos myös kasvaa. Tomalalle (p = 0.44) ja svlsäädylle (p = 0.6) e saada tlastollsest merktsevää vakutusta, mutta ällä o merktsevä yhdysvakutus (p = 0.04). Tos saoe svlsäätyje ero o erlasta er tomalolla. Tämä tulktaa varte o hyvä tarkastella ryhmttäsä keskarvoja: 7

72 Descrptve Statstcs Depedet Varable: TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ SOSIAALI-JA TERV.PAL. SIVIILISÄÄTY Mea Std. Dev ato N TOIMINTASEKTORI Kotpalv elu amato 7,86 5,005 7 avo- ta av oltossa 3,947 7, erout ta asumuserossa,875 7,868 Kotsaraahoto Total lesk Total amato avo- ta av oltossa Total amato avo- ta av oltossa erout ta asumuserossa lesk Total,00 4, ,634 7, ,333, ,5 5, ,59 4, ,830 4,49 0,535 7,575 99,875 7,868,00 4,7645 5,483 7, SOSIAALI-JA TERV.PAL.TOIMINTASEKTORI Depedet Varable: TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ SOSIAALI-JA TERV. PAL. TOIMINTASEKTORI Kotpalv elu Kotsaraahoto 95% Cofdece Iterv al Mea Std. Error Lower Boud Upper Boud,85 a,037 0,797 4,905 9,708 a,b,90 5,944 3,47 a. Covarates appearg the model are evaluated at the followg values: kä = 47,306. b. Based o modf ed populato margal mea.. SIVIILISÄÄTY Depedet Varable: TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ SIVIILISÄÄTY amato avo- ta av oltossa erout ta asumuserossa lesk 95% Cofdece Iterv al Mea Std. Error Lower Boud Upper Boud 0,054 a,55 5,787 4,3,09 a,75 9,673,545 0,357 a,b,803 6,787 3,98 8,38 a,b,848,499 3,777 a. Covarates appearg the model are ev aluated at the f ollowg v alues: kä = 47,306. b. Based o modf ed populato margal mea. 7

73 3. SOSIAALI-JA TERV.PAL. TOIMINTASEKTORI * SIVIILISÄÄTY Depedet Varable: TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ SOSIAALI-JA TERV.PAL. TOIMINTASEKTORI Kotpalv elu Kotsaraahoto SIVIILISÄÄTY amato avo- ta av oltossa erout ta asumuserossa lesk amato avo- ta av oltossa erout ta asumuserossa lesk 95% Cofdece Iterv al Mea Std. Error Lower Boud Upper Boud 8,599 a,350 3,947 3,5 4,3 a,77,89 5,730 0,357 a,803 6,787 3,98 8,38 a,848,499 3,777,509 a 3,589 4,40 8,66 7,907 a,63 5,406 0,408. a,b.... a,b... a. Covarates appearg the model are evaluated at the f ollowg values: kä = 47,306. b. Ths lev el combato of factors s ot observ ed, thus the correspodg populato margal mea s ot estmable. Esmmäsessä keskarvotaulukossa o estetty alkuperäset työssäolovuose keskarvot (lma mtää korjauksa). Stä ähdää, että havatoja e ole rttäyt kakk luokk ja tämä vuoks aalyys e ole täys kattava. Kotsaraahodossa e ole ollut lakaa eroeta ta asumuserossa oleva ekä leskä. Aalyys tulktaa varte e ptäs tarkastellakaa tätä "korjaamatota" taulukkoa, vaa myöhemm estettyjä mude mallssa oleve muuttuje vakutukslla korjattuja keskarvotaulukkoja "Estmated Margal Meas". Esmmäsestä taulukosta ähdää, että keskarvoje ero o peetyyt selväst (.85 ja 9.708) verrattua aempaa korjaamattome keskarvoje eroo (3.634 ja 8.59). Tämä vuoks tomalaa e saatu merktseväks selttäjäks tässä aalyysssä. Samalae keskarvoje eroje peetyme o tapahtuut myös svlsäädyttässsä keskarvossa. Vmesestä taulukosta havataa yhdysvakutus: ku kotpalvelussa amattome työssäoloaka o avo- ta avoltossa oleve työssäoloakaa peemp, kotsaraahodossa tlae o pävasto. Seuraava SPSSstä saatu kuvo havaollstaa tlaetta: 73

74 Sllo ku ryhmäkeskarvosta prretyt vvat kulkevat selväst er suut, o yhdysvakutusta havattavssa. Yleesä yhdysvakutukset ovat sovellusala ssältötutemukse perusteella seltettävssä ja ymmärrettävssä, mutta koska e tue tätä aestoa ja alaa se tarkemm, tämä jää pelkäks esmerkks yhdysvakutuksesta. Useampsuutaste (3, 4, 5, je) yhdysvakutuste tulkta meee samalla tavo: jos tosessa ryhmässä o edellse taso yhdysvakutus, mutta tosessa ryhmässä stä e ole, kysesellä tasolla o yhdysvakutusta. Krjallsuutta varassaalyystä: Kempthore, O.(95). The Desg ad Aalyss of Expermets. Joh Wley & Sos. N.Y. Motgomery, D.C.(976). Desg ad Aalyss of Expermets.. ed. Joh Wley. N.Y. Wer, B.J.(97). Statstcal Prcples Expermetal Desg. ed. McGraw-Hll Book Compay. N.Y. 74

75 6.6 Oletuste testaamsesta 6.6. Varasstestt Joskus saatetaa olla kostueta vertalemaa osajoukkoje hajotaa säsä, mutta yles varassteste käyttökohde o keskarvoteste oletuste testaame. T - testsuuree valta rppuu stä, ovatko varasst osajoukossa yhtäsuuret ja varassaalyysä vodaa käyttää va sllo ku osajoukkoje varasst ovat yhtäsuuret. Kahde osajouko varasstest: Hypoteest: H0: = H: ta < ta > Oletukset: - X oudattaa lkma ormaaljakaumaa - rppumattomat satuasotokset Testsuure ja se jakauma: s F ~ F(, ) ku H 0 o tos s Mkäl varasst ovat yhtä suura, tulee osamäärästä lähelle lukua oleva arvo. Testsuure saattaa -suutasessa testauksessa poketa ykkösestä joko ylös- ta alaspä. F- jakaumataulukot o yleesä laadttu varassaalyysä varte ja kakssuutasta varasstestä varte täytyy laskukaavalla määrätä H0: hyväksymsaluee alaraja. Merktsevyystasolla p saadaa alarajaks F F (, ) 0.05 Käytäössä kaattaa valta s:ks s:sta suuremp luku, tällö F o aa > ja "alarajaa" e tarvtse laskea, vaa rttää mustaa -suutasessa testssä kertoa taulukossa estetty merktsevyystaso kahdella. Esmerkk akasemmasta keskarvovertalusta Luvussa.3 valtt esmerkssä ersuurte varasse t-test, koska ryhmttäset keskhajoat (7.8 ja 4.5) äyttvät erkokoslta. Testataa yt tämä päätelmä pakkasaptävyys: H0: = H: Oletukset: - X oudattaa lkma ormaaljakaumaa - rppumattomat satuasotokset 75

76 Testsuure: 7.8 F P-arvo arvot: Vapausasteet o käytössä oleva tauluko taka pyörstettävä. Oke laskettua df = 03 - = 0 ja df = 9 - = 8. Jaetusta F-jakaumataulukosta lähmmät löytyvät luvut ovat (00 ja 30). Ss vertaluluku o F.975(00,30) =.9. Johtopäätös: Koska aestosta laskettu 3.00 o taulukkolukua.9 suuremp, ollahypotees hylätää ja vodaa vättää ryhmttäste varasse eroava tosstaa tlastollsest merktseväst (p< 0.05). Useamma osajouko varasstest: Jos ryhmä o useta, edellstä testä e voda käyttää. Käytetymp Levee test o myös paremp sä melessä, että se e ole herkkä varasse yhtäsuuruusoletukse suhtee. Tämä taka t-test yhteydessä SPSS laskee Levee test varasse yhtäsuuruutta arvomaa. Levee test vaheet: Hypoteest: H0: =... = k el varasst ovat yhtäsuuret H: = j, jollek ja j el varasst eroavat. Oletukset: - X oudattaa lkma ormaaljakaumaa - rppumattomat satuasotokset Testsuure ja se jakauma: Lasketaa jokaselle havatoarvolle erotus ryhmä keskarvoo. Tarkastellaa ä saatuje erotuste tsesarvoja, jolle tehdää ykssuutae varassaalyys. Jos jossa ryhmässä pokkeamat ryhmäkeskarvosta ovat muta suuremmat (el varass o muta ryhmä suuremp), varassaalyysstä saadaa suur F-arvo. Testsuuree arvoa verrataa F-jakaumatauluko arvoh vapausaste (k-, -k), mssä k o ryhme lukumäärä ja otoskoko. Edellse esmerk varasse yhtäsuuruus testatt t-testesmerkssä (svu 5) Levee testllä. testsuureeks saat F = (vapausaste, 30) ja p-arvoks p = Esmerkk varassaalyys oletukse testaamsesta 76

77 Ykssuutase varassaalyys esmerkssä tarkastelt svlsäädyttäsä ä keskarvoja. Aalyys olett ryhmttäset varasst yhtäsuurks. Hypoteest: H0: =... = k el varasst ovat yhtäsuuret H: j, jollek ja j el varasst eroavat. Oletukset: - X oudattaa lkma ormaaljakaumaa - rppumattomat satuasotokset Testsuure ja p-arvo: kä F =.48 ja p = Johtopäätös: Test of Homogeety of Varaces Levee Statstc df df Sg., ,068 Koska p = > 0.05, ollahypotees hyväksytää. Varasst vodaa olettaa yhtäsuurks, el varassoletus ptää ja varassaalyys o okea test tlateesee. Mkäl varassoletus e täyty, kaattaa tutka muuttuja jakaumaa ja mettä, jos jolla muuttujamuuoksella saatas varassaalyys varassoletus täyttymää. Toe vahtoehto o käyttää testejä, jotka evät ole herkkä varassoletukselle. Nätä ovat mm Brow-Forsythe ja Welch testt Jakauma tutkme Kakk keskarvotestt ja moet momuuttujameetelmät olettavat ormaaljakauma. Kakssa testessä rttää, jos muuttujat ovat lkma ormaaljakautueta. Nä vomakasta oletusta e kakssa meetelmssä tarvtse tehdä. Use rttää, että keskarvo otatajakauma o ormaale ta jääökset oudattavat lkma ormaaljakaumaa. Normaalsuude vo todeta graafsest hstogrammsta ta summafrekvess kuvaajasta. Jakauma muotoa vodaa tarkastella myös vous- ja hupukkuustuusluvu (skewess ja kurtoss). Nämä tuusluvut lmottavat jakauma pokkeama ormaaljakauma vastaavasta omasuudesta. Nälle tuusluvulle vodaa myös laskea keskvrhe ja ste käyttää testeä. O kutek huomattava, että kyseset testt testaavat stä, pokkeaako jakauma vous ta hupukkuus ormaaljakauma vastaavasta omasuudesta, ekä varsasest stä voko saatu jakauma olla otos ormaaljakaumasta. Ykskertastettua 77

78 voude ja hupukkuude testaus tom ste, että verrataa ormaaljakauma arvoo.96 ( P(Z >.96) = 0.05 ) kaavasta Tuusluku Testsuure ~ N(0,) SE( Tuusluku) saatua arvoa. Tuusluku vo olla vousluku (skewess) ta hupukkuusluku (kurtoss) ja SE o tuusluvu keskvrhe. Jotta ämä testt olsvat luotettava, o otoskoo oltava suur. O mattu, että voude testaus vaats otoskooks vähtää =50 ja hupukkuude testaus jopa =000. Jakaumatestejä kutsutaa yhteesopvuustesteks ja käytety o Kolmogorov-Smrov - test. Test vertaa jakauma summafrekvessejä ormaaljakauma (ta muu jakauma) kertymäfukto vastaav arvoh. Test vaheet: Hypoteest: H0: jakauma e eroa ormaaljakaumasta (ta muusta jakaumasta) H: jakauma eroaa ormaaljakaumasta (ta muusta jakaumasta) Oletukset: -muuttuja X o vähtää välmatka-astekolle Testsuure: D max F 0 ( x ) S N ( x ), mssä F0(x) ovat summafrekvessejä ja SN(x) ovat ormaaljakauma vastaava arvoja. D:tä verrataa ertysest tätä testä varte suutellu tauluko arvoh ja ste saadaa selvlle merktsevyystaso ta tetokoe tulostaa tarka p -arvo. Test tulos tulktaa ste, että pellä p: arvolla hylätää H0 ja tällö jakauma pokkeaa ormaaljakaumasta. Varotus: test o melko koservatve: se e helpost hylkää H0:aa varskaa peellä otoskoolla, mutta soveltuu sellasea hyv ormaaljakaumaoletukse testauksee. Esmerkk aemm käytetystä aestosta ä ja työvuose ormaaljakaumaoletukset Hypoteest: H0: ä ja työvuose jakaumat evät eroa ormaaljakaumasta H: ä ja työvuose jakaumat eroavat ormaaljakaumasta Oletukset: - kä ja työvuodet ovat vähtää välmatka-astekolle Testsuureet ja p-arvot SPSS tulostuksesta: 78

79 Oe-Sample Kolmogorov-Smrov Test N Normal Parameters a,b Most Extreme Df f ereces Kolmogorov-Smrov Z Asy mp. Sg. (-taled) Mea Std. Dev ato Absolute Postv e Negatv e a. Test dstrbuto s Normal. b. Calculated f rom data. TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ kä 47 46,478 47,976 7,697 8,4844,089,097,089,064 -,057 -,097,078,74,95,7 Välvahea vodaa havata, että testsuureet ovat D = ja Nästä muodostetut ormaaljakaumaa oudattavat aputestsuureet ovat z =.078 ja.74. Johtopäätös: Tärketä o tulostuksesta poma p-arvot, jotka molemmat (0.65 ja 0.7) ovat päätöksetekorajaa 0.05 suurempa. Jote ollahypoteest hyväksytää el kumpkaa muuttujsta e pokkea ormaaljakaumasta tlastollsest merktseväst ja se suhtee aempe aalyyse ormaaljakaumaoletus täyttyy. Yleesä muuttujsta o hyvä katsoa jakaumaoletukse tarkastelu yhteydessä hstogrammt. Työvuodet o hema okealle loveevast ja kä vasemmalle loveevast jakautuut. Molemmssa jakaumssa o myös havattavssa satuasvahtelua, mkä tarkottaa stä ettevät pylväät mee ava ormaaljakaumakäyre mukaa, mutta sellae kuuluu havatoaestoo. TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ kä Frequecy 8 6 Frequecy ,0 0,0 TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ 40,0 Mea =,478 Std. Dev. =7,697 N =47 0 0,00 40,00 kä 60,00 Mea =47,976 Std. Dev. =8,4844 N =46 79

80 6.6.3 Jakaumasta rppumattoma testejä Jakaumasta rppumattomat el parametrttömät ta e-parametrset (oparametrc methods) evät vaad muuttuja perusjouko jakauma ta jakauma parametre (esm. varass) tutemsta. Tässä estettävssä testessä alkuperäset havatoarvot korvataa järjestysluvulla ja laskutomtukset perustuvat äh järjestyslukuh. Jakaumasta rppumattomat testt evät tetyst yleesä ole vomakkata ku jakaumasta rppuvat meetelmät el e evät yleesä hylkää H0:aa yhtä helpost. Wlcoxo test Vastaa verraollste pare t-testä. Hypoteest: H0: ryhmät evät eroa sjaltaa (e ole tapahtuut muutosta) H: ryhmät sjatsevat erllää (muutosta o tapahtuut) Oletukset: - rppuvat otokset - muuttuja X vähtää järjestysastekolle Testsuure ja se jakauma: Lasketaa vastpare erotus. Asetetaa erotukset tsesarvo mukasee suuruusjärjestyksee. Aetaa erotukslle järjestysluvut. Aetaa järjestysluvulle erotukse etumerkk. Testauksee otetaa va havaot, jode erotukset e ole 0. Testsuure ) Peet otokset: T = m (T+, T-), (pare määrä < 5) mssä T+ o plusmerkkste erotuste järjestyslukuje summa ja T- o egatvste erotuste järjestyslukuje summa tsesarvo. Testsuureella o oma jakauma ja krjallsuudesta löytyy taulukota tätä varte. Tetokoeohjelmat tulostavat yleesä tarka p -arvo. ) Suuret otokset: (pare määrä > 5 ( ) T 4 ( )( ) ~ N(0,) ku H 4 Esmerkk z 0 o tos Jos kappalede. ja. pao muutos e ols ormaaljakautuut, käytettäs t-test sjaa Wlcoxo testä. SPSS ataa tästä teststä seuraava tulostukse. Test ptäs tetek tulkta kakke vahede kassa, mutta estä tulka lyhyest. 80

81 Raks loppupao - alkupao Negatv e Raks Postv e Raks Tes Total a. loppupao < alkupao b. loppupao > alkupao c. loppupao = alkupao N Mea Rak Sum of Raks 8 a 4,50 36,00 0 b,00,00 c 0 Z Test Statstcs b Asy mp. Sg. (-taled) a. Based o postve raks. loppupao - alkupao -,536 a b. Wlcoxo Sged Raks Test,0 Kahdeksalla pao putos, keelläkää e oussut ja kahdella se pysy eallaa. Testsuureeks saadaa z = ja merktsevyystasoks p = 0.0, mkä o edellee tlastollsest merktsevä muutos, mutta e selvä ku jakaumasta rppuvalla t-testllä (p = 0.00). Ma - Wthey U-test Vastaa rppumattome otoste t -testä. Hypoteest: H0: osajoukot evät eroa sjaltaa tosstaa H: osajoukot eroavat Oletukset: - x vähtää järjestysastekolle - rppumattomat otokset Testsuure ja se jakauma: Asetetaa havatoarvot suuruusjärjestyksee. Lasketaa kuka mota tose osajouko havatoarvoa kuk esmmäse osajouko havatoarvo edeltää. Tätä summaa merktää D:llä: Esmerkk 3.7 Tettpstemäärät: Naset: Mehet: Asetetaa havatoarvot suuruusjärjestyksee: 8

82 N N N M M M M N M Naste arvo 3 edeltää vttä meste arvoa, samo aste arvot 7 ja 0. Naste arvo 9 edeltää yhtä meste arvoa. Täte D = = 6 ) Pellä otokslla, jossa < 8 ja < 8 a) U = D ta b) U = m (U, U), mssä U U ( ) ( ) R( x R( x ) ) mssä R( ) o. osaryhmä järjestyslukuje summa ja R ( x ) o. osaryhmä x järjestyslukuje summa. ) Kesksuurlla otokslla, jossa > 8 ja < 0 a) U = m (U, U) ta b) U = T T (T + ), mssä T = m (R(x), R(x)) ja T o se ryhmä koko, josta T-arvo tulee. 3) Suurlla otokslla, jossa > 0 ta > 0 U m z ~ N(0,) ku H 0 ( ) mssä Um = m(u, U). o tos Johtopäätös: Pelle otokslle ) ja ) o testsuureelle U löytyy taulukota johtopäätökse tekoa varte. Suurte otoste testsuuree Z-arvoa vertallaa ormaaljakaumatauluko arvoh. Esmerkk t-testesmerkkaestosta, jos työaka e ols ormaaljakautuut, käytettäs t-test sjaa Ma-Wthey testä, joka SPSS-tulostus: 8

83 TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ Raks SOSIAALI-JA TERV.PAL. TOIMINTASEKTORI kotpalv elu kotsaraahoto Total N Mea Rak Sum of Raks 03 7,3 749, ,50 348,50 3 Ma-Whtey U Wlcoxo W Z Test Statstcs a Asy mp. Sg. (-taled) TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ 93, ,500-3,9,00 a. Groupg Varable: SOSIAALI-JA TERV.PAL.TOIMINTASEKTORI Test tulkta tuls tetek tehdä jällee kakke vahede kassa, mutta jätä se väl ja kerro, mtä SPSS-tulostuksessa o luettavssa. Esmmäsessä taulukossa o ryhmttäste järjestyslukuje (Raks) keskarvot ja stä ähdää, että kotpalvelussa o oltu keskmäär pdempää ku kotosaraahodossa. Alemmasta taulukosta löytyy välvaheea testsuurede arvot U = 93.5 ja z = Tärketä o poma p-arvo, joka o p = Johtopäätös o tetek sama ku t-testssä, mutta p-arvo hema suuremp. Kruskall - Walls ykssuutae varassaalyys: Käytetää, ku varassaalyys oletukset: ormaaljakauma ta varasse yhtäsuuruus evät ole vomassa. Hypoteest: Oletukset: H0: osajoukot evät eroa sjaltaa tosstaa H: osajoukot eroavat - rppumattomat ryhmät - vähtää järjestysastekolle muuttuja Testsuure ja se jakauma: Havatoarvot xj korvataa järjestysluvulla Rj ja testsuure perustuu stä laskettav keskarvoh k KW ( R R) ( ) KW ( ) k R 3( ) 83

84 Esmmäsestä kaavasta ähdää mte testsuure perustuu koko aesto järjestyslukuje keskarvo ja ryhme järjestyslukuje keskarvoje erotuksee. Toe kaava o käs laske käyttökelposemp. Kaavassa R o ryhmä järjestyslukuje keskarvo ja R o koko aesto järjestyslukuje keskarvo. Mkäl ryhme lukumäärä k > 3 ja havatoja kakssa ryhmssä o yl vs (j > 5), oudattaa testsuure KW -jakaumaa vapausaste k -. Jos taas ryhmä o kolme ta ryhmssä o alle kuus havatoa, löytyvät krttset psteet (joh testsuuree arvoa verrataa) erllsestä taulukosta. Esmerkk jällee jakaumasta rppuvasta teststä, el tällä kertaa -suutasesta varassaalyysstä. Tässä SPSS-tulostus Kruskall-Walls teststä: Raks kä SIVIILISÄÄTY amato avo- ta avoltossa erout ta asumuserossa lesk Total N Mea Rak 5, ,3 5 8,83 8,8 43 Test Statstcs a,b Ch-Square df Asy mp. Sg. kä 6,7 3,00 a. Kruskal Walls Test b. Groupg Varable: SIVIILISÄÄTY Jällee koko test tulkassa ptäs olla kakk test 5 vahetta, mutta kerro tässä mtä SPSS-tulostuksessa o luettavssa. Esmmäsessä taulukossa o ryhmttäset järjestyslukuje (Raks) keskarvot. Stä ähdää mm, että lesket ovat äkkämpä. Tosesta taulukosta äkyy testsuuree arvo KW = 6.7 ja merktsevyystaso p = Johtopäätös o jällee sama ku jakaumasta rppuvassa testssä: ryhmät eroavat tosstaa tlastollsest merktseväst. 84

85 7 Rppumattomuustestejä Rppumattomuustestellä vodaa selvttää kahde muuttuja välse rppuvuude olemassaoloa. O huomattava, että mllää tlastollsella meetelmällä e voda selvttää kump muuttuja o tose muuttuja syy (kausalteett), vaa tämä tetämys löytyy soveltava ahealuee teorasta ta ykskertasesta järkelystä: akasemp tapahtuma o syy ja myöhäsemp tapahtuma o seuraus. Edellsessä luvussa estetyt keskarvotestt vodaa haluttaessa tulkta rppumattomuustesteks: luoktteleva muuttuja, joka jakaa havatoaesto ryhm, vakutusta tutktt jatkuvaa muuttujaa (se keskarvoh). Ste keskarvotestt tomvat luoktteluasteko muuttuja ja jatkuva muuttuja välsä rppumattomuustesteä. Jos kausalteett o tospä: jatkuvalla seltetää luokttelevaa, soveltuva meetelmä ovat esm. erotteluaalyys ja logste regressoaalyys. Rppumattomuustest valta o ykskertasta: luoktteluasteko muuttujlle -test ja mulle Pearso- ta järjestyskorrelaatokertome testaus. Es tässä estetää kutek prosettlukutest, jolla vertallaa osaryhme prosettosuuksa, kute edellsessä luvussa vertalt keskarvoja. Useamma osajouko prosettlukutestt vodaa tehdä -testllä ja tulos o aa sama, vakka otatajakaumat eroavat tosstaa, jote tässä estetää va yhde prosettluvu vertaame vakoo. 7. Suhteellse osuude testaame (bomtest) Halutaa testata, pokkeaako otoksesta laskettu ostuede kokede suhteelle osuus x/ hypotees mukasesta ostumse todeäkösyydestä. Ajatellaa, että o saatu otos jakaumasta B(, ) ja lasketaa todeäkösyys p = P(x/ > otos oudattaa B(, ) -jakaumaa) Otatajakauma o tuttu jo bomjakauma p: luottamusväl laskemsesta. Kute luottamusvälssä, myös testauksessa vodaa käyttää ormaalkajauma-approksmaatota, ku otoskoko o rttävä suur (>5) ja lähellä 0.5:ta. Hypoteest: H0: x/ =, o hypotees mukae suhteelle osuus H: x/, x/ < ta x/ > Oletukset: - rppumato satuasotos Testsuure ja se jakauma: ) Peellä otoskoolla (<5) saadaa merktsevyystaso suoraa bomkaavoje summasta: 85

86 Jos x/ <, mssä x o ostuede kokede lukumäärä, saadaa kakssuutase test merktsevyystaso kaavasta x p ( ) 0 Jos x/ >, saadaa kakssuutase test merktsevyystaso kaavasta p ( ) x ) Suurella otoskoolla (>5) vodaa käyttää ormaaljakauma-approksmaatota ja testsuureeks saadaa x z ~ N(0,) ku H 0 o tos ( ) Tarkemp tulos saadaa, ku käytetää jatkuvuuskorjausta x z ~ N(0,) ku H 0 o tos ( ) Jatkuvuuskorjaukse merkk valtaa ste, että korjattu k: arvo lähestyy keskarvoa. Vastaavlla prosettlukutestellä votas vertalla usea osajouko prosettlukuje eroja, mutta -testllä vodaa tehdä sama asa. Esmerkk Puoluee X kaatus edellsssä vaalessa ol 5 prosetta ja puoluee Y kaatus ol 5 prosetta. Galluptutkmuksessa kyselt 000:ta heklöltä ääestäsvätkö he puoluetta X ta Y, jos yt ols vaalt. Sekä puoluee X että puoluee Y kaattaja ol 40, jollo x/ = 40/000 = 0.4. Tutktaa ovatko puoluede kaatusprosette muutokset tlastollsest merktsevä. Hypoteest: Oletukset: H0: x/ = perusjoukossa X:lle =0.05 ja Y:lle =0.5 H: x/ -satuasotos Testsuureet: Puolueelle X jatkuvuuskorjauksella saadaa z ( 0.05) Puolueelle Y saadaa z ( 0.5) 86

87 p-arvot: Normaaljakaumataulukosta ja t-jakaumataulukosta -rvltä löytyy 5%: merktsevyystasoa varte kakssuutasee testauksee z =.96. T-jakaumataulukosta saadaa vapausaste df = merktsevyystasolla p = arvo 3.9. Johtopäätös: Puoluee X muutokse testsuure.986 o tsesarvoltaa taulukkolukua.96 (ja lukua 3.9) suuremp, jote H0 hylätää ja puoluee muutos osottautuu tlastollsest merktseväks. Vodaa ss vättää puoluee X kaatukse kasvaee myös perusjoukossa (prosettlukutest, p < ). Puoluee Y muutokse testsuure o tsesarvoltaa taulukkolukua.96 peemp, jote puoluee Y muutos e ole tlastollsest merktsevä, ekä voda vättää puoluee kaatukse muuttuee perusjoukossa (prosettlukutest, p = 0.40). -test Kahde luoktteluastekollse muuttuja rppuvuude kuvaluu vodaa käyttää kotgess- el rsttaulukkoa. Tästä taulukosta vodaa laskea -arvo, joka tom rppumattomuude testmuuttujaa. -test o ehkä käytety hypotees test. Hypoteest: Oletukset: H0: muuttujat evät rpu tosstaa H: muuttujat rppuvat tosstaa - odotetusta frekvessestä (ej) alle 0 % saa olla peempä ku 5 Testsuure ja se jakauma: Es jokasee ruutuu lasketaa odotettu frekvess reuajakaumsta (=jos rppuvuutta e ole ovat havatut frekvesst hyv lähellä odotettuja frekvessejä) kaavalla f f j ej Testsuure lasketaa kaavalla r s ( f ) j ej ~ ( df ) e j j mssä r ja s ovat muuttuje luokke lukumäärät (ta rsttauluko rve ja sarakkede lukumäärät) sekä df = (r-)(s-). Jos oletus e ole vomassa, täytyy yhdstellä luokka, jotta odotetut frekvesst saadaa rttävä suurks. x -taulussa vodaa käyttää Fsher eksakta testä. Merktsevyystaso saadaa Fsher testssä suoraa kaavasta 87

88 ( a b)!( c d)!( a c)!( b d)! p! a! b! c! d! mssä a, b, c ja d ovat elketä frekvessejä (a vasemmasta yläkulmasta, b okeasta yläkulmasta, je) sekä o otoskoko. -test e sovellu muutokse testaamsee. Esm. o mtattu sama luoktteluastekolle muuttuja alku- ja loppumttauksessa ja tutktaa oko tapahtuut muutosta tällä väl. Eräs tällasee ogelmaa soveltuva tlastolle meetelmä o tuusluku kappa ja se testaus. Esmerkk jällee kotpalvelutyötekjöstä Testataa eroavatko kotpalvelu ja kotsaraahodo työtekjät tosstaa se suhtee ovatko he tomeet aemm sos. ja terveydehuollo palveluksessa. H0: eroa ta rppuvuutta e ole el molemmat ovat tomeet yhtä paljo Oletukset: Korketaa 0% odotetusta frekvessestä saa olla <5. Testsuure ja p-arvo: TOIMINUT NYKYISTÄ TEHT. ENNEN SOS. JA TERV.HUOLLON PALV. * SOSI AALI-JA TERV.PAL. TOIMINTASEKTORI Crosstabulato TOIMINUT NYKYISTÄ TEHT. ENNEN SOS. JA TERV.HUOLLON PALV. Total e kyllä Cout Expected Cout % wth SOSIAALI-JA TERV.PAL. TOIMINTASEKTORI Cout Expected Cout % wth SOSIAALI-JA TERV.PAL. TOIMINTASEKTORI Cout Expected Cout % wth SOSIAALI-JA TERV.PAL. TOIMINTASEKTORI SOSI AALI-JA TERV.PAL. TOIMINTASEKTORI kotsaraa kotpalv elu hoto Total ,5 3,5 6,0 59,6%,0% 46,6% ,5 5,5 7,0 40,4% 00,0% 53,4% ,0 9,0 33,0 00,0% 00,0% 00,0% Taulukossa ylmpää ovat havatut frekvesst, seuraavaa odotetut frekvesst ja almpa sarakeprosett. Tästä ähdää että kaklla kotsaraahotajlla o ollut kokemusta aemm, ku taase kotpalvelu hmsstä o 40%:la o stä. (6 48.5) (0 3.5) (4 55.5) (9 5.5)

89 df = (-)(-) = Pearso Ch-Square Cotuty Correcto a Lkelhood Rato Fsher's Exact Test Lear-by-Lear Assocato N of Vald Cases -jakaumataulukosta esmmäsellä rvllä suur luku o 0.8. Otoksesta laskettu =3.4 o tätä suuremp, jote p < Sama tulos saadaa SPSS-tulostukse. rvltä. Johtopäätös: Nollahypotees hylätää, jote kotsaraahotajlla o ollut tlastollsest merktseväst eemmä työkokemusta sosaal- ja terveydehuollo palvelusta (p < 0.00). Krjallsuutta: Ch-Square Tests Asy mp. Sg. Value df (-sded) 3,385 b,000 30,034,000 43,463,000 3,4, a. Computed oly for a x table Exact Sg. (-sded) Exact Sg. (-sded),000,000 b. 0 cells (,0%) have expected cout less tha 5. The mmum expected cout s 3,5. Evert, B.S.D.(977). The Aalyss of Cotgescy Tables. Feberg, S.E.(977). The Aalyss of Cross-Classfed Categorcal Data. The MIT Press, Cambrdge. Freema, D.H.Jr.(987). Appled Categorcal Data Alayss. Marcel Dekker, N.Y. 7.3 Korrelaatokertome testaus Kahde vähtää välmatka-astekollse muuttuja leaarse rppuvuude kuvaluu ja testauksee käytetää korrelaatohajotakuvota, korrelaatokerrota ja se merktsevyyde testausta. Mkäl muuttujat ovat järjestysastekollsa, vodaa käyttää Spearma ta Kedall järjestyskorrelaatokerrota ja se merktsevyyde testausta. O huomattava, että korrelaatokerro mttaa aoastaa leaarse rppuvuude määrää. Aestossa saattaa olla epäleaarsta rppuvuutta, jota korrelaatokerro e havatse. Hypoteest: H0: el korrelaatokerro perusjoukossa = 0 H: el korrelaatokerro perusjoukossa e ole olla. Oletukset: 89

90 - muuttujat x ja y ovat vähtää välmatka-astekollsa ja oudattavat lkma ormaaljakaumaa Testsuure ja se jakauma: r t ~ t( ) ku H 0 o tos r Vastaavast vodaa testata järjestyskorrelaatokerrote tlastollsta merktsevyyttä. Esmerkk ä ja työssäolovuose välsestä rppuvuudesta, ku äde välseks korrelaatokertomeks o saatu r = 0.49 otoskoolla = 4 Hypoteest: Oletukset: H0: = 0 el e rppuvuutta H: 0 el o rppuvuutta Muuttujat oudattavat lkma ormaaljakaumaa. Testsuure ja se jakauma: t 6.65 df = 4 - = TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ kä Correlatos Pearso Correlato Sg. (-taled) N Pearso Correlato Sg. (-taled) N **. Correlato s sgf cat at the 0.0 lev el (-taled). TOIMINUT NYKYISESSÄ TEHTÄVÄSSÄ kä,490**, ,490**, P-arvo: Vapausasteet ptää pyörstää alaspä, koska taulukosta e löydy rvä 40. T- jakaumataulukossa rvllä df = 00 kakk luvut ovat peempä (suur o 3.39) ku aestosta laskettu 6.65, jote p < Sama tulos löytyy SPSS-tulostuksesta lma testsuuree arvoa. Johtopäätös: Nollahypotees hylätää (p < 0.00) ja todetaa äkkäämmllä heklöllä oleva uorempa eemmä työkokemusta (tetek). 90

91 Tlastollse test valasta Taulukko kahde muuttuja rppuuvutta testaavsta hypotees testestä, ku seltettävä (seuraus) muuttuja estetää alaspä (rvt) ja selttävä (syy) vaakaa (sarakkeet). Mttaastekot Luokttelu Järjestys Välmatka Suhde Luokttelu -test -test erotteluaalyys, logste regresso erotteluaalyys, logste regresso Järjestys -test, Ma- järjestyskorrel järjestyskorrelaato järjestyskorrelaato Wthey U, aato test test test Kruskall- Walls test Välmatka t-test, -suut ANOVA, Ma- Wthey U, Kruskall- Walls test Suhde t-test, -suut ANOVA järjestyskorrel aato test järjestyskorrel aato test korrelaatokertome test, regressoaalyys korrelaatokertome test, regressoaalyys korrelaatokertome test, regressoaalyys korrelaatokertome test, regressoaalyys Taulukossa e vo esttää rppuve havatopare el tostomttauste t-testä ja Wlcoxo testä. Samo momuuttujameetelmät puuttuvat taulukosta, koska ssä o useampa muuttuja. 9

92 8 Momuuttujameetelmä Momuuttujameetelmät ovat okeastaa meetelmäpaketteja, joh lttyy useta er tomtoja, kute mall detfot, parametre estmot, erlasa hypoteese testejä sekä jääöstarkasteluja. Jokasella momuuttujameetelmällä o omat työvaheesa ja sovellusalueesa. Yhtestä momuuttujameetelmssä o se, että llä kästellää useta muuttuja samaakasest ja tarkotuksea o havatoaesto formaato tvstäme jok mall avulla. Keskarvoteste yhteydessä estetyt kovarassaalyys ja mosuutae varassaalyys ovat myös momuuttujameetelmä. Ee srtymstä momuuttujameetelme käyttöö, kaattaa tutkja tutustua aestoo jakaume, tuuslukuje ja hypoteese testauste avulla. Esmerkks ee regresso- ja faktoraalyysä kaattaa tarkastella muuttuje korrelaatomatrsa. 8. Regressoaalyysstä Edellsessä luvussa estety korrelaatokertome avulla vodaa tutka kahde, vähtää välmatka-astekollse, muuttuja leaarsta rppuvuutta. Mkäl tutkmusala asatutemuksesta tuetaa syy- el selttävä-muuttuja ja seuraus- el seltettävämuuttuja, vodaa tlastollsea meetelmää käyttää regressoaalyysä. Regressoaalyys vodaa ottaa mukaa myös useta selttävä muuttuja. Regressomall: Ku merktää seltettävää muuttujaa Y:llä ja selttävä muuttuja X:llä, vodaa leaare regressomall krjottaa kaavaa Y x x... 0 p X p mssä :t ovat parametreja, jotka estmodaa aestosta ja o jääösterm, joka ssältää selttämättä jääee vahtelu. Mallssa regressovako o kaksta vähämerktyksells term. Use se jätetää jopa esttämättä. Se kertoo va regressosuora taso. Kutek mallssa, mllä halutaa eustaa Y-muuttuja arvoja, vakoterm o tarpee olla mukaa. Regressokerro o tärkeä term, sllä se kertoo muuttuje välsestä relaatosta. Aalyysssä ehkä tärke test o regressokertome ollaa vertaamse testaus. Lsäks se tulkta o tärkeää: se kertoo stä kuka paljo Y-muuttuja muuttuu X-muuttuja kasvaessa yhde ykskö. Jääösterm o ava beta-parametre estmot ja tärkeä term mall sopvuustarkastelussa. Estmosta: Ku regressomall yhtälöstä postetaa jääösterm, jäljelle jää suora yhtälö vakoee (0) ja kulmakertomee (:t). Suora määrttelemseks täytyy es estmoda parametrt. Regressosuora pyrk keräämää muuttuje vahtelu 9

93 93 mahdollsmma hyv (Vertaa korrelaatohajotakuvoo prrettyä suoraa). Suora o ss kuljettava mahdollsmma läheltä havatopstetä. Yleesä määrtellää jääökset muuttuja Y suuassa )... ( 0 p p X X X Y Yleesä käytetää pemmä elösumma estmotmeetelmää, mssä korotetaa edelle kaava tosee potess ja mmodaa ä saatu jääöselösummafukto p p x x x y 0 ))... ( ( Mm löytyy tetek fukto dervaattoje ollakohdsta. Tämä fukto ss dervodaa kakke estmotave parametre 0,,...,p suhtee, asetetaa dervaatat ollks ja ä saadusta yhtälöryhmästä ratkastaa estmotavat parametrt. Näh kaavoh stte sjotetaa havatoarvot ja lasketaa regressokertomet aestosta. Kertome tulkta tulee luoollsest kulmakertome tulkasta: ku selttävä muuttuja kasvaa yhde ykskö, seltettävä muuttuja arvo muuttuu regressokertome b verra. Jos regressokerro o lähellä ollaa, e selttävä muuttuja vakuta. Regressovako tulkta o tetek se, että seltettävä muuttuja Y o kertome 0 tasolla X-muuttuja ollessa olla. Yhde selttävä muuttuja tlateessa yhtälö f X Y 0 )) ( ( 0 ) ( 0 ) ( x x y f x y f Esmmäsestä saadaa helpost estmaatt regressovakolle x b y b 0 ˆ. Ku tämä sjotetaa tosee yhtälöö, saadaa regressokertome estmaatks ) ( ), ( ) ( ) )( ( ˆ x D y x Cov x x y y x x b mkä mustuttaa kovast korrelaatokertome kaavaa, ku korrelaato ol ) ( ) ( ), ( y D x D y x Cov r Ss regressokertome ja korrelaatokertome yhteys vodaa krjottaa r s s r x D y D b x y ) ( ) ( ˆ Momuuttujasta regressoaalyysä varte o helpota srtyä käyttämää matrsmerktöjä. Ku seltettävä muuttuja havaot sjotetaa pystyvektor y ja selttäve muuttuje havaot X-matrs sarakkeks sekä havaot keskarvostetaa

94 ta stadardodaa (ä jää regressovako pos mallsta), vodaa regressosuora yhtälö krjottaa muodossa y X, mssä -vektor ssältää regressokertomet ja -vektor regressojääökset. Yhtälö krjotettua auk matrsa ja vektorea o muotoa Y X X X p Y X X X p Y X X X p Y p Jääöste elömuoto vodaa krjottaa ε T ε = (y-x) T (y-x), joka dervaata ollakohdasta saadaa regressokerrote pemmä elösumma estmaattort ˆ T T ( X X ) X y Ss tuolla kaavalla o helppo laskea vakka kuka moe selttävä muuttuja regressokertomet. Summamuodossa (kute yhde selttävä muuttuja tlateessa) vastaava mes hyv ptkäks sgmakaavaks. Estmaattorsta ähdää regressoaalyys yks ogelma: matrs X T X käätesmatrs laskeme o epävakaata, jos X o lähes sgulaare el matrs sarakkeet mlte rppuvat tosstaa. Tämä vuoks joudutaa olettamaa selttäve X-muuttuje tosstaa rppumattomuus, mkä e käytäössä aa toteudu. Kysestä ogelmaa kutsutaa multkolleaarsuudeks ja she päädytää, jos selttävät X-muuttujat korrelovat hyv vomakkaast keskeää. Testt: Tärke ja ykskertas test regressoaalyysssä o kertome merktsevyystest. Test perustuu ykskertasee ajatuksee testsuuree (tuusluvu) stadardomsesta: väheetää ollahypotees mukae odotusarvo ja jaetaa keskvrheellä. Ho: = c H: c Tavallsest vakoterm c o olla, jollo testataa stä pokkeaako kerro ollasta. Testsuureeks saadaa t ˆ c ~ t(-), se( ˆ ) 94

95 mssä tetek ˆ se( ) D ( ˆ ). Koko mall sopvuutta aestoo vodaa tarkastella elösummahajotelma perusteella. SS(Y) = SS(R) + SS(E) Nelösummakaavoje johtame lähtee seltettävä muuttuja Y havatoje arvosta regressomalllla jääösterm kassa Y Yˆ e Y Y Yˆ Y e Y Y ˆ ( X X ) e Nämä korottamalla tosee potess ja summattua yl ajatellu havatoaesto saadaa elösummahajotelmaks SS(Y) (Y Y ) ( ˆ ( X X ) e ) = ˆ ˆ ˆ ( ) ( ) ( ) X X e X X e X X e SS( R) SS( E) koska X e = 0 ja e = 0. Jakamalla ämä elösummat vapausastellaa ( ja -), saadaa keskelösummat, jode osamäärä käy testsuureesta, mkä testaa stä, sopko mall tyhjää paremm. F SS( R) / df ( R) ~ F(, -). SS( E) / df ( E) Tätä testä tärkeämp tulos o deks, joka kertoo mall seltysosuudesta elösummamelessä. Seltysosuus el seltysaste (detemaatokerro) määräytyy regresso selttämä elösumma SS(R) suhteesta kokoaselösummaa SS(T): R SS( R) SS( E), SS( T) SS( T) mssä summat vodaa laskea edellä estetystä kaavosta. Seltysaste o aa 0 R ja saadaa laskettua myös korrelaatokertome elöä. R o hyvä deks kertomaa selttäve X-muuttuje eustuskyvystä, mutta korkea seltysaste e ole mall hyvyyde tae. Tosaalta myös mall, jolla o matala seltysaste, vo olla hyvä, jos se ssältää tlastollsest ja ee kakkea ssällöllsest merktsevä selttäjä. Jääöstarkastelut ja oletukset: Regressoaalyys oletukssta vodaa mata: 95

96 - ssällölle järkevyys - vähtää välmatka-astekollset muuttujat (pokkeuksea dummy-muuttujat) - rppuvuude leaarsuus - selttävät muuttujat evät saa vomakkaast korreloda keskeää (s. multkolleaarsuusogelma) - y: hajota o x muuttujsta rppumato (homoskedastsuus) - autokorrelomattomuus (akasarja-aestossa peräkkäset havaot evät saa korreloda keskeää) - jääösmuuttuja oudattaa ormaaljakaumaa Oletuste vomassaoloa tutktaa yleesä tarkastelemalla jääöksä, josta lasketaa erlasa tuuslukuja ja prretää kuvota. Selttäve muuttuje joukkoo vodaa ottaa myös -luokkasa dummy-muuttuja (saa arvo 0 ja ), mutta e mssää messä moluokkasa luoktteluasteko muuttuja (tämä rajotukse vo kertää muodostamalla useampa dummyjä yhdestä muuttujasta). Jos dummy-muuttuja otetaa mall mukaa tavallse selttävä muuttuja tapaa, o kyseessä tlae dummy regressovakotermssä, mllä saadaa samaa mall kaks samasuutasta regressosuoraa, eroa o va se, että suorat kulkevat dummy-muuttuja osottame ryhme mukaa er tasolla. Jos halutaa regressosuore kulkeva er suut, täytyy ottaa dummy myös kertomee. Epäleaarsuus saadaa use korjattua muuttujamuuokslla. Nätä kaattaa käyttää, jos X-muuttuja vakutus khtyy ta pkemmk hekkeee arvoje kasvaessa (saturaatomall). Tok regressoyhtälöö vodaa helpost lsätä moelasa fuktota, mutta tällö saatetaa päätyä oleellsest epäleaarsee mall, joka estmot ja muut tarkastelut evät ole ykskertasa (Y = f(x) + ). Multkolleaarsuusogelmasta matt momuuttujase regressoaalyys estmo yhteydessä. Ogelmaa o ss selttäve X-muuttuje keskäe vomakas rppuvuus. Muuttujat syövät toste vakutuksa ta pahmmllaa regressokertomet muuttuvat epäloogsks (esm. postvsest vakuttava selttäjä kerro muuttuu egatvseks). Käytäössä tästä ogelmasta päästää use valtsemalla selttävät X- muuttujat ste, ette ogelmaa syy. Joskus muodostetaa yhdstettyjä muuttuja vomakkaast keskeää korrelovsta muuttujsta. Yks matemaatte ratkasu ogelmaa o srtyä harhasee harjaparametrsot (rdge regresso) lsäämällä X T X matrs vako k: ~ T T ( X X ki) X y Varass o tapaa kasvaa havatoarvoje kasvaessa. Tällö homoskedastsuusoletus D (e) = e täyty (jääökse vahtelu sama X-muuttuja arvosta rppumatta). 96

97 Tlateessa regressokertome estmaattor o tok harhato, mutta se varass o D ( ˆ) w ja kertome merktsevyystest tulos e ole välttämättä okea. Heteroskedastsuus vodaa havata hajotakuvosta. Ykskertasmm se äkyy seltettävä muuttuja Y hajoa kasvua, ku syy-muuttuja (X) arvot kasvavat. Jääökset e vodaa myös plotata X-muuttuja vastaa, mstä katsotaa myös stä vahteleeko jääökse hajota X-muuttuje kasvaessa. Heteroskedastsuutta vodaa myös testata erlaslla testellä. Ogelmaa vodaa korjata muuttujamuuokslla ta lsäämällä regressomall X-muuttuja arvosta rppuva varassterm. Oletusta Cov(e,ej) = 0 ( ja j vttaavat peräkkäs havatoh akasarja-aestossa) kutsutaa autokorrelaato-oletukseks. El jääökset korrelovat keskeää. Autokorrelaatota estyy use akasarja-aestossa, mssä seuraava havato o hyv edellse havao kaltae (postve autokorrelaato). Seuraukset ovat lkma samat ku heteroskedastsessa tlateessa: estmaattort kyllä ovat harhattoma, mutta estmaattor keskvrheet o väärä. Tällö testejä (etekää kerrote merktsevyystestejä) e pdä käyttää. Autokorrelaato vodaa havata plottaamalla regressojääökset aja suhtee (havatojärjestyksessä) ta stte Durb-Watso-testllä. Mkäl e tedetä mtkä muuttujat ovat selttävä muuttuja, vodaa selttävät muuttujat valta muuttujajoukosta proseduraalsest (ohjelma avulla). ) Lähdetää täydestä mallsta, josta pudotetaa selttäjä pos muuttuja kerrallaa, kues seuraavaks postovuorossa oleva muuttuja o tlastollsest merktsevä mallssa (takaapä postava), ta ) valtaa yks muuttuja kerrallaa paremmuusjärjestyksessä, kues seuraava mukaa otettava muuttuja e ole tlastollsest merktsevä (eteepä valkova), ta 3) valtaa yks muuttuja kerrallaa, kute edellä, mutta joka teraatokerroksella testataa vodaako muuttuja postaa mallsta (askeltava el stepwse). Esmerkk SPSS-ohjelma mukaa tulevasta aestosta, mssä o tetoja 5 maasta. Tutktaa vakuttavatko väestö määrä, asukastheys, lukutatoprosett ja väestökasvu bruttokasatuotteesee. Ee aalyysä o BKT (GDP) muutettu ormaaljakautueeks logartmmuuokse avulla. 97

98 Model Model Summary Adjusted Std. Error of R R Square R Square the Estmate,765 a,585,568,409 a. Predctors: (Costat), Populato crease (% per y ear)), Populato thousads, Number of people / sq. klometer, People who read (%) Model Regresso Resdual Total ANOVA b Sum of Squares df Mea Square F Sg. 3,93 4 5,983 35,557,000 a 6,994 0,68 40,95 05 a. Predctors: (Costat), Populato crease (% per y ear)), Populato thousads, Number of people / sq. klometer, People who read (%) b. Depedet Varable: Log (base 0) of GDP_CAP Model (Costat) Populato thousads Number of people / sq. klometer People who read (%) Populato crease (% per y ear)) Coeffcets a Ustadardzed Coeff cets a. Depedet Varable: Log (base 0) of GDP_CAP Stadardzed Coeff cets B Std. Error Beta t Sg.,53,66 8,099,000-6,8E-007,000 -,6 -,495,04,000,000,7,94,055,07,00,64 7,03,000 -,058,048 -,0 -,90,37 Vmesessä taulukossa o regressosuora yhtälö: log(bkt) = väestö määrä asukastheys lukutatoprosett väestökasvu. Asukastheyde kerro e ole tasa olla, vakka estetyllä tarkkuudella se äyttää sltä. Esmerkks lukutatoproset kerro o tulkttavssa ste, että jos väestö lukutato kasvaa yhde proset, BKT: logartm kasvaa Tauluko okeassa ladassa o kerrote merktsevyystestt ja stä ähdää, ette väestötheyde ja väestö kasvu kertomet pokkea ollasta tlastollsest merktseväst (p > 0.05), jote ämä muuttujat votas jättää pos mallsta. Mallsta löytyy ss merktsevää selttäjää: mtä suuremp väkluku, stä matalamp BKT ja mtä somp lukutatoprosett, stä korkeamp BKT. Edellsessä taulukossa o mall sopvuude test. Test ataa pee p-arvo (p < 0.00), mutta tämä tulos e vakuuta mall hyvyydestä. Esmmäsessä taulukossa o mall seltysaste R = 0.585, mkä kertoo selttäve muuttuje selttävä 59% BKT logartm vahtelusta. 98

99 8. Logstsesta regressomallsta Jos seltettävä Y-muuttuja o -luokkae, e suora sov hyv kuvaamaa muuttuje välstä yhteyttä, vaa rppuvuude mallttamsee o käytettävä lkkfuktota. Logste regressomall (ta bomregresso) sop tlates, mssä seltettävä muuttuja o dgotome. Esmerkks ostohalukkuus, kuoleme, sarastume,, mssä vastaus o kyllä/e. Mall S-muoto tulee lkkfuktosta Ehkä ykskertasmm se vo esttää kaavaa P( Y ) log b P( Y ) 0 b x mssä P(Y=) o todeäkösyys slle, että seltettävä muuttuja saa arvo yks. Jakolasku o tse asassa vedolyötsuhde (Odds Rato) slle oko y-muuttuja arvo yks. Tämä ataa regressokertomlle tulka: e b o vedolyötsuhtee muutos selttävä muuttuja arvo kasvaessa yhde ykskö. Käyrästä lkkfuktosta johtue regressokerrote estmot e ole ykskertasta ku leaarsessa regressoaalyysssä. Estmot perustuu aemm estettyh pemmä elösumma ta suurmma uskottavuude meetelm, mutta dervaata ollakohta e löydy helpost, vaa se joudutaa hakemaa terolla. 99

100 Regressokertome merktsevyyttä testataa kute leaarsessa regressoaalyysssä. Mall sopvuutta vodaa myös testata ja laskea seltysaste, mutta seltysasteet ovat logstsessa regressoaalyysssä yleesä melko matala, aak verrattua leaarse regressoaalyys seltysasteesee. Esmerkk SPSS tlasto-ohjelma mukaa tulevasta aestosta, mssä seltetää tetokoee omstamsta ällä, tulolla, auto halla ja koulutuksella.. Ombus Tests of Model Coeffcets Ch-square df Sg. Step Step 934,383 4,000 Block 934,383 4,000 Model 934,383 4,000 Model Summary - Log Cox & Sell R Nagelkerke R Step lkelhood Square Square 7843,09 a,36,8 a. Estmato termated at terato umber 4 because parameter estmates chaged by less tha,00. Classfcato Table a Observed Predcted Ows computer No Yes Percetage Correct Step Ows computer No , Yes ,0 Overall Percetage 66,7 a. The cut value s,500 Varables the Equato B S.E. Wald df Sg. Exp(B) Step a age -,04,00 33,7,000,986 come,000,00,035,85,000 car,000,00,004,950,000 ed,657,04 70,899,000,930 Costat -,39, 3,4,000,48 a. Varable(s) etered o step : age, come, car, ed. 00

101 Vmesestä taulukosta löytyy tärkemmät tulokset. Ikä ja koulutus selttävät tlastollsest merktseväst (p < 0.05), tulot ja auto hta evät (p > 0.05). Iä egatve kerro kertoo uorempe hmste omstava tetokoee vahempa useamm, ku koulutukse postve kerro taas stä, että eemmä kouluttautueet omstavat vähemmä koulutettuja usemm tetokoee. Tauluko vmesessä sarakkeessa olevat (Exp(B)) Odds Ratot (OR) ovat tulkttavssa syy-muuttuja arvo kasvaessa yhde ykskö (esm kä vuode), vedolyötsuhtede suhde (OR) muuttuu kysese kertome verra (katso OR luvusta 4.3..).. Muut taulukot kertovat mall sopvuudesta ja se eustuskyvystä, jotka tässä tapauksessa ovat huooja. Esmmäse tauluko pe p-arvo hylkää mall sopvuude sekä pseudoseltysasteet ovat va 0.4 ja 0.8. Logstsessa regressoaalyysssä yleesä ok oleellsta löytää tlastollsest merktsevä selttäjä, harvemm päästää täys stuvaa mall, vakka joskus malllla pyrtää tekemää eusteta. Eustee hyvyydestä kertoo mukavast ROC-aalyys (recever operatg characterstc). 0

TKK @ Ilkka Mellin (2008) 1/24

TKK @ Ilkka Mellin (2008) 1/24 Mat-.60 Sovellettu todeäkösyyslasketa B Mat-.60 Sovellettu todeäkösyyslasketa B / Ratkasut Aheet: Mtta-astekot Havatoaesto kuvaame ja otostuusluvut Avasaat: Artmeette keskarvo, Frekvess, Frekvessjakauma,

Lisätiedot

MTTTP1 SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN

MTTTP1 SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN MTTTP SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN Aesto kaavoje () (3), (9) ja () esmerkkeh Lepakot pakallstavat hyötesä lähettämällä korkeataajusta äätä Ne pystyvät pakallstamaa hyöteset

Lisätiedot

Mat Sovellettu todennäköisyyslaskenta B 8. harjoitukset / Ratkaisut Aiheet: Otos ja otosjakaumat Avainsanat:

Mat Sovellettu todennäköisyyslaskenta B 8. harjoitukset / Ratkaisut Aiheet: Otos ja otosjakaumat Avainsanat: Mat-1.60 Sovellettu todeäkösyyslasketa Mat-1.60 Sovellettu todeäkösyyslasketa B / Ratkasut Aheet: Otos ja otosjakaumat Avasaat: Artmeette keskarvo, Beroull-jakauma, Beroull-koe, χ -jakauma, Frekvess, Frekvessjakauma,

Lisätiedot

Mat Koesuunnittelu ja tilastolliset mallit. Yhden selittäjän lineaarinen regressiomalli. Avainsanat:

Mat Koesuunnittelu ja tilastolliset mallit. Yhden selittäjän lineaarinen regressiomalli. Avainsanat: Mat-.3 Koesuuttelu ja tlastollset mallt 4. harjotukset Mat-.3 Koesuuttelu ja tlastollset mallt 4. harjotukset / Ratkasut Aheet: Avasaat: Yhde selttäjä leaare regressomall Artmeette keskarvo, Estmaatt,

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paper -harjotukset Tana Lehtnen 8.8.07 Tana I Lehtnen Helsngn ylopsto Etelä-Suomen ja Lapn lään, 400 opettajaa a. Perusjoukon (populaaton) muodostvat kakk Etelä-Suomen ja Lapn läänn peruskoulun opettajat

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemaalyys laboratoro Mat-.9 Sovellettu todeäkösyyslasku A Nordlud Harjotus 8 (vko 45/3) (Ahe: Raja-arvolauseta, otostuuslukuja, johdatusta estmot, Lae luvut 9.5,.-.6). Olkoo X ~ p(λ), mssä λ

Lisätiedot

Ilkka Mellin (2006) 1/1

Ilkka Mellin (2006) 1/1 Mat-.60 Sovellettu todeäkösyyslasketa B Mat-.60 Sovellettu todeäkösyyslasketa B / Ratkasut Aheet: Mtta-astekot Havatoaesto kuvaame ja otostuusluvut Avasaat: Artmeette keskarvo, Frekvess, Frekvessjakauma,

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemaalyys laboratoro Mat-.090 Sovellettu todeäkösyyslasku A Nordlud Harotus (vko 49/003) (Ahe: Tlastollsa testeä, regressoaalyysä Lae luvut 5.5, 6) HUOM! Laskarede palautukse takaraa o pokkeuksellsest

Lisätiedot

Suoran sovittaminen pistejoukkoon

Suoran sovittaminen pistejoukkoon Suora sovttame pstejoukkoo Ku halutaa tutka kahde tlastollse muuttuja rppuvuutta tosstaa, käytetää use leaarsta regressota el suora sovttamsta havatojoukkoo. Sä o aettu joukko havatopareja (x, y ), ja

Lisätiedot

Luento 6 Luotettavuus Koherentit järjestelmät

Luento 6 Luotettavuus Koherentit järjestelmät Aalto-ylosto erustetede korkeakoulu Matematka a systeemaalyys latos Lueto 6 Luotettavuus Koherett ärestelmät Aht Salo Systeemaalyys laboratoro Matematka a systeemaalyys latos Aalto-ylosto erustetede korkeakoulu

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 5 Aiheet: Tilastolliset testit Avainsanat:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 5 Aiheet: Tilastolliset testit Avainsanat: MS-A5 Todeäkösyyslaskea ja tlastotetee peruskurss Esmerkkkokoelma 5 MS-A5 Todeäkösyyslaskea ja tlastotetee peruskurss Esmerkkkokoelma 5 Aheet: Tlastollset testt Avasaat: Artmeette keskarvo Beroull-jakauma

Lisätiedot

Muuttujien välisten riippuvuuksien analysointi

Muuttujien välisten riippuvuuksien analysointi Mat-.4 Tlastollse aalyys peusteet, kevät 7 5. lueto: Tlastolle ppuvuus ja koelaato Muuttuje välste ppuvuukse aalysot Tlastollsssa aalyysessä tutktaa use muuttuje välsä ppuvuuksa Työttömyysastee ppuvuus

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 4 MS-A Todeäkösyyslaskea ja tlastotetee peruskurss Vkko Tlastollste aestoje kerääme ja mttaame; tlastollste aestoje kuvaame; Otokset ja otosjakaumat; Estmot; Estmotmeetelmät; Vällestmot Mtä tlastotede o?

Lisätiedot

Ilkka Mellin. Sovellettu todennäköisyyslasku: Kaavat ja taulukot

Ilkka Mellin. Sovellettu todennäköisyyslasku: Kaavat ja taulukot Mat-.09 Sovellettu todeäkösyyslasku Systeemaalyys laboratoro Teklle korkeakoulu SYKSY 00 Ilkka Mell Sovellettu todeäkösyyslasku: Kaavat ja taulukot f XY x X x X y Y ( x, y) exp XY ( XY ) XY XY X X Y Tomttaut

Lisätiedot

Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava: Esitiedot

Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava. Kokonaistodennäköisyys ja Bayesin kaava: Esitiedot TKK (c) Ilkka Mell (2004) Kokoastodeäkösyys ja Kokoastodeäkösyys ja : Johdato Kokoastodeäkösyyde ja Bayes kaavoje systeemteoreette tulkta Johdatus todeäkösyyslasketaa Kokoastodeäkösyys ja TKK (c) Ilkka

Lisätiedot

Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio: Esitiedot

Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio. Tilastollinen riippuvuus ja korrelaatio: Esitiedot TKK (c) Ilkka Mell (4) Tlastolle rppuvuus ja korrelaato Tlastolle rppuvuus, korrelaato ja regresso Kahde muuttuja havatoaesto kuvaame Pearso korrelaatokertome estmot ja testaus Järjestyskorrelaatokertomet

Lisätiedot

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2 HY / Matematka ja tlastotetee latos Tlastolle päättely II, kevät 28 Harjotus 3A Ratkasuehdotuksa Tehtäväsarja I Olkoot Y,, Y ja Nθ, ) Osota, että T T Y) Y 2 o parametr gθ) θ 2 harhato estmaattor Laske

Lisätiedot

Tilastollinen riippuvuus ja korrelaatio

Tilastollinen riippuvuus ja korrelaatio Tlastollset meetelmät Osa 4: Leaare regressoaalyys Tlastolle rppuvuus ja korrelaato KE (204) Tlastolle rppuvuus ja korrelaato >> Tlastolle rppuvuus, korrelaato ja regresso Kahde muuttuja havatoaesto kuvaame

Lisätiedot

2-suuntainen vaihtoehtoinen hypoteesi

2-suuntainen vaihtoehtoinen hypoteesi Mat-.6 Sovellettu todeäkösyyslasketa. harjotukset Mat-.6 Sovellettu todeäkösyyslasketa B. harjotukset / Ratkasut Aheet: Tlastollset testt Avasaat: Artmeette keskarvo, Beroull-jakauma, F-jakauma, F-test,

Lisätiedot

Todennäköisyyden aksioomat. Todennäköisyyden aksioomat. Todennäköisyyden aksioomat: Mitä opimme? 2/2. Todennäköisyyden aksioomat: Mitä opimme?

Todennäköisyyden aksioomat. Todennäköisyyden aksioomat. Todennäköisyyden aksioomat: Mitä opimme? 2/2. Todennäköisyyden aksioomat: Mitä opimme? TKK () Ilkka Mell (2004) 1 Todeäkösyyde aksoomat Suhteelle rekvess, klasse todeäkösyys ja ehdolle todeäkösyys Johdatus todeäkösyyslasketaa Todeäkösyyde aksoomat TKK () Ilkka Mell (2004) 2 Todeäkösyyde

Lisätiedot

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus Mat-1.361 Tlastolle päättely. Data reduso peraatteet Tlastolle päättely. Data reduso peraatteet.1. Tyhjetävyys Asllaarsuus, Basu teoreema, Data redusot, Faktorotteoreema, Iformaato, Mmaale tyhjetävyys,

Lisätiedot

1. Luvut 1, 10 on laitettu ympyrän kehälle. Osoita, että löytyy kolme vierekkäistä

1. Luvut 1, 10 on laitettu ympyrän kehälle. Osoita, että löytyy kolme vierekkäistä Johdatus dskreettn matematkkaan Harjotus 3, 30.9.2015 1. Luvut 1, 10 on latettu ympyrän kehälle. Osota, että löytyy kolme verekkästä lukua, joden summa on vähntään 17. Ratkasu. Tällasa kolmkkoja on 10

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen Tilastolliset aineistot

Tilastollisten aineistojen kerääminen ja mittaaminen Tilastolliset aineistot Todeäkösyyslaskea ja talstotetee peruskurssesmerkkkokoelma 4 Todeäkösyyslaskea ja tlastotetee peruskurss Esmerkkkokoelma 4 Aheet: Tlastollste aestoje kerääme ja mttaame Tlastollste aestoje kuvaame Otokset

Lisätiedot

Raja-arvot. Osittaisderivaatat.

Raja-arvot. Osittaisderivaatat. 1 MAT-13440 LAAJA MATEMATIIKKA 4 Tamperee teklle ylopsto Rsto Slveoe Kevät 2010 Luku 3 Raja-arvot Osttasdervaatat 1 Fuktode raja-arvot Tarkastelemme fuktota f : A, jode määrttelyjoukko A T Muuttujat ovat

Lisätiedot

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus

Tilastollinen päättely. 2. Datan redusoinnin periaatteet Tyhjentävyys Uskottavuus Mat.36 Tlastolle päättely. Data reduso peraatteet Tlastolle päättely. Data reduso peraatteet.. Tyhjetävyys Asllaarsuus, Basu teoreema, Data redusot, Faktorotteoreema, Iformaato, Mmaale tyhjetävyys, Otos,

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 6

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 6 Todeäkösyyslaskea ja tlastotetee peruskurss Esmerkkkokoelma 6 Todeäkösyyslaskea ja tlastotetee peruskurss Esmerkkkokoelma 6 Aheet: Tlastolle rppuvuus ja korrelaato Yhde selttäjä leaare regressomall Regressoaalyys

Lisätiedot

13. Lineaariset ensimmäisen kertaluvun differentiaalisysteemit

13. Lineaariset ensimmäisen kertaluvun differentiaalisysteemit 68 3. Leaarset esmmäse kertaluvu dfferetaalsysteemt Tarkastelemme systeemejä () x () t = A() t x() t + b () t, jossa matrs A kertomet ja b ovat välllä I jatkuva. Jatkuve vektorarvoste fuktode avaruutta

Lisätiedot

Generoidaan tiedostoon BINORM satunnaislukuja jakaumasta N(0,1) muuttujiksi U, V: (U, V): N 2 (0, 0, 1, 1, 0)

Generoidaan tiedostoon BINORM satunnaislukuja jakaumasta N(0,1) muuttujiksi U, V: (U, V): N 2 (0, 0, 1, 1, 0) Mat-2.04 Tlastollse aalyys perusteet / Ratkasut Aheet: Avasaat Korrelaato ja assosaato Hypotees, Järjestyskorrelaatokertomet, χ 2 -rppumattomuustest, Korrelaatokerro, Pstedagramm, Päätössäätö, Nollahypotees,

Lisätiedot

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

Tilastolliset menetelmät: Lineaarinen regressioanalyysi Tlastollset meetelmät Leaare regressoaalyys Tlastollset meetelmät: Leaare regressoaalyys 3. Tlastolle rppuvuus ja korrelaato 4. Johdatus regressoaalyys 5. Yhde selttäjä leaare regressomall 6. Ylee leaare

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.204 Tlastollsen analyysn perusteet, kevät 2007 5. luento: Tlastollnen rppuvuus ja korrelaato Ka Vrtanen Muuttujen välsten rppuvuuksen analysont Tlastollsssa analyysessä tutktaan usen muuttujen välsä

Lisätiedot

Turingin kone on kuin äärellinen automaatti, jolla on käytössään

Turingin kone on kuin äärellinen automaatti, jolla on käytössään 4 TUINGIN KONEET Ala Turg 1935 36 auha Koe vo srtää auha: T U I N G auhapää: ohjausykskkö: Turg koe o ku äärelle automaatt, jolla o käytössää auhapäätä vasemmalle ta okealle; se vo myös lukea ta krjottaa

Lisätiedot

Mittausepävarmuus. Mittaustekniikan perusteet / luento 7. Mittausepävarmuus. Mittausepävarmuuden laskeminen. Epävarmuuslaskelma vai virhearvio?

Mittausepävarmuus. Mittaustekniikan perusteet / luento 7. Mittausepävarmuus. Mittausepävarmuuden laskeminen. Epävarmuuslaskelma vai virhearvio? Mttausteknkan perusteet / luento 7 Mttausepävarmuus Mttausepävarmuus Mttaustulos e ole koskaan täysn oken Mttaustulos on arvo mtattavasta arvosta Mttaustuloksen ja mtattavan arvon ero on mttausvrhe Mkäl

Lisätiedot

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia. HY, MTO / Matemaattste tetede kadohjelma Tlastolle päättely II, kevät 208 Harjotus 7B Ratkasuehdotuksa Tehtäväsarja I Olkoo Y, Y rppumato otos Pareto jakaumasta, fy; θ θc θ y θ+ { y > c } tuetulla vakolla

Lisätiedot

Jaksolliset ja toistuvat suoritukset

Jaksolliset ja toistuvat suoritukset Jaksollset ja tostuvat suortukset Korkojakson välen tostuva suortuksa kutsutaan jaksollsks suortuksks. Tarkastelemme tässä myös ylesempä tlanteta jossa samansuurunen talletus tehdään tasavälen mutta e

Lisätiedot

1.2. Aritmeettisen keskiarvon ja otosvarianssin otosjakaumat: Odotusarvot ja varianssit

1.2. Aritmeettisen keskiarvon ja otosvarianssin otosjakaumat: Odotusarvot ja varianssit Tlastolle päättely. Otosjakaumat Tlastolle päättely. Otosjakaumat.. Otos, otostuusluvut ja de otosjakaumat Arvota, Havato, Havatoarvo, Otos, Otosjakauma, Otostuusluku, Rppumattomuus, Satuasmuuttuja, Satuasotos,

Lisätiedot

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt FYSP103 / 1 KAASUTUTKIMUS Työn tavotteta havannollstaa deaalkaasun tlanyhtälöä oppa, mten lman kosteus vakuttaa havattavn lmöhn ja mttaustuloksn kerrata mttauspöytäkrjan ja työselostuksen laatmsta Luento-

Lisätiedot

1. (Monisteen teht. 5.16) Eräiden kuulalaakereiden kestoa (miljoonaa kierrosta) on totuttu kuvaamaan Weibull-jakaumalla, jonka tiheysfunktio on

1. (Monisteen teht. 5.16) Eräiden kuulalaakereiden kestoa (miljoonaa kierrosta) on totuttu kuvaamaan Weibull-jakaumalla, jonka tiheysfunktio on HY MTO / Matemaattste tetede kadohjelma Tlastolle päättely II kevät 019 Harjotus 7B Ratkasuehdotuksa Tehtäväsarja I 1 Mostee teht 516 Eräde kuulalaakerede kestoa mljooaa kerrosta o totuttu kuvaamaa Webull-jakaumalla

Lisätiedot

1. PARAMETRIEN ESTIMOINTI

1. PARAMETRIEN ESTIMOINTI Mat-.04 Tlastollse aalyys perusteet Mat-.04 Tlastollse aalyys perusteet / Ratkasut Aheet: Avasaat: Yhde selttäjä leaare regressomall Estmaatt, Estmaattor, Estmot, Jääöselösumma, Jääösterm, Jääösvarass,

Lisätiedot

Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet: Mitä opimme?

Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet. Konvergenssikäsitteet ja raja-arvolauseet: Mitä opimme? TKK (c) Ilkka Mell (004) Kovergesskästteet ja raja-arvolauseet Kovergesskästtetä Suurte lukuje lat Keskee raja-arvolause Keskese raja-arvolausee seurauksa Johdatus todeäkösyyslasketaa Kovergesskästteet

Lisätiedot

on tavanomainen yhden selittäjän lineaarinen regressiomalli, jossa jäännöstermit ε i toteuttavat seuraavat oletukset:

on tavanomainen yhden selittäjän lineaarinen regressiomalli, jossa jäännöstermit ε i toteuttavat seuraavat oletukset: Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset Mat-.03 Koesuuttelu ja tlastollset mallt 5. harjotukset / Ratkasut Aheet: Avasaat: Yhde selttäjä leaare regressomall Ylee leaare mall Artmeette keskarvo,

Lisätiedot

9. Jakojärjestelmät. Sisältö. Puhdas jakojärjestelmä. Yksinkertainen liikenneteoreettinen malli

9. Jakojärjestelmät. Sisältö. Puhdas jakojärjestelmä. Yksinkertainen liikenneteoreettinen malli lueto9.ppt S-38.45 Lkeeteora perusteet Kevät 5 Ykskertae lkeeteoreette mall Puhdas jakojärjestelmä Asakkata saapuu keskmäär opeudella asakasta per akayks. / keskmääräe asakkade välaka Asakkata palvellaa

Lisätiedot

10.5 Jaksolliset suoritukset

10.5 Jaksolliset suoritukset 4.5 Jaksollset suortukset Tarkastellaa tlaetta, jossa asakas tallettaa pakktllle tostuvast yhtäsuure rahasumma k aa korkojakso lopussa. Asakas suorttaa talletukse kertaa. Lasketaa tlllä oleva pääoma :e

Lisätiedot

9. Jakojärjestelmät. Sisältö. Puhdas jakojärjestelmä. Yksinkertainen liikenneteoreettinen malli

9. Jakojärjestelmät. Sisältö. Puhdas jakojärjestelmä. Yksinkertainen liikenneteoreettinen malli Ssältö Kertausta: ykskertae lkeeteoreette mall M/M/-PS asakasta palvelja asakaspakkaa M/M/-PS asakasta palveljaa asakaspakkaa Sovellus elastse datalketee malltamsee vuotasolla M/M//k/k-PS k asakasta palvelja

Lisätiedot

Mittausvirhe. Mittaustekniikan perusteet / luento 6. Mittausvirhe. Mittausepävarmuus ja siihen liittyvää terminologiaa

Mittausvirhe. Mittaustekniikan perusteet / luento 6. Mittausvirhe. Mittausepävarmuus ja siihen liittyvää terminologiaa Mttausteknkan perusteet / luento 6 Mttausepävarmuus ja shen lttyvää termnologaa Mttausepävarmuus = mttaustulokseen lttyvä parametr, joka kuvaa mttaussuureen arvojen odotettua vahtelua Mttauksn lttyvä kästtetä

Lisätiedot

1.4. Aritmeettisen keskiarvon otosjakauma: Suurten otosten tuloksia

1.4. Aritmeettisen keskiarvon otosjakauma: Suurten otosten tuloksia Tlastolle päättely. Otosjakaumat Tlastolle päättely. Otosjakaumat.. Otos, otostuusluvut ja de otosjakaumat Arvota, Havato, Havatoarvo, Otos, Otosjakauma, Otostuusluku, Rppumattomuus, Satuasmuuttuja, Satuasotos,

Lisätiedot

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman 4. Datan kästtel lht katsaus Havatsevan tähtteteen peruskurss I, luento 7..008 Thomas Hackman 4. Datan kästtel Ssältö Tähtteteellsten havantojen vrheet Korrelaato Funkton sovtus Akasarja-anals 4. Tähtteteellsten

Lisätiedot

Harjoituksen pituus: 90min 3.10 klo 10 12

Harjoituksen pituus: 90min 3.10 klo 10 12 Pallollse puolustae: Sokea ja ta käspallo/ Lppupallo Tavote: aalteo estäe sjottue puolustavalle puolelle, potku ta heto estäe, syöttäse estäe rstäe taklaus, pae tla vottase estäe sjottue puolustavalle

Lisätiedot

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4 TKK (c) lkka Melln (005) Koesuunnttelu TKK (c) lkka Melln (005) : Mtä opmme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Mten varanssanalyysssa tutktaan yhden tekän vakutusta vastemuuttujaan, kun

Lisätiedot

3. Datan käsittely lyhyt katsaus

3. Datan käsittely lyhyt katsaus 3. Datan kästtel lht katsaus Havatsevan tähtteteen peruskurss I, luento..0 Thomas Hackman HTTPK I, kevät 0, luento 3 3. Datan kästtel Ssältö Tähtteteellsten havantojen vrheet Korrelaato Funkton sovtus

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.4 Tlastollse aals perusteet, evät 7 8. lueto: Usea selttää leaare regressomall Usea selttää leaare regressomall Seltettävä muuttua havattue arvoe vahtelu halutaa selttää selttäve muuttue havattue

Lisätiedot

Monte Carlo -menetelmä

Monte Carlo -menetelmä Monte Carlo -menetelmä Helumn perustlan elektron-elektron vuorovakutuksen laskemnen parametrsodulla yrteaaltofunktolla. Menetelmän käyttökohde Monen elektronn systeemen elektronkorrelaato oteuttamnen mulla

Lisätiedot

FYSA220/2 (FYS222/2) VALON POLARISAATIO

FYSA220/2 (FYS222/2) VALON POLARISAATIO FYSA220/2 (FYS222/2) VALON POLARSAATO Työssä tutktaan valoaallon tulotason suuntasen ja stä vastaan kohtsuoran komponentn hejastumsta lasn pnnasta. Havannosta lasketaan Brewstern lan perusteella lasn tatekerron

Lisätiedot

Tchebycheff-menetelmä ja STEM

Tchebycheff-menetelmä ja STEM Tchebycheff-menetelmä ja STEM Optmontopn semnaar - Kevät 2000 / 1 1. Johdanto Tchebycheff- ja STEM-menetelmät ovat vuorovakuttesa menetelmä evät perustu arvofunkton käyttämseen pyrkvät shen, että vahtoehdot

Lisätiedot

Varianssianalyysi. Varianssianalyysi. Varianssianalyysi. Varianssianalyysi: Mitä opimme? Varianssianalyysi: Johdanto

Varianssianalyysi. Varianssianalyysi. Varianssianalyysi. Varianssianalyysi: Mitä opimme? Varianssianalyysi: Johdanto TKK (c Ila Mell (004 Varassaalyys Varassaalyys: Johdato Johdatus tlastoteteesee Varassaalyys TKK (c Ila Mell (004 Varassaalyys: Mtä opmme? Tarastelemme tässä luvussa seuraavaa ysymystä: Mte tavaomae ahde

Lisätiedot

Tilastolliset menetelmät: Otokset, otosjakaumat ja estimointi. 4. Otokset ja otosjakaumat 5. Estimointi 6. Estimointimenetelmät 7.

Tilastolliset menetelmät: Otokset, otosjakaumat ja estimointi. 4. Otokset ja otosjakaumat 5. Estimointi 6. Estimointimenetelmät 7. Tlastollset meetelmät Otokset, otosjakaumat ja estmot Tlastollset meetelmät: Otokset, otosjakaumat ja estmot 4. Otokset ja otosjakaumat 5. Estmot 6. Estmotmeetelmät 7. Välestmot Ilkka Mell 5 Tlastollset

Lisätiedot

Tilastollinen päättely. 3. Piste-estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Tilastollinen päättely. 3. Piste-estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet Mat-1.361 Tlastolle päättely 3. Pste-estmot Tlastolle päättely 3. Pste-estmot 3.1. Johdato Estmaattor, Estmaatt, Estmot, Havato, Havatopste, Otos, Otostuusluku, Parametr, Pste-estmot, Pstetodeäkösyysfukto,

Lisätiedot

Mittalaitteet. M. Kuisma, T. Torttila, J. Tyster. Elektroniikan laboratoriotyöt 1 - Mittalaitteet 1

Mittalaitteet. M. Kuisma, T. Torttila, J. Tyster. Elektroniikan laboratoriotyöt 1 - Mittalaitteet 1 Elektroka laboratorotyöt - Mttalatteet Mttalatteet M. Kusma, T. Torttla, J. Tyster Tvstelmä Laboratorotyössä tutustutaa sovelletu elektroka laboratoroo, laboratorossa olev mttalattes sekä laboratoro työsketelytapoh.

Lisätiedot

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu Mat-1.361 Tlastolle päättely 4. Hypoteese testaus Tlastolle päättely 4. Hypoteese testaus 4.1. Johdato Hylkäysalue, Hypotees, Hyväksymsalue, Krtte alue, Nollahypotees, Otos, Parametr, Parametravaruus,

Lisätiedot

5. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

5. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman 5. Datan kästtel lht katsaus Havatsevan tähtteteen peruskurss I, luento 7.4.006 Thomas Hackman 5. Datan kästtel Ssältö Tähtteteellsten havantojen vrheet Korrelaato Funkton sovtus Akasarja-anals 5. Tähtteteellsten

Lisätiedot

Mat Tilastollinen päättely 7. harjoitukset / Tehtävät. Hypoteesien testaus. Avainsanat:

Mat Tilastollinen päättely 7. harjoitukset / Tehtävät. Hypoteesien testaus. Avainsanat: Mat-.36 Tlastollnen päättely 7. harjotukset Mat-.36 Tlastollnen päättely 7. harjotukset / Tehtävät Aheet: Avansanat: ypoteesen testaus. lajn vrhe,. lajn vrhe, arhaton test, ylkäysalue, ylkäysvrhe, ypotees,

Lisätiedot

Puupintaisen sandwichkattoelementin. lujuuslaskelmat. Sisältö:

Puupintaisen sandwichkattoelementin. lujuuslaskelmat. Sisältö: Puupntasen sandwchkattoelementn lujuuslaskelmat. Ssältö: Sandwch kattoelementn rakenne ja omnasuudet Laatan laskennan kulku Tulosten vertalua FEM-malln ja analyyttsen malln välllä. Elementn rakenne Puupntasa

Lisätiedot

Satunnaismuuttujat ja todennäköisyysjakaumat

Satunnaismuuttujat ja todennäköisyysjakaumat Satuasmuuttujat ja todeäkösyysjakaumat Todeäkösyyslasketa: Satuasmuuttujat ja todeäkösyysjakaumat 9. Satuasmuuttujat ja todeäkösyysjakaumat 0. Kertymäfukto. Jakaume tuusluvut. Moulotteset satuasmuuttujat

Lisätiedot

Jakaumien tunnusluvut. Jakaumien tunnusluvut. Jakaumien tunnusluvut: Mitä opimme? 2/2. Jakaumien tunnusluvut: Mitä opimme? 1/2

Jakaumien tunnusluvut. Jakaumien tunnusluvut. Jakaumien tunnusluvut: Mitä opimme? 2/2. Jakaumien tunnusluvut: Mitä opimme? 1/2 TKK (c) Ila Mell (4) Jaaume tuusluvut Johdatus todeäösyyslasetaa Jaaume tuusluvut Marov ja Tshebyshev epäyhtälöt Momett Vous ja hupuuus Suurte luuje la TKK (c) Ila Mell (4) Jaaume tuusluvut: Mtä opmme?

Lisätiedot

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro Lsätehtävä 1. Erään yrtyksen satunnasest valttujen työntekjöden possaolopäven määrät olvat vuonna 003: 5, 3, 1, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4,, 1, 15, 4, 0,, 4, 3, 3, 8, 3, 9, 11, 19, 17, 14, 7 a)

Lisätiedot

3.5 Generoivat funktiot ja momentit

3.5 Generoivat funktiot ja momentit 3.5. Generovat funktot ja momentt 83 3.5 Generovat funktot ja momentt 3.5.1 Momentt Eräs tapa luonnehta satunnasmuuttujan jakaumaa, on laskea jakauman momentt. Ne määrtellään odotusarvon avulla. Määrtelmä

Lisätiedot

Työssä tutustutaan harmonisen mekaanisen värähdysliikkeen ominaisuuksiin seuraavissa

Työssä tutustutaan harmonisen mekaanisen värähdysliikkeen ominaisuuksiin seuraavissa URUN AMMAIKORKEAKOULU YÖOHJE (7) FYSIIKAN LABORAORIO V.2 2.2 38E. MEKAANISEN VÄRÄHELYN UKIMINEN. yön tavote 2. eoraa yössä tutustutaan harmonsen mekaansen värähdyslkkeen omnasuuksn seuraavssa tapauksssa:

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 2

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 2 Todeäkösyyslaskea ja tlastotetee peruskurss Esmerkkkokoelma Aheet: Satuasmuuttujat ja todeäkösyysjakaumat Kertymäfukto Jakaume tuusluvut Dskreettejä jakauma Jatkuva jakauma Avasaat: Bomjakauma Desl Dskreett

Lisätiedot

Moniulotteiset jakaumat ja havaintoaineistot

Moniulotteiset jakaumat ja havaintoaineistot Momuuttujameetelmät: Ilkka Mell. Moulotteset jakaumat.. Satuasmuuttujat ja todeäkösyysjakaumat.. Yhtesjakaumat.3. Reuajakaumat ja satuasmuuttuje rumattomuus.4. Ehdollset jakaumat.5. Yhtesjakaume tuusluvut.6.

Lisätiedot

Baltian Tie 2001 ratkaisuja

Baltian Tie 2001 ratkaisuja Balta Te 001 ratkasuja 1. Olkoot tehtävät T, = 1,,..., 8. Eräs mahdollsuus jakaa tehtävät kahdeksalle opskeljalle O j, j =1,,..., 8 o ohesessa taulukossa T 1 T T T 4 T T 6 T 7 T 8 O 1 O O O 4 O O 6 O 7

Lisätiedot

Mat /Mat Matematiikan peruskurssi C3/KP3-I Harjoitus 2, esimerkkiratkaisut

Mat /Mat Matematiikan peruskurssi C3/KP3-I Harjoitus 2, esimerkkiratkaisut Harjotus, esmerkkratkasut K 1. Olkoon f : C C, f(z) z z. Tutk, mssä pstessä f on dervotuva. Ratkasu 1. Jotta funkto on dervotuva, on sen erotusosamäärän f(z + ) f(z) raja-arvon 0 oltava olemassa ja ss

Lisätiedot

Uuden eläkelaitoslain vaikutus allokaatiovalintaan

Uuden eläkelaitoslain vaikutus allokaatiovalintaan TEKNILLINEN KORKEAKOULU Systeemanalyysn laboratoro Mat-2.108 Sovelletun matematkan erkostyö Uuden eläkelatoslan vakutus allokaatovalntaan Tmo Salmnen 58100V Espoo, 14. Toukokuuta 2007 Ssällysluettelo Johdanto...

Lisätiedot

Mat Koesuunnittelu ja tilastolliset mallit

Mat Koesuunnittelu ja tilastolliset mallit Mat-.03 Koeuuttelu tlatollet mallt. harjotuket Mat-.03 Koeuuttelu tlatollet mallt. harjotuket / Ratkaut Aheet: Avaaat: Tlatollte aetoje kuvaame Oto otokaumat Etmot Etmotmeetelmät Väletmot Artmeette kekarvo,

Lisätiedot

Hallin ilmiö. Laatija - Pasi Vähämartti. Vuosikurssi - IST4SE. Tekopäivä 2005-9-14 Palautuspäivä 2005-9-28

Hallin ilmiö. Laatija - Pasi Vähämartti. Vuosikurssi - IST4SE. Tekopäivä 2005-9-14 Palautuspäivä 2005-9-28 Jyväskylän Aattkorkeakoulu, IT-nsttuutt IIF00 Sovellettu fyskka, Syksy 005, 4.5 ETS Opettaja Pas epo alln lö Laatja - Pas Vähäartt Vuoskurss - IST4SE Tekopävä 005-9-4 Palautuspävä 005-9-8 8.9.005 /7 LABOATOIOTYÖ

Lisätiedot

Menetelmiä signaali/kohina-suhteen parantamiseksi. Vahvistinten epäideaalisuudet

Menetelmiä signaali/kohina-suhteen parantamiseksi. Vahvistinten epäideaalisuudet Mtlmä sgaal/koha-suht paratamsks Vahvstt pädaalsuudt Atur kohasovtus vahvstm Suodatus Chopprvahvstmt Lock- vahvst (Vahhrkkävahvst, PSD) Kskarvostus (Auto- ja rstkorrlaato) Ptr Kärhä 0/0/009 Luto 4: Mtlmä

Lisätiedot

3.3 Hajontaluvuista. MAB5: Tunnusluvut

3.3 Hajontaluvuista. MAB5: Tunnusluvut MAB5: Tunnusluvut 3.3 Hajontaluvusta Esmerkk 7 Seuraavat kolme kuvaa osottavat, että jakaumlla vo olla sama keskarvo ja stä huolmatta ne vovat olla avan erlaset. Kakken kolmen keskarvo on 78,0! Frekvenss

Lisätiedot

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu

Tilastollinen päättely. 4. Hypoteesien testaus Johdanto Testien konstruointi Testien vertailu Mat.36 Tlastolle päättely 4. Hypoteese testaus Tlastolle päättely 4. Hypoteese testaus 4.. Johdato Hylkäysalue, Hypotees, Hyväksymsalue, Krtte alue, Nollahypotees, Otos, Parametr, Parametravaruus, Perusjoukko,

Lisätiedot

Tilastolliset menetelmät: Lineaarinen regressioanalyysi

Tilastolliset menetelmät: Lineaarinen regressioanalyysi Tlastollset meetelmät Leaare regressoaals Tlastollset meetelmät: Leaare regressoaals 3. Tlastolle rppuvuus ja korrelaato 4. Johdatus regressoaals 5. Yhde selttäjä leaare regressomall 6. Ylee leaare mall

Lisätiedot

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä.

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä. MS-A0205/MS-A0206 Dfferentaal- ja ntegraallaskenta 2 Luento 7: Lagrangen kertojat. Penmmän nelösumman menetelmä. Jarmo Malnen Matematkan ja systeemanalyysn latos 1 Aalto-ylopsto Kevät 2016 1 Perustuu Antt

Lisätiedot

Terveytemme Termisanasto ja tilastolliset menetelmät

Terveytemme Termisanasto ja tilastolliset menetelmät Terveytemme Termsaasto a tlastollset meetelmät Termsaasto Tlastollset meetelmät Lädevtteet Termsaasto Elaaodote Estyvyys Ilmaatuvuus Iävaot Koortt Luottamusväl Mallvaot PYLL el potetaalsest meetetyt elvuodet

Lisätiedot

Mat-2.108 Sovelletun matematiikan erikoistyö. Sijoitussalkun optimointi Black-Litterman -mallilla

Mat-2.108 Sovelletun matematiikan erikoistyö. Sijoitussalkun optimointi Black-Litterman -mallilla Mat-2.8 Sovelletu matematka erkostyö Sjotussalku optmot Black-Ltterma -malllla Kar Vatae (4753V) 9.5.24 Ssällysluettelo Johdato...2 2 Sjotussalku optmot Markowtz malllla...3 2. Sjotussalku optmot...5 2.2

Lisätiedot

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt FYSP103 / 1 KAASUTUTKIUS Työn tavotteta havannollstaa deaalkaasun tlanyhtälöä oa, mten lman kosteus vakuttaa havattavn lmöhn ja mttaustuloksn kerrata mttausöytäkrjan ja työselostuksen laatmsta Luento-

Lisätiedot

Tilastollinen päättely. 3. Piste estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet

Tilastollinen päättely. 3. Piste estimointi Johdanto Estimointimenetelmät Estimaattoreiden ominaisuudet Mat.36 Tlastolle päättely 3. Pste estmot Tlastolle päättely 3. Pste estmot 3.. Johdato Estmaattor, Estmaatt, Estmot, Havato, Havatopste, Otos, Otostuusluku, Parametr, Pste estmot, Pstetodeäkösyysfukto,

Lisätiedot

Otantajakauman käyttö päättelyssä

Otantajakauman käyttö päättelyssä Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus

Lisätiedot

Aamukatsaus 13.02.2002

Aamukatsaus 13.02.2002 Indekst & korot New Yorkn päätöskursst, euroa Muutos-% Päätös Muutos-% Helsnk New York (NY/Hel) Dow Jones 9863.7-0.21% Noka 26.21 26.05-0.6% S&P 500 1107.5-0.40% Sonera 5.05 4.99-1.1% Nasdaq 1834.2-0.67%

Lisätiedot

TILASTOMATEMATIIKKA I

TILASTOMATEMATIIKKA I TILASTOMATEMATIIKKA I Srkku Parvae 1. JOHDANTO MIHIN TILASTOTIEDETTÄ TARVITAAN? suure havatomäärä (data) keräämsee, tetoje tvstämsee ja kuvaluu (deskrptvset meetelmät, data-aalyys) johtopäätöste tekemsee

Lisätiedot

KUNTIEN ELÄKEVAKUUTUS 30.10.2008 VARHAISELÄKEMENOPERUSTEISESSA MAKSUSSA 1.1.2009 LÄHTIEN NOUDATETTAVAT LASKUPERUSTEET

KUNTIEN ELÄKEVAKUUTUS 30.10.2008 VARHAISELÄKEMENOPERUSTEISESSA MAKSUSSA 1.1.2009 LÄHTIEN NOUDATETTAVAT LASKUPERUSTEET KUNTIN LÄKVKUUTU 328 VRHILÄKMNORUTI MKU 29 LÄHTIN NOUDTTTVT LKURUTT Valtuusuta ahstaa arhaseläemeoperustese masu eaode yhtesmäärä uodelle euromääräsest Tämä ahstettu masu o samalla lopullste masue yhtesmäärä

Lisätiedot

Satunnaismuuttujat ja todennäköisyysjakaumat

Satunnaismuuttujat ja todennäköisyysjakaumat Satuasmuuttujat ja todeäkösyysjakaumat Todeäkösyyslasketa: Satuasmuuttujat ja todeäkösyysjakaumat 9. Satuasmuuttujat ja todeäkösyysjakaumat 0. Kertymäfukto. Jakaume tuusluvut. Moulotteset satuasmuuttujat

Lisätiedot

1 0 2 x 1 a. x 1 2x c b 2a c a. Alimmalta riviltä nähdään että yhtälöyhmällä on ratkaisu jos ja vain jos b 3a + c = 0.

1 0 2 x 1 a. x 1 2x c b 2a c a. Alimmalta riviltä nähdään että yhtälöyhmällä on ratkaisu jos ja vain jos b 3a + c = 0. BM20A5800 - Funktot, lneaaralgebra, vektort Tentt, 26.0.206. (a) Krjota yhtälöryhmä x + 2x 3 = a 2x + x 2 + 5x 3 = b x x 2 + x 3 = c matrsmuodossa Ax = b ja ratkase x snä erkostapauksessa kun b = 0. Mllä

Lisätiedot

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat: Mat-.60 Sovellettu todeäkösyyslasketa B Mat-.60 Sovellettu todeäkösyyslasketa B / Ratkasut Aheet: Estmot Estmotmeetelmät Välestmot Avasaat: Artmeette keskarvo, Beroull-jakauma, Beroull-koe, Estmaatt, Estmaattor,

Lisätiedot

Segmentointimenetelmien käyttökelpoisuus

Segmentointimenetelmien käyttökelpoisuus Metsäteteen akakauskrja t e d o n a n t o Rasa Sell Segmentontmenetelmen käyttökelposuus ennakkokuvonnssa Rasa Sell Sell, R. 00. Segmentontmenetelmen käyttökelposuus ennakkokuvonnssa. Metsäteteen akakauskrja

Lisätiedot

TILASTOMATEMATIIKKA I

TILASTOMATEMATIIKKA I TILASTOMATEMATIIKKA I Srkku Parvae 1. JOHDANTO MIHIN TILASTOTIEDETTÄ TARVITAAN? suure havatomäärä (data) keräämsee, tetoje tvstämsee ja kuvaluu (deskrptvset meetelmät, data-aalyys) johtopäätöste tekemsee

Lisätiedot

HASSEN-WEILIN LAUSE. Kertausta

HASSEN-WEILIN LAUSE. Kertausta HASSEN-WEILIN LAUSE Kertausta Käytetään seuraava merkntjä F = F/F q on sukua g oleva funktokunta Z F (t = L F (t (1 t(1 qt on funktokunnan F/F q Z-funkto. α 1, α 2,..., α 2g ovat polynomn L F (t nollakohten

Lisätiedot

Tilastollisen fysiikan luennot

Tilastollisen fysiikan luennot Tlastollsen fyskan luennot Tvstelmät luvuttan I PERUSKÄSITTEITÄ JA MÄÄRITELMIÄ Lämpö on systeemen mkroskooppsten osen satunnasta lkettä Lämpöenerga vrtaa kuumemmasta kappaleesta kylmempään Jos kaks kappaletta

Lisätiedot

6. Stokastiset prosessit (2)

6. Stokastiset prosessit (2) Ssältö Markov-prosesst Syntymä-kuolema-prosesst luento6.ppt S-38.45 - Lkenneteoran perusteet - Kevät 6 Markov-prosess Esmerkk Tark. atkuva-akasta a dskreetttlasta stokaststa prosessa X(t) oko tla-avaruudella

Lisätiedot

ABTEKNILLINEN KORKEAKOULU

ABTEKNILLINEN KORKEAKOULU ABTEKNILLINEN KORKEAKOULU Tetoverkkolaboratoro 6. Stokastset prosesst () Luento6.ppt S-38.45 - Lkenneteoran perusteet - Kevät 5 6. Stokastset prosesst () Ssältö Markov-prosesst Syntymä-kuolema-prosesst

Lisätiedot

Mat Lineaarinen ohjelmointi

Mat Lineaarinen ohjelmointi Mat-.4 Lneaarnen ohelmont 8..7 Luento 6 Duaaltehtävä (kra 4.-4.4) S ysteemanalyysn Lneaarnen ohelmont - Syksy 7 / Luentorunko Motvont Duaaltehtävä Duaalteoreemat Hekko duaalsuus Vahva duaalsuus Täydentyvyysehdot

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Kuluttajahintojen muutokset

Kuluttajahintojen muutokset Kuluttajahntojen muutokset Samu Kurr, ekonomst, rahapoltkka- ja tutkmusosasto Tutkmuksen tausta ja tavotteet Tavaroden ja palveluden hnnat evät muutu jatkuvast, vaan ovat ana jossan määrn jäykkä lyhyellä

Lisätiedot

Mittaustulosten käsittely

Mittaustulosten käsittely Mttaustulosten kästtely Vrhettä ja epävarmuutta lmasevat kästteet Tostokoe ja satunnasten vrheden tlastollnen kästtely. Mttaustulosten jakaumaa kuvaavat tunnusluvut. Normaaljakauma 7. Tostokoe ja suurmman

Lisätiedot

7.5. Yleinen lineaarinen malli ja suurimman uskottavuuden menetelmä

7.5. Yleinen lineaarinen malli ja suurimman uskottavuuden menetelmä Mat.36 Tlastolle päättely 7. Suurmma uskottavuude meetelmä ja asymptootte teora Tlastolle päättely 7. Suurmma uskottavuude meetelmä ja asymptootte teora 7.. Suurmma uskottavuude estmotmeetelmä Akasarja,

Lisätiedot