Biostatistisen päättelyn salaisuudet ja sudenkuopat. Eliisa Löyttyniemi,

Koko: px
Aloita esitys sivulta:

Download "Biostatistisen päättelyn salaisuudet ja sudenkuopat. Eliisa Löyttyniemi,"

Transkriptio

1 Biostatistisen päättelyn salaisuudet ja sudenkuopat Eliisa Löyttyniemi,

2 Tilastollinen päättely kokeellisessa tutkimuksessa Haluamme TODISTAA ideamme tutkimuksessa ja se tehdään tilastollisen päättelyn avulla

3 Esimerkkejä Voiko liikunnan lisääminen estää lonkkamurtumia? Onko HIIT tehokkaampi kuin MIT? Muuttaako HIIT rasva-arvoja eri tavalla kuin MIT?

4 Mikä on yhteistä tutkimuksille? Halutaan todistaa jotakin Tämä tehdään matemaattisella mallilla = tilastollinen analyysi Täytyy tietää millä paremmuutta tms voidaan mitata esimerkiksi lonkkamurtuma, rasvaprosentti Täytyy selvittää, mikä muu voi vaikuttaa asiaan esimerkiksi lonkkamurtumissa ravinto, geeniperimä

5 Tutkimussuunnitelma Tutkimuksen tavoite tärkein kappale APPAC - Aims of the study and study hypothesis - 1. The aim of the study is to compare antibiotic therapy with placebo in the treatment of uncomplicated acute appendicitis to evaluate the role of antibiotic therapy in the resolution of acute uncomplicated appendicitis. 2. The study hypothesis is that antibiotic therapy is necessary in the treatment of acute uncomplicated and that antibiotic therapy is superior to spontaneous resolution (placebo) with the primary endpoint evaluated at ten days after the intervention. Right ventricular metabolic adaptations to high-intensity interval and moderateintensity continuous training in healthy middle-aged men The primary outcome of the study was to determine the effects of HIIT and MICT on RV (Right ventricle) metabolism (RVGU [insulin-stimulated RV glucose uptake] and RVFFAU [fasted state RV free fatty acid uptake]) using PET.

6 Tutkittavien muuttujien määrä Tutkimussuunnitelmassa pitäisi määritellä päämuuttujaa (primary outcome) ja pari-kolme sekundääri muuttujaa (secondary outcome) Jos tutkittavia muuttujia kymmeniä tai sadoittain ja ne kaikki analysoidaan (ja pahimmillaan raportoidaan vain merkitsevät), on valtava riski, että tulokset eivät ole totta!

7 Tutkimuksen tavoitteet muodostaa tilastollisen hypoteesin Osoittaa keskiarvojen ero tutkimuksen lopussa? Osoittaa muutosta tutkimuksen aikana? Osoittaa, onko muutos tutkimuksen aikana erilaista eri ryhmissä? Osoittaa, että muutos on samankaltaista eri ryhmissä? 7

8 Ennen tutkimusta - Otoskoko! Tutkimuksen päämuuttujan ja päätavoitteiden perusteella lasketaan ennen tutkimusta tarvittava otoskoko Yleensä tähdätään 80% tilastolliseen voimakkuuteen = meillä on 80% todennäköisyys löytää haluttu ero MIKÄLI ERO ON TOTTA Jos meillä numeerinen päämuuttuja, niin otoskokolaskentaan tarvitaan arvio tulevasta keskihajonnasta ja eron suuruudesta, joka halutaan havaita Kategorinen päämuuttuja tarvitsee aina moninkertaisen otoskoon numeeriseen muuttujaan verrattuna

9 Ennen tutkimusta - Randomisointi Satunnaistamisen hyvät periaatteet Toistettava Perusperiaate sama todennäköisyys kaikille! Lohkoissa Stratifiointi

10 Kerrataan tilastollisen päättelyn idea

11 Otos => Päätelmät populaatioon Tutkimuksissa käytännössä aina on otos Kuitenkin halutaan todistaa, että päätelmät voidaan yleistää kaikille eli koko populaatioon Määritellään populaatio Tehdään sisäänotto- ja poissulkukriteerien avulla

12 Kokeellisen tutkimuksen statistiikka Otos 1 Populaatio Otos 2 Päätelmien yleistys - Tunnusluvut - Data - Luottamusvälit -> Populaatio - Analyysit -> Populaatio Epävarmuus - riski, että päätelmät väärin - ero on totta, vaikka tutkimuksessa ei sitä havaita (tai sitä ei ole..) - ero ei ole totta, vaikka se nyt havaittiin

13 Tunnusluvuista tilastolliseen päättelyyn Keskiarvo ja keskihajonta ovat esimerkkejä tunnusluvuista, jotka kuvaavat sijaintia ja vaihtelua Ei kuitenkaan ole tilastollista päättelyä, jos saat ryhmälle A keskiarvon 125 ja ryhmälle B keskiarvo 135, ja sanot, että ryhmän B keskiarvo oli suurempi Tilastollisessa päättelyssä, joka tehdään keskiarvosta, otetaan huomioon samanaikaisesti havaitut keskiarvot, hajonnat ja otoksen suuruus.

14 Luottamusväli Jos halutaan tehdä päättelyä populaation keskiarvosta datan perusteella, lasketaan luottamusväli Populaatiokeskiarvon luottamusvälin laskuun vaikuttavat otoskoko, otoksen keskiarvo ja otoksen keskihajonta Jos saadaan keskiarvon 95% luottamusväliksi Voidaan sanoa, että havaitun datan perusteella, oikea keskiarvo on 95% todennäköisyydellä 123 ja 145 välillä Näin on päästy otoksesta populaatiotasolle

15 Data-analyysi esimerkki - miten todistaminen tehdään? Olkoon meillä tutkimus, jossa lumelääke ja oikea lääke Halutaan todistaa, että testattavalla lääkkeellä saadaan korkeampi hemoglobiinin keskiarvo

16 Koko data kuvassa

17 Kuvan perusteella jotain vaikutusta on, mutta riittääkö se todistamaan lääkkeen tehon? Tunnusluvut RYHMÄ N Keskiarvo Keskihajonta Median Min Max Luottamusvälin alaraja Luottamusvälin yläraja Placebo Treatment Tehdään testi ja todennäköisyys, että tällainen ero havaittaisiin otoksessa vain sattumalta, jos eroa ei ole populaatiotasolla on Voidaan päätellä, että lääke tehoaa keskimäärin

18 Tuloksen merkitys Jos on suuri otos (ja/tai pieni hajonta), niin tulee tilastollisesti merkitsevä tulos, vaikka tuloksella ei ole kliinistä merkitystä Pieni otos (tai suuri hajonta) voi aiheuttaa sen, että havaitulla erolla on kliininen merkitys, mutta sitä ei pystytä tilastollisesti todistamaan.

19 Tuloksen epävarmuus Tilastollisiin analyyseihin ja päätelmiin liittyy aina epävarmuus (95% luottamusväli 95% todennäköisyydellä toistettaessa 95% tapauksissa), p-arvo <0.05 tuloksella väitämme, että on ero, vaikka on pieni todennäköisyys, että eroa ei ole

20 Miten löydän sopivan metodin?

21 Sinun täytyy ymmärtää data rakenne ja sen ominaisuudet tilastoyksikkö mikä on riippumatonta ja mikä riippuvaa vasteen mitta-asteikko jakauma 21

22 Tilastolliset testit/mallit Testin valitaan vaikuttaa Millainen muuttuja on se, mitä tutkitaan (=vaste) Muuttujaan vaikuttavien tekijöiden määrä ja millaisia ne ovat Koeasetelma, datassa olevat riippuvuusrakenteet miten data on kerätty Tutkimushypoteesi

23 Study data Mikä on tutkimuksessa tilastoyksikkö? Subject/potilas/koehenkilö Vai Lihas, silmä, käsi, jalka... Huom: Mittauksia tehdään usein toistuvasti Mittaukset subjektin sisällä riippuvia Subjektit riippumattomia 23

24 Mitta-asteikot KATEGORISET NUMEERISET Nominaaliasteikko -väri -sukupuoli Frekvenssit ja % Järjestysasteikko -mielipide -kivun määrä Frekvenssit ja % Välimatka-ast. -lämpötila Suhteet ei järkeviä Abs. Asteikko -lukumäärä Suhdeasteikko -yleisin -verenpaine -labrat

25 Statistinen malli Vaste (response, dependent, output) = kiinnostuksen kohde Voi olla kategorinen tai numeerinen Tekijät (factors,explanatory, independent, input) = millä pyrit selittämään mitä vasteessa tapahtuu Voi olla kategorinen, numeerinen Yksi, monta. Jos monta, niiden välisiä yhteyksiä täytyy myös selvittää Hyvin oleellista kerätä mahdollisimman täydellisesti 25

26 Tekijä numeerisena vai kategorisena? Usein jatkuva tekijä (esimerkiksi liikunnan määrä) jaetaan 2-4 luokkaan (useimmiten mediaanin tai kvartiilien mukaan) Numeerisen käsittely on tehokkaampaa Mutta silloin tutkitaan esim lineaarista yhteyttä (tai muuta muotoa) Kategorioiden kanssa tulkinta helpompaa? Mutta jos luokittelu väärä, niin yhteyttä ei löydy Joka tutkimuksessa eri luokittelut, jos tehdään datan mukaan BMI on käytössä standardi-luokittelut

27 Vasteen mitta-asteikko Vasteen eli kiinnostuksen kohteena olevan muuttujan mitta-asteikko määrää sopivan analyysimetodin Vältä vasteen luokittelua analyysiä varten, mikäli numeerinen muuttuja Huom. Tarkista aina, että käyttämäsi ohjelmisto ymmärtää muuttujien mitta-asteikon oikein 27

28

29 Vaste (mitattu kerran) Vaste kaksiluokkainen => logistinen regression Vaste moniluokkainen => multinominaalinen regressio Vaste järjestysasteikollinen => ordinal regression Vaste lukumäärä => Poisson regressio Vaste numeerinen ja 1 kpl => esim varianssianalyysit (jos normaalijakauma)

30

31 2 riippumatonta ryhmää Numeerinen vaste (1 kpl) Normaalijakauma Ei normaalijakauma Samat varianssit Eri varianssit Muunnos Log, sqrt Kahden riippumattoman otoksen t-testi samavarianssisuusoletuksella Kahden riippumattoman otoksen t-testi erisuurilla variansseilla Muunnos ei auta Wilcoxon rank sum test

32 Useampi riippumatonta ryhmä Numeerinen vaste (1 kpl) Normaalijakauma Ei normaalijakauma p<0.05 Samat varianssit Yksisuuntainen ANOVA Monivertailut Eri varianssit Welch s test Muunnos Log, sqrt p<0.05 Monivertailut Muunnos ei auta Kruskal-Wallis test

33 Huom. Jos sinua kiinnostaa kahdennumeerisen muuttujan välinen yhteys, niin vaste/tekijä asetelmaa ei tarvita Pearson korrelaatio (linear association) Spearman korrelaatio (monotonic association) 33

34 Numeerinen vaste - Jakauma Sinun täytyy selvittää, noudattaako vasteesi likimain normaalijakaumaa Normaalijakaumaoletuksen ollessa voimassa Tuloksena tehokkaimmat analyysit Helppo tehdä monimutkaisia malleja Muista muunnosten mahdollisuus (log, neliöjuuri..) 34

35 Keskiarvo versus mediaani Histogrammi Akselit! Tutki jakaumaa ryhmissä Poikkeavat havainnot? Poikkeavat Normalisuus testaus 35

36 Histogrammin pylväiden leveys! 36

37 Yhden poikkeavan havainnon vaikutus 37

38 Neliöjuurimuunnoksen jälkeenkaunis normaalijakauma Myös poikkeavan havainnon kanssa ok 38

39 Vaste Mikä? Millainen muuttuja? Jakauma? Kategorinen: Nominaaliasteikko/kaksiluokkainen/moniluokkainen/järjestysasteikko Numeerinen: suhdeasteikko vai lukumäärä Time to -muuttuja? Monta aikapistettä? Mittaukset ovat riippuvia, se täytyy ottaa mallissa huomioon Monta vastetta? Esim mittauksia eri lihaksista, ovat myös hyvin korreloituneita Yksi mahdollisuus on mallintaa ne samassa mallissa

40 Tekijät Mitä tekijöitä mukaan malliin? Millaisia ne ovat? Kategorisia, onko tarvetta yhdistää luokkia? Numeerisia milloin luokitella? Onko kontrolliryhmää? Tekijät lähtötilanteessa Jos mitattu tutkimuksen aikana, analyysit monimutkaistuu Tekijöiden väliset yhteydet? Jos voimakasta korrelaatiota => valitse Tekijöiden määrä suhteessa datan määrään Mikä on oleellista? Yhdysvaikutukset?

41 Sudenkuopat

42 Yleisimmät virheet Riippuvuutta kahden tai useamman aikapisteen välillä ei ole huomioitu Tämä usein kyllä havaitaan ennen julkaisua Joskus analysoidaan vain tutkimuksen loppumittaus = tehotonta Oletuksia ei ole tarkistettu (joskus huomaa, että keskiarvo ja mediaani eroavat selkeästi, silti käytetty normaalisuuteen perustuvia testejä) Usein ei raportoida molempia, joten mahdoton tarkistaa Oletusten tarkastelua ei usein raportoida

43 Yleisimmät virheet Poikkeavat havainnot erityisesti pienissä datoissa Jos ei ole kuvia, poikkeavia ei pysty havaitsemaan Analysoidaan kymmeniä muuttujia Raportoidaan vain merkitsevät Vertailut monen ryhmän välillä Monivertailukorjauksia ei tehty Tai tehdään erillisiä kahden ryhmän t-testejä monta

44 Yleisimmät puutteet Analyysejä ei ole suunniteltu ennalta Julkaisussa ei mainita, onko analyysit suunniteltu kunnolla tutkimussuunnitelmassa tai analyysisuunnitelmassa vai ei

45 Yleisimmät puutteet YHDYSVAIKUTUKSEN ymmärryksen puute Selostetaan miesten ja naisten analyysit erikseen. Toisilla ero ja toisilla ei => päätellään, että miehet ja naiset ovat erilaisia TÄMÄ ON VIRHEELLINEN TAPA Oikea tapa: pidetään mallissa miehet ja naiset. Lisätään gender*group yhdysvaikutus malliin. Jos tämä termi merkitsevä, se on osoitus erilaisuudesta. Yhdysvaikutus usein heikompi testi, niiden havaitsemiseen tarvitaan suurempi otoskoko.

46 Analyysin jälkeen Tulosten järkevyys Mallin sopivuus, arviointi Jäännösten jakauma Poikkeavien havaintojen vaikutus

47 Vinkkejä raportointiin Käytä mean (sd), ei mean ± sd Käytä median (Q1-Q3), jos vino jakauma Käytä keskihajontaa, kun kuvailet dataa (Table 1.) Käytä luottamusvälejä (tai SE), kun kuvailet tuloksia, kun kuvailet keskiarvoa/mediaania

48 Vinkkejä raportointiin (starting from page 195), in Finnish content/uploads/2013/03/sampl-guidelines pdf,in English

49 Hyvä kirja raportointiin

50 Miten löytää sopiva analyysitapa? Analyysien valintojen apukeino SAS, SPSS-koodin pätkää ja apuja HYVÄ kirjan korvike AtMyPace Statistics (ipad ym)

51 Tai.. Etsi joukkoosi statistikko, jonka vastuulla on yhteistyössä tehdä Tutkimushypoteesi <-> statistiset hypoteesit Otokokolaskenta Satunnaistaminen Lomakkeiden suunnittelu/tarkistaminen Tietokantarakenteiden optimointi analyyseja varten Analyysien suunnittelu Analyysien suoritus & oletusten tarkastelu Analyysien tulkinta

52 Vaan miten analysoida dataa, jossa toistettuja mittauksia? Eliisa Löyttyniemi

53 Todella yleinen tilanne kliinisissä tutkimuksissa on että vasteena on numeerinen, jatkuva vaste, jota on mitattu useassa aikapisteessä. Siis samoilta tilastoyksiköiltä (subjekteilta) on mitattu samaa asiaa toistuvasti (=pitkittäisaineisto). Useimmiten kiinnostuksen kohteena on tutkia, tapahtuuko yli ajan tilastollisesti merkitsevää muutosta. Myös erittäin kiintoisana halutaan nähdä, onko muutos erilaista eri ryhmissä (interventio, sukupuoli tms)

54 Toistomittaus Useimmiten toistettujen mittausten analyysillä tarkoitetaan tutkimustilannetta, jossa useita mittauksia per henkilö yli ajan Aikapisteet voivat olla tasavälisiä tai aikapisteet voivat jakautua epätasaisesti Optimaalisinta/helpointa on sellainen tutkimus, jossa mitataan mittauksia samoissa aikapisteissä kaikilta subjekteilta (mutta muistakin selvitään) Mutta se voi olla myös: Molemmista käsistä/silmistä tehdään mittaukset Useammasta lihaksesta Luuntiheys useammasta eri kohdasta

55 Toistomittaus Useampi havainto samasta tilastoyksiköstä (ihminen, hiiri) aiheuttaa sen, että eri aikapisteissä mitatut vasteen arvot ovat korreloituneita, ne eivät siis ole riippumattomia

56 Toistomittaus VÄÄRIN tehtynä Eri aikapisteiden välinen riippuvuus, korrelaatio pitää ottaa huomioon analyyseissä, muuten analyysitulokset ovat vääriä! On siis TÄYSIN VÄÄRIN analysoida toistomittausdataa esim yksisuuntaisella varianssianalyysillä, jossa aika olisi tekijä. Tämä olettaisi eri aikapisteissä tehdyt mittaukset riippumattomiksi.

57 Toistomittaus VÄÄRIN tehtynä Toinen tyypillinen huono tapa on analysoida aikapisteet erikseen Jos aikapisteessä 1 ei ole ryhmien välillä tilastollisesti merkitsevää eroa ja aikapisteessä 2 on, niin siitä EI voi päätellä, että ryhmien välillä muutos olisi tilastollisesti merkitsevästi erilaista

58 Toistomittaus puutteellisesti tehtynä Verrataan ryhmiä vain lopputilanteessa Jätetään muut aikapisteet pois eli ei hyödynnetä koko data Kenties jätetään lähtötilanne huomiotta Saadaan tulokseksi, että yhdessä ryhmässä muutos on merkitsevö ja muissa ei ja tehdään päätelmä tai vihjataan, että tämän perusteella ryhmät ovat erilaisia Ei riitä, erilainen muutos ryhmien välillä todistetaan yhdysvaikutuksen avulla

59 Muita VANHOJA tapoja Ennen dataa yksinkertaistettiin, jotta päästiin riippuvuudesta eroon Laskettiin aikapisteiden keskiarvo ja analysoitiin sitä ryhmien välillä Tällä analysointi tavalla jää koko aikakäyrän muoto analysoimatta Laskettiin AUC (Area Under Curve) jokaiselle henkilölle ja analysoitiin se Tästä jää erilaiset aikakäyrän muodot havaitsematta, mutta voi olla hyväkin tiivistelmä datasta, erottaa hyvin tasoerot. Tosin AUC arvo ei tarkoita kliinisesti mitään ja kliinisesti merkittävän eroa on mahdoton arvioida

60 Puuttuva data Toistettujen mittausta data sisältää useimmiten puuttuvaa dataa Ne metodit, joita tänään käsitellään olettavat puuttuvan olevan missing at random tai missing completely at random Eli puuttuva arvo ei saisi korreloida arvoon joka puuttuu.. Esimerkiksi arvo ei saa puuttua sen takia, että subjektin sairaus on pahentunut ja puuttuva arvo olisi sen takia luultavasti koholla/matala Tai subjektit lopettaneet kokonaan tutkimuksen, kun heidän tilansa on pahentunut/parantunut niin paljon Emme tietenkään tiedä puuttuvista arvoista koskaan totuutta, mutta onko olettamus uskottava?

61 Puuttuva data Nykyisillä metodeilla voi analysoida dataa, jossa on satunnaista puuttuvaa (MAR, MCAR) vasteen arvoissa Vanha metodi, jossa korvattiin loput puuttuvat viimeisellä havaitulla arvolla (LOCF last observation carried forward) on siten turha Huomaa, että joidenkin mielestä termi repeated measures analysis of variance viittaa vanhoihin metodeihin, jossa subjektit, joilla on puuttuvaa dataa vasteen arvoissa, tiputettiin automaattisesti pois HUOM metodit eivät kestä sitä, että tekijän arvo puuttuu. Nämä henkilöt tiputetaan automaattisesti analyyseistä pois. Tämä on tärkeää huomioida analyysejä suunnitellessa.

62 Toistomittaus Nyt käsitellään metodia, josta käytetään esimerkiksi nimeä Hierechical linear mixed models Hierarkiset lineaariset sekamallit Hierarkinen = datassa voi olla hierarkisia rakenteita (esim toistoja periodin sisällä, tai subjekti pesiytynyt cross-over tutkimuksen jonoon) Lineaarinen = mallissa testaan vain lineaarisia tai polynomisia funktioita, ei siis epälineaarisia funktioita

63 Toistomittaus Sekamalli = mallissa voi olla sekä kiinteitä, että satunnaisia tekijöitä Kiinteä tekijä = analyysin johtopäätökset vedetään vain tekijässä havaittuihin arvoihin Esim lääkeannokset 50 mg ja 100 mg tutkimuksessa. EI tehdä mitään johtopäätöksiä miten 75 mg voisi vaikuttaa. Sukupuoli, veriryhmä, syövän vakavuusaste Satunnaistekijä = analyysin johtopäätökset vedetään tekijän koko jakaumaan Esim. tutkimuksessa on 6 tutkimuskeskusta. Näiden keskusten uskotaan kuuluvan kaikkien mahdollisten tutkimuskeskuksen populaatioon, joka muodostaa jakauman. Analyysistä tehtävät johtopäätökset halutaan yleistää kaikkiin maailman tutkimuskeskuksiin, eikä vain 6 tutkimuksessa olevaan.

64 Sekamallista vielä Yleisesti oletetaan subjektin olevan satunnaistekijä (tulokset halutaan yleistää kaikkia subjekteja vastaavaan populaatioon) Tämä siis olettaa, että subjektien tasoerot muodostavat normaalijakauman Mutta haluttaessa mallia voidaan vielä monimutkaistaa, eli laittaa malliin myös subjektille satunnaisen kulmakertoimen (random slope), jossa sallitaan kaikille subjekteille (tai haluttaessa centre slope) erilaiset muutokset Voidaan tutkia, onko tämä tarpeellista datassa Useissa tapauksissa ei tarvita slope-malleja

65 Toistomittaus - tekijät Useimmiten kategoriset tekijät käsitellään kiinteinä Satunnaistekijöinä subjekti (oletuksena) ja joskus keskus Malliin tulee sisältää kohtuullinen määrä tekijöitä (riippuen tietenkin datan määrästä, mutta harvoin yli 10) Kiinnitä huomiotasi siihen, että tekijät eivät korreloisi keskenään valtavasti (jos korreloi, et tarvitse kuin toisen malliin, koska kuvaavat samaa asiaa) Mieti tarkkaan, minkä muuttujien kanssa lisää vielä tekijän päävaikutuksen kanssa yhdysvaikutuksen ajan kanssa (onko muutos til merk erilainen miehillä kuin naisilla jne). Samat säännöt koskevat numeerisia tekijöitä eli kovariaatteja

66 Toistomittaus - korrelaatio Aikapisteiden välillä oleva korrelaatio täytyy ottaa mallissa huomioon Yksi tapa arvioida datassa olevaa korrelaatiorakennetta on aluksi tehdä korrelaatiomatriisi Tähän tarvitaan useimmiten datarakenteeksi sellainen data, jossa eri aikapisteet ovat eri sarakkeissa/muuttujissa

67 Toistomittaus - korrelaatio Korrelaatiomatriisista näet mitä korrelaatiolle tapahtuu, kun aikapisteiden välinen etäisyys kasvaa. Useimmiten A) korrelaatio on aika vakio aikapisteiden välillä = tasakorrelaatiorakenne (CS compound symmetry) B) korrelaatio pienenee mitä suuremmaksi aikaetäisyys tulee (AR autoregressio) C) ei ole oikein mitään rakennetta (UN unstructured) CS sopii ainakin datoihin, jossa muutokset ovat pieniä (luuntiheys)

68 Toistomittaus - korrelaatio Korrelaation (tai tarkalleen ottaen varianssi-kovarianssimatriisin) mallintaminen vaatii estimoitavia parametrejä. CS rakenne aina 2 AR rakenne v, missä v on aikapisteiden määrä UN rakenne v(v+1)/2, missä v on aikapisteiden määrä Ja koska meitä kiinnostaa enemmän keskiarvokäyrän estimointi, kuin korrelaatio, niin pyritään mahdollisimman yksinkertaiseen korrelaatiorakenteeseen (minkä data sallii). Varsinkin tilanteissa, jossa paljon aikapisteitä!

69 Korrelaatiorakenteiden vertailu oikeaoppisesti Verrataan monimutkaisempia rakenteita yksinkertaiseen (CS), lasketaan erotus -2RLL arvoille. Tämä noudattaa khin neliö- (chisquare) jakaumaa. Lasketaan sille p-arvo. Vapausasteen määräytyvät estimoitavien parametrien erotuksesta. Jotkut katsovat vain AIC lukua (smaller is better)

70 Toistomittaus Aika-tekijä Aika-tekijä voidaan käsitellä kategorisena tai numeerisena Kategorisena: voimme vertailla jokaista aikapistettä keskenään. Keskiarvokäyrän muoto voi olla minkälainen vain, miten siksak kuvioinen vain. Jokaisella aikapisteelle tulee estimaatti sovitetusta arvosta (LsMeans=Least Square Means), joista voi tehdä kliinistä tulkintaa Numeerisena: dataan sovitetaan lineaarinen suora (käyttäen datassa ilmaistuja numeroarvoja). Tällöin tulokseksi tulee siis yksi kulmakerroin. Nyt voidaan vain verrata kulmakertoimia esim ryhmien välillä koko tutkimuksen aikana, ei yksittäisiä aikapisteitä

71 Toistomittaus Aika tekijä Jokaisen aikapisteen estimointi vaatii taas enemmän voimaa (=vapausasteita), mutta tulkinta helppoa. Jos aikapisteitä todella paljon, dataa pitäisi olla paljon, muuten mallin ratkaisua ei pystytä estimoimaan Lineaarista suoraa voi laajentaa toisen asteen yhtälöllä, kolmannen asteen funktiolla jne jos tarkoituksenmukaista Valinta riippuu kliinisestä kysymyksestä Paljon sovitetaan myös ns spline funktioita, jotka mukailevat vielä enemmän dataa. Silloin tulkinta kenties haasteellista

72 Toistomittaus mallin valinta päävaikutukset VASTE = Sukupuoli + BMI + ryhma + aika + sukupuoli x aika + BMI x aika + ryhma x aika yhdysvaikutukset Yleensä ei lisätä enää sukupuoli x ryhma x aika yms yhdysvaikutuksia (voimattomia testejä ja haastavia tulkintoja, vaativat suuria datoja) Jos mallissa on yhdysvaikutus, niin silloin on pakko pitää molemmat päävaikutuksetkin Osa pudottaa ei-merkitseviä yhdysvaikutuksia pois mallista

73 Toistomittaus vinkkejä - eroavaisuuksia Analysoi originaaleja arvoja, ei prosenttimuutoksia Prosenttimuutoksilla usein isompi hajonta ja yhdysvaikutuksen tulkinta hankala (=muutoksen muutos eli vastaa kysymykseen kiihtyykö muutos) Osa analysoi vasteena muutoksen. Silloin yhdysvaikutuksessa sama kiihtyvyys tulkinta. Ohjeistuksen mukaan silloin baseline pitää olla mallissa kovariaattina Osa analysoi vasteena originaalit arvot aikapisteissä 1-x ja baseline (aikapiste 0) on mallissa kovariaattina. Tällöin on haastavaa saada selville, onko muutosta tapahtunut 0->1 ja onko se erilaista eri ryhmissä Kaikki nämä siis analysoivat samaa dataa, mutta tulkinta on erilaista!

74 Toistomittaus - vinkkejä Itse analysoin aina kaikki aikapisteet 0 - x time -muuttujassa. Yhdysvaikutuksen tulkinta selkeä: onko keskimääräinen muutos erilaista ryhmien välillä. Kontrasteilla saan selville, minkä aikapisteiden välillä ero on Myös ensimmäisen ja toisen mittauksen välillä Osa analysoi aikapisteet 1-x ja pitävät lähtötilannetta kovariaattina Vaikea saada 0-1 vertailua Joskus käyttökelpoinen, tällöin ryhmän päävaikutus kuvaa jo kokonaan intervention vaikutusta

75 Raportoinnista Normaalijakauman tarkistus (jäännöksistä). Normal distribution assumption was checked from studentized residuals. XX was analysed using hierachical linear mixed model where gender, time (fixed effects) and center (random) were factors in the model. Also, gender x time interaction was included in the model to examine whether mean change over time was different between male and females. Compound symmetry covariance structure was used for repeated measures. Data included some missing values but they were assumed to be completely at random.

76 Datan rakenne Kaikki ohjelmistot (JMP, SPSS, SAS) vaativat datarakenteen, jossa toistomittaukset ovat allekkain useammalla rivillä. Toisena muuttujana Aika, jolla määritellään aikapisteet. Tämä vaatii usein datan transponoinnin (=kääntämisen tähän muotoon). Huom. Jos käsittelevät aikapisteitä numeerisena (slope-malli), niin numeroilla (aikapisteiden etäisyyksillä) on todellakin väliä.

77 Esimerkki data Vasteena PTH (Parathormoni eli lisäkilpirauhashormoni) Tarvittiin logaritmimuunnos, jotta normaalistijakautunut Tutkimuksessa 60 henkilöä Kolme ryhmää, eri interventioita (A, B, C) Aikapisteet 0, 1 viikko, 12 viiikkoa Tutkimuskysymys: Eroaako ryhmien muutokset 0-12viikon aikana?

78 Datasta lasketut keskiarvot logaritmiasteikolla (A=sin, B=pun, C=vihr)

79 Tulokset (JMP UN-rakenne)

80

81

82 Residuaalin saa dataan uudeksi muuttujaksi

83 Fit Model- Save columns-residuals

84 SAS PROC MIXED DATA=opetus.toisto plots=residualpanel; WHERE substr(var_name, 1, 4)='pth' ; CLASS nro ryhma time; MODEL ln_col1= ryhma time ryhma*time/ddfm=kr; REPEATED time/subject=nro TYPE=CS; LSMEANS ryhma /CL DIFF ADJUST=TUKEY; LSMEANS ryhma*time/cl DIFF; LSMEANS time /CL DIFF;

85

86

87 SAS

88 SAS interaktioiden tulos!

89 SAS: exp(estimate) + exp(lower),exp(upper)

90 SAS: esim A-ryhmän 0->1w

91 SAS: time main effect contrast Mutta huomaa, että nyt time-efektin päävaikutusta ei ole kovin järkevää raportoida, kun ryhmien muutokset ovat erilaisia yli ajan

92 Raportointi The mean changes from baseline to 12 weeks were statistically significantly different between the treatment groups (p=0.016) whereas treatment group C differed from A and B between time points 0 and 1 week (C vs A p=0.0041, C vs B p=0.0047). Toki on mahdollista raportoida ensin koko ajan yhdysvaikutukset ryhmien välillä (A vs B, A vs C, B vs C) ja vasta sitten mennä yksittäisiin aikapisteisiin.

93 Summary Ottamalla huomioon samoista henkilöistä tehtävien mittausten välinen riippuvuus saadaan aikaiseksi voimakkaita testejä, koska subjektien sisäinen vaihtelu aina pienempää kuin subjektien välinen vaihtelu. Sen takia näihin tutkimuksiin tarvitaan huomattavasti pienempi otoskoko Monimutkaisissa otoskokolaskuissa voidaan myös optimoida aikapisteiden määrää ja etäisyyttä (jos korkea korrelaatio, aikapisteet tuottavat suhteellisen vähän lisäinformaatiota).

94 KIITOS KIITOS

95

96 JMP

97

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Tutkimuksen suunnittelu -tutkimusasetelmien valinta ja satunnaistaminen -statistiikan suunnittelu tutkimussuunnitelmassa. Eliisa Löyttyniemi, 2017

Tutkimuksen suunnittelu -tutkimusasetelmien valinta ja satunnaistaminen -statistiikan suunnittelu tutkimussuunnitelmassa. Eliisa Löyttyniemi, 2017 Tutkimuksen suunnittelu -tutkimusasetelmien valinta ja satunnaistaminen -statistiikan suunnittelu tutkimussuunnitelmassa Eliisa Löyttyniemi, 2017 Miksi satunnaistetaan? Jotta tutkimusryhmät olisivat mahdollisimman

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Otoskoon arviointi. Tero Vahlberg

Otoskoon arviointi. Tero Vahlberg Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 16.11.2017/1 MTTTP5, luento 16.11.2017 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla ~,, ~,,. 16.11.2017/2 Esim. Tutkittiin uuden menetelmän käyttökelpoisuutta

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

riippumattomia ja noudattavat samaa jakaumaa.

riippumattomia ja noudattavat samaa jakaumaa. 12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564. POIKKEAVAN HAVAINNON VAIKUTUS PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Puuttuvan tiedon ongelmat pitkittäistutkimuksissa

Puuttuvan tiedon ongelmat pitkittäistutkimuksissa 1/27 Puuttuvan tiedon ongelmat pitkittäistutkimuksissa Jaakko Nevalainen Tampereen yliopisto Sosiaalilääketieteen päivät 3.-4.11.2014 2/27 Sisältö 1 Johdanto ja peruskäsitteet 2 Mallintamiseen pohjautuvat

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas MUITA HAJONNAN TUNNUSLUKUJA Varianssi, variance (s 2, σ 2 ) Keskihajonnan neliö Käyttöä enemmän osana erilaisia menetelmiä (mm. varianssianalyysi),

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

Aineistokoko ja voima-analyysi

Aineistokoko ja voima-analyysi TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA JBI: Arviointikriteerit kvasikokeelliselle tutkimukselle 29.11.2018 Tätä tarkistuslistaa käytetään kvasikokeellisen tutkimuksen metodologisen laadun arviointiin ja tutkimuksen tuloksiin vaikuttavan harhan

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 LIITE 1 VIRHEEN ARVIOINNISTA Mihin tarvitset virheen arviointia? Mittaustulokset ovat aina todellisten luonnonvakioiden ja tutkimuskohdetta kuvaavien suureiden likiarvoja, vaikka mittauslaite olisi miten

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? 1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45. Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot