Biostatistisen päättelyn salaisuudet ja sudenkuopat. Eliisa Löyttyniemi,
|
|
- Riitta Lahti
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Biostatistisen päättelyn salaisuudet ja sudenkuopat Eliisa Löyttyniemi,
2 Tilastollinen päättely kokeellisessa tutkimuksessa Haluamme TODISTAA ideamme tutkimuksessa ja se tehdään tilastollisen päättelyn avulla
3 Esimerkkejä Voiko liikunnan lisääminen estää lonkkamurtumia? Onko HIIT tehokkaampi kuin MIT? Muuttaako HIIT rasva-arvoja eri tavalla kuin MIT?
4 Mikä on yhteistä tutkimuksille? Halutaan todistaa jotakin Tämä tehdään matemaattisella mallilla = tilastollinen analyysi Täytyy tietää millä paremmuutta tms voidaan mitata esimerkiksi lonkkamurtuma, rasvaprosentti Täytyy selvittää, mikä muu voi vaikuttaa asiaan esimerkiksi lonkkamurtumissa ravinto, geeniperimä
5 Tutkimussuunnitelma Tutkimuksen tavoite tärkein kappale APPAC - Aims of the study and study hypothesis - 1. The aim of the study is to compare antibiotic therapy with placebo in the treatment of uncomplicated acute appendicitis to evaluate the role of antibiotic therapy in the resolution of acute uncomplicated appendicitis. 2. The study hypothesis is that antibiotic therapy is necessary in the treatment of acute uncomplicated and that antibiotic therapy is superior to spontaneous resolution (placebo) with the primary endpoint evaluated at ten days after the intervention. Right ventricular metabolic adaptations to high-intensity interval and moderateintensity continuous training in healthy middle-aged men The primary outcome of the study was to determine the effects of HIIT and MICT on RV (Right ventricle) metabolism (RVGU [insulin-stimulated RV glucose uptake] and RVFFAU [fasted state RV free fatty acid uptake]) using PET.
6 Tutkittavien muuttujien määrä Tutkimussuunnitelmassa pitäisi määritellä päämuuttujaa (primary outcome) ja pari-kolme sekundääri muuttujaa (secondary outcome) Jos tutkittavia muuttujia kymmeniä tai sadoittain ja ne kaikki analysoidaan (ja pahimmillaan raportoidaan vain merkitsevät), on valtava riski, että tulokset eivät ole totta!
7 Tutkimuksen tavoitteet muodostaa tilastollisen hypoteesin Osoittaa keskiarvojen ero tutkimuksen lopussa? Osoittaa muutosta tutkimuksen aikana? Osoittaa, onko muutos tutkimuksen aikana erilaista eri ryhmissä? Osoittaa, että muutos on samankaltaista eri ryhmissä? 7
8 Ennen tutkimusta - Otoskoko! Tutkimuksen päämuuttujan ja päätavoitteiden perusteella lasketaan ennen tutkimusta tarvittava otoskoko Yleensä tähdätään 80% tilastolliseen voimakkuuteen = meillä on 80% todennäköisyys löytää haluttu ero MIKÄLI ERO ON TOTTA Jos meillä numeerinen päämuuttuja, niin otoskokolaskentaan tarvitaan arvio tulevasta keskihajonnasta ja eron suuruudesta, joka halutaan havaita Kategorinen päämuuttuja tarvitsee aina moninkertaisen otoskoon numeeriseen muuttujaan verrattuna
9 Ennen tutkimusta - Randomisointi Satunnaistamisen hyvät periaatteet Toistettava Perusperiaate sama todennäköisyys kaikille! Lohkoissa Stratifiointi
10 Kerrataan tilastollisen päättelyn idea
11 Otos => Päätelmät populaatioon Tutkimuksissa käytännössä aina on otos Kuitenkin halutaan todistaa, että päätelmät voidaan yleistää kaikille eli koko populaatioon Määritellään populaatio Tehdään sisäänotto- ja poissulkukriteerien avulla
12 Kokeellisen tutkimuksen statistiikka Otos 1 Populaatio Otos 2 Päätelmien yleistys - Tunnusluvut - Data - Luottamusvälit -> Populaatio - Analyysit -> Populaatio Epävarmuus - riski, että päätelmät väärin - ero on totta, vaikka tutkimuksessa ei sitä havaita (tai sitä ei ole..) - ero ei ole totta, vaikka se nyt havaittiin
13 Tunnusluvuista tilastolliseen päättelyyn Keskiarvo ja keskihajonta ovat esimerkkejä tunnusluvuista, jotka kuvaavat sijaintia ja vaihtelua Ei kuitenkaan ole tilastollista päättelyä, jos saat ryhmälle A keskiarvon 125 ja ryhmälle B keskiarvo 135, ja sanot, että ryhmän B keskiarvo oli suurempi Tilastollisessa päättelyssä, joka tehdään keskiarvosta, otetaan huomioon samanaikaisesti havaitut keskiarvot, hajonnat ja otoksen suuruus.
14 Luottamusväli Jos halutaan tehdä päättelyä populaation keskiarvosta datan perusteella, lasketaan luottamusväli Populaatiokeskiarvon luottamusvälin laskuun vaikuttavat otoskoko, otoksen keskiarvo ja otoksen keskihajonta Jos saadaan keskiarvon 95% luottamusväliksi Voidaan sanoa, että havaitun datan perusteella, oikea keskiarvo on 95% todennäköisyydellä 123 ja 145 välillä Näin on päästy otoksesta populaatiotasolle
15 Data-analyysi esimerkki - miten todistaminen tehdään? Olkoon meillä tutkimus, jossa lumelääke ja oikea lääke Halutaan todistaa, että testattavalla lääkkeellä saadaan korkeampi hemoglobiinin keskiarvo
16 Koko data kuvassa
17 Kuvan perusteella jotain vaikutusta on, mutta riittääkö se todistamaan lääkkeen tehon? Tunnusluvut RYHMÄ N Keskiarvo Keskihajonta Median Min Max Luottamusvälin alaraja Luottamusvälin yläraja Placebo Treatment Tehdään testi ja todennäköisyys, että tällainen ero havaittaisiin otoksessa vain sattumalta, jos eroa ei ole populaatiotasolla on Voidaan päätellä, että lääke tehoaa keskimäärin
18 Tuloksen merkitys Jos on suuri otos (ja/tai pieni hajonta), niin tulee tilastollisesti merkitsevä tulos, vaikka tuloksella ei ole kliinistä merkitystä Pieni otos (tai suuri hajonta) voi aiheuttaa sen, että havaitulla erolla on kliininen merkitys, mutta sitä ei pystytä tilastollisesti todistamaan.
19 Tuloksen epävarmuus Tilastollisiin analyyseihin ja päätelmiin liittyy aina epävarmuus (95% luottamusväli 95% todennäköisyydellä toistettaessa 95% tapauksissa), p-arvo <0.05 tuloksella väitämme, että on ero, vaikka on pieni todennäköisyys, että eroa ei ole
20 Miten löydän sopivan metodin?
21 Sinun täytyy ymmärtää data rakenne ja sen ominaisuudet tilastoyksikkö mikä on riippumatonta ja mikä riippuvaa vasteen mitta-asteikko jakauma 21
22 Tilastolliset testit/mallit Testin valitaan vaikuttaa Millainen muuttuja on se, mitä tutkitaan (=vaste) Muuttujaan vaikuttavien tekijöiden määrä ja millaisia ne ovat Koeasetelma, datassa olevat riippuvuusrakenteet miten data on kerätty Tutkimushypoteesi
23 Study data Mikä on tutkimuksessa tilastoyksikkö? Subject/potilas/koehenkilö Vai Lihas, silmä, käsi, jalka... Huom: Mittauksia tehdään usein toistuvasti Mittaukset subjektin sisällä riippuvia Subjektit riippumattomia 23
24 Mitta-asteikot KATEGORISET NUMEERISET Nominaaliasteikko -väri -sukupuoli Frekvenssit ja % Järjestysasteikko -mielipide -kivun määrä Frekvenssit ja % Välimatka-ast. -lämpötila Suhteet ei järkeviä Abs. Asteikko -lukumäärä Suhdeasteikko -yleisin -verenpaine -labrat
25 Statistinen malli Vaste (response, dependent, output) = kiinnostuksen kohde Voi olla kategorinen tai numeerinen Tekijät (factors,explanatory, independent, input) = millä pyrit selittämään mitä vasteessa tapahtuu Voi olla kategorinen, numeerinen Yksi, monta. Jos monta, niiden välisiä yhteyksiä täytyy myös selvittää Hyvin oleellista kerätä mahdollisimman täydellisesti 25
26 Tekijä numeerisena vai kategorisena? Usein jatkuva tekijä (esimerkiksi liikunnan määrä) jaetaan 2-4 luokkaan (useimmiten mediaanin tai kvartiilien mukaan) Numeerisen käsittely on tehokkaampaa Mutta silloin tutkitaan esim lineaarista yhteyttä (tai muuta muotoa) Kategorioiden kanssa tulkinta helpompaa? Mutta jos luokittelu väärä, niin yhteyttä ei löydy Joka tutkimuksessa eri luokittelut, jos tehdään datan mukaan BMI on käytössä standardi-luokittelut
27 Vasteen mitta-asteikko Vasteen eli kiinnostuksen kohteena olevan muuttujan mitta-asteikko määrää sopivan analyysimetodin Vältä vasteen luokittelua analyysiä varten, mikäli numeerinen muuttuja Huom. Tarkista aina, että käyttämäsi ohjelmisto ymmärtää muuttujien mitta-asteikon oikein 27
28
29 Vaste (mitattu kerran) Vaste kaksiluokkainen => logistinen regression Vaste moniluokkainen => multinominaalinen regressio Vaste järjestysasteikollinen => ordinal regression Vaste lukumäärä => Poisson regressio Vaste numeerinen ja 1 kpl => esim varianssianalyysit (jos normaalijakauma)
30
31 2 riippumatonta ryhmää Numeerinen vaste (1 kpl) Normaalijakauma Ei normaalijakauma Samat varianssit Eri varianssit Muunnos Log, sqrt Kahden riippumattoman otoksen t-testi samavarianssisuusoletuksella Kahden riippumattoman otoksen t-testi erisuurilla variansseilla Muunnos ei auta Wilcoxon rank sum test
32 Useampi riippumatonta ryhmä Numeerinen vaste (1 kpl) Normaalijakauma Ei normaalijakauma p<0.05 Samat varianssit Yksisuuntainen ANOVA Monivertailut Eri varianssit Welch s test Muunnos Log, sqrt p<0.05 Monivertailut Muunnos ei auta Kruskal-Wallis test
33 Huom. Jos sinua kiinnostaa kahdennumeerisen muuttujan välinen yhteys, niin vaste/tekijä asetelmaa ei tarvita Pearson korrelaatio (linear association) Spearman korrelaatio (monotonic association) 33
34 Numeerinen vaste - Jakauma Sinun täytyy selvittää, noudattaako vasteesi likimain normaalijakaumaa Normaalijakaumaoletuksen ollessa voimassa Tuloksena tehokkaimmat analyysit Helppo tehdä monimutkaisia malleja Muista muunnosten mahdollisuus (log, neliöjuuri..) 34
35 Keskiarvo versus mediaani Histogrammi Akselit! Tutki jakaumaa ryhmissä Poikkeavat havainnot? Poikkeavat Normalisuus testaus 35
36 Histogrammin pylväiden leveys! 36
37 Yhden poikkeavan havainnon vaikutus 37
38 Neliöjuurimuunnoksen jälkeenkaunis normaalijakauma Myös poikkeavan havainnon kanssa ok 38
39 Vaste Mikä? Millainen muuttuja? Jakauma? Kategorinen: Nominaaliasteikko/kaksiluokkainen/moniluokkainen/järjestysasteikko Numeerinen: suhdeasteikko vai lukumäärä Time to -muuttuja? Monta aikapistettä? Mittaukset ovat riippuvia, se täytyy ottaa mallissa huomioon Monta vastetta? Esim mittauksia eri lihaksista, ovat myös hyvin korreloituneita Yksi mahdollisuus on mallintaa ne samassa mallissa
40 Tekijät Mitä tekijöitä mukaan malliin? Millaisia ne ovat? Kategorisia, onko tarvetta yhdistää luokkia? Numeerisia milloin luokitella? Onko kontrolliryhmää? Tekijät lähtötilanteessa Jos mitattu tutkimuksen aikana, analyysit monimutkaistuu Tekijöiden väliset yhteydet? Jos voimakasta korrelaatiota => valitse Tekijöiden määrä suhteessa datan määrään Mikä on oleellista? Yhdysvaikutukset?
41 Sudenkuopat
42 Yleisimmät virheet Riippuvuutta kahden tai useamman aikapisteen välillä ei ole huomioitu Tämä usein kyllä havaitaan ennen julkaisua Joskus analysoidaan vain tutkimuksen loppumittaus = tehotonta Oletuksia ei ole tarkistettu (joskus huomaa, että keskiarvo ja mediaani eroavat selkeästi, silti käytetty normaalisuuteen perustuvia testejä) Usein ei raportoida molempia, joten mahdoton tarkistaa Oletusten tarkastelua ei usein raportoida
43 Yleisimmät virheet Poikkeavat havainnot erityisesti pienissä datoissa Jos ei ole kuvia, poikkeavia ei pysty havaitsemaan Analysoidaan kymmeniä muuttujia Raportoidaan vain merkitsevät Vertailut monen ryhmän välillä Monivertailukorjauksia ei tehty Tai tehdään erillisiä kahden ryhmän t-testejä monta
44 Yleisimmät puutteet Analyysejä ei ole suunniteltu ennalta Julkaisussa ei mainita, onko analyysit suunniteltu kunnolla tutkimussuunnitelmassa tai analyysisuunnitelmassa vai ei
45 Yleisimmät puutteet YHDYSVAIKUTUKSEN ymmärryksen puute Selostetaan miesten ja naisten analyysit erikseen. Toisilla ero ja toisilla ei => päätellään, että miehet ja naiset ovat erilaisia TÄMÄ ON VIRHEELLINEN TAPA Oikea tapa: pidetään mallissa miehet ja naiset. Lisätään gender*group yhdysvaikutus malliin. Jos tämä termi merkitsevä, se on osoitus erilaisuudesta. Yhdysvaikutus usein heikompi testi, niiden havaitsemiseen tarvitaan suurempi otoskoko.
46 Analyysin jälkeen Tulosten järkevyys Mallin sopivuus, arviointi Jäännösten jakauma Poikkeavien havaintojen vaikutus
47 Vinkkejä raportointiin Käytä mean (sd), ei mean ± sd Käytä median (Q1-Q3), jos vino jakauma Käytä keskihajontaa, kun kuvailet dataa (Table 1.) Käytä luottamusvälejä (tai SE), kun kuvailet tuloksia, kun kuvailet keskiarvoa/mediaania
48 Vinkkejä raportointiin (starting from page 195), in Finnish content/uploads/2013/03/sampl-guidelines pdf,in English
49 Hyvä kirja raportointiin
50 Miten löytää sopiva analyysitapa? Analyysien valintojen apukeino SAS, SPSS-koodin pätkää ja apuja HYVÄ kirjan korvike AtMyPace Statistics (ipad ym)
51 Tai.. Etsi joukkoosi statistikko, jonka vastuulla on yhteistyössä tehdä Tutkimushypoteesi <-> statistiset hypoteesit Otokokolaskenta Satunnaistaminen Lomakkeiden suunnittelu/tarkistaminen Tietokantarakenteiden optimointi analyyseja varten Analyysien suunnittelu Analyysien suoritus & oletusten tarkastelu Analyysien tulkinta
52 Vaan miten analysoida dataa, jossa toistettuja mittauksia? Eliisa Löyttyniemi
53 Todella yleinen tilanne kliinisissä tutkimuksissa on että vasteena on numeerinen, jatkuva vaste, jota on mitattu useassa aikapisteessä. Siis samoilta tilastoyksiköiltä (subjekteilta) on mitattu samaa asiaa toistuvasti (=pitkittäisaineisto). Useimmiten kiinnostuksen kohteena on tutkia, tapahtuuko yli ajan tilastollisesti merkitsevää muutosta. Myös erittäin kiintoisana halutaan nähdä, onko muutos erilaista eri ryhmissä (interventio, sukupuoli tms)
54 Toistomittaus Useimmiten toistettujen mittausten analyysillä tarkoitetaan tutkimustilannetta, jossa useita mittauksia per henkilö yli ajan Aikapisteet voivat olla tasavälisiä tai aikapisteet voivat jakautua epätasaisesti Optimaalisinta/helpointa on sellainen tutkimus, jossa mitataan mittauksia samoissa aikapisteissä kaikilta subjekteilta (mutta muistakin selvitään) Mutta se voi olla myös: Molemmista käsistä/silmistä tehdään mittaukset Useammasta lihaksesta Luuntiheys useammasta eri kohdasta
55 Toistomittaus Useampi havainto samasta tilastoyksiköstä (ihminen, hiiri) aiheuttaa sen, että eri aikapisteissä mitatut vasteen arvot ovat korreloituneita, ne eivät siis ole riippumattomia
56 Toistomittaus VÄÄRIN tehtynä Eri aikapisteiden välinen riippuvuus, korrelaatio pitää ottaa huomioon analyyseissä, muuten analyysitulokset ovat vääriä! On siis TÄYSIN VÄÄRIN analysoida toistomittausdataa esim yksisuuntaisella varianssianalyysillä, jossa aika olisi tekijä. Tämä olettaisi eri aikapisteissä tehdyt mittaukset riippumattomiksi.
57 Toistomittaus VÄÄRIN tehtynä Toinen tyypillinen huono tapa on analysoida aikapisteet erikseen Jos aikapisteessä 1 ei ole ryhmien välillä tilastollisesti merkitsevää eroa ja aikapisteessä 2 on, niin siitä EI voi päätellä, että ryhmien välillä muutos olisi tilastollisesti merkitsevästi erilaista
58 Toistomittaus puutteellisesti tehtynä Verrataan ryhmiä vain lopputilanteessa Jätetään muut aikapisteet pois eli ei hyödynnetä koko data Kenties jätetään lähtötilanne huomiotta Saadaan tulokseksi, että yhdessä ryhmässä muutos on merkitsevö ja muissa ei ja tehdään päätelmä tai vihjataan, että tämän perusteella ryhmät ovat erilaisia Ei riitä, erilainen muutos ryhmien välillä todistetaan yhdysvaikutuksen avulla
59 Muita VANHOJA tapoja Ennen dataa yksinkertaistettiin, jotta päästiin riippuvuudesta eroon Laskettiin aikapisteiden keskiarvo ja analysoitiin sitä ryhmien välillä Tällä analysointi tavalla jää koko aikakäyrän muoto analysoimatta Laskettiin AUC (Area Under Curve) jokaiselle henkilölle ja analysoitiin se Tästä jää erilaiset aikakäyrän muodot havaitsematta, mutta voi olla hyväkin tiivistelmä datasta, erottaa hyvin tasoerot. Tosin AUC arvo ei tarkoita kliinisesti mitään ja kliinisesti merkittävän eroa on mahdoton arvioida
60 Puuttuva data Toistettujen mittausta data sisältää useimmiten puuttuvaa dataa Ne metodit, joita tänään käsitellään olettavat puuttuvan olevan missing at random tai missing completely at random Eli puuttuva arvo ei saisi korreloida arvoon joka puuttuu.. Esimerkiksi arvo ei saa puuttua sen takia, että subjektin sairaus on pahentunut ja puuttuva arvo olisi sen takia luultavasti koholla/matala Tai subjektit lopettaneet kokonaan tutkimuksen, kun heidän tilansa on pahentunut/parantunut niin paljon Emme tietenkään tiedä puuttuvista arvoista koskaan totuutta, mutta onko olettamus uskottava?
61 Puuttuva data Nykyisillä metodeilla voi analysoida dataa, jossa on satunnaista puuttuvaa (MAR, MCAR) vasteen arvoissa Vanha metodi, jossa korvattiin loput puuttuvat viimeisellä havaitulla arvolla (LOCF last observation carried forward) on siten turha Huomaa, että joidenkin mielestä termi repeated measures analysis of variance viittaa vanhoihin metodeihin, jossa subjektit, joilla on puuttuvaa dataa vasteen arvoissa, tiputettiin automaattisesti pois HUOM metodit eivät kestä sitä, että tekijän arvo puuttuu. Nämä henkilöt tiputetaan automaattisesti analyyseistä pois. Tämä on tärkeää huomioida analyysejä suunnitellessa.
62 Toistomittaus Nyt käsitellään metodia, josta käytetään esimerkiksi nimeä Hierechical linear mixed models Hierarkiset lineaariset sekamallit Hierarkinen = datassa voi olla hierarkisia rakenteita (esim toistoja periodin sisällä, tai subjekti pesiytynyt cross-over tutkimuksen jonoon) Lineaarinen = mallissa testaan vain lineaarisia tai polynomisia funktioita, ei siis epälineaarisia funktioita
63 Toistomittaus Sekamalli = mallissa voi olla sekä kiinteitä, että satunnaisia tekijöitä Kiinteä tekijä = analyysin johtopäätökset vedetään vain tekijässä havaittuihin arvoihin Esim lääkeannokset 50 mg ja 100 mg tutkimuksessa. EI tehdä mitään johtopäätöksiä miten 75 mg voisi vaikuttaa. Sukupuoli, veriryhmä, syövän vakavuusaste Satunnaistekijä = analyysin johtopäätökset vedetään tekijän koko jakaumaan Esim. tutkimuksessa on 6 tutkimuskeskusta. Näiden keskusten uskotaan kuuluvan kaikkien mahdollisten tutkimuskeskuksen populaatioon, joka muodostaa jakauman. Analyysistä tehtävät johtopäätökset halutaan yleistää kaikkiin maailman tutkimuskeskuksiin, eikä vain 6 tutkimuksessa olevaan.
64 Sekamallista vielä Yleisesti oletetaan subjektin olevan satunnaistekijä (tulokset halutaan yleistää kaikkia subjekteja vastaavaan populaatioon) Tämä siis olettaa, että subjektien tasoerot muodostavat normaalijakauman Mutta haluttaessa mallia voidaan vielä monimutkaistaa, eli laittaa malliin myös subjektille satunnaisen kulmakertoimen (random slope), jossa sallitaan kaikille subjekteille (tai haluttaessa centre slope) erilaiset muutokset Voidaan tutkia, onko tämä tarpeellista datassa Useissa tapauksissa ei tarvita slope-malleja
65 Toistomittaus - tekijät Useimmiten kategoriset tekijät käsitellään kiinteinä Satunnaistekijöinä subjekti (oletuksena) ja joskus keskus Malliin tulee sisältää kohtuullinen määrä tekijöitä (riippuen tietenkin datan määrästä, mutta harvoin yli 10) Kiinnitä huomiotasi siihen, että tekijät eivät korreloisi keskenään valtavasti (jos korreloi, et tarvitse kuin toisen malliin, koska kuvaavat samaa asiaa) Mieti tarkkaan, minkä muuttujien kanssa lisää vielä tekijän päävaikutuksen kanssa yhdysvaikutuksen ajan kanssa (onko muutos til merk erilainen miehillä kuin naisilla jne). Samat säännöt koskevat numeerisia tekijöitä eli kovariaatteja
66 Toistomittaus - korrelaatio Aikapisteiden välillä oleva korrelaatio täytyy ottaa mallissa huomioon Yksi tapa arvioida datassa olevaa korrelaatiorakennetta on aluksi tehdä korrelaatiomatriisi Tähän tarvitaan useimmiten datarakenteeksi sellainen data, jossa eri aikapisteet ovat eri sarakkeissa/muuttujissa
67 Toistomittaus - korrelaatio Korrelaatiomatriisista näet mitä korrelaatiolle tapahtuu, kun aikapisteiden välinen etäisyys kasvaa. Useimmiten A) korrelaatio on aika vakio aikapisteiden välillä = tasakorrelaatiorakenne (CS compound symmetry) B) korrelaatio pienenee mitä suuremmaksi aikaetäisyys tulee (AR autoregressio) C) ei ole oikein mitään rakennetta (UN unstructured) CS sopii ainakin datoihin, jossa muutokset ovat pieniä (luuntiheys)
68 Toistomittaus - korrelaatio Korrelaation (tai tarkalleen ottaen varianssi-kovarianssimatriisin) mallintaminen vaatii estimoitavia parametrejä. CS rakenne aina 2 AR rakenne v, missä v on aikapisteiden määrä UN rakenne v(v+1)/2, missä v on aikapisteiden määrä Ja koska meitä kiinnostaa enemmän keskiarvokäyrän estimointi, kuin korrelaatio, niin pyritään mahdollisimman yksinkertaiseen korrelaatiorakenteeseen (minkä data sallii). Varsinkin tilanteissa, jossa paljon aikapisteitä!
69 Korrelaatiorakenteiden vertailu oikeaoppisesti Verrataan monimutkaisempia rakenteita yksinkertaiseen (CS), lasketaan erotus -2RLL arvoille. Tämä noudattaa khin neliö- (chisquare) jakaumaa. Lasketaan sille p-arvo. Vapausasteen määräytyvät estimoitavien parametrien erotuksesta. Jotkut katsovat vain AIC lukua (smaller is better)
70 Toistomittaus Aika-tekijä Aika-tekijä voidaan käsitellä kategorisena tai numeerisena Kategorisena: voimme vertailla jokaista aikapistettä keskenään. Keskiarvokäyrän muoto voi olla minkälainen vain, miten siksak kuvioinen vain. Jokaisella aikapisteelle tulee estimaatti sovitetusta arvosta (LsMeans=Least Square Means), joista voi tehdä kliinistä tulkintaa Numeerisena: dataan sovitetaan lineaarinen suora (käyttäen datassa ilmaistuja numeroarvoja). Tällöin tulokseksi tulee siis yksi kulmakerroin. Nyt voidaan vain verrata kulmakertoimia esim ryhmien välillä koko tutkimuksen aikana, ei yksittäisiä aikapisteitä
71 Toistomittaus Aika tekijä Jokaisen aikapisteen estimointi vaatii taas enemmän voimaa (=vapausasteita), mutta tulkinta helppoa. Jos aikapisteitä todella paljon, dataa pitäisi olla paljon, muuten mallin ratkaisua ei pystytä estimoimaan Lineaarista suoraa voi laajentaa toisen asteen yhtälöllä, kolmannen asteen funktiolla jne jos tarkoituksenmukaista Valinta riippuu kliinisestä kysymyksestä Paljon sovitetaan myös ns spline funktioita, jotka mukailevat vielä enemmän dataa. Silloin tulkinta kenties haasteellista
72 Toistomittaus mallin valinta päävaikutukset VASTE = Sukupuoli + BMI + ryhma + aika + sukupuoli x aika + BMI x aika + ryhma x aika yhdysvaikutukset Yleensä ei lisätä enää sukupuoli x ryhma x aika yms yhdysvaikutuksia (voimattomia testejä ja haastavia tulkintoja, vaativat suuria datoja) Jos mallissa on yhdysvaikutus, niin silloin on pakko pitää molemmat päävaikutuksetkin Osa pudottaa ei-merkitseviä yhdysvaikutuksia pois mallista
73 Toistomittaus vinkkejä - eroavaisuuksia Analysoi originaaleja arvoja, ei prosenttimuutoksia Prosenttimuutoksilla usein isompi hajonta ja yhdysvaikutuksen tulkinta hankala (=muutoksen muutos eli vastaa kysymykseen kiihtyykö muutos) Osa analysoi vasteena muutoksen. Silloin yhdysvaikutuksessa sama kiihtyvyys tulkinta. Ohjeistuksen mukaan silloin baseline pitää olla mallissa kovariaattina Osa analysoi vasteena originaalit arvot aikapisteissä 1-x ja baseline (aikapiste 0) on mallissa kovariaattina. Tällöin on haastavaa saada selville, onko muutosta tapahtunut 0->1 ja onko se erilaista eri ryhmissä Kaikki nämä siis analysoivat samaa dataa, mutta tulkinta on erilaista!
74 Toistomittaus - vinkkejä Itse analysoin aina kaikki aikapisteet 0 - x time -muuttujassa. Yhdysvaikutuksen tulkinta selkeä: onko keskimääräinen muutos erilaista ryhmien välillä. Kontrasteilla saan selville, minkä aikapisteiden välillä ero on Myös ensimmäisen ja toisen mittauksen välillä Osa analysoi aikapisteet 1-x ja pitävät lähtötilannetta kovariaattina Vaikea saada 0-1 vertailua Joskus käyttökelpoinen, tällöin ryhmän päävaikutus kuvaa jo kokonaan intervention vaikutusta
75 Raportoinnista Normaalijakauman tarkistus (jäännöksistä). Normal distribution assumption was checked from studentized residuals. XX was analysed using hierachical linear mixed model where gender, time (fixed effects) and center (random) were factors in the model. Also, gender x time interaction was included in the model to examine whether mean change over time was different between male and females. Compound symmetry covariance structure was used for repeated measures. Data included some missing values but they were assumed to be completely at random.
76 Datan rakenne Kaikki ohjelmistot (JMP, SPSS, SAS) vaativat datarakenteen, jossa toistomittaukset ovat allekkain useammalla rivillä. Toisena muuttujana Aika, jolla määritellään aikapisteet. Tämä vaatii usein datan transponoinnin (=kääntämisen tähän muotoon). Huom. Jos käsittelevät aikapisteitä numeerisena (slope-malli), niin numeroilla (aikapisteiden etäisyyksillä) on todellakin väliä.
77 Esimerkki data Vasteena PTH (Parathormoni eli lisäkilpirauhashormoni) Tarvittiin logaritmimuunnos, jotta normaalistijakautunut Tutkimuksessa 60 henkilöä Kolme ryhmää, eri interventioita (A, B, C) Aikapisteet 0, 1 viikko, 12 viiikkoa Tutkimuskysymys: Eroaako ryhmien muutokset 0-12viikon aikana?
78 Datasta lasketut keskiarvot logaritmiasteikolla (A=sin, B=pun, C=vihr)
79 Tulokset (JMP UN-rakenne)
80
81
82 Residuaalin saa dataan uudeksi muuttujaksi
83 Fit Model- Save columns-residuals
84 SAS PROC MIXED DATA=opetus.toisto plots=residualpanel; WHERE substr(var_name, 1, 4)='pth' ; CLASS nro ryhma time; MODEL ln_col1= ryhma time ryhma*time/ddfm=kr; REPEATED time/subject=nro TYPE=CS; LSMEANS ryhma /CL DIFF ADJUST=TUKEY; LSMEANS ryhma*time/cl DIFF; LSMEANS time /CL DIFF;
85
86
87 SAS
88 SAS interaktioiden tulos!
89 SAS: exp(estimate) + exp(lower),exp(upper)
90 SAS: esim A-ryhmän 0->1w
91 SAS: time main effect contrast Mutta huomaa, että nyt time-efektin päävaikutusta ei ole kovin järkevää raportoida, kun ryhmien muutokset ovat erilaisia yli ajan
92 Raportointi The mean changes from baseline to 12 weeks were statistically significantly different between the treatment groups (p=0.016) whereas treatment group C differed from A and B between time points 0 and 1 week (C vs A p=0.0041, C vs B p=0.0047). Toki on mahdollista raportoida ensin koko ajan yhdysvaikutukset ryhmien välillä (A vs B, A vs C, B vs C) ja vasta sitten mennä yksittäisiin aikapisteisiin.
93 Summary Ottamalla huomioon samoista henkilöistä tehtävien mittausten välinen riippuvuus saadaan aikaiseksi voimakkaita testejä, koska subjektien sisäinen vaihtelu aina pienempää kuin subjektien välinen vaihtelu. Sen takia näihin tutkimuksiin tarvitaan huomattavasti pienempi otoskoko Monimutkaisissa otoskokolaskuissa voidaan myös optimoida aikapisteiden määrää ja etäisyyttä (jos korkea korrelaatio, aikapisteet tuottavat suhteellisen vähän lisäinformaatiota).
94 KIITOS KIITOS
95
96 JMP
97
Matemaatikot ja tilastotieteilijät
Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
LisätiedotTutkimuksen suunnittelu -tutkimusasetelmien valinta ja satunnaistaminen -statistiikan suunnittelu tutkimussuunnitelmassa. Eliisa Löyttyniemi, 2017
Tutkimuksen suunnittelu -tutkimusasetelmien valinta ja satunnaistaminen -statistiikan suunnittelu tutkimussuunnitelmassa Eliisa Löyttyniemi, 2017 Miksi satunnaistetaan? Jotta tutkimusryhmät olisivat mahdollisimman
LisätiedotMitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto
Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotPienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto
Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
LisätiedotOtoskoon arviointi. Tero Vahlberg
Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
LisätiedotLuentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012
Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
LisätiedotKaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.
Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
LisätiedotMS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
LisätiedotKvantitatiiviset tutkimusmenetelmät maantieteessä
Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
Lisätiedot1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotSisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotTilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle
Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen
Lisätiedot/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla
16.11.2017/1 MTTTP5, luento 16.11.2017 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla ~,, ~,,. 16.11.2017/2 Esim. Tutkittiin uuden menetelmän käyttökelpoisuutta
LisätiedotAki Taanila VARIANSSIANALYYSI
Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy
LisätiedotMS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12
Lisätiedotriippumattomia ja noudattavat samaa jakaumaa.
12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotMTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
Lisätiedot/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla
17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotEstimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1
Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta
Lisätiedot1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564. POIKKEAVAN HAVAINNON VAIKUTUS PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla
LisätiedotTestit järjestysasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten
LisätiedotTilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit
Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli
LisätiedotEsim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4
18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan
LisätiedotJos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
LisätiedotJos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan
17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotPuuttuvan tiedon ongelmat pitkittäistutkimuksissa
1/27 Puuttuvan tiedon ongelmat pitkittäistutkimuksissa Jaakko Nevalainen Tampereen yliopisto Sosiaalilääketieteen päivät 3.-4.11.2014 2/27 Sisältö 1 Johdanto ja peruskäsitteet 2 Mallintamiseen pohjautuvat
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas MUITA HAJONNAN TUNNUSLUKUJA Varianssi, variance (s 2, σ 2 ) Keskihajonnan neliö Käyttöä enemmän osana erilaisia menetelmiä (mm. varianssianalyysi),
LisätiedotSisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotRISTIINTAULUKOINTI JA Χ 2 -TESTI
RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN
LisätiedotAineistokoko ja voima-analyysi
TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla
LisätiedotMetsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3
LisätiedotTil.yks. x y z
Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)
LisätiedotA130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala
Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien
LisätiedotKURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun
LisätiedotTekijä(t) Vuosi Nro. Arviointikriteeri K E? NA
JBI: Arviointikriteerit kvasikokeelliselle tutkimukselle 29.11.2018 Tätä tarkistuslistaa käytetään kvasikokeellisen tutkimuksen metodologisen laadun arviointiin ja tutkimuksen tuloksiin vaikuttavan harhan
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
Lisätiedot3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?
Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,
LisätiedotMONISTE 2 Kirjoittanut Elina Katainen
MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
LisätiedotSisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotLIITE 1 VIRHEEN ARVIOINNISTA
1 LIITE 1 VIRHEEN ARVIOINNISTA Mihin tarvitset virheen arviointia? Mittaustulokset ovat aina todellisten luonnonvakioiden ja tutkimuskohdetta kuvaavien suureiden likiarvoja, vaikka mittauslaite olisi miten
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotJakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?
1 Hydrobiologian tutkijaseminaari 20.3.2000 Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista? Jari Hänninen Turun yliopisto Saaristomeren
LisätiedotEstimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio
17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla
LisätiedotPylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.
Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien
LisätiedotSPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö
SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotParametrin estimointi ja bootstrap-otanta
Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista
Lisätiedot