Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007

Koko: px
Aloita esitys sivulta:

Download "Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007"

Transkriptio

1 EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET L2 kevät 2007 mittaaminen Biostatistiikan näkökulmasta Janne Pitkäniemi VTM, MSc (biometry) HY, Kansanterveystieteen laitos 1 Perusjoukon ja otoksen käsitteet Mitta-asteikot Sairauden vaara ja riski Otostunnusluvut Luottamusvälin käsite p-arvo 2 Lääketieteen sovelluksille erinomainen biometrian kooste löytyy prof. Sarnan kotisivuilta 3

2 Tilastollisten menetelmien käytöstä Valtaosassa (>80%) lääketieteellisiä tutkimuksia ja julkaisuita edellytetään nykyisin tilastollisten menetelmien käyttöä. Useimmissa arvostetuissa lehdissä (esim. BMJ ja Lancet) kiinnitetään erityistä huomiota tilastollisten menetelmien riittävälle ja oikealle käytölle. Kliinisissä kokeissa on erittäin tarkat normit tilastollisten menetelmien käytölle. 4 Tilasto-ohjelmistopaketteja SPSS ( SAS ( STATA ( SYSTAT STATISTICA S-PLUS R ( nquery ( 5 Tilastollinen päättely statistical inference Se on päättelymekanismi, jolla kerätyn otoksen/otosten (tutkimusaineiston) perusteella tutkittavasta asiasta pyritään tekemään johtopäätöksiä (päätelmiä) laajempaa perusjoukkoa (populaatiota) koskevaksi. Osa-alueet ovat arviointi (estimointi) ja hypoteesien testaaminen (testaus). 6

3 Kohdeperusjoukko Suomen väestö Otanta Otoksesta Laskettu Otossuure (otoskeskiarvo) Otosperusjoukko Otos Otoksen Suomalaiset henkilöt x Väestörekisterin suomenkansalaiset Perusjoukon Tuntematon suure Kolesteroli keskiarvo (TAI Suomen Reumapotilaat) (TAI Reumasäätiösairaalan potilaat) (TAI Otos reumasäätiön Potilaista) 7 Esimerkki tutkimuksen aloituksesta Oletetaan että olemme kiinnostuneet suomalaisten kolesterolin keskimääräisestä arvosta koko väestössä (merkitään µ) Satunnaismuuttuja on kolesteroli merk. X Koska kaikkia ei voi/kannata mitata => poimitaan 50 yksilön otos => (3.28,3.99,7.53,4.93,5.73,5.2,6.5,5.1,5.07,5.4,6.3,3.95,3.3,6.38, 4.8,5.06,4.21,4.88,5.42,4.59,4.59,5.7,4.62,5.16,2.78,2.71,6.36, 4.15,5.34,4.74,5.73,3.45,8.31,4.52,4.9,3.75,6.42,3.89,4.35,2.61,3.95,5.22,5.72,5.32,5.69,4.52,7,6.03,4.08,5.34) Havaittua muuttujan arvo: x 1 =3.28 mmol/l Jos poimittaisiin uusi otos saataisiin eri havaintoarvot => satunnaisuus 8 Avainsanoja Estimoinnilla estimation tarkoitetaan tutkittavan ilmiön kuvaamiseen käytetyn mallin tai jakauman sisältämien tuntemattomien suureiden, parametrien, arviointia otoksen/otosten perusteella. Parametri parameter on tuntematon suure, joka säätelee tutkittavan ilmiön kuvaamisessa käytettyä mallia, esim. jotain teoreettista jakaumaa. Arvioidaan tutkimusaineiston perusteella. (esim. ) piste-estimointia ( point estimation ) ja luottamusväliestimointia ( confidence interval estimation ) Piste-estimointi on tuntemattoman suureen, eli parametrin, (esim. jonkin taudin yleisyys) arviointi yhdellä lukuarvolla (estimaatilla), joka on laskettu havaintoaineistosta. Otossuure sample statistic on otoksen havaintoarvojen perusteella laskettu suure, havaintoarvojen funktio. Estimaattori sample statistic on otossuure, jolla tuntematonta parametria arvioidaan. (aritmeettinen keskiarvo, x ) estimaatti estimate on otoksen perusteella laskettu estimaattorin lukuarvo. (aritmeettinen otoskeskiarvo 4.97) 9

4 Harha bias Tilastolliseen tutkimukseen liittyvät harhat voidaan määritellä sellaisina tulkintoina ja toimenpiteinä missä tahansa tutkimusprosessin vaiheessa, jotka johtavat systemaattiseen poikkeamaan todellisuudesta. Harhasta voidaan myös käyttää nimitystä systemaattinen virhe ( systematic error ). Kriittisen tutkimuksen olennainen osa on harhamahdollisuuksien jatkuva arviointi tutkimuksen kaikissa vaiheissa. Tutkittavan muuttujan (esim. kolesteroli) mittaasteikko/tyyppi ratkaiseen analyyseissa valittavan tilastollisen mentelmän 10 Muuttujien tyypit Muuttuja on suure, jota käytetään havaintojen tekemiseen tai mittaamiseen. Päätyypit: epäjatkuvat ( discrete ) ja jatkuvat ( continuous ) Epäjatkuvat muuttujat voivat saada vain tiettyjä, määrättyjä arvoja, ja jatkuvat muuttujat voivat saada arvoalueensa sisältä mitä tahansa arvoja (mittaustarkkuuden puitteissa), esim. henkilön ikä. Epäjatkuvat muuttujat voidaan edelleen jakaa: luokkamuuttujiin ( categorical ) ja numeerisiin muuttujiin ( numerical ) edellisistä esimerkkinä ABO-veriryhmäjärjestelmä, ja jälkimmäisestä lukumäärät ( counts ). 11 Mitta-asteikot Välimatka-asteikko ( Interval scale ) Asteikko, missä minkä tahansa kahden numeerisen arvon erotuksella on kvantitatiivisesti sama merkitys missä tahansa kohdassa skaalaa. Esim. lämpötila. Suhdeasteikko ( Ratio scale ) Välimatka-asteikko, missä 0-arvo merkitsee ominaisuuden puuttumista. Absoluuttinen nollapiste Esim. alkoholin kulutus, pituus, paino. 12

5 Asteikot (jatkoa) Järjestysasteikko ( Ordinal scale ) Kolmi- tai useampiluokkainen asteikko, missä luokkien suhteellinen sijainti toisiinsa nähden muodostaa luonnollisen järjestyksen Esim. oireen voimakkuus: 0=ei oiretta, 1=lievä, 2=kohtalainen, 3=vaikea. (numerointi samansuuntainen muutoksen kanssa, mutta muuten mielivaltainen!), sotilasarvo Laatueroasteikko ( Nominal scale ) Kolmi- tai useampiluokkainen asteikko, missä luokkien välillä ei oleteta olevan mitään luonnollista järjestystä tutkittavassa asiayhteydessä Esim. siviilisääty, tautiluokitus. 13 Asteikot (jatkoa) Kaksiluokkainen asteikko ( Dichotomy ) On erikoistapaus järjestysasteikosta. Siinä on kaksi luokkaa, joiden järjestys keskenään on sopimuskysymys, esim. sukupuoli, taudin olemassaolo, jonkun asia tapahtuminen. Muunnokset: Monissa tilastollisissa malleissa välimatka- tai suhdeasteikollinen muuttuja joudutaan luokittelemaan järjestysasteikolliseksi, jotta mallin parametrien arviointi olisi mahdollista ja tulokset tulkittavissa. 14 Asteikot (jatkoa) Välimatka- tai suhdeasteikollista muuttujaa (esim. ikä) voidaan tilastollisissa malleissa käsitellä kuten laatueroasteikollista muuttujaa, kun halutaan esim. testata muuttujan mahdollisia ei-monotonisia yhteyksiä mallin muihin muuttujiin. Katkaisukohdilla ( cut-off points ) on suuri merkitys tulosten kannalta. Huono katkaisukohtien valinta voi peittää alleen tilastollisen yhteyden. Tiedot kannattaa kerätä mahdollisimman tarkasti, ja tilastokäsittelyssä niitä yhdistellä tutkimushypoteesin edellyttämällä tavalla 15

6 Aineiston esitarkastelu ( data screening ) Suoritetaan ennen varsinaisia analyysejä Poikkeavien havaintoarvojen etsintä Outlier Muista havaintoarvoista selvästi poikkeava arvo, joita biologisessa aineistossa esiintyy. Paitsi biologinen vaihtelu syynä voi myös olla mittaus- tai tallennusvirhe. Jakaumien muotojen tarkastelu Perusriippuvuuksien selvittely 16 Sairauksien mittaaminen Sairauksia voidaan mitata karkeilla tunnusluvuilla jotka kuvaavat kahta keskeistä sairauksiin liittyvää ilmiötä Uusien tapausten ilmaantumista väestöön tai sairaiden ihmisten osuutta väestössä Otetaan esimerkiksi seuraava kuuden hengen väestö otos 17 Vaara risk on tietyn tapahtuman todennäköisyys. Lasketaan kaavalla: vaara = (tapahtumien lukumäärä) / (vaaralle alttiina olevien lukumäärä) Ilmaantuvuus ( Rate ) on tietyn tapahtuman todennäköisyys pienellä aikavälillä Lasketaan kaavalla Rate = uusien tapausten määrä aikavälillä / aikavälin henkilöaikojen summa 18

7 Event Chart sairas terve Follow-up Time 19 Sairastumisvaara risk Esimerkistä laskettuna 3/6=0.5 eli 50% Estimoitu todennäköisyys sairastua tarkastelujaksolla HUOM! Oletetaan että sairastumistodennäköisyys on vakio eikä huomioida kuka on riskissä sairastua tietyllä ajanhetkellä 20 Ilmaantuvuus (insidenssi) Uusien tautitapausten määrä tietyllä aikavälillä sairastumiselle alttiina olevassa väestönosassa. Event Chart Lasketaan tapaukset Aikavälillä 2-4 yht. 3 ja henkilövuodet =6.5 eli Ilmaantuvuus: 3 tapausta / 6.5 =0.462 tapausta/ eletty vuosi Follow-up Time HUOM: Ilmaantuvuus muille väleille vaihtelee esim. 0-2 se olisi 0 sairas terve

8 Esiintyvyys (prevalenssi) Olemassa olevien sairaiden osuus perusväestöstä tiettynä ajankohtana Event Chart Lasketaan esiintyvyys Ajanhetkellä 3.5 tapausta seuranta-ajan hetkellä 3 jaettuna elossa olevien Lukumäärällä joka on 10 Siis 3/10=0.3 on siis taudin eli taudin esiintyvyys on 30 % ajanhetkellä sairas terve elossa Follow-up Time 22 Suhteellinen vaara (RR) relative risk, risk ratio Seurantatutkimusasetelmissa käytetty altisteen ja taudin välisen yhteyden mitta altistuneiden ja altistumattomien sairastumisvaaran suhde RR lasketaan kaavalla: RR = (vaara altistuneilla) / (vaara altistumattomilla) Vaaraa arvioidaan tavallisesti kumulatiivisella ilmaantuvuudella. Kumulatiinen ilmaatuvuus: seurannan aikana sairastuneet Altisteiden ja / sairauksien väestön määrä seurannan alussa 23 Oletetaan että henkilöt 1-3 (A) ovat altistuneita ja 4-6 altistumattomia (EA) Event Chart Altistuneet: 2/3 Altistumattomat: 1/3 Suhteellinen vaara 2 / 3 1/ sairas terve Follow-up Time 24

9 Vaarasuhde rate ratio, incidence ratio Lasketaan kahden ilmaantuvuusluvun suhteena (Altistuneet 1-3 ja altistumattomat 4-6) Ilmaantuvuus altistuneilla: 2/(3+6+3) pyrs = Ilmaantuvuus altistumattomilla: 1/( ) pyrs = Event Chart sairas terve Follow-up Time Vaarasuhde: 0.17/ Vaaratekijästä johtuva osuus (AF), attributable fraction Se suhteellinen osuus absoluuttisesta vaaraerosta(ard), joka johtuu jostakin tekijästä, esim. altisteesta. Määritellään: AF = (vaara1 -vaara2) / vaara2 = (RR - 1) / RR, missä vaara1 on vaara altistuneessa ryhmässä, vaara2 on altistumattomien vaara ja RR on suhteellinen riski. Esimerkissämme (2-1)/2=0.5 eli 50% 26 Vaaratekijästä johtuva osuus perusjoukossa (PAF), population attributable fraction Mittaa kuinka suuri vaikutus vaaratekijällä (tai altisteella) on tietyssä perusjoukossa ylimääräiseen sairastumisvaaraan. Se ei riipu pelkästään altisteen ja taudin välisestä yhteydestä vaan myös altisteen yleisyydestä kyseisessä perusjoukossa. Määritellään: PAF = (ilmaantuvuus perusjoukossa -ilmaantuvuus altistumattomilla)/ ilmaantuvuus perusjoukossa = p (RR - 1) / ( p (RR - 1) + 1), missä p on altisteen vallitsevuus ja RR on suhteellinen riski. Esimerkki: Altisteen vallitsevuus 50% ja RR=2.0 Tällöin 33% eli 33% tapauksista olisi selitettävissä ko.altisteella. 27

10 Keskiluvut Aritmeettinen keskiarvo Painotettu aritmeettinen keskiarvo Mediaani (50%:n piste) Moodi, yleisimmin esiintyvä arvo 28 Esimerkki 1: Lasketaan aritmeettinen otoskeskiarvo x mmol/ l 4.97mmol/ l 50 Tämä estimoi/arvioi otoksesta laskettuna, perusjoukon oikeaa ei-havaittua / tuntematonta perusjoukon kolesterolin keskiarvoa 29 Hajonnan mitat Numeerinen tapa kvantifioida tutkittavissa suureissa esiintyvää vaihtelua ( variability ) eli hajontaa ( dispersion ) Vaihteluväli Range, (x min, x max ) (2.61 ; 8.31) Prosenttipisteet (Q P% ) Percentiles Kvartiilipoikkeama (Q 75%, Q 25% ) Interquartile range (5.70 ; 4.17) Keskihajonta, Standardipoikkeama (SD) Standard deviation Variaatiokerroin (CV) Coefficient of variation Skaalasta riippumaton vaihtelun mitta; mittausvirheiden SD jaettuna keskiarvolla 30

11 Keskihajonta, standardipoikkeama, standard deviation Mitta, joka kuvaa tutkittavan muuttujan havaintoarvojen jakautumista tietyssä tutkimusaineistossa. Soveltuu parhaiten hajonnan mitaksi symmetrisille jakaumille. Herkkä poikkeaville havaintoarvoille ( outlier ). Laskentakaava: missä x SD 2 = varianssi 2 SD (x x) /(n 1) on aritmeettinen keskiarvo i 31 Lasketaan 50 suomalaisen kolesteroliarvojen otoskeskihajonta SD 2 2 ( ) ( ) ( ) mmol / l Keskihajonta mittaa suureen x hajontaa yksittäisessä tutkimusaineistossa, ts. kuinka paljon esim. potilaskohtaisissa havaintoarvoissa esiintyy vaihtelua Keskivirhe, standard error Mittaa tutkimusaineiston perusteella lasketun minkä tahansa otossuureen hajontaa (luotettavuutta), eli kuinka paljon suure voisi vaihdella, jos tutkimus toteutettaisiin toistuvasti samalla aineistokoolla ja tutkimusasetelmalla. Esim. Keskiarvon keskivirhe: SE( x) SD/ n 33

12 Lasketaan 5 suomalaisen otoksesta lasketun (otos)kolesterolikeskiarvon 1.19 SEM mmol/l 34 Luottamusväliestimointi Kaikille tärkeimmille tutkimustuloksille tulisi aina laskea luottamusvälit. Ne antavat käsityksen tulosten varmuudesta, ts. kuinka paljon ilmoitetut tulokset voisivat vaihdella otantavaihtelusta johtuen. Luottamusväli voidaan laskea mille tahansa otoksesta lasketulle otossuureelle (keskiarvo, prosenttiosuus jne.) 35 Laskentakaava Alaraja : ˆ z /2 SE( ˆ), Yläraja : ˆ z1 /2 1 SE( ˆ), Kaavassa on tarkasteltavan suureen piste-estimaatti, SE() sen keskivirhe ja z1- /2 standardin normaalijakauman (keskiarvo 0, hajonta 1) prosenttipiste, joka on 95% luottamusvälille 1.96 eli noin 2. on merkitsevyystaso - usein 5% eli olemme valmiit hyväksymään että keskimäärin 5 kertaa sadasta olemme väärässä sanoessamme että esim. todellinen kolesteroli keskiarvo on laskemallamme välillä 36

13 Keskiarvon luottamusväli Alaraja : x t (n 1) SD/ n, Yläraja : x t (n 1) SD/ 1 /2 1 /2 n Kaavassa t1- /2 (n-1) on Studentin t-jakauman prosenttipiste vapausastein n-1, x on aineistosta (x1, x2,, x n) laskettu aritmeettinen keskiarvo ja SD / sqrt(n) on keskiarvon keskivirheen arvio. 37 Lasketaan esimerkki aineiston otoskeskiarvon 95%:n Luottamusväli, perusjoukon tuntemattomalle koko suomalaisten Kolesteroli keskiarvolle: x 4.97 mmol/l ja SEM ( x) mmol/l kone laskee : t 1 /2 (n 1) alaraja : *0.17 yläraja : * % luottamusväli (4.63; 5.31) t 0.95 (50 1) Mitkä tekijät vaikuttavat luottamusväliin? Otoskoko n ja luottamustaso Ajatellaan esimerkkiämme kolesteroliarvoja koskevasta otoksestamme. Jos tietäisimme että todellinen suomalaisten kolesteroli keskiarvo olisi 5.0 mmol/l ja jos poimisimme suomalaisista 10 kappaletta 5 sekä 50 hengen otoksia ja laskisimme 95% ja 99% keskiarvon luottamusvälit tulokset voisivat näyttää seuraavilta. 39

14 95% luottamusväli otoskoko 5 95% luottamusväli otoskoko 50 otoksen numero kol (mmol/l) 99% luottamusväli otoskoko 5 otoksen numero otoksen numero kol (mmol/l) 99% luottamusväli otoskoko 50 otoksen numero kol (mmol/l) kol (mmol/l) 40 Klassisen tilastollisen testauksen vaiheet voidaan jaotella seuraavasti: 1. Muodostetaan hypoteesi (ennen otoksen poimintaa) 2. Poimitaan otos ja lasketaan tarvittavat otostunnusluvut (estimointi) 3. Lasketaan testisuureen arvo otoksen perusteella 4. Testisuureen jakauman perusteella lasketaan todennäköisyys sille, että olisi saatu poikkeavampi testisuureen arvo kuin kohdassa 3 laskettu (näin saadaan p-arvo) 5. Tehdään johtopäätös eli nollahypoteesi joko hylätään tai ei hylätä 41 p-arvon Hypoteesien Otoksen Testisuureen laskenta Johtopäätösen muodostamien poiminta laskenta tekeminen 42

15 Tilastolliseen päättelyyn liittyvät hypoteesit Nollahypoteesi (H 0 ), null hypothesis Ennalta määritelty perusväittämä, jonka hyväksymiseen tai kumoamiseen tutkimuksessa pyritään. Esim., että vertailtavien lääkehoitojen A ja B tehojen välillä ei ole eroa. Vaihtoehtoinen hypoteesi (H 1 ), alternative hypothesis Ennalta määritelty vaihtoehtoinen väittämä nollahypoteesille. Esim. lääkehoitojen teholla on eroa, mutta ei määritellä suuntaa (kaksisuuntainen hypoteesi) tai että hoito A on tehokkaampi kuin hoito B (yksisuuntainen hypoteesi). Tavallisimmin tutkimuksissa käytetään kaksisuuntaista hypoteesia. 43 Tilastolliseen päättelyyn liittyvät virheet alfa-virhe, -virhe, alpha error, type I error Todennäköisyys tehdä johtopäätös, että (esim. hoitojen välillä) on merkitsevää eroa, kun todellisuudessa ei kuitenkaan ole. eli hylätään nollahypoteesi vaikka se on tosi beeta-virhe, -virhe, beta error, type II error Todennäköisyys tehdä johtopäätös, että (esim. eri hoitojen välillä) ei ole eroa, kun sitä todellisuudessa on. eli ei hylätä nollahypoteesia vaikka pitäisi 44 Esimerkki 1 Oletetaan että olemme kiinnostuneet suomalaisten keskimääräisestä kolesteroliarvosta, jota emme kuitenkaan voi suoraan havaita. Noudatetaan edellä kuvattuja tilastollisen testauksen vaiheita: 1. Tutkija muotoilee seuraavat väittämät: H0 : perusjoukon kolesteroli keskiarvo on 5.5 mmol/l HA: perusjoukon kolesteroli keskiarvo on jotain muuta ja valitaan merkitsevyystasoksi 5% 2. Tehdään 50 hengen otos (3.28,,5.34) ja poimitun otoksen perusteella laskimme aikaisemmin seuraavat otossuureet 45

16 Esimerkki 1 3. Lasketaan havaittu testisuureen arvo poimimamme otoksen perusteella, yleensä tietokonetta ja valittua tilasto-ohjelmaa apuna käyttäen. Testisuureen laskentakaava saadaan tilastotieteellisestä kirjallisuudesta Meidän esimerkki tapauksessa se on muotoa ( x 0) t sd ( x) / n / Verrataan testisuureen teoreettiseen jakaumaan joka on tässä tapauksessa t-jakauma ja saadaan p-arvo= Tehdään johtopäätös: H0 hylätään (p-arvo<merkitsevyystaso), joten poimimamme otos ei ole perusjoukosta, jonka kolesteroli keskiarvo on 5.5 mmol/l. 46 t-jakauma 49 vapausastetta tiheysfunktio dt(x, 49) t(49) p-arvo=jakauman häntien pinta-ala laskettu t= laskettu t=3.143 pinta-ala pinta-ala t 47 Oikean testin valinta erittäin yksinkertaisessa tilateessa Riippumaton otos Parittainen otos N>30 ja normaalinen N<10 tai ei-normaalinen N>30 N<10 ja normaalinen tai ei-normaalinen Riippumattomien Otosten t-testi Wilcoxon-Mann- Whitney testi pariutettu t-testi Wilcoxon parittainen testi 48

17 Monivertailutestaustilanne Vertaillaan päälopputulosmuuttujan ohella useita muita lopputulosmuuttujia (jotka on valittu joko ad hoc tai post hoc), joiden testaamiseen ei voimalaskelmissa ole varauduttu Vertaillaan pareittain tuloksia useina ajankohtina tai samana ajankohtana useiden ryhmien välillä Tehdään osaryhmäanalyysejä Tehdään välianalyysejä Monivertailutestaustilanne kasvattaa -virheen mahdollisuutta ja siksi monivertailutesteissä ('multiple comparison test') suoritetaankin -virheen korjaus 49 Bonferroni-korjaus (Ref. Carlo Emilio Bonferroni, 1936 Teoria statistica delle classi e calcolo delle probabilita.) Bonferroni-korjaus on monivertailujen yhteydessä käytetty P-arvojen korjausmenettely, jonka tavoitteena on säilyttää alkuperäinen tilastollinen merkitsevyystaso ( -virhe) alun perin suunnitellun suuruisena monivertailuista huolimatta. Tavallisimmin käytetty taso on 0,05 (5 %). Bonferroni-korjauksella korjattu P-arvo saadaan kertomalla testin antama P-arvo vertailujen lukumäärällä. 50 Monivertailutyypit Suunnitellut vertailut planned/ad hoc comparisons Tutkimushypoteeseissa (protokollassa) etukäteen, ennen analyysejä, määritellyt vertailut Jälkikäteisvertailut post hoc comparisons Vertailut, jotka ryhmien välillä suoritetaan sen jälkeen, kun yleisvaikutus lopputuloksesta on todettu; esim. todetaan, että hoitoryhmien A, B ja C keskiarvojen välillä on eroa ja vertaillaan sen jälkeen ryhmiä pareittain keskenään. 51

18 Tilastollinen merkitsevyystaso Tilastolliseen päättelyyn liittyvä todennäköisyys ( -virhe, I-lajin virhe), joka ilmoittaa kuinka suuri erehtymisriski nollahypoteesin virheelliseen hylkäämiseen halutaan sallia. Tilastollinen merkitsevyys on välttämätön edellytys kliiniselle merkittävyydelle ( importance ), mutta ei kerro mitään todellisesta vaikutuksen suuruudesta. 52 P- arvo Havaintoaineiston ja käytetyn testisuureen otosjakauman perusteella laskettu todennäköisyys saada lopputulos, joka on vähintään yhtä epätodennäköinen (harvinainen) kuin tutkimuksessa todettu lopputulos edellyttäen, että todellisuudessa nollahypoteesi (H 0 ) olisi tosi. P-arvo liittyy ainoastaan H 0 :n testaamiseen, eikä kerro esimerkiksi hoitoerosta mitään, toisin kuin luottamusväli. 53

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Otoskoon arviointi. Tero Vahlberg

Otoskoon arviointi. Tero Vahlberg Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 2) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Hypoteesin testaus Alkeet

Hypoteesin testaus Alkeet Hypoteesin testaus Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Johdanto Kokeellinen tutkimus: Varmennetaan teoreettista olettamusta fysikaalisen systeemin käyttäytymisestä

Lisätiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa

Lisätiedot

1 TILASTOMENETELMIEN PERUSTEITA

1 TILASTOMENETELMIEN PERUSTEITA 1 TILASTOMENETELMIEN PERUSTEITA Insinööritieteissä suoritetaan usein erilaisia mittauksia tai kokeita, joiden tuloksena saadaan numeerisia havaintoaineistoja tutkittavasta ilmiöstä. Hyvinvointiteknologiassa

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Aineistokoko ja voima-analyysi

Aineistokoko ja voima-analyysi TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?

Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta? Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta? Matti Uhari Lääkärin ammatin harjoittaminen Akateeminen ei pelkkä suorittaja Asiantuntija potilaalle lääketieteellisestä tiedosta Biologinen/luonnontieteellinen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Keskivirheyksiköllä ilmaistuna voidaan erottaa otantajakaumalta kriittisiä kohtia: Keskimmäinen 95 % otoskeskiarvoista välillä [-1.96,+1.96] Keskimmäinen

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa Sisältö Kvantitatiivinen metodologia verkossa Perusteiden Kertaus Pekka Rantanen Helsingin yliopisto Tilastollinen analyysi Tilastotieteen tavoitteet Kvantitatiivisen tutkimuksen peruskäsitteitä Tilastollisten

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

Luottamusvälit. Normaalijakauma johnkin kohtaan

Luottamusvälit. Normaalijakauma johnkin kohtaan Luottamusvälit Normaalijakauma johnkin kohtaan Perusjoukko ja otanta Jos halutaan tutkia esimerkiksi Suomessa elävien naarashirvien painoa, se voidaan (periaatteessa) tehdä kahdella tavalla: 1. tutkimalla

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5 TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564. POIKKEAVAN HAVAINNON VAIKUTUS PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu 1.1 Noudattakoon satunnaismuuttuja X normaalijakaumaa a) b) c) d) N(5, 15). Tällöin P (1.4 < X 12.7) on likimain

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

Kliininen arviointi ja kliininen tieto mikä riittää?

Kliininen arviointi ja kliininen tieto mikä riittää? Kliininen arviointi ja kliininen tieto mikä riittää? Riittävä tutkimuksen otoskoko ja tulos Timo Partonen LT, psykiatrian dosentti, Helsingin yliopisto Ylilääkäri, Terveyden ja hyvinvoinnin laitos Tutkimuksen

Lisätiedot