TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas
LUENNOT KEVÄT 2015 Luento Paikka Vko Päivä Pvm Klo 1 Ag. Auditorio 1 7 Ma 9.2. 10:15-12:00 2 L 304 7 To 12.2. 12:15-14:00 3 L 304 8 Pe 20.2. 10:15-12:00 4 L 304 9 Ma 23.2. 10:15-12:00 5 L 304 9 Pe 27.2. 10:15-12:00 6 L 304 10 Ti 3.3. 08:15-10:00 7 L 304 10 To 5.3. 12:15-14:00 8 L 304 11 Ti 10.3. 12:15-14:00 9-10 L 304 11 Pe 13.3. 08:15-12:00
SUORITUS(PAKOLLISET) Luennon jälkeiset nettitestit Soveltavia tehtäviä Puolet vastauksista oikein Luennoille osallistuminen parantaa onnistumismahdollisuuksia Hyväksytty luentotentin suoritus Soveltavia tehtäviä 2-3 kpl (ks. verkkosivu) Tenttipäivät: 22.4. ja 18.5. Tulostetut luentodiatja luentomonisteen saa ottaa tenttiin mukaan Laskin (EI KÄNNYKKÄ tms., jolla on puhelin-tai verkkoyhteyksiä tenttisalin ulkopuolelle) Hyväksytty suoritus: vähintään HYVÄT TIEDOT Harjoitukset: osallistuminen vähintään neljälle harjoituskerralle kuudesta
HARJOITUKSET Harjoitusryhmien ajat ja paikat löytyvät Korpista Osallistuminen yhteen ryhmään Ryhmävaihtoja harjoituksen vetäjän suostumuksella Jos harjoitukset on suoritettu hyväksytysti aikaisemmin, ei niihin tarvitse osallistua uudestaan
KURSSIN INTERNET-SIVU http://users.jyu.fi/~tatima/ter/luennot15.htm Luentomoniste (ei jaeta kurssilla) Tiedotteet Linkit (mm. nettitesteihin) Kysymyksiä ja vastauksia Lisämateriaalia ja oheiskirjallisuutta Palautteet (nettitestit ja tentit)
Miksi menetelmiä opiskellaan? Lähde: http://opiskelijablogi.uta.fi/?tag=opiskelijaelama Motivaation tärkeys Lähde: http://collab0708.wikispaces.com/tiimi7_teema3
KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen empiirisen jakauman esittäminen Frekvenssijakauma Luokittelu Kuviot Tunnusluvut Kaksiulotteisen jakauman esittäminen ja riippuvuus Ristiintaulukko ja kuviot Riippuvuuden tunnusluvut Vähän todennäköisyydestä Otantajakauma Tilastollinen päätöksenteko Estimointi Hypoteesien testaus Perustestejä Keskiarvotestit, varianssianalyysit Riippuvuuden testit
Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli) Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1)Onko ryhmien keskiarvoissa eroa perusjoukossa? 2)Onko keskiarvoeroja itse arvioidun terveyden suhteen (hyvä / keskinkertainen / huono). Sari: Aineisto: Ryhmä naisia Kolme muuttujaa: Kehon painoindeksi (kg/m 2 ) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksi riippuvainen fyysisen aktiivisuuden määrästä ja / tai kävelynopeudesta? Elina: Aineisto: Ryhmä satunnaisesti valittuja viidesluokkalaisia kolmesta koulusta Kaksi muuttujaa: Ruokavalio (vähärasvainen, vähälaktoosinen, normaali) Itse arvioitu terveys (hyvä / keskinkertainen / huono). Tutkimuskysymys: Riippuuko oma arvio terveyden tilasta ruokavaliosta? Kurssin aikana tarkastellaan näitä kolmea tutkijaa ja pyritään löytämään keinoja tutkimuskysymysten analysointiin ja tulosten raportointiin.
KVANTITATIIVINEN TUTKIMUS Kvantitatiivisessa tutkimuksessa tarkastellaan teoreettista mallia(engl. model) suhteessa kerättyyn aineistoon Esim. malli: parempi motivaatio johtaa keskimäärin korkeampiin arvosanoihin Malli-pohjaista tutkimusajattelua voi yksinkertaistaa seuraavasti: Teoria Operationalistaminen Empiirisen aineiston keruu ja analysointi Tulkinta Tutkimuksen tarkoitus on selvittää, onko empiirinen aineisto johdonmukainen teorian kanssa Erotus: Havaittu odotettu Hypoteettis-deduktiivinen lähestymistapa
KVANTITATIIVINEN TUTKIMUS Mallin tarkoitus on yleistää tarkasteltavan ilmiön piirteitä niin, että keskitytään vain ilmiöön olennaisesti vaikuttaviin tekijöihin Usein joudutaan tekemään oletuksia siitä, mitkä ovat huomionarvoisia tekijöitä Tulosten suhteellisuus: tulokset eivät absoluuttisia totuuksia, ehdollisia teorian pätevyydelle ja oletusten voimassaololle Tutkimuskysymysten toistettu tutkinta Jos samaa tutkimuskysymystä tutkitaan eri tutkittavilla (saman perusjoukon eri otokset) ja saadaan saman suuntaisia tuloksia, teorian pätevyydestä saadaan parempaa osoitusta
Mitä malleja liittyy Markon tutkimukseen? Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli) Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1)Onko ryhmien keskiarvoissa eroa perusjoukossa? 2)Onko keskiarvoeroja itse arvioidun terveyden suhteen (hyvä / keskinkertainen / huono). Entä Sarin tutkimukseen? Sari: Aineisto: Ryhmä naisia Kolme muuttujaa: Kehon painoindeksi (kg/m 2 ) Fyysinen aktiivisuus (MET, energiankulutus suhteessa lepotilaan) Kävelynopeus (m/s) Tutkimuskysymys: Onko painoindeksi riippuvainen fyysisen aktiivisuuden määrästä ja / tai kävelynopeudesta?
KVANTITATIIVINEN TUTKIMUS Yleisesti kvantitatiivisen tarkastelun kohteena on selvittää, mikä aiheuttaa eroa (tai samanlaisuutta) tutkittavien välillä: hajonta Tarkastellaan yksilöitä osana ryhmiä; tulokset koskevat ryhmiä, eivät niinkään yksittäisiä tutkittavia Erotellaan systemaattisen vaihtelun osuus satunnaisesta Keskeistä: yksilöiden väliset erot systemaattisten vaikutusten takia vs. satunnaisen vaikutuksen takia Esim. systemaattinen ero kävelynopeudessa intervention takia + satunnainen ero (muut tekijät, mittausvirheet jne.) Luodaan teoreettinen malli siitä, mitkä vaikutukset aiheuttavat systemaattisia eroja tutkittavien kesken Esim. kävelynopeus yli 70-vuotiailla on keskimäärin korkeampi miehillä kuin naisilla.
Miten hajonta ilmenee Markon tutkimuksessa? Marko: Aineisto: Kaksi ryhmää (koe ja kontrolli) Kolme muuttujaa: Kävelynopeus (metri/sekunti) Polven ojennusvoima (Newton) Bergin tasapainotesti (summapistemäärä) Tutkimuskysymys: 1)Onko ryhmien keskiarvoissa eroa perusjoukossa? 2)Onko keskiarvoeroja itse arvioidun terveyden suhteen (hyvä / keskinkertainen / huono).
TILASTOLLISEN TUTKIMUKSEN KOHDE Millaisia ongelmia tilastollinen tutkimus tarkastelee? Tutkimuksen kohde on empiirinen, kvantitatiivinen ja toistuva Konkreettinen, aistein havaittava Numeeriseen tietoon liittyvä kohteesta saadaan mittalukuja, joita voidaan analysoida matemaattisesti Ilmiö koskettaa useampaa yksilöä (poikkileikkausasetelma) tai yhdestä yksilöstä voidaan tarkastella ilmiötä useammin kuin kerran (pitkittäisasetelma) Mikä on keskimääräinen tila? Onko kahden asian välillä riippuvuutta? Onko ryhmien välillä eroa?
TILASTOTIEDE Tavoitteena kehittää menetelmiä, joilla voidaan analysoida eritavoin kerättyjä aineistoja testataan teoreettisia hypoteeseja lasketaan arvioita erilaisten vaikutusten suuruuksista määrittää erilaisten tapausten todennäköisyyksiä tehdä johtopäätöksiä Käytetään useiden tieteiden aputieteenä (väestötiede, taloustiede, lääketiede, yhteiskuntatieteet, arkielämä: esim. vakuutustoiminta, urheilutilastot, gallupit) Tutkijan työväline tietoa tiivistävä raportointi usein tieteellisesti perusteltu johtopäätösten teko
KVANTITATIIVISTEN MENETELMIEN HYVÄT JA HUONOT PUOLET Hyvää Tutkittava ilmiö saadaan eksaktin käsitejärjestelmän puitteisiin Ilmiöön liittyvä malli voidaan yksinkertaistaa Huonoa Kaikki ilmiöt eivät ole mitattavissa Tieto yksilön erityispiirteistä häviää
ESIMERKKI PÄÄTTELYSTÄ KVANTITATIIVISESSA TUTKIMUKSESSA Herra X haluaa selvittää, voiko hän saapua arkipäivänä bussipysäkille 5 minuuttia myöhemmin? Hän tarkkailee viikon ajan bussin lähtöaikoja. Bussin lähtöajaksi on merkitty 8:00, ja Herra X havaitsee seuraavat lähtöajat Ma 8:02 Ti 8:04 Ke 8:03 To 8:09 Pe 8:03 Herra X muuntaa aineisto siten, että hän tarkastelee minuuttimäärää yli klo 8:00
ESIMERKKI Aineisto Ma 8:02 Ti 8:04 Ke 8:03 To 8:09 Pe 8:03 Keskimääräinen lähtöaika on 4.2 minuuttia (yli klo 8:00). Keskiarvoon vaikuttaa kuitenkin kovasti torstain poikkeuksellisen myöhäiseltä vaikuttava lähtöaika (8:09). (Täsmällisen) keskimääräisen lähtöajan perusteella herra X olisi siis myöhästynyt jokaisena aamuna, paitsi torstaina. Jos herra X ei halua myöhästyä bussista, hänen kannattaa keskiarvon sijasta tarkastella bussin aikaisinta lähtöaikaa (maanantain 2 minuuttia) ja mennä bussipysäkille ennen kuin kello on 8:02.
ESIMERKKI Herra X:n päätelmän käyttökelpoisuuteen vaikuttavat kuitenkin monet tekijät. Onko 2 minuuttia sittenkään varma päätös sille, ettei myöhästy bussista? Aineistossa yksikään havainto ei alita 2 min. Onko tämä vain sattumaa? Onko viikko tyypillinen? Ovatko tässä havaitut ajat poikkeuksellisen korkeita tai alhaisia? Onko lähtöaikojen vaihtelu todellisuudessa suurempaa? Ajaako linjaa sama kuljettaja vastaisuudessa? Aineisto Ma 8:02 Ti 8:04 Ke 8:03 To 8:09 Pe 8:03 Oliko herra X:n kello viisarikello vai digitaalikello ja miten hän pyöristi minuutit?
YLEISTÄMISEN ONGELMIA Yhden aineiston analyysin pohjalta voidaan tehdä tilastollisia johtopäätöksiä, kun käytetään tilastotieteen matemaattisia menetelmiä Ongelmia ilmenee siinä vaiheessa, kun tuloksia yleistetään kattamaan laajempaa joukkoa Mallin ja kerätyn aineiston välillä voi olla liian suuria eroja, jotka johtavat harhapäätelmiin Huonon tilastomenetelmän valinta Oletusten huomiotta jättäminen Objektiivisuus: aineiston keruussa keskeistä ottaa huomioon se, että tutkija ei saisi vaikuttaa siihen, millaisia mittaustuloksia saadaan (puolueettomuus, eettisyys)
YLEISTÄMISEN ONGELMIA Ongelmia voidaan havaita tilastollisen päättelyketjun eri vaiheissa Onko teoria riittävän yleinen, mutta ei silti liian yksinkertainen? Puuttuuko mallista jotain tärkeää? Oliko mittarit tai mitattavat valittu oikein? Oliko ominaisuutta mitattu oikealla mittarilla? Oliko ongelmia mittauksessa? Jos käytettiin useampia mittaajia, mittasivatko he samalla tavalla? Oliko ongelmia aineiston käsittelyssä? Tallennettiinko aineisto oikein tietokoneelle? Tulkittiinko tuloksia oikein? Liioiteltiinko vähäisen tuloksen merkitystä? Oliko johtopäätös oikeutettu suhteessa tarkasteltujen tutkittavien määrään? Useisiin näistä ongelmista liittyy subjektiivisuutta ja riippuvaisuutta tieteenalan käytännöistä
Eri maiden ravitsemussuositukset ovat ristiriidassa HYVINVOINTI31.10.2013 Helsingin Sanomat Rajoita perunan syömistä ja vältä rypsiöljyä, neuvotaan Kreikassa. Suomessa taas peruna on klassikko ja rypsiöljy suositeltua. Eri maiden suositusten erot ovat synnyttäneet runsaasti salaliittoteorioita. Perunoita ei pitäisi syödä useammin kuin kolmesti viikossa, koska perunan syömisen on todettu lisäävän tyypin 2 diabeteksen riskiä. Ruuanlaitossa kannattaa käyttää aina mieluummin oliiviöljyä kuin esimerkiksi rypsiöljyä, jossa on runsaasti monityydyttymättömiä rasvahappoja. Niiden on nimittäin tutkimuksissa havaittu aiheuttavan syöpää eläimille, jopa ihmisille. Oliiviöljynpuolestaan on todettu ehkäisevän muun muassa rintasyöpää. Sen käyttöä ei olekaan syytä rajoittaa, jos painoindeksi on alle 25. Alkoholin kohtuullinen käyttö, etenkin punaviinin juominen, ehkäisee sydän-ja verisuonitauteja. Siksi on terveydelle hyväksi juoda viiniä aterialla. Naisille terveellinen päiväannos on puolitoista pientä lasillista, miehille kolme lasillista. Edellä mainitut ohjeet on poimittu Kreikan terveysministeriön ravitsemussuosituksista. Suositukset perustuvat tutkimustietoon. Niin perustuvat suomalaisetkin. Silti suosituksissa on ristiriitaisia ohjeita. Suomalaisenmittapuun mukaan kreikkalaisten terveellisenä pitämä viinin päiväannos hipoo jo riskirajoja. Meikäläisessä lautasmallissa peruna on klassikko. Ohjeiden mukaan se on suositeltava: siitä saadaan kasvisten, marjojen ja hedelmien tapaan hiilihydraatteja ja ravintokuituja, mutta vain vähän energiaa, vähemmän kuin esimerkiksi riisistä tai pastasta. Suomalaisten suositusten mukaan rasvojen, myös terveellisten öljyjen, määrä on syytä pitää kohtuullisena. Monityydyttymättömät rasvahapot ovat välttämättömiä, ja niiden tärkeimmät lähteet ovat rypsiöljy ja kasvirasvalevitteet. Ote: http://www.hs.fi/terveys/a1383131766408#
Ravitsemussuositukset on ymmärretty väärin KOTIMAA 1.2.2014 Helsingin Sanomat Koko väestöä koskevat tavoitteet ovat tärkeimpiä, eikä suositusten päätarkoituksena ole antaa ohjeita yksittäisten ihmisten valintoihin. Uudet suomalaiset ravitsemussuositukset julkistettiin viime viikolla. Sen jälkeen käydyn vilkkaan keskustelun perusteella vaikuttaa siltä, että moni suositusten kohta on ymmärretty väärin. Valtion ravitsemusneuvottelukunnan asiantuntijoiden laatimat ravitsemussuositukset perustuvat viime syksynä julkaistuihin pohjoismaisiin ravitsemussuosituksiin. : Monet ovat ihmetelleet ja arvostelleet sitä, etteivät suositukset ota huomioon ravintoaineiden tarpeen tai makumieltymysten yksilöllisiä eroja. Eri ravintoaineita koskevat ravitsemussuositukset perustuvat kymmeniin tai jopa satoihin tutkimuksiin. Yksilöllinen vaihtelu vaikuttaa tietenkin tutkimusten tuloksiin. Ravitsemussuosituksetkertovat todennäköisyyksistä eli siitä, että syömällä suositusten mukaisesti hyvän terveyden todennäköisyys on suurempi kuin suosituksista huomattavasti poikkeavaa ruokavaliota noudattamalla. Suosituksissa ei väitetä, ettei joku voisi pysyä terveenä toisenlaisillakin ruokatottumuksilla. Jotkut tupakoijatkin elävät terveinä, eikä tämä todista tupakan terveyshaittoja yleisesti vääriksi. Ravitsemussuositukset ilmaisevat ensisijaisesti koko väestöä koskevia tavoitteita, eikä niiden päätavoitteena ole yksittäisten ihmisten valintojen ohjaaminen. Väestöllä tarkoitetaan koko maan asukkaiden ohella myös väestöryhmiä, kuten vanhuksia tai koululaisia. Tarkoituksena on, että suositusten vaikutuksia seurataan ja että suositukset ohjaavat terveyspoliittista päätöksentekoa. Seurantaan osallistuu myös Terveyden ja hyvinvoinnin laitos (THL). : Ote: http://www.hs.fi/kotimaa/a1391158441538
Keventäjät Istuminen tappaa Moni asia on vaarallista. Tupakoida ei saa, eikä juoda liikaa viinaa. Kova rasva tukkii sepelvaltimot. Lihavuus on terveysriski. Nyt tiedetään lisäksi, että istuminenkin tappaa. Istuminen vaatii vastapainoksi paljon liikuntaa. Liikunnan harrastaja tietää, että kuntoilu tekee hyvää sydämelle, terveydelle, mielelle. Parhaassa tapauksessa rasva palaa, paino laskee, mutta lihakset kasvavat. Voi kuitenkin olla, että modernin maailman pienimuotoinen liikunnan harrastelu ei riitä, kun muuten istumme lähes koko päivän. Suositeltu vähimmäismäärä, puolen tunnin liikunta on vain 3% valveillaoloajasta! Lopun aikaa teemme jotain paljon vähemmän rasittavaa, yleensä istumme. Amerikan Syöpäsäätiössä tutkittiin istumiseen ja liikkumiseen käytetyn ajan yhteyttä kuolleisuuteenhttp://aje.oxfordjournals.org/cgi/content/abstract/kwq155. 53 440 miestä ja 69 776 naista vastasivat kyselyihin, joissa he ilmoittivat päivittäisen istumisen ja liikunnan määrän. 11307 miestä ja 7923 naista kuoli 14-vuoden seuranta-aikana. Jos istui yli 6 tuntia päivässä, kuolleisuusriski oli 17% suurempi miehillä ja 34% suurempi naisilla verrattuna niihin tutkittaviin, jotka istuivat alle 3 tuntia päivässä. Istuminen oli yhteydessä kuolleisuuteen niilläkin, jotka liikkuivat, mutta erityisen suuri kuolleisuus oli niillä, jotka sekä istuivat yli 6 tuntia päivässä että liikkuivat alle 25 MET-tuntia viikossa (esim. alle 3.5 tuntia hölkkää viikossa). Tällaisilla eiliikkuvilla istujilla kuolleisuus oli lähes kaksinkertainen. Mutta kukapa meistä ei istuisi kuutta tuntia päivässä?!? Ja kuinka moni hölkkää yli 30 min päivässä?!? Tällaisia riskihenkilöitä löytyy joukostamme vaikka kuinka paljon, joten meistä itse kunkin tulisi terästäytyä! Peppu ylös tuolista puolen tunnin välein ja puoli tuntia liikuntaa päivässä! Tässä meille minimivaatimukset. Mitä vähemmän istumista, sen parempi. Jo seisominen on parempi vaihtoehto kuin istuminen. : Ote: http://keventajat.fi/hyvinvointi/terveys/istuminen-tappaa
Mitä ihmettä? Outo tilasto: Suomen terveydenhuoltoko Albanian tasolla? Brittiläinen Business Insider uutisoi verkkosivuillaan tilastosta, johon on listattu Euroopan terveydenhuoltojärjestelmät paremmuusjärjestykseen. Suomea on turha hakea kärkikymmeniköstä. Yllättäen asiallisesti uutisoidusta tilastosta käy ilmi, että hyvinvointivaltiomme terveydenhuolto junnaa sijalla 16. Olemme vain yhden sijan Albanian yläpuolella, ja aivan Liettuan alapuolella. Tilasto kertoo ranskalaisen terveydenhuollon olevan Euroopan huippua. Suomalaista terveydenhuoltoa kehuviin artikkeleihin tottunut saattaakin hieraista silmiään. Pienen tarkastelun jälkeen näyttää kuitenkin siltä, että laadukkaana julkaisuna tunnettu Business Insider on sotkeutunut tilastotieteen perusteisiin. Siteeratun tilaston on laatinut Numbeo, jonka tilastot perustuvat joukkoistamalla kerättyyn dataan. Terveydenhuoltojärjestelmiä vertaileva data on kerätty satunnaisilta ja vapaaehtoisilta Numbeonsivuille syystä tai toisesta päätyneiltä henkilöitä, jotka haluavat jakaa omia kokemuksiaan terveydenhuollostaan. Tämänkin tilaston luvut pohjautuvat siis käyttäjien arvioihin, eivät mihinkään satunnaisotantaan tai tutkimukseen. Kysymyksissä pyydetään arvioimaan esimerkiksi terveydenhuollon välineistön nykyaikaisuus, henkilökunnan ammattitaito ja ystävällisyys sekä laitoksen sijainnin sopivuus. Vastausvaihtoehtoja on viisi, tyytyväisestä tyytymättömään, sekä en osaa sanoa. Lähde: http://www.iltasanomat.fi/kotimaa/art-1422321873076.html
Sarjataulukko Kaikkien otteluiden sarjataulukko Ottelun IFK Mariehamn-VPS (13.4.) lopputulos on sääntörikkomuksen vuoksi muutettu 0-3:ksi. Seura O V T H TM PM ME P HJK 33 21 9 3 65 22 43 72 SJK 33 16 11 6 40 26 14 59 FC Lahti 33 15 13 5 45 23 22 58 VPS 33 13 9 11 39 34 5 48 IFK Mariehamn 33 14 6 13 49 55-6 48 FF Jaro 33 12 8 13 47 47 0 44 KuPS 33 11 11 11 44 44 0 44 MYPA 33 10 9 14 41 54-13 39 FC Inter 33 8 12 13 42 47-5 36 RoPS 33 10 5 18 34 44-10 35 FC Honka 33 6 13 14 38 57-19 31 TPS 33 6 6 21 29 60-31 24 Selitykset: O = pelatut ottelut, V = voitot, T = tasapelit, H = häviöt, TM = tehdyt maalit, PM = päästetyt maalit, ME = maaliero, P = pisteet. Helmikuu / 2015 Lähde: http://www.veikkausliiga.com/statistic.aspx
KURSSILLA KÄSITELTÄVIEN AIHEIDEN RAJAUKSIA Kokeelliset tutkimukset, epidemiologia, havaintotutkimukset (useimmat asetelmat) Yksinkertainen satunnaisotanta Ääretön / suuri perusjoukko Yksinkertaiset tutkimuskysymykset Pääasiassa poikkileikkaustutkimukset