Oulun yliopiston matemaattisten tieteiden tutkimusyksikkö/tilastotiede 805305A JOHDATUS REGRESSIO- JA VARIANSSIANALYYSIIN, sl 2018 (Jari Päkkilä) Harjoitus 3, viikko 37 (20. 21.9.): kotitehtävät 1. Erään elektronisen komponentin elinajan jakaumaa tutkittiin vakio-olosuhteissa 10 komponentilla, joista saatiin seuraavat havainnot (viikkoja): 4, 5, 10, 11, 20, 29, 35, 40, 66, 70. Näiden 10 havainnon keskiarvo oli 29 ja keskihajonta 24.0 viikkoa. Valmistajan väitteen mukaan tämäntyyppisten komponenttien keskimääräinen elinaika on 40 viikkoa. (a) Piirrä havainnot pistekuvioon (dotplot) eli yksiulotteiseen sirontakuvioon. Pohdi mm. piirtämäsi kuvion perusteella sitä, voisiko normaalijakauma olla hyvä malli tähän tilanteeseen? (b) Testaa valmistajan väitettä komponenttien keskimääräisestä 40 viikon elinajasta normaalijakaumamallin puitteissa (yhden otoksen t-testi). (c) Laske 95% luottamusväli komponenttien keskimääräiselle elinajalle. 2. Jatkoa edelliseen tehtävään. Olkoon Y = elektronisen komponentin elinaika, jota kuvataan yksinkertaisella regressiomallilla Y i = µ+ɛ i (i = 1,..., 10). Oletetaan lisäksi virhetermit ɛ i riippumattomiksi ja N(0, σ 2 )-jakautuneiksi, ts. Y i N(µ, σ 2 ). (a) Määrää parametrien µ ja σ 2 piste-estimaatit. (b) Määrää estimoidun regressiomallin mukaiset Y i :n sovitetut arvot (ŷ i ) ja jäännöstermit eli residuaalit (e i = y i ŷ i ) kaikille havaintoyksiköille (i = 1,..., 10). (c) Laske jäännöstermien keskihajonta ja vertaa saamaasi tulosta komponenttien elinajan keskihajontaan, joka on 24 viikkoa. Mitä huomaat? (d) Esitä jäännöstermit pistekuviona ja kommentoi kuvion perusteella regressiomallin normaalijakauma-oletusta. Mikä muu jaukauma voisi tulla kyseeseen tilastollista mallia valittaessa? 3. Jatkoa edellisiin tehtäviin. Piirrä vastemuuttujaan Y liittyvä QQ-kuvio. Laskujen lyhentämiseksi todettakoon, että viiteen ensimmäiseen havaintoarvoon liityvät z [k] -luvut (pyöristettyinä) ovat 1.34, 0.91, 0.60, 0.35 ja 0.11. Onko piirretyn QQ-kuvion perusteella oletus muuttujan normaalijakautuneisuudesta uskottava? 4. Data-analyysin perusmenetelmien kurssilla tehtiin useana vuonna yksi datankeruuta havainnollistava harjoitus. Tämän tehtäväpaperin liitteenä on kuvattu harjoitus vuodelta 2015. Lue kuvaus huolellisesti ja vastaa sen perusteella alla esitettyihin kysymyksiin. (a) Kokeen tavoitteiden ja kysymysten asettelu. - Mikä on kokeen tutkimusongelmana ja miten tämä kausaalinen kysymys parhaiten muotoillaan? (b) Tutkimusjoukko eli -populaatio tai -väestö. - Tutkimuksen kohdepopulaatio? - Tutkimusjoukon lähdeväestö ja sen edustavuus kohdepopulaation suhteen?
(c) Tutkimusasetelma. - Tutkimusasetelman tarkka luonnehdinta (onko se kokeellinen/epäkokeellinen, historiallinen/tosiaikainen, pitkittäis-/poikittaistutkimus)? - Koeasetelman tarkka luonnehdinta (onko se rinnakkaisten ryhmien asetelma/vaihtovuoroasetelma, täysin satunnaistettu/satunnaistettujen lohkojen koe, yhden tekijän/monen tekijän koe)? - Satunnaistuksen toteuttaminen? (d) Koeasetelmaan ei sisältynyt koehenkilöiden lohkomista (blocking) tai ositusta (stratification) ennen satunnaistusta. Millaisten tekijöiden suhteen tällaista menettelyä olisi voinut harkita, ja mitä mahdollisia etuja siitä kenties olisi koitunut?
LIITE Oulun yliopiston matemaattisten tieteiden laitos/tilastotiede 806112P DATA-ANALYYSIN PERUSMENETELMÄT, sl 2015 (Esa Läärä & Jari Päkkilä) Oulu 15.9.2015 LYHYTAIKAISEN KEVYEN LIIKUNTASUORITUKSEN VAIKUTUS SYKKEESEEN Hyvä data-analyysin perusmenetelmien opintojakson osallistuja, Kutsun sinut ystävällisesti toimimaan koehenkilönä kurssillamme toteutettavassa kokeellisen tutkimuksen demonstraatiossa. Kokeen kohteena on arvioida, kuinka paljon tietty lyhytaikainen liikuntasuoritus muuttaa sydämen lyöntitiheyttä terveillä nuorilla aikuisilla. Sen varsinaisena tarkoituksena on havainnollistaa erityisesti ihmisillä toteutettavan kontrolloidun kokeen suorittamisen periaatteita ja vaiheita. Koe suoritetaan seuraavasti. Kaikki koehenkilöt istuvat aluksi salissa M304 hiljaa paikallaan viisi (5) minuuttia, jonka aikana he vastaavat datankeruulomakkeen kaikkiin muihin kysymyksiin paitsi sykemittauksia koskeviin. Tämän jälkeen koehenkilöt mittaavat senhetkisen leposykkeensä laskemalla valtimon tunnusteluun perustuvalla tekniikalla sydämenlyöntiensä määrän 30 sekunnin aikana ja kirjaavat tämän lukeman datankeruulomakkeeseen. Seuraavassa vaiheessa satunnaistuksen perusteella koeryhmään A määrätyt tekevät kokeen johtajan ohjeiden mukaan kolme (3) kyykkyynylösliikettä, joiden suorittamisen jälkeen he istuutuvat ja mittaavat välittömästi sykkeensä uudelleen kuten alussakin. Samanaikaisesti ryhmään B kuuluvat henkilöt istuvat edelleen paikallaan ja mittaavat leposykkeensä uudestaan. Tarkemmat ohjeet kokeen kulusta antaa kokeen johtaja suullisesti. Kokeessa voi koeryhmään kuuluvilla esiintyä tavanomaisia ja ohimeneviä sivuvaikutuksia, kuten hengästymistä ja ehkä lievää hikoiluakin. Siihen liittyy myös vähäinen tapaturman riski, jonka vuoksi kokeen vaatimat voimisteluliikkeet täytyy toteuttaa riittävän varovaisesti ja huolellisesti, jottei tapahdu kaatumisia, venähdyksiä tai muita fyysisiä vahinkoja. Koska koe ei ole varsinainen lääketieteellinen koe vaan lähinnä liikuntafysiologinen, eikä kokeeseen liittyvä liikuntasuoritus kovin paljon poikkea koehenkilöiden tavanomaisesta sisäliikunnasta, paikalla ei ole lääkäriä valvomassa koehenkilöiden terveydentilaa. Kokeeseen ei myöskään ole haettu Oulun yliopiston lääketieteellisen tiedekunnan ja Pohjois-Pohjanmaan sairaanhoitopiirin eettisen toimikunnan lupaa. Kokeen johtaja ei ota vastuuta mahdollisista vammoista tai haitoista, joita kokeesta saattaa aiheutua, eikä ole vakuuttanut koehenkilöitä näiden varalta. Kokeesta voi odottaa olevan enemmän myönteisiä kuin kielteisiä vaikutuksia kaikille siihen osallistuville. Tämäntapainen opetusrutiineista poikkeaminen on todennäköisesti virkistävä ja henkistä hyvinvointia lisäävä kokemus. Keskeisimpänä myönteisenä sivuvaikutuksena on odotettavissa koesuunnittelun periaatteiden sisäistämisen tekemisen kautta. Mitään aineellista korvausta koehenkilöille ei suoriteta. Voit osallistua kokeeseen, jos olet mielestäsi riittävän terve ja hyväkuntoinen kokemaan lyhyen voimistelusuorituksen aiheuttaman fyysisen rasituksen. Jos kuitenkin sinulla on jokin sairaus tai vamma, jonka vuoksi tätä liikuntasuoritusta on syytä välttää, ei sinun tule osallistua kokeeseen. Osallistumisesi on täysin vapaaehtoista; voit missä vaiheessa tahansa keskeyttää kokeen ilman
että siitä on sinulle mitään haitallisia seurauksia. Kokeen johtajana sitoudun antamaan sinulle niin hyvää tilastotieteen opetusta ja ohjausta kuin kaikille muillekin ja arvostelemaan opintosuorituksesi asianmukaisesti riippumatta osallistumisestasi tähän kokeeseen. Koehenkilöiden jakaminen koeryhmiin tapahtuu satunnaistamalla. Tämä tarkoittaa sitä, että sinut sijoitetaan arvonnan perusteella joko ryhmään A, joka tekee kyykkyyn-ylösliikkeet, tai ryhmään B, joka pysyy paikallaan, ilman että kokeen johtaja tai kukaan muukaan voi tähän vaikuttaa, eikä arvonnan tulosta myöskään tiedetä ennen kuin kokeen varsinainen suoritus alkaa. Arvonnan tarkoituksena on jakaa ryhmät täysin puolueettomasti ja lisätä siten koetulosten tieteellistä luotettavuutta. Henkilökohtaisia tietojasi ja koetuloksiasi käsitellään täysin luottamuksellisesti eikä niitä luovuteta kellekään ulkopuoliselle. Koetuloksia kuvataan tilastollisesti ryhmäkohtaisten tunnuslukujen avulla niin, että kenenkään koehenkilön yksilölliset tiedot eivät ole tunnistettavissa. Jos haluat jotain lisätietoja kokeesta ja siihen liittyvistä yksityiskohdista, vastaan mielelläni. Jos kaiken edellä antamani kirjallisen informaation sekä ennen kokeen aloitusta antamani suullisen informaation jälkeen olet suostuvainen toimimaan koehenkilönä, pyydän sinua ystävällisesti allekirjoittamaan oheisen tietoisen suostumuksen. Myönteistä suhtautumista kokeellemme toivoen, Jari Päkkilä, yliopisto-opettaja, kokeen johtaja Matemaattisten tieteiden laitos, 90014 Oulun yliopisto p. (08) 553 1837, sähköposti jari.pakkila@oulu.fi TIETOINEN SUOSTUMUS Olen lukenut edellä olevan kuvauksen lyhytaikaisen liikuntasuorituksen vaikutusta sykkeeseen koskevasta kokeesta. Sen perusteella sekä kokeen johtajan antaman suullisen informaation pohjalta olen ymmärtänyt kokeen suorittamisen periaatteet ja vaiheet sekä omat tehtäväni kokeen aikana. Olen myös tietoinen kokeen johtajan velvollisuuksista koehenkilöitä kohtaan sekä kokeeseen liittyvistä sivuvaikutuksista ja riskeistä, joista kannan itse täyden vastuun. Osallistumiseni kokeeseen on täysin vapaaehtoista. Näiden seikkojen pohjalta annan kokeen johtajalle tietoisen suostumuksen toimia koehenkilönä mainitussa kokeessa. Oulussa 15.9.2015 Allekirjoitus Nimen selvennys
Oulun yliopiston matemaattisten tieteiden laitos/tilastotiede 806112P DATA-ANALYYSIN PERUSMENETELMÄT, sl 2015 (Esa Läärä & Jari Päkkilä) Oulu 15.9.2015 LYHYTAIKAISEN KEVYEN LIIKUNTASUORITUKSEN VAIKUTUS SYKKEESEEN 1. Sarjanumero (satunnaistuslipukkeesta) 2. Koeryhmä (satunnaistuslipukkeesta, rengasta) A B 3. Sukupuoli (rengasta) 1 nainen 2 mies 4. Ikä vuotta 5. Pituus cm 6. Paino kg 7. Liikuntaharrastus: Kuinka usein harrastat vapaa-ajan kuntoliikuntaa vähintään ½ tuntia kerrallaan niin, että ainakin lievästi hengästyt ja hikoilet (esim. lenkkeilyä, pyöräilyä, hiihtoa, voimistelua, uintia, pallopelejä)? (rengasta) 0 en lainkaan tai hyvin harvoin 3 2-3 kertaa viikossa 1 1-3 kertaa kuukaudessa 4 4-6 kertaa viikossa 2 noin kerran viikossa 5 päivittäin 8. Leposyke, oma arviosi ennen mittausta lyöntiä per minuutti 9. Syke kokeen alussa lyöntiä 30 sekunnissa 10. Syke kokeen lopussa lyöntiä 30 sekunnissa Muita havaintoja ja kommentteja: