PSYKOLOGIAN VALINTAKOE TILASTOMATEMATIIKAN LISÄMATERIAALI 2016

Koko: px
Aloita esitys sivulta:

Download "PSYKOLOGIAN VALINTAKOE TILASTOMATEMATIIKAN LISÄMATERIAALI 2016"

Transkriptio

1 PSYKOLOGIAN VALINTAKOE TILASTOMATEMATIIKAN LISÄMATERIAALI 06 HELSINGIN YLIOPISTO

2 PSYKOLOGIAN VALINTAKOE 06 Tilastomatematiikan lisämateriaali Copyright Helsingin yliopisto, käyttäytymistieteiden laitos Materiaalin tai sen osien luvaton kopiointi ja muuntelu on kielletty.

3 Aluksi Tässä lisämateriaalissa esitetään muutamia täydennyksiä valintakoekirjaan, mutta keskeisemmän osan saavat psykologian valintakoetehtävät vuosien takaa. Vanhat koetehtävät on pyritty valitsemaan sopivan kattavasti niin, että niiden ratkaisemisesta voisi olla aidosti hyötyä valintakokeeseen valmistautumisessa. Tehtäviin esitetään myös ratkaisumallit, jotka eivät kuitenkaan kaikissa tapauksissa ole ainoat oikeat, sillä kuten usein tilastomatematiikan tehtävissä, oikeaan ratkaisuun voi päätyä monella tavalla. Lisämateriaalin sisältöä kirjoitettaessa on pyritty sopivaan tasapainoon ytimekkään ja perinpohjaisen ilmaisun välillä. Tästä johtuen lisämateriaalista saanee parhaimman hyödyn kun sitä lukee yhdessä valintakoekirjan Nummenmaa, Holopainen ja Pulkkinen: Tilastollisten menetelmien perusteet kanssa. Koska tähän lisämateriaaliin on otettu tehtäviä psykologian vanhojen valintakokeiden originaaliversioista, ei taitto ikävä kyllä ole aina paras mahdollinen. Ulkoasun puutteista huolimatta asiat toivottavasti selviävät lukijalle. Tässä esitettyjen vanhojen koetehtävien lisäksi kannattaa opiskella Helsingin yliopiston käyttäytymistieteellisen tiedekunnan opiskelijavalintojen verkkosivulta löytyvät muutaman viime vuoden kokeet. Valintakoekirjan ja tämän lisämateriaalin mahdollisia virheitä tullaan korjaamaan kevään 06 aikana Helsingin yliopiston käyttäytymistieteellisen tiedekunnan opiskelijavalintojen verkkosivulla Korjausten osalta verkkosivua päivitetään tarvittaessa torstaina 8..06, ja kello Tätä lisämateriaalia saavat käyttää ainoastaan yksityishenkilöt Helsingin, Tampereen ja Turun yliopistojen psykologian opiskelijavalinnan valintakoetta 06 varten. Kaikki muu käyttö on kielletty.

4 VALINTAKOEKIRJASTA Valintakoekirjasta Tässä osassa on täydennyksiä ja huomioita kirjaan Nummenmaa, L., Holopainen, M. ja Pulkkinen, P.: Tilastollisten menetelmien perusteet. Valintakoekirjan alussa mainitaan, että koska tilastollinen analyysi tehdään nykyään useimmiten tietokoneohjelmilla, ei laskukaavojen opetteleminen ole itsetarkoitus. Kuitenkin monien kaavojen ymmärtäminen on tärkeää analyysien perusteiden ymmärtämiseksi ja oikeiden analyysien valitseminen ja niiden tulosten tulkitseminen oikein perustuu tällaiseen ymmärtämiseen. Siksi tässä lisämateriaalissa esitellään muutamia käsin laskemisen tapoja, joita kirjassa ei ole. Lisäksi muutamiin asioihin esitetään tarkennuksia ja huomioita. Jotkin huomiot ovat asioista, joissa tämä lisämateriaali ja valintakoekirja ovat ristiriidassa. Näissä kohtaa tulee luottaa lisämateriaaliin. Valintakokeessa on siis syytä muistaa, että jos tämän lisämateriaalin ja valintakoekirjan välillä on jostakin asiasta ristiriita, niin lisämateriaalin mukainen vastaus on oikea. Valintakoekirjassa ei esitetä vastauksia kaikkiin tehtäviin. Yleensä vastaukset puuttuvat, jos vastauksen esittäminen olisi vienyt melko paljon tilaa. Esimerkiksi luvusta 3 ei vastauksia ole lainkaan. Tässäkään ei näitä vastauksia tilan rajallisuuden vuoksi esitetä, mutta on silti syytä tutkia nämäkin tehtävät valintakoekirjasta tarkasti. Lukua 3 on hyvä kuvata esimerkkinä. Luvussa käsitellään muun muassa graafista esittämistä ja vaikka nykyään tilastolliset kuviot tehdään yleensä tietokoneohjelmalla, on kuvien käsin piirtäminen tarpeen harjoitella. Käsin piirtämisen harjoittelu ei kuitenkaan ole kovin vaikeaa, minkä vuoksi sitä tässä lisämateriaalissa käsitellään vain vähän. Lisämateriaalissa käytetään kahta tapaa summamerkinnän indekseissä. Ne kuvataan alla ja tarkoittavat siis täysin samaa. Joskus kun indeksointi on selvä ja yksikäsitteinen indeksointi on jätetty kokonaan merkitsemättä. ja jos indeksointi on selvä, niin yksinkertaisesti tai jopa on käytössä. Valintakoekirjan luvusta ja 0 ei ole tässä lisämateriaalissa huomioita, täydennyksiä tai korjauksia. Yksittäisistä valintakoekirjan huomioista, täydennyksistä ja korjauksista tullaan ilmoittamaan aikaisemmin mainitulla tavalla siis verkkosivulla kolme kertaa kevään 06 aikana. Valintakoekirjassa kuvatut aineistot ASIAKAS ja KYSELY löytyvät Helsingin yliopiston käyttäytymistieteellisen tiedekunnan opiskelijavalintojen verkkosivulta tekstitiedostoina.

5 VALINTAKOEKIRJASTA Tieteellinen tutkimus ja tilastollinen ajattelu Osassa.5 Mittaaminen, validiteetti ja reliabiliteetti käsitellään mitta-asteikkoja. Psykologiassa ja käyttäytymistieteissä yleensä erityisesti sen asian selvittämiseen, onko jokin muuttuja järjestys- vai välimatka-asteikollinen, liittyy tärkeitä ja olennaisia kysymyksiä. Esimerkiksi kyselytutkimuksissa ja joissakin psykologisissa testeissä kysymyksiin vastaamiseen käytetään Likert-asteikkoa. Likert-asteikolla vastaaja ilmaisee käsityksensä tai mielipiteensä esitettyyn väitteeseen tai kysymykseen valitsemalla yhden vastausvaihtoehdoista, jotka tutkija on etukäteen laatinut. Vastausvaihtoehdot voivat olla esimerkiksi täysin samaa mieltä, osin samaa mieltä, ei samaa eikä eri mieltä, osin eri mieltä ja täysin eri mieltä. Kun näitä vastausvaihtoehtoja merkitään peräkkäisillä kokonaisluvuilla (esim. 5: = täysin eri mieltä, 5 = täysin samaa mieltä), tutkittava muuttuja on vähintään järjestysasteikollinen. Kirjassa esiteltävän ASIAKAS-aineiston muuttujat tyytyväisyys liikkeen tuotevalikoimaan ja tyytyväisyys liikkeen hintatasoon ovat esimerkkejä Likert-asteikollisista muuttujista. Usein oletetaan, että vaihtoehtojen välit ovat ainakin likimain yhtä suuret, jolloin muuttujaa voidaan käsitellä välimatka-asteikollisena. Vaikka tämä oletus ei ole ongelmaton, monissa tutkimustilanteissa toimitaan niin, että jotain psykologista ilmiötä (esim. persoonallisuudenpiirrettä) arvioidaan usealla kysymyksellä tai väitteellä (väitteet Olen yleensä seurallinen, Minulla on paljon ystäviä ja Nautin muiden ihmisten seurasta voisivat kaikki mitata ulospäinsuuntautuneisuutta). Jos kaikkiin näihin vastattaisiin edellä kuvatuilla vaihtoehdoilla 5 ja jokaisen vastaajan vastausten arvot laskettaisiin yhteen, saataisiin tälle summamuuttujalle, joka olisi siis havainnon ulospäinsuuntautuneisuuden arvio, mahdolliseksi vaihteluväliksi 3 5. Kun usein tutkittavaa ilmiötä tai ominaisuutta selvitetään suuremmalla kysymysmäärällä, voidaan näistä laskettuja summamuuttujia käsitellä välimatka-asteikollisina. Tässä ei ole kuitenkaan mahdollista eikä tarpeellistakaan käsitellä asiaa tämän enempää tai tarkemmin. Riittää toistaiseksi todeta, että kun jonkin psykologisen ominaisuuden (esim. persoonallisuuspiirteen tai älykkyyden) mittaus tehdään hyvin (esim. luotettava ja tarkka persoonallisuus- tai älykkyystesti), niin mittauksen taso on vähintään välimatka-asteikollinen. Tehtävässä.3 (s. 3 ja vastaukset s. 37) tuli ratkaista, millä mitta-asteikolla muuttujia on mitattu. Vastauksissa älykkyysosamäärän mittaamisen tasoksi on mainittu suhdeasteikko. Älykkyysosamäärä on kuitenkin välimatka-asteikollinen muuttuja. Vaikka nykyaikana pankkitilin saldo voi mennä miinukselle, niin tilillä käytettävissä olevan rahan suhteen saldo on suhdeasteikollinen muuttuja miinuksella oleva saldo kun on velkaa. 3

6 VALINTAKOEKIRJASTA 3 Tutkimusaineiston valmistelu ja graafinen kuvaileminen Osassa 3. Tutkimusaineiston graafinen kuvaileminen käydään läpi havainnollistavien kuvien teon periaatteita. Vaikka nykyaikana tilastokuvat tehdään yleensä tietokoneohjelmalla, on niiden piirtämistä käsinkin hyvä harjoitella. Suurimmaksi osaksi kuvien piirtäminen käsin onnistuu kirjassa kerrottujen periaatteiden pohjalta, mutta histogrammin laatimista on tarpeen käsitellä jonkin verran. Näin erityisesti siksi että kirjassa sivun 50 esimerkin 7 histogrammi on piirretty kovin pienenä, sen tekemiseen annetut ohjeet ovat puutteelliset eikä se anna parasta mahdollista kuvaa muuttujan jakaumasta. Kirjan kuvassa luokkaväliksi on valittu 700 kirjan ss. 4 4 ohjeiden ja esimerkkien pohjalta ja X-akselilla luvut on merkitty pylväiden keskikohdille. ASIAKAS-aineiston kotitalouksien nettotulojen kohdalla kannattaa valita luokkaväliksi 500. Niin sanotut pyöreät luvut ovat monesti käytännöllisempiä ja ymmärrettävämpiä kuvassa eikä luokkien lukumäärä tulojen kohdalla kuitenkaan kasva liian suureksi. X-akselien merkintöjen on paras olla luokkien alarajojen kohdalla, koska histogrammia käytetään vain kvantitatiivisille muuttujille. Kaikkia lukuja ei tarvitse välttämättä kirjoittaa, kunhan luokkarajat käyvät yksiselitteisesti ilmi. Alla on frekvenssitaulukko ja histogrammi, josta x-akselilta on jätetty viidet sadat merkitsemättä, mutta asteikko käy silti selvästi ilmi, kun käytetään erimittaisia asteikkomerkkejä (pitkät viivat asteikon ulkopuolella tuhansille ja lyhyet viisille sadoille). Kun vertaat kuvaa kirjan sivun 50 kuvaan, huomaa myös y-akselin muutos. Kirjassa sanotaan, että histogrammia käytetään jatkuvien muuttujien jakauman kuvaamiseen. Se sopii myös sellaisten diskreettien kvantitatiivisten muuttujien kohdalla, jotka saavat useita erisuuruisia arvoja (esimerkiksi kuukauden aikana tehtyjen bussimatkojen lukumäärä). Jos histogrammissa käytetään epätasavälistä luokittelua, niin pylväiden pinta-alojen tulee olla verrannollisia luokkien prosenttiosuuksiin. Näin on myös tasavälisessä luokittelussa, mutta koska tällöin pylväiden kannat ovat saman levyisiä, niin pylväiden korkeudet kuvaavat luokkien kokoa oikein. Epätasavälisesti luokitellun muuttujan histogrammin piirtämistä ei käsitellä tässä. Kotitalouksien nettotulot ( /kk) Alaraja Yläraja Luokkakeskus Luokkaväli Frekvenssi %-osuus Kumulatiivinen frekvenssi Kumulatiivinen %-osuus 500 < ,0 3 3,0 000 < ,0,0 500 < ,0 3 3,0 000 < , ,0 500 < , , < ,0 8 8, < , , < , , < , , , ,0 4

7 VALINTAKOEKIRJASTA (%) Kotitalouden nettotulot ( /kk) Euroa kuukaudessa 5

8 VALINTAKOEKIRJASTA 4 Tutkimusaineiston kuvaileminen numeerisesti Osassa 4. Sijaintiluvut esitetään, että jos järjestysasteikollisen muuttujan havaintoarvoja on parillinen määrä, niin mediaaniksi valitaan jompikumpi keskimmäisistä arvoista (tai jos nämä ovat hyvin kaukana toisistaan, niin ilmoitetaan joko molemmat tai jätetään mediaani kokonaan ilmoittamatta). Jos havaintoja on parillinen määrä, niin myös järjestysasteikollisen muuttujan kohdalla ilmoitetaan mediaanina kahden keskimmäisen havainnon aritmeettinen keskiarvo. Sivun 7 esimerkin b mediaani on siis (4+7) / = 5.5. Mediaanin tulkinnassa tulee luonnollisesti muistaa muuttujan mittauksen taso. Sivulla 73 esimerkin 3 polarisoitunutta aineistoa on parasta kuvata frekvenssitaulukolla tai pylväsdiagrammilla. Sivulla 74 esimerkissä 4 Md = 388. Seuraavassa lasketaan sivun 7 esimerkin a aineiston keskiarvo. Nyt lukuja ei ajatella järjestysluvuiksi, vaan välimatka-asteikollisen muuttujan arvoiksi tai Osassa 4. Hajontaluvut kerrotaan otoksesta laskettavan keskihajonnan laskemisesta. Keskihajonta kuvaa havaintoarvojen keskimääräistä poikkeamista keskiarvosta ja se on sopiva tunnusluku kertomaan arvojen vaihtelusta välimatka- ja suhdeasteikollisilla muuttujilla. Kirjassa esitetään otoskeskihajonnalle kaava, jossa keskihajonnan merkitys keskimääräisenä poikkeamana keskiarvosta käy ilmi selkeästi. Joskus keskihajonta on kuitenkin kätevämpi laskea siitä johdetulla alla esitetyllä kaavalla. Tätä kaavaa voidaan soveltaa, myös kun lasketaan keskihajontaa luokitellusta aineistosta. 6

9 VALINTAKOEKIRJASTA k = luokkien lukumäärä, f i = luokan i frekvenssi, x i = luokan i luokkakeskus Seuraavassa esitetään kummallakin tavalla laskien kirjan ss oleva esimerkki 8 (jossa hajonnan laskemisessa on pieni virhe kirjassa). Käsin laskemisessa käytetään apuna taulukkoon laskettuja välivaiheita. nettopaino Σ Pieni ero neliöjuurilausekkeen osoittajassa johtuu siitä, että ensin lasketulla tavalla keskiarvo oli pyöristetty yhteen desimaaliin. 7

10 VALINTAKOEKIRJASTA Laskemista voi vielä helpottaa vähentämällä ensin kaikista luvuista 900. nettopaino Σ Kun ilmoitetaan alkuperäisen muuttujan keskiarvo, tulee lukuun 87. muistaa lisätä 900. Tässä huomataan samalla, mitä vakion lisääminen (tai vähentäminen) kaikkien havaintoarvojen kohdalla vaikuttaa: Keskiarvo muuttuu lisätyn (tai vähennetyn) vakion suuruudella, mutta keskihajonta ei muutu. Kun hajonta lasketaan perusjoukon arvoista, kaavoissa on jakajana (n-) sijasta n. 8

11 VALINTAKOEKIRJASTA Sivuilla käsitellään variaatiokerrointa. Esimerkissä 9 päätellään, että palkat on ilmeisesti sidottu myynnin määrään. Pelkän variaatiokertoimen avulla tätä ei voi päätellä, vaan päätelmä vaatii muuttujien välisen yhteyden tarkastelua, mihin kirjan tekstissä viitataan (yhteyden tarkastelua käsitellään luvuissa 8 ja 9). Variaatiokertoimen perusteella voidaan tehdä päätelmä, että palkkojen ja myynnin määrän suhteellinen vaihtelu on likimain samansuuruista. Päätelmien ero käy selväksi, jos tarkastellaan esimerkin alkuperäistä aineistoa ja seuraavia aineistoja. Alkuperäinen aineisto Myynti ( /kk) Palkka ( /kk) Myynti: /kk /kk 0,0 Palkka: /kk 578 /kk 0,93 palkka ( 000 /kk) 4,0 3,5 3,0,5,0,5, Myynti ( 000 /kk) Myynnin ja palkkojen välinen hajontakuvio, r 0,996. Vaihtoehtoinen aineisto A. Myynnin määrät ovat samat kuin alkuperäisessä aineistossa. Palkkojen jakauma on sama, mutta myynnin ja palkkojen yhteisjakauma on erilainen. Eli yritys maksaa samat palkkasummat, mutta eri myyntimiehille kuin alkuperäisessä aineistossa. (Tässä vaihtoehdossa hyvin epäkannustavasti!) Myynti ( /kk) Palkka ( /kk)

12 VALINTAKOEKIRJASTA Myynti: /kk /kk 0,0 Palkka: /kk 578 /kk 0,93 palkka ( 000 /kk) 4,0 3,5 3,0,5,0,5, Myynti ( 000 /kk) Myynnin ja palkkojen välinen hajontakuvio, r -0,98. Vaihtoehtoinen aineisto B. Myynnin määrät ovat samat kuin alkuperäisessä aineistossa. Palkkojen jakauma on sama, mutta myynnin ja palkkojen yhteisjakauma on erilainen. Eli yritys maksaa samat palkkasummat, mutta eri myyntimiehille kuin alkuperäisessä aineistossa tai aineistossa A. Myynti ( /kk) Palkka ( /kk) Myynti: /kk /kk 0,0 Palkka: /kk 578 /kk 0,93 palkka ( 000 /kk) 4,0 3,5 3,0,5,0,5, Myynti ( 000 /kk) Myynnin ja palkkojen välinen hajontakuvio, r 0,00. 0

13 VALINTAKOEKIRJASTA Vaihtoehtoinen aineisto C. Myynnin määrät ovat samat kuin alkuperäisessä aineistossa. Palkkojen jakauma on erilainen, mutta myynnin ja palkkojen välillä on samansuuntainen yhteys kuin alkuperäisessä aineistossa eli suurempi myynti on yhteydessä suurempiin palkkoihin. Tässä aineistossa yrityksen maksamissa palkoissa on vähemmän vaihtelua kuin alkuperäisessä aineistossa tai aineistoissa A ja B. Myynti ( /kk) Palkka ( /kk) Myynti: /kk /kk 0,0 Palkka: /kk /kk, palkka ( 000 /kk) 4,0 3,5 3,0,5,0,5, Myynti ( 000 /kk) Myynnin ja palkkojen välinen hajontakuvio, r 0,996. Variaatiokertoimen käyttäminen sellaisen muuttujan kohdalla, jonka keskiarvo on nolla, on mahdotonta. Myös hyvin lähellä nollaa olevat keskiarvot tekevät variaatiokertoimen käytöstä ongelmallista, koska pienikin muutos keskiarvossa vaikuttaa variaatiokertoimeen voimakkaasti. Pääasiassa variaatiokerrointa tulisi käyttää ainoastaan suhdeasteikollisten muuttujien kohdalla, jolloin edellä mainittua ongelmaa ei yleensä tule. Välimatkaasteikollisten muuttujien kohdalla keskiarvo voi olla myös negatiivinen, jolloin variaatiokertoimelle ei voi antaa mielekästä tulkintaa. Välimatka-asteikollisten muuttujien kohdalla onkin lähes aina parempi ilmoittaa keskiarvo ja keskihajonta.

14 VALINTAKOEKIRJASTA Viisilukuinen yhteenveto ja laatikkokuvio Muuttujan viisilukuinen yhteenveto on muuttujan pienimmän arvon, alakvartiilin, mediaanin, yläkvartiilin ja suurimman arvon järjestetty joukko (min, Q, Md, Q 3, max). Nämä viisi lukua jakavat siis aineiston neljään yhtä suureen osaan: havainnoista 5 % on välillä min Q, 5 % välillä Q Md, 5 % välillä Md Q 3 ja 5 % välillä Q 3 max. Laatikkokuvio on viisilukuisen yhteenvedon kuvallinen esitys. Siitä on alla esimerkki ASIAKAS-aineiston muuttujasta kotitalouksien nettotulot ( /kk). Laatikkokuvio on käyttökelpoinen myös ryhmäerojen kuvailussa. Alla ss esimerkissä 0 käsitellyn miesten ja naisten palkkojen kuvailu, josta on helppo havaita erojen olevan erityisesti suurten palkkojen kohdalla.

15 VALINTAKOEKIRJASTA 5 Todennäköisyyslaskennan perusteet Valintakoekirjassa käsitellään todennäköisyyslaskennan peruslaskusäännöt. Tässä tarkastellaan ensin hieman lisää tapahtumien erillisyyttä, riippumattomuutta ja ehdollista todennäköisyyttä sekä esitellään lisäksi kokonaistodennäköisyyden laskeminen ja Bayesin teoreema. Alkuun on syytä tarkentaa kirjan sivulla 5 olevaa lausetta: Kuten tapahtumien yhteenlaskusäännön tapauksessa myös kertolaskusääntöä täytyy muuttaa silloin, jos tapahtumat eivät olekaan toisistaan riippumattomia. Yhteislaskusäännön kohdalla vaikuttaa kuitenkin se, ovatko tapahtumat erillisiä (eli toisensa pois sulkevia) vai eivät. Yleistä yhteenlaskusääntöä voi käyttää aina. Erillisten tapausten kohdalla sääntö yksinkertaistuu, kun termin, joka on nolla, voi jättää pois. Jos tapahtumia on enemmän kuin kaksi ja ne kaikki ovat erillisiä, erillisten tapahtumien yhteenlaskusääntöä voi käyttää. Useamman kuin kahden tapahtuman yleinen yhteenlaskusääntö on hieman monimutkaisempi eikä sitä esitellä kirjassa tai tässäkään materiaalissa. Riittää todeta, että ratkaisuissa voi käyttää apuna liitäntälakia.. Tähdennetään vielä, että tapahtumien erillisyys ja riippumattomuus ovat siis eri asioita. Tapahtumat A ja B ovat erillisiä, jos, jolloin 0. Tapahtumat A ja B ovat riippumattomia, jos. Jos 0 ja 0, niin 0. Tapahtumat eivät voi siis olla sekä erillisiä että riippumattomia. Ei-erilliset tapahtumat voivat olla joko riippumattomia tai riippuvaisia. Kirjassa esitellään yleinen kertolaskusääntö:, jonka voi myös esittää. Siis, josta voidaan johtaa ja. Riippumattomuus voidaan ilmaista siis myös seuraavasti. Tapahtumat A ja B ovat riippumattomia, jos. Kun molemmat puolet supistetaan P(A):lla saadaan. Vastaavasti tapahtumat A ja B ovat riippumattomia, jos. Eli tapahtumat A ja B ovat riippumattomia, jos A:n tapahtuminen ei vaikuta B:n tapahtumisen todennäköisyyteen eikä vastaavasti B:n tapahtuminen vaikuta A:n tapahtumisen todennäköisyyteen. Kokonaistodennäköisyyttä tarvitaan tilanteissa, joissa jokin tapahtuma voi toteutua usealla eri tavalla (ehdolla). Tarkastellaan seuraavaa kirjan s. esimerkistä muokattua esimerkkiä. Kutsuille on varattu kolme korillista limonadia. Yhdessä korissa on 6 kolajuomaa, toisessa korissa on 8 kolajuomaa ja kolmannessa korissa on kolajuomaa. Liisan isä hakee kellarista 3

16 VALINTAKOEKIRJASTA sattumanvaraisesti yhden korin ja näkemättä koria ja pulloja Liisa valitsee korista yhden pullon. Mikä on todennäköisyys, että Liisa saa kolajuoman? Merkitään P(A ) = {isä valitsee korin } =, P(A ) = {isä valitsee korin } =, P(A 3) = {isä valitsee korin 3} = ja P(B) = {Liisa saa kolajuoman} Tässä tapauksessa tämä on luonnollisesti sama kuin kolajuomien kokonaismäärä jaettuna kaikkien limonadipullojen määrällä. Toisissa tilanteissa, joissa P(A ), P(A ), P(A 3 ),, P(A n ) eivät kaikki ole yhtä suuria, vastaavuus ei ole näin suoraviivainen. Bayesin teoreeman avulla voidaan esimerkin tilanteessa vastata seuraavaan kysymykseen. Kun tiedetään, että Liisa sai kolajuoman, niin millä todennäköisyydellä isä toi kellarista korin?

17 VALINTAKOEKIRJASTA Esimerkin voi havainnollistaa seuraavalla puurakenteella. Kokonaistodennäköisyys on kaikkien alusta loppuun kulkevien polkujen yhdistelmä. Kun tiedetään, että jokin tapahtuma on tapahtunut, niin Bayesin teoreeman avulla voidaan selvittää, mikä on tapahtumaan johtaneiden eri vaihtoehtojen todennäköisyys. Bayesin teoreemaa voidaan käyttää vastaavissa tilanteissa monissa yhteyksissä. Kuvataan asiaa vielä kahden esimerkin avulla. Tiedetään, että tiettyä virustautia sairastaa 5 % perusjoukosta. Viruksen toteamiseksi on olemassa laboratoriotesti, joka antaa joko positiivisen tai negatiivisen tuloksen (positiivinen tulos tarkoittaa, että testin mukaan henkilöllä on tautia aiheuttava virus ja negatiivinen testitulos, että henkilöllä ei ole virusta). Niiden henkilöiden kohdalla, joilla on virus, testi antaa oikean (positiivisen) tuloksen todennäköisyydellä Terveiden henkilöiden kohdalla testi antaa oikean (negatiivisen) tuloksen todennäköisyydellä Satunnaisesti valittu perusjoukon henkilö menee testiin ja testin tulos on positiivinen. Millä todennäköisyydellä tällä henkilöllä on virus? Kootaan annetut tiedot yhteen. Merkitään V = henkilöllä on virus, T = henkilöllä ei ole virusta eli henkilö on terve, P = testin tulos on positiivinen ja N = testin tulos on negatiivinen. Huomioidaan, että ja. On ehkä kuitenkin helpompi käyttää ensin mainittuja merkintöjä. 0.05, , 0.95 ja Ratkaistava todennäköisyys on puolestaan. Lasketaan ensin kokonaistodennäköisyys sille, että testi antaa positiivisen tuloksen Bayesin teoreeman avulla Eli testatuista henkilöistä, joiden testitulos on positiivinen joka kolmannella on virus. 5

18 VALINTAKOEKIRJASTA Tarkastellaan vielä yhtä esimerkkiä. Kokeessa on yksi monivalintatehtävä, jossa on viisi vastausvaihtoehtoa. Vaihtoehdoista yksi on oikea ja neljä ovat vääriä. Tehtävään vastanneet henkilöt ovat joko hyvin valmistautuneita, melko hyvin valmistautuneita tai täysin valmistautumattomia. Hyvin valmistautuneita on 40 %, melko hyvin valmistautuneita samoin 40 % ja valmistautumattomia on 0 %. Hyvin valmistautuneet valitsevat oikean vaihtoehdon todennäköisyydellä 0.90, melko hyvin valmistautuneet todennäköisyydellä 0.50 ja valmistautumattomat arvaavat satunnaisesti. a) Kuinka iso osa monivalintatehtävän vastauksista on oikein? b) Jos hakija on vastannut oikein, millä todennäköisyydellä hän on hyvin valmistautunut? Kohdassa a) on selvitettävä kokonaistodennäköisyys Kohta b) ratkeaa Bayesin teoreeman avulla. Tehtäviä (vastaukset ovat seuraavalla sivulla) Eräässä käräjäoikeudessa niistä syytetyistä, jotka ovat syyllistyneet rikokseen, vapautetaan 8 % ja niistä syytetyistä, jotka eivät ole syyllistyneet rikokseen, tuomitaan 6 %. Kaikista syytetyistä 80 % on syyllisiä. a) Mikä on todennäköisyys, että tuomittu henkilö on syyllistynyt rikokseen? b) Mikä on todennäköisyys, että tuomittu henkilö ei ole syyllistynyt rikokseen? c) Mikä on todennäköisyys, että vapautettu henkilö on syyllistynyt rikokseen?. Syventävälle kurssille osallistumisen vaatimuksena on, että opiskelijalla on peruskurssilla saatavat tiedot. Nämä voi saavuttaa joko avoimen yliopiston kurssilla tai kirjatentissä tai yliopiston kurssilla tai kirjatentissä. Oletetaan, että edellä mainitut neljä tapaa ovat toisensa poissulkevia. Syventävälle kurssille osallistuvista 30 % on suorittanut avoimen yliopiston peruskurssin ja 0 % kirjatentin, 40 % on suorittanut yliopiston peruskurssin ja 0 % kirjatentin. Syventävän kurssin hyväksytyn suorituksen on saanut 80 % avoimessa yliopistossa peruskurssin suorittaneista ja 90 % yliopistossa peruskurssin suorittaneista. a) Mikä on todennäköisyys, että syventävästä kurssista hylätyn suorituksen saanut on käynyt avoimen yliopiston peruskurssin? b) Mikä on todennäköisyys, että syventävästä kurssista hylätyn suorituksen saanut on suorittanut yliopiston peruskurssin kirjatentillä? 3. Kaupassa myynnissä olevista tomaateista /3 tulee puutarhalta A, /4 puutarhalta B ja loput puutarhalta C. Puutarhan A tomaateista 94 % on myyntikelpoisia, puutarhan B tomaateista 90 % on myyntikelpoisia ja puutarhan C tomaateista vain 88 % on myyntikelpoisia. a) Millä todennäköisyydellä satunnaisesti valittu tomaatti on myyntiin kelpaamaton? b) Millä todennäköisyydellä myyntiin kelpaamaton tomaatti on peräisin puutarhalta A? 6

19 VALINTAKOEKIRJASTA Tehtävien vastaukset. a) b) c) a) b) a) b)

20 VALINTAKOEKIRJASTA 6 Todennäköisyysjakaumat Kirjan sivulla 54 on lause, joka alkaa: Voidaan siis ajatella, että χ -jakauma muodostuu yhteenlasketuista normaalijakaumista,. Edellisellä sivulla on esitetty satunnaismuuttujan χ lauseke, josta nähdään, että normaalijakautuneet satunnaismuuttujat neliöidään. Sivun 54 lauseen oikea ilmaisu on siis: Voidaan siis ajatella, että χ -jakauma muodostuu neliöidyistä yhteenlasketuista normaalijakaumista,. Osaan 6.3 Jatkuvat todennäköisyysjakaumat liittyen käydään tässä lyhyesti läpi normitetun normaalijakauman kertymäfunktion arvojen taulukon lukeminen. Kirjan liitteen taulukossa on z välillä Z-arvon kokonaisosa ja kymmenesosa luetaan. sarakkeesta ja sadasosa. riviltä (z). Taulukosta sarakkeen ja rivin leikkauskohdasta löytyy kertymäfunktion arvo. Siis esimerkiksi jos tarvitsee selvittää P(Z <.75) = Φ(.75), niin taulukon kolmannelta sivulta etsitään sarakkeesta z luku.7 ja riviltä z luku.05. Näiden leikkauskohdasta löytyy kertymäfunktion arvo Arvojen - ja.75 väliin jää siis % normitetun normaalijakauman tiheysfunktion kuvaajan ja x-akselin rajoittamasta alasta. Kannattaa myös huomata, että koska normaalijakauma on symmetrinen, niin Φ(-z) = - Φ(z) Siis esimerkiksi Φ(-.75) = ja Φ(.75) = = Koska näin on, niin jos normaalijakauman taulukko on annettu vain välille tai välille , voi toisen välin arvot laskea komplementtitapahtuman säännöllä. 8

21 VALINTAKOEKIRJASTA Studentin t-jakauma on symmetrinen, mutta sen muoto määräytyy vapausasteiden mukaan. Studentin t-jakauman taulukossa esitetään tiettyihin merkitsevyystasoihin liittyvät testisuureen kriittiset arvot. Taulukon vasemmasta reunasta valitaan vapausasteluku. Vapausasteiden riviltä nähdään testisuureen kriittiset arvot. Jos esimerkiksi t-jakauman vapausasteluku on 0, niin todennäköisyys, että t < -.8 on 0.05 (likiarvo kahden desimaalin tarkkuudella) ja todennäköisyys että t >.764 on 0.0 (likiarvo tämäkin). χ -jakauma ei ole symmetrinen ja sen muoto määräytyy vapausasteiden mukaan. χ -jakauman kriittiset arvot on taulukoitu vapausasteiden ja merkitsevyystason mukaan. Jos esimerkiksi χ -jakauman vapausasteluku on 5, niin todennäköisyys että χ < 5.9 on 0.0 (siis likiarvo kahden desimaalin tarkkuudella) ja todennäköisyys että χ > on 0.05 (likiarvo). 9

22 VALINTAKOEKIRJASTA 7 Tilastollinen päätöksenteko ja hypoteesien testaaminen Sivulla 75 mainitaan, että Saatu p-arvo osoittaa, kuinka suuri on väärän johtopäätöksen todennäköisyys, jos nollahypoteesi hylätään. Tämän voidaan tavallaan ajatella olevan myös todennäköisyys sille, että vaihtoehtoinen hypoteesi on väärä. Ensimmäisen lauseen voi ymmärtää oikein, mutta toisesta voi saada sellaisen väärän käsityksen, että p-arvo olisi todennäköisyys sille, että H on väärä. Näin ei ole. P-arvo on todennäköisyys sille, että saadaan otoksesta lasketun arvon verran poikkeava tai sitä vielä poikkeavampi tulos nollahypoteesin mukaisesta arvosta olettaen että nollahypoteesi on tosi. P-arvon tulkinnassa saattaa tulla vastaan muutamia muitakin väärinymmärryksiä, joita tässä pyritään ennalta ehkäisemään. P-arvo ei ole todennäköisyys sille, että nollahypoteesi on tosi, p-arvo ei ole todennäköisyys hylätä väärä nollahypoteesi eikä p-arvo ole todennäköisyys sille, että havaittu tulos olisi saatu sattumalta. Kirjan lauseella pyrittäneen kuvaamaan seikkaa, että mitä pienempi p-arvo on, sitä vahvempi todiste otoksesta laskettu testisuure on nollahypoteesia vastaan. Tähän liittyen kirjan sivun 75 taulukko olisi parempi esittää seuraavassa muodossa. Todellisuus Päätös H0 epätosi H0 tosi H0 hylätään. Oikea päätös. Hylkäämisvirhe (tyypin virhe eli väärä positiivinen päätös) H0 jää voimaan 3. Hyväksymisvirhe (tyypin virhe eli väärä negatiivinen päätös) 4. Oikea päätös Kirjan sivulla 86 käsitellään riippumattomien otosten t-testiä. Sivulla kerrottu t-testisuureen kaava soveltuu käytettäväksi tilanteissa, joissa n = n. Yleisesti t-testisuureen kaava on:, jossa ja siis Kirjassa sivulla 87 olevan esimerkin vastaus pyöristettynä 3 desimaalin tarkkuuteen on kirjassa esitetyllä kaavalla laskettuna ja yllä esitetyllä Jos otoshajontojen ja otoskokojen erot ovat pieniä, molemmat kaavat antavat likimain saman tuloksen. Otoskokojen ollessa eri suuret tulee kuitenkin käyttää yllä olevaa kaavaa. 0

23 VALINTAKOEKIRJASTA 8 Tilastollinen riippuvuus ja korrelaatiokertoimet Osassa 8. Korrelaatio esitetään Pearsonin korrelaatiokerroin kahden muuttujan välisen yhteyden mittana. Kertoimen laskemiseen esitetään seuraava kaava, mutta kertoimen voi laskea muillakin tavoin., jossa z x on x-muuttujan normitettu arvo ( ), z y on y-muuttujan normitettu arvo ( ) Kun korrelaatiokerroin lasketaan otoksesta, oikea jakaja on n-. Hajontojen ja kovarianssin avulla korrelaatiokertoimen voi laskea kaavalla s xy on muuttujien x ja y välinen kovarianssikerroin, s x on muuttujan x keskihajonta ja s y on muuttujan y keskihajonta Kovarianssikerroin on kahden muuttujan yhteisvaihtelun estimaatti, jota ei ole normitettu välille [-, ]. Kovarianssi lasketaan kaavalla Siis jokaisen havainnon kohdalla lasketaan havainnon x-muuttujan arvon ja x-muuttujan keskiarvon erotus sekä havainnon y-muuttujan arvon ja y-muuttujan keskiarvon erotus ja nämä arvot kerrotaan. Näin saadut tulot lasketaan yhteen otoksen kaikilta havainnoilta ja tämä summa jaetaan luvulla n-. Korrelaatiokertoimen voi laskea myös seuraavalla kaavalla, jota käytettäessä ei ole välttämätöntä laskea muuttujien hajontoja. Joskus korrelaatiokertoimen voi laskea helpoiten käsin seuraavien kaavojen avulla.

24 VALINTAKOEKIRJASTA Seuraavassa taulukossa on pieni kymmenen havainnon aineisto, jonka avulla eri kaavojen mukaisia laskuja on helppo harjoitella, sillä välivaiheissa saatavat luvut ovat pyöreitä. Kummankin muuttujan keskiarvo on 4 ja hajonta. Kovarianssikertoimen arvo on 3 ja korrelaatiokertoimen arvo on nro x y

25 VALINTAKOEKIRJASTA 9 Regressioanalyysi Luvun tekstiä on jonkin verran muutettu verrattuna kirjan pohjana olleeseen edellisten vuosien valintakoekirjaan. Tekstistä on korjattu maininnat syy-yhteydestä, mutta sellainen on jäänyt sivun 6 vuokaavioon, josta voi saada virheellisen käsityksen. Regressioanalyysi ei edellytä eikä sen tuloksista yksistään voida päätellä kausaaliyhteyttä. Mahdollisen kausaalisuuden selvittäminen voi tapahtua koeasetelman ja teoreettisen mekanismin elaboraation perusteella, esimerkiksi sulkemalla pois muita selitysmahdollisuuksia. Regressiomallin arvioimista käsitellään kirjan luvussa 9.4. Tässä tuodaan esiin muutama näkökohta lisää tarkastelemalla esimerkkejä 4 ja 5. Regressiomallin tilastollisen merkitsevyyden selvittäminen aloitetaan tutkimalla koko mallin tilastollista merkitsevyyttä selityskertoimen lisäksi. Mallin tilastollinen testaaminen tapahtuu F-testisuureen avulla. F-jakauma on jatkuva todennäköisyysjakauma, jolla on kaksi vapausastelukua, jotka vaikuttavat jakauman muotoon. F-jakauman käyttöä ei käydä läpi tarkemmin ja valintakoetta ajatellen jakaumasta ei tarvitse tietää enempää. Regressioanalyysin yhteydessä F-testisuuretta käytetään testaamaan nollahypoteesia H 0 : R = 0 eli mallin yhteiskorrelaatiokerroin on nolla. H -hypoteesi on puolestaan R > 0. Yhtä hyvin nollahypoteesin voi esittää muodossa R = 0 eli mallin selitysaste on nolla. Jos tämä nollahypoteesi jää voimaan, niin silloin ei voida sanoa, että mallin selittävät muuttujat ennustaisivat tai selittäisivät selitettävää muuttujaa tilastollisesti merkitsevästi. Yhteiskorrelaatiokerroin on regressiomallin ennustearvojen ja selitettävän muuttujan havaittujen arvojen välinen korrelaatiokerroin. Tämän tarkempaan yhteiskorrelaatiokertoimen tarkasteluun ei tässä mennä. Alle on koottu esimerkin 5 malleista taulukkoja. Taulukko. Esimerkin 5 mallien yhteenvetotietoja. Selitettävä muuttuja on elinajanodote. Malli R R R a F df df p-arvo <.00 Huomataan, että kaikki mallit selittävät elinajanodotetta tilastollisesti merkitsevästi (p-arvot ovat pieniä). Yhteiskorrelaatiokerroin ja selityskerroin ovat lähes yhtä suuria malleissa 3, mutta muuttujien jättäminen pois parantaa suhteutettua selityskerrointa. Kun tarkastellaan yhdessä edellä olevan taulukon kanssa mallien regressiokertoimia, voidaan malleja verrata tarkemmin. Seuraavan sivun taulukossa on esimerkin 5 taulukko muutamin lisäyksin ja korjauksin. Mukaan on lisätty muun muassa VIF-arvot ja mallin 3 BKT:n t- ja p-arvot on korjattu. 3

26 VALINTAKOEKIRJASTA Taulukko. Esimerkin 5 mallien regressiokertoimet, niiden tilastollinen merkitsevyys ja VIF-arvot. Selitettävä muuttuja on elinajanodote. Regressiokerroin Malli Selittäjät t-arvo p-arvo VIF Vakiotermi <.00 3 Henkilöä/lääkäri Imeväiskuolleisuus Hedelmällisyysluku BKT/henkilö (000 USD) Vakiotermi <.00 Imeväiskuolleisuus Hedelmällisyysluku BKT/henkilö (000 USD) Vakiotermi <.00 Imeväiskuolleisuus BKT/henkilö (000 USD) Mallissa huomataan, että vaikka koko malli selitti elinajanodotetta tilastollisesti merkitsevästi, niin yhdenkään muuttujan t-arvo ei ole tilastollisesti merkitsevä. Tämä ristiriitaiselta tuntuva tulos johtuu siitä, että selittävillä muuttujilla on paljon päällekkäistä selitysosuutta. Huomataan, että imeväiskuolleisuus korreloi (katso kirjan s. 55 korrelaatiomatriisi) voimakkaasti muiden selittävien muuttujien (erityisesti henkilöä/lääkäri -muuttujan) kanssa. Kirjassa esitettyjen nyrkkisääntöjen perusteella joudutaan nyt päättämään poistetaanko mallista imeväisyyskuolleisuus (korkea VIF-arvo, mutta voimakas korrelaatio elinajanodotteen kanssa) vai henkilöä/lääkäri (suuri p-arvo mallissa ja matalampi korrelaatio selitettävän muuttujan kanssa). Imeväiskuolleisuuden korkea VIF-arvo johtuu siitä, että mallissa mukana oleva, mutta elinajanodotetta huonommin selittävä henkilöä/lääkäri -muuttuja korreloi sen kanssa voimakkaasti. Jos ei ole teoreettisia perusteita muuttujien valinnalle, kannattaa poistaa henkilöä/lääkäri -muuttuja ja tutkia, mitä imeväiskuolleisuuden VIF-arvolle tapahtuu. Mallissa imeväiskuolleisuuden VIF-arvo on selvästi pienempi ja sen p-arvo lähestyy perinteistä tilastollisen merkitsevyyden rajaa (.05). Hedelmällisyysluvun p-arvo on suuri (mitä se oli myös mallissa ), joten sen mukana olo mallissa ei ole tilastollisen merkitsevyyden valossa kovin hyödyllistä. Mallissa 3 imeväiskuolleisuus on tilastollisesti merkitsevä ja BKT:kin lähestyy perinteistä tilastollisen merkitsevyyden rajaa (.05). Jos BKT jätettäisiin pois ja selitettäisiin elinajanodotetta ainoastaan imeväiskuolleisuudella, niin mallin selityskerroin olisi (-0.89) 0.67, mikä on selvästi pienempi kuin malleissa 3. Tämän esimerkin tapauksessa olisi järkevää pitää myös BKT selittäjänä. Kannattaa myös pitää mielessä, että esimerkin aineisto on kovin pieni. Taulukon merkinnöistä on hyvä huomata, että on oikeampaa ilmoittaa p-arvon merkintä p <.00, vaikka tietokoneohjelmien tulostus olisikin esimerkiksi.00 (kirjan esimerkissä vakiotermien p-arvot) ja ettei VIF-arvoa lasketa vakiotermille. 4

27 VALINTAKOEKIRJASTA Kirjan sivulla 334, luvun 9 tehtävän 7 (itse tehtävä on sivulla 66 ja siinä olevassa taulukossa lienee painovirhe m 3, kun luultavasti tarkoitetaan m ) kohdan b vastauksessa on regressioyhtälö Koko = 5,44 + 0,33 Hinta Tämän yhtälön perusteella on sitten laadittu ennuste hinnalle kun asunnon koko on 50 m :,,,, Joka siis kerrottuna tuhannella eurolla on B-kohdan kysymykseen vastaamiseksi voitaisiin laatia regressiomalli, jossa hintaa selitetään/ennustetaan asunnon koolla. Tällöin saadaan regressioyhtälö Hinta = 3,49 + 3,5 Koko.,, Ennuste olisi siis Tämä on oikea vastaus, kun tehtävässä puhutaan koon vaikutuksesta hintaan. On pienimmän neliösumman menetelmän ominaisuus, että kahden muuttujan väliselle regressiolle saadaan kaksi eri yhtälöä riippuen siitä, kumpi muuttujista on selitettävä ja kumpi selittävä muuttuja. Asian tarkempi selostus ohitetaan tässä, koska se on valintakokeeseen valmistautumista ajatellen melko vaativa. Tämän tehtävän osalta seuraavan sivun kuvat valaisevat asiaa hieman. 5

28 VALINTAKOEKIRJASTA 6

29 VANHOJA VALINTAKOETEHTÄVIÄ Vanhoja valintakoetehtäviä Tässä osassa on joitakin vanhoja valintakoetehtäviä. Ratkaisut niihin löytyvät lisämateriaalin viimeisestä osasta. Vuosi 989, tehtävä 4 Sankari oli päässyt tutkimusapulaiseksi erään lääkärin tutkimusprojektiin. Lääkäri oli kiinnostunut siitä, kuinka suuri vaikutus lämpötilan muutoksilla on päähineen käyttöön. Sankarimme oli saanut seuraavat ohjeet tutkimuksen tekoon: Mene kaupungille johonkin baariin, istu siellä rauhallisessa nurkkapöydässä, josta on näköala vilkasliikenteiselle kadulle ja tutki päähineen käyttöä. Kirjaa seuraavat tiedot tutkimustilanteesta: Päivämäärä, ulkolämpötila. kadulla kulkevista jalankulkijoista kirjaa seuraavat tiedot: päähineen käyttö, sukupuoli, arvioitu ikä, kellonaika. Sankari teki työtä käskettyä (pienen palkkion toivossa) ja seuraavalla sivulla on hänen tilastonsa. Rinnakkain esiintyvät kahtena eri päivänä tehdyt mittaukset. Ensimmäisen päivänä pakkasta ei ollut lainkaan. Toisella mittauskerralla lämpötila oli -0 C. Aikaisemmissa tutkimuksissa oli todettu, että kylmemmällä säällä useammat käyttävät päähinettä, mikä kuulostaakin ihan luontevalta. Jos lasket päähineen käyttäjien lukumäärät 0 C ja -0 C huomaat, että päähineen käyttäjiä on lähes yhtä paljon. a) Mistä johtuu, ettei Sankari saanut yllä mainitulla aineistolla aikaisempien tutkimustulosten mukaista tulosta? Perustele vastauksesi graafisin kuvin. Tilastollisia testejä tuloksen vahvistamiseen ei tämän tehtävän ratkaisuissa edellytetä. b) Jos sinun pitäisi tutkia lämpötilan vaikutusta päähineen käyttöön, miten voisit ottaa huomioon kokeen järjestämisessä Sankarin saamia tuloksia? Taulukossa esiintyvät muuttujat: päähine: Päähine on päässä =, ei päähinettä päässä = 0 sukup: Sukupuoli, nainen = N, mies = M ikä: Arvioitu ikä 0 vuoden tarkkuudella kellonaika: Kellonaika, jolloin tutkittavan henkilön päähineen käyttö kirjattu 7

30 VANHOJA VALINTAKOETEHTÄVIÄ Mittauskerta, Mittauskerta, Ulkolämpötila 0 C Ulkolämpötila 0 C päähine sukup ikä kellonaika ulkolämpötila päähine sukup ikä kellonaika ulkolämpötila M 0 9:0 0 N 50 9:5 0 0 M 40 9:0 0 M 0 9:5 0 0 M 0 9:0 0 0 N 0 9:5 0 0 N 0 9:0 0 M 0 9:5 0 N 50 9:0 0 0 N 0 9:5 0 N 50 9:0 0 N 0 9:5 0 N 60 9:0 0 N 60 9:5 0 0 M 60 9:0 0 0 M 0 9:5 0 M 50 9:0 0 M 0 9:5 0 0 M 50 9:0 0 0 M 0 9:5 0 N 60 9:0 0 M 60 9:5 0 0 M 0 9:03 0 N 0 9:5 0 N 40 9: N 0 9:5 0 0 N 0 9: N 0 9:53 0 M 40 9:03 0 N 0 9:53 0 M 40 9: M 0 9:53 0 M 50 9:03 0 M 50 9: M 0 9: M 0 9:54 0 N 50 9: M 0 9: N 0 9: N 0 9:54 0 N 40 9:04 0 N 40 9: N 50 9: N 0 9:54 0 M 60 9:04 0 M 0 9:54 0 N 60 9: M 0 9: N 0 9:04 0 N 0 9:54 0 M 50 9:04 0 N 50 9:55 0 Vuosi 990, tehtävä Tutkija on kiinnostunut siitä, ehtiikö aamun lehti tulla kello viiteen mennessä, jolloin hän ehtisi lukea lehden. Tutkijalla on seuraavaa tietoa postinkannosta: Postin kanto tapahtuu päivän periodeissa. Yhden periodin aikana varsinainen postinkantaja tuo postin 0 kertaa ja sijainen kahtena satunnaisena päivänä. Kun varsinainen postinkantaja tuo postin, niin 9 kertana 0:stä postin saapuminen noudattaa normaalijakaumaa parametrein: odotusarvo kello 4 aamulla, hajonta tunti. Keskimäärin kerran yhden periodin aikana postinkantajamme unohtuu juhlimaan liian pitkään (silloin, kun hänellä on oma kantovuoro) ja tällöin postin saapuminen noudattaa normaalijakaumaa parametrein: odotusarvo kello 6 aamulla, hajonta 90 minuuttia. 8

31 VANHOJA VALINTAKOETEHTÄVIÄ Kun sijainen kantaa postia, postin saapuminen noudattaa tasaista jakaumaa kello puoli neljän ja kello 6 välillä (näiden aikojen ulkopuolella postin saapumisen todennäköisyys on 0). Millä todennäköisyydellä lehti saapuu kello viiteen mennessä jonakin satunnaisena aamuna, jos: a) Varsinainen postinkantaja tuo lehden ja hän ei ole ollut juhlimassa. b) Varsinainen postinkantaja tuo lehden ja hän on ollut juhlimassa. c) Sijainen tuo postin. d) Millä todennäköisyydellä jonakin satunnaisena aamuna lehti on tipahtanut postiluukusta kello viiteen mennessä? Vuosi 990, tehtävä 3 Tutkija on kiinnostunut polkupyöräkypärän käytöstä. 00 pyöräilijän otoksesta 0 käyttää kypärää. Edellisenä vuonna on todettu, että kypärän käyttäjiä on 0 % polkupyöräilijöistä. Voiko tutkija väittää, että kypärän käyttö on lisääntynyt 5 % riskitasolla. a) Aseta H 0 ja H hypoteesit. b) Ratkaise tehtävä. Miten tämän esimerkin tapauksessa määrittelet hypoteesin testauksessa: c) I lajin virhe. d) II lajin virhe. 9

32 VANHOJA VALINTAKOETEHTÄVIÄ Vuosi 99, tehtävä Seuraavassa on piirretty kolme jakaumaa. Määrittele yksikäsitteisesti mistä todennäköisyys- tai tiheysfunktiosta on kysymys. Piirrä pyydetyt kertymäfunktiot. Kaikkiin piirrettäviin kuvioihin on myös merkittävä asianmukaiset asteikot. a) Mikä on seuraava jakauma ja mitkä ovat jakauman tunnusluvut? Kuvioon on piirretty jakauman kaikkien mahdollisten arvojen todennäköisyydet. 0,8 0,4 pistemäärä pistemäärän todennäköisyys , 0,6 0, 0,08 0, b) Kuviossa on erään jakauman tiheysfunktio. Mikä todennäköisyysjakauma on kyseessä? pistemäärä osuus pintaalasta pistemäärä osuus pintaalasta ,5 0,5 0 c) Mikä jakauma kuvaan on piirretty? Mitkä ovat jakauman tunnusluvut? Tarkennukseksi ohessa pistemäärien väliin jäävän pinta-alan osuus jakauman kokonaispinta-alasta (kun kokonaispinta-alaa kuvataan luvulla ). pistemäärä osuus pinta-alasta pistemäärä osuus pinta-alasta

33 VANHOJA VALINTAKOETEHTÄVIÄ Vuosi 99, tehtävä Tutkija halusi tietää, kumpia pareja on Helsingin puhelinyhdistyksen (HPY) 99 puhelinluettelossa (kotipuhelimet) enemmän: sellaisia pareja, joissa miehen nimi on ensimmäisenä (esim. Virtanen Ahti ja Liisa) vai pareja, joissa naisen nimi on ensimmäisenä (esim. Virtanen Aili ja Pentti). Mukaan otetaan myös sellaiset pariskunnat, joilla on eri sukunimi, mutta yhteinen puhelinnumero (esim. Virtanen Antero ja Turunen Leena). Sellaisista nimistä, joissa oli vain pelkästään miehen nimi (esim. Virtanen Aarre), pelkästään naisen nimi (esim. Virtanen Agnes), enemmän kuin kaksi nimeä tai jonkun yhdistyksen nimi, ei oltu kiinnostuneita. Kyseisessä puhelinluettelon osassa on varsinaisia puhelinnumeroita sivulta 57 sivulle 3. Nimet ovat aakkosjärjestyksessä. jokaisella sivulla on kolme palstaa, jokaisella täydellä palstalla on noin 30 puhelinnumeroa. Seuraavassa on näyte puhelinluettelosta sivulta 080. Näytteessä on sivulta 080 ensimmäiset 0 nimeä jokaiselta palstalta, kolme nimeä keskeltä sivua jokaiselta palstalta ja kolme nimeä sivun alalaidasta jokaiselta palstalta. osoitteet ja puhelinnumerot on jätetty pois. Alleviivattuna ovat tutkimusotokseen hyväksyttävät nimiparit. Vir Virtanen Aarre 080 (palsta ) (palsta ) (palsta 3) Virtanen Aarre Virtanen Anne ja Markku Virtanen Eero ja Tarja Virtanen Aarre ja Glory Virtanen Anne-Leena Virtanen Eero Virtanen Aarre A ja Sylvia Virtanen Anneli Virtanen Eeva Virtanen Aatos Viljo Virtanen Anneli Virtanen Eeva Virtanen Agnes Virtanen Anneli Virtanen Eeva Virtanen Agnes ja Kalle Virtanen Anneli Virtanen Eeva Virtanen Ahti Virtanen Anneli ja kalle Virtanen Eeva Virtanen Ahti Virtanen Anneli ja Olavi Virtanen Eeva ja Juhani Virtanen Ahti Virtanen Anni Virtanen Eeva ja Olavi Virtanen Ahti ja Liisa Virtanen Anni Virtanen Eeva ja Soini Virtanen Ahti ja Sally Virtanen Anni ja Jukka Virtanen Eeva ja Veikko Virtanen Ahti ja Senja Virtanen Anniina ja Risto Virtanen Eeva, Jouko ja Heikki Virtanen Aija ja Tuija Virtanen Annikki Virtanen Eeva Kaarina Virtanen Aila Virtanen Annikki Virtanen Eeva-Liisa Virtanen Aila Virtanen Annikki Virtanen Eeva-Liisa Virtanen Aila Virtanen Annikki ja Iippo Virtanen Eeva-Liisa ja Matti Virtanen Aila Virtanen Annikki ja Rauno Virtanen Eevi ja Kalevi Virtanen Aila Virtanen Annikki ja Tauno Virtanen Eigil Virtanen Aila Virtanen Annukka Virtanen Eija Virtanen Aila Virtanen Ansa Virtanen Eija Virtanen Aino ja Rainer Virtanen Arto ja Anja Virtanen Elsa Virtanen Aino ja Toini Virtanen Arto ja Marja-Leena Virtanen Elsa Virtanen Aino ja vilho Virtanen Avo Virtanen Else Virtanen Anne ja Esa Virtanen Eero Virtanen Eva Virtanen Anne ja Juha Virtanen Eero ja Pirkko Virtanen Eva ja Voitto Virtanen Anne ja Markku Virtanen Eero ja Raila Virtanen Eva-Lisa ja Kari Tutkija otti otoksen kolmella tavalla: Otos. Ensimmäiseen otokseen valittiin kokonaisina sivut 57, 57, 57 ja 357. Jokaiselta sivulta laskettiin kaikkien otokseen hyväksyttävien parien määrät palstoittain. Otosyksikkönä on siis yhden sivun yksi palsta. 3

34 VANHOJA VALINTAKOETEHTÄVIÄ Otos. Virtanen on Helsingin puhelinluettelon yleisin nimi. Mukaan otettiin kaikki Virtaset. Otosyksikkönä on yhden sivun yksi palsta. (Mukaan otettiin vain ne palstat, joissa oli koko palstan mitan Virtasia.) Otos 3a ja 3b. Otoksen 3a ensimmäinen otantayksikkö muodostui seuraavasti: Otettiin sivuilta jokaisen palstan ensimmäinen pariskunta. Täten otokseen tuli 30 pariskuntaa. Toiseen otantayksikköön otettiin vastaavasti sivuilta jokaiselta palstalta ensimmäinen pariskunta. Näin tehtiin edeten aina 00 sivua eteenpäin, niin että viimeisenä otettiin sivuilta jokaisen palstan ensimmäiset parit. Otos 3b otettiin vastaavalla tavalla kuin otos 3a, mutta aloitettiin sivulta ja edettiin aina 00 sivua eteenpäin. Taulukko. Taulukossa on esitetty edellä mainituilla tavoilla poimitut otokset. Taulukossa on ensiksi poimintasivu (sivu) (otoksissa 3a ja 3b sivut), palstan numero sivulla (palsta), otantayksikön järjestysnumero (otantayksikön numero), Niiden parien lukumäärät, joissa naisen nimi on ensimmäisenä (nainen ensin), kaikkien otantayksikköön hyväksyttyjen parien lukumäärät (kaikki parit) ja niiden parien suhteellinen osuus, joissa naisen nimi on ensin (nainen ensin/kaikki). Otos Otos sivu palsta otantayksikön numero nainen ensin kaikki parit nainen ensin / kaikki nainen ensin kaikki parit nainen ensin / kaikki , , , , , , , , , , , , , , , , , , , , , , , , , ,6 yht: ,35 yht: ,35 Otos 3a Otos 3b sivut nainen ensin kaikki parit nainen ensin / kaikki sivut sivu palsta otantayksikön numero otantayksikön numero otantayksikön numero nainen ensin kaikki parit , , , , , , , , , , , , , , , , , , , , , ,33 yht: ,4 yht: ,39 nainen ensin / kaikki 3

35 VANHOJA VALINTAKOETEHTÄVIÄ a) Piirrä naisten suhteellista osuutta kuvaavat frekvenssikäyrät otantayksiköittäin kahteen kuvioon seuraavasti: toiseen kuvioon otos yhtenäisellä viivalla ja otos katkoviivalla, toiseen kuvioon otos 3a yhtenäisellä viivalla ja otos 3b katkoviivalla. X-akselille tulee otantayksikön numero, Y-akselille suhteellinen osuus. b) Laske otoksille 3a ja 3b nainen ensin -pariskuntien suhteellisten osuuksien luottamusväli yhdelle otantayksikölle (N=30). Käytä suhteellisten osuuksien testiä, p:n arvona voit käyttää 0.4. Piirrä tämä luottamusväli molempien kuvioiden reunaan. c) Mikä käytetyistä otantamenetelmistä vaikuttaa parhaalta? Perustele vastauksesi. d) Tutki voitko tehtyjen otosten perusteella prosentin riskitasolla osoittaa, että joko miehen tai naisen nimi on yleisempi ensimmäisenä nimenä ja jos voit niin kumpi on yleisempi. Vuosi 99, tehtävä 3 Tutkija osallistuu tv:n Kymppitonni-nimiseen kilpailuun. Kilpailussa on viisi osallistujaa, joista yksi aina vuorollaan tekee kysymyksen ja neljä muuta yrittävät arvata, mikä on oikea vastaus. Jos arvaajista ei kukaan tai kaikki neljä arvaavat oikein, tulee kysyjälle 500 mk:n tappio. Jos kolme vastaa oikein saa kysyjä ja jokainen oikein vastannut 00 mk, jos kaksi vastaa oikein saa kysyjä ja oikein vastanneet 300 mk ja jos vain yksi vastaa oikein saavat kysyjä ja vastaaja molemmat 000 mk. Tutkija aikoo ilmoittaa kilpailijoille vastauksen vaihtoehdot. Hän kysyy esim. ajattelen jotain numeroista,, 3, 4 tai 5, arvaa mitä numeroa ajattelen. (Täten tässä tapauksessa vaihtoehtoja on viisi). a) Millä vaihtoehtojen määrällä tutkija minimoi sen mahdollisuuden, että hän joutuisi maksamaan 500 mk (eli joko ei kukaan tai kaikki neljä henkilöä vastaavat oikein)? b) Jos vaihtoehtoja on neljä (siis esim. numerot,, 3 ja 4), niin mikä on todennäköisyys, että täsmälleen kaksi henkilöä vastaa oikein? c) Montako vaihtoehtoa kannattaa antaa arvattavaksi, jos haluaa maksimoida todennäköisyyden, että vain yksi henkilö arvaa oikein (eikä välitetä ollenkaan siitä mahdollisuudesta, että kaikki arvaisivat väärin tai kaikki arvaisivat oikein)? Vuosi 993, tehtävä 3 Tutkija on pitkällä junamatkalla pääsiäisen ruuhkajunassa ravintolavaunun viereisessä vaunussa. Juna on hyvin pitkä ja väkeä kulkee jatkuvasti edestakaisin. Matkan virkistykseksi lapset haluavat pelata lehdestä löytynyttä peliä, jossa tarvitaan normaalia kuusitahoista arpakuutiota, jossa jokaisella numerolla -6 on yhtä suuri todennäköisyys tulla valituksi. Koko pelin läpi pelaamiseen jokainen heittäjä tarvitsee korkeintaan 50 heittoa, pelaajia on kolme. Arpakuutiota ei kuitenkaan ollut ja niinpä tutkija joutuu käyttämään muita keinoja vastaavien numeroiden arpomiseen. Miten arpominen suoritettaisiin, jos: 33

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

PSYKOLOGIA - KOGNITIOTIEDE TILASTOMATEMATIIKAN LISÄMATERIAALI VALINTAKOE 2015 HELSINGIN YLIOPISTO

PSYKOLOGIA - KOGNITIOTIEDE TILASTOMATEMATIIKAN LISÄMATERIAALI VALINTAKOE 2015 HELSINGIN YLIOPISTO PSYKOLOGIA - KOGNITIOTIEDE TILASTOMATEMATIIKAN LISÄMATERIAALI VALINTAKOE 05 HELSINGIN YLIOPISTO PSYKOLOGIAN JA KOGNITIOTIETEEN VALINTAKOE 05 Tilastomatematiikan lisämateriaali Copyright Helsingin yliopisto,

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Tilastomatematiikan materiaali

Tilastomatematiikan materiaali Psykologian valintakoe 2019 Tilastomatematiikan materiaali Copyright Helsingin yliopisto, Lääketieteellinen tiedekunta Materiaalin tai sen osien luvaton kopiointi ja muuntelu on kielletty. 1 Aluksi Tässä

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

Johdatus tn-laskentaan perjantai 17.2.2012

Johdatus tn-laskentaan perjantai 17.2.2012 Johdatus tn-laskentaan perjantai 17.2.2012 Kahden diskreetin muuttujan yhteisjakauma On olemassa myös monen muuttujan yhteisjakauma, ja jatkuvien muuttujien yhteisjakauma (jota ei käsitellä tällä kurssilla;

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 24.4.2017 1 Kategoriset muuttujat Lukumääriä Prosentteja (muista n-arvot) Pylväitä 2 Yhteenvetotaulukko (frekvenssitaulukko) TAULUKKO 1. Asunnon tyyppi

Lisätiedot

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. 1/11 4 MITTAAMINEN Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku. Mittausvirhettä johtuen mittarin tarkkuudesta tai häiriötekijöistä Mittarin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

11. laskuharjoituskierros, vko 15, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut 11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

+ 3 2 5 } {{ } + 2 2 2 5 2. 2 kertaa jotain

+ 3 2 5 } {{ } + 2 2 2 5 2. 2 kertaa jotain Jaollisuustestejä (matematiikan mestariluokka, 7.11.2009, ohjattujen harjoitusten lopputuloslappu) Huom! Nämä eivät tietenkään ole ainoita jaollisuussääntöjä; ovatpahan vain hyödyllisiä ja ainakin osittain

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

ARVIOINTIPERIAATTEET

ARVIOINTIPERIAATTEET PSYKOLOGIAN YHTEISVALINNAN VALINTAKOE 2012 ARVIOINTIPERIAATTEET Copyright Helsingin yliopisto, käyttäytymistieteiden laitos, Materiaalin luvaton kopiointi kielletty. TEHTÄVÄ 1. (max. 34.5 pistettä) 1 a.i)

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu 1.1 Noudattakoon satunnaismuuttuja X normaalijakaumaa a) b) c) d) N(5, 15). Tällöin P (1.4 < X 12.7) on likimain

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi Tilastotiedettä Tilastotieteessä kerätään tietoja yksittäisistä asioista, ominaisuuksista tai tapahtumista. Näin saatua tietoa käsitellään tilastotieteen menetelmin ja saatuja tuloksia voidaan käyttää

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen MAT-5 Todennäköisyyslaskenta Tentti.. / Kimmo Vattulainen Vastaa jokainen tehtävä eri paperille. Funktiolaskin sallittu.. a) P A). ja P A B).6. Mitä on P A B), kun A ja B ovat riippumattomia b) Satunnaismuuttujan

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33. Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa.

MAY1 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 12.4.2016 Julkaiseminen sallittu vain koulun suljetussa verkossa. KERTAUS Lukujono KERTAUSTEHTÄVIÄ K1. Ratkaisussa annetaan esimerkit mahdollisista säännöistä. a) Jatketaan lukujonoa: 2, 4, 6, 8, 10, 12, 14, 16, Rekursiivinen sääntö on, että lukujonon ensimmäinen jäsen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30. FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen MAT-25 Todennäköisyyslaskenta Tentti 12.4.216 / Kimmo Vattulainen Funktiolaskin sallittu. Palauta kaavakokoelma 1. a) Pelaajat A ja B heittävät noppaa vuorotellen ja pelin voittaa se, joka saa ensimmäiseksi

Lisätiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 31.03.2012 klo. 9.00-12.00 saleissa L1,L3 Jukka Kemppainen Mathematics

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Luottamusvälit. Normaalijakauma johnkin kohtaan

Luottamusvälit. Normaalijakauma johnkin kohtaan Luottamusvälit Normaalijakauma johnkin kohtaan Perusjoukko ja otanta Jos halutaan tutkia esimerkiksi Suomessa elävien naarashirvien painoa, se voidaan (periaatteessa) tehdä kahdella tavalla: 1. tutkimalla

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti Sosiaalitieteiden laitos Tilastotieteen jatkokurssi, kevät 20 7. laskuharjoitusten ratkaisuehdotukset. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

2 Yhtälöitä ja epäyhtälöitä

2 Yhtälöitä ja epäyhtälöitä 2 Yhtälöitä ja epäyhtälöitä 2.1 Ensimmäisen asteen yhtälö ja epäyhtälö Muuttujan x ensimmäisen asteen yhtälöksi sanotaan yhtälöä, joka voidaan kirjoittaa muotoon ax + b = 0, missä vakiot a ja b ovat reaalilukuja

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 7.11.2011 1 Muuttujat Aineiston esittämisen kannalta muuttujat voidaan jaotella kolmeen tyyppiin: Kategoriset (esimerkiksi sukupuoli, koulutus) Asteikolla

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Hypoteesin testaus Alkeet

Hypoteesin testaus Alkeet Hypoteesin testaus Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Johdanto Kokeellinen tutkimus: Varmennetaan teoreettista olettamusta fysikaalisen systeemin käyttäytymisestä

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto...2. 2 Aineiston kuvaus...3. 3 Riippuvuustarkastelut...4

Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto...2. 2 Aineiston kuvaus...3. 3 Riippuvuustarkastelut...4 TILTP1 Tilastotieteen johdantokurssin harjoitustyö Tampereen yliopisto 5.11.2007 Perttu Kaijansinkko (84813) perttu.kaijansinkko@uta.fi Pääaine matematiikka/tilastotiede Tarkastaja Tarja Siren 1 Johdanto...2

Lisätiedot