Tampereen yliopiston kirjasto, 2003

Koko: px
Aloita esitys sivulta:

Download "Tampereen yliopiston kirjasto, 2003"

Transkriptio

1 Tekijä: Leppälä, Raija Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla. Tampere : Tampereen yliopisto, lehteä. ISBN Tämä aineisto on julkaistu verkossa oikeudenhaltijoiden luvalla. Aineistoa ei saa kopioida, levittää tai saattaa muuten yleisön saataviin ilman oikeudenhaltijoiden lupaa. Aineiston verkko-osoitteeseen saa viitata vapaasti. Aineistoa saa selata verkossa, mutta sitä ei saa tallentaa pysyvästi omalle tietokoneelle. Aineisto on PDF-tiedostomuodossa. Sen lukemiseen tarvitaan Adobe Acrobat Reader-ohjelma. Mikäli ohjelmaa ei ole jo asennettu, sen saa ilmaiseksi osoitteesta Tampereen yliopiston kirjasto,

2 Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla Raija Leppälä TAMPEREEN YLOIOPISTOPAINO OY Juvenes-Print Tampere 2001 Opetusmoniste B korjailematon painos Matematiikan, tilastotieteen ja Helmikuu 2001 filosofian laitos ISBN ISSN TAMPEREEN YLIOPISTO

3 ALUKSI Tämä opas on tarkoitettu tilastollisen tutkimuksen tekemisen oppaaksi, kun toteutuksessa käytetään SPSS for Windows -ohjelmistoa. Opas on syntynyt vuosien varrella Tampereen yliopistossa pitämieni tilastotieteen peruskurssien yhteydessä tapahtuneiden SPSS -ohjelmiston käytön opetuksen sekä erillisten SPSS -kurssien pohjalta. Tässä oppaassa ei esitellä yksityiskohtaisesti eri toimintojen teknistä toteuttamista, vaan annetaan ainoastaan ohjeet siitä, mistä haluttu analyysi löytyy, ja kiinnitetään erityistä huomiota analyysin oikeaan valintaan ja tulosten tulkintaan. Tarvittaessa teknisiä oppaita löytyy lukuisia (ks. Liite 2, esimerkiksi Karjalainen (1999), Kanniainen (1999)). Lukijalta edellytetään perustietoja tilastotieteestä, mutta toisaalta opasta voi käyttää vaikka tiedot olisivatkin melko vähäiset. Opas tarjoaakin mahdollisuuden tietojen ajan tasalle saattamiseksi sekä täydentämiseksi, sillä oppaassa esitellään lyhyesti myös tilastotieteen perusteita. Opas soveltuu tilastollisen analyysin tekemisen tueksi silloin, kun käytetään tavanomaisempia tilastollisia analyysejä. Tilastotieteen teorian perinpohjainen hallitseminen ei siis ole oppaan käytön kannalta tarpeellista. Opas on paremminkin pyritty kirjoittamaan soveltajan näkökulma huomioiden. Pyritään siis avustamaan tutkijaa menetelmien valinnassa ja ohjelmiston antamien tulosten tulkinnassa. Tampereella 2. lokakuuta 2000 Raija Leppälä

4 SISÄLLYSLUETTELO 1. Johdanto 7 2. SPSS -ympäristö 7 3. Havantomatriisin luominen ja muokkaaminen 9 4. Muuttujien jakaumat ja tunnusluvut Jakaumat Ehdollistaminen Tunnuslukuja Pisteparvi ja korrelaatiokerroin Joitain yleisesti käytettyjä analysointimenetelmiä Ristiintaulukko Odotusarvojen yhtäsuuruuden testaaminen t -testillä Variansianalyysi Regressioanalyysi Lopuksi 36 Liite 1. Joitain SPSS -oppaita sekä kirjallisuutta, jossa yhdistetty tilastollinen tutkimus sekä SPSS -opastus. 38 Liite 2. Joitain huomioita liittyen SPSS -ohjelmiston aiempiin versioihin. 39

5 7 1. JOHDANTO Tilastollinen analyysi voidaan karkeasti jakaa kuvailevaan analyysiin ja tilastolliseen inferenssiin (päättelyyn). Kuvaileva osuus pyrkii kuvailemaan tietoaineistoa erilaisten graafisten esitysten ja tunnuslukujen sekä taulukoiden avulla. Tilastollinen päättely käsittelee johtopäätelmien tekoa populaatiosta aineiston (otoksen) perusteella. Inferenssi perustuu todennäköisyysjakaumiin ja niiden hyväksi käyttöön erilaisten testien ja analyysien yhteydessä. Tässä monisteessa esitellään lyhyesti joitain analysointimenetelmiä, annetaan ohjeita menetelmän valinnasta ja analyysin suorittamisesta SPSS (Statistical Package for Social Sciences) 9.0 for Windows -ohjelmiston avulla sekä tulkitaan esimerkeissä saatuja tuloksia. Lähdetään liikkeelle aineiston tallennuksesta, muokkauksesta ja kuvailusta. Sitten tutustutaan joihinkin testeihin ja menetelmiin, joita voidaan käyttää tilastollisen tutkimuksen teossa. SPSS for Windows -ohjelmisto on helppokäyttöinen, Windows -ympäristössä toimiva, valikko-ohjattu tilastollinen ohjelmisto, jolla on mahdollista suorittaa empiirisen aineiston tallennus ja muokkaus sekä tilastolliset analyysit graafisine esityksineen. Ohjelmisto sisältää hyvin laajan valikoiman analysointimenetelmiä aina aineiston kuvailuun liittyvistä menetelmistä ei-parametrisiin testeihin, monimuuttujamenetelmiin, epälineaarisiin malleihin ja aikasarjaanalyysiin. 2. SPSS -YMPÄRISTÖ Käynnistettäessä SPSS -ohjelma avautuu Data Editor -ikkuna (aineistoikkuna). Tämä ikkuna sisältää,ohjelman päävalikon. Analysointeja tehtäessä tulokset tulevat automaattisesti avautuvaan Output navigator -ikkunaan (tulostusikkunaan), jonka valikko poikkeaa jonkin verran Data Editor -ikkunan valikosta.

6 8 Päävalikko, jonka avulla käyttäjä pyytää ohjelmaa suorittamaan toiminnot, sisältää seuraavat kohdat: File Havaintomatriisin luominen, avaaminen, tallennus, tulostaminen,..., ohjelman käytön lopetus. Edit Cut-, Copy-, Paste-, Clear -toiminnot (mm. muuttujien/havaintojen poisto). Data (vain Data Editor-ikkunassa) Havaintomatriisiin liittyvien määritysten teko, kuten muuttujien lisääminen ja määritteleminen, tilastoyksiköiden lisääminen, ehdollistaminen. Transform (vain Data Editor-ikkunassa) Muunnosten teko muuttujille, uusien muuttujien määrittäminen olemassa olevien muuttujien avulla,... Analyze (aiemmissa versioissa Statistics) Valitaan haluttu analyysi (esim. ristiintaulukointi, varianssianalyysi, regressioanalyysi). Graphs Graafisten esitysten tekeminen (esim. jakaumat, pisteparvet, laatikko-jana - kuviot). Uti liti es Muuttujien määrittelytietojen katsominen, muuttujien arvojen selitteiden näyttäminen havaintomatriisissa. Win do w Ikkunasta toiseen siirtyminen. Help Ohjeita. Päävalikko on hyvin edellä esitetyn mukainen myös versiossa 8.0 ja 7.5 eikä olennaisia eroja ole versioissa 6.0/6.1. Myös ikkunointi on hyvin samanlaista versioissa 7.5/8.0/9.0, mutta eroja on jonkin verran vanhemmissa versioissa (ks. Liite 1). Seuraavassa esitellään näiden valikoiden käyttöä tilastollisen tutkimuksen teon edetessä aineiston tallennuksesta analysointeihin. Lähdetään siis liikkeelle havaitoaineiston talletuksesta ja muokkauksesta. Kun aineisto on talletettu, voidaan aineiston analysointi aloittaa jakaumien teolla ja tunnuslukujen laskulla. Kuvailevan osuuden jälkeen on vuorossa tilastollisten analysointien teko riippuvuuksien selvittämiseksi. Suoritettaessa analyysiä valitaan tilanteeseen sopiva komento, jonka jälkeen ohjelma pyytää tarvittavat lisämääreet kuten mm. muuttuja(t). Muuttujat voidaan valita esillä olevasta muuttujaluettelosta; valitaan muuttuja(t), jolle halutaan jakauma, joista piirretään pisteparvi, jne.

7 9 3. HAVAINTOMATRIISIN LUOMINEN JA MUOKKAAMINEN Empiirisen aineiston eritysmuotona käytetään havaintomatriisia, jossa n tilastoyksikön p muuttujan arvot esitetään tilastoyksiköittäni seuraavasti: missä x ij on i. tilastoyksikön mittaluku ominaisuudelle X j. Muuttujan X j jakauma on j. pystyrivi eli sarake havaintomatriisissa. Tilastoyksikön a i havaintovektori muodostuu i. vaakarivistä. Muuttujia on kahdenlaisia: kvalitatiivisia (kategorisia) ja kvantitatiivisia (numeerisia). Kvalitatiivinen mittaaminen on vain laadullista mittaamista ja se voidaan jakaa nominaali- eli luokitteluasteikolliseksi ja järjestys- eli ordinaaliasteikolliseksi mittaamiseksi. Kvantitatiivinen mittaaminen on numeerista mittaamista, mitta-asteikkoina intervalli- ja suhdeasteikko sekä absoluuttinen asteikko. SPSS:llä käsiteltävä aineisto on aluksi saatettava havaintomatriisimuotoon, joka siis on kaksiulotteinen taulukko, jossa määritellään sarakkeille muuttujat ja kirjataan riveille tilastoyksiköittäin mittaustulokset. Tilastoyksiköitä ei havaintomatriisiin tarvitse nimetä, mutta identifioiva tunnusmuuttuja (vaikkapa juokseva numero) on syytä olla, jotta tarvittaessa löydetään vastaavuus aineiston ja talletetun havaintomatriisin välillä.

8 10 Havaintomatriisin avaaminen tai uuden luominen tapahtuu valikosta File New> uuden luominen Data... Open vanhan avaaminen (oletusarvoisesti näkyvät.sav-tunnisteella olevat Kun ohjelma käynnistetään, avautuu automaattisesti tyhjä havaintomatriisipohja. SPSS voi lukea myös muilla ohjelmilla talletettuja aineistoja. Esimerkiksi Excel-tiedosto voidaan lukea, kunhan se on talletettu Excel versio 4 (tai vanhempi) taulukoksi. Excel -taulukossa voi muuttujien nimet olla 1. rivillä, jolloin tieto tästä annetaan SPSS:lle lisämäärittelynä. Samasta File -valikosta voidaan avata myös uusi tulostusikkuna. Oletusarvona on se tiedostotyyppi, jota vastaava ikkuna on sillä hetkellä aktiivinen. Uuden havaintoaineiston talletus aloitetaan muuttujien määrityksillä; määritellään mm. muuttujan nimi; tyyppi, joka on yleensä numeerinen, mutta voi olla myös merkkitietoa; desimaalien lukumäärä; selitteet muuttujalle ja sen koodeille. Muuttujan määritteleminen tapahtuu valikosta Data Define Uariable... tai kaksoisosoittamalla kyseistä "sarakeotsikkoa". Kun muuttuja/muuttujat on määritelty, syötetään arvot muuttujille jokaiselta tilastoyksiköltä (muuttuja kerrallaan, useampia muuttuja yhdessä tai tilastoyksikkö kerrallaan). Jos tietoja puuttuu, niin syötettäessä kyseinen solu jätetään tyhjäksi. Tällöin ohjelma tulkitsee sen puuttuvaksi tiedoksi eikä käyttäjän yleensä tarvitse huolehtia puuttuvista tiedoista; ohjelma jättää ne pois käsittelystä. Joissain graafisissa esityksissä oletusarvoisesti tulee puuttuvan tiedon ryhmä mukaan. Sen saa lisämäärityksillä pois.

9 11 Usein tarvitaan uusia laskennallisia muuttujia. Uuden muuttujan tekeminen havaintomatriisissa olemassa olevien muuttujien avulla (esimerkiksi summat, suhteet, mittayksikkövaihdot,...) suoritetaan valikosta Esimerkki 1. Transform Compute... Avautuvassa ikkunassa nimetään uusi muuttuja (Target Variable) ja määritellään laskukaava (Numeric Expression). Tarkastellaan Tampereella myynnissä olleita kerrostalohuoneistoja (lähde Aamulehti ). Havaintomatriisissa on muuttujat asunnon koko neliöinä (NELIÖT) ja asunnon myyntihinta (HINTA). Asunnon neliöhinta NELIÖH = HINTA/NELIÖT. Tällöin uusi muuttuja Target Variable on NELIÖH ja Numeric Expression HINTA/NELIÖT. 4. MUUTTUJIEN JAKAUMAT JA TUNNUSLUVUT 4.1 JAKAUMAT Kun havaintomatriisi on kunnossa, voidaan aineiston analysointi aloittaa. Ensin muodostetaan muuttujien frekvenssijakaumat (suorat jakaumat) joko graafisesti tai taulukkona. Muuttujien jakaumista voidaan huomata mahdollisesti tehtyjä tallennusvirheitä. Frekvenssijakauman graafiset esitykset valitaan mitta-asteikosta perusteella. Histogrammeja käytetään kvantitatiivisen muuttujan jakauman esittämiseen, pylväitä/janoja yleensä kvalitatiiviselle muuttujalle ja piirakoita luokitteluasteikollisen muuttujan tapauksessa. Graafiset esitykset löytyvät valikosta Graphs Bar... Pie... Histogram... pylväs- ja janadiagrammit, piirakat, frekvenssihistogrammit; esityksen valinnan jälkeen annetaan muuttuja(t), jolle graafinen esitys tehdään. Numeerisen muuttujan yhteydessä itse määritellyn luokituksen tekeminen (tasavälisen luokituksen saa myös editoimalla histogrammia) tai kategoristen

10 12 muuttujien tapauksessa luokkien yhdistäminen tapahtuu tekemällä uusi muuttuja havaintomatriisiin uudelleen koodauksen kautta. Koodaus tapahtuu valikosta Esimerkki 2. Transform Recode > Into Different Variables... jossa annetaan luokiteltava muuttuja (Input Variable), luokituksen seurauksena syntyvän muuttujan nimi (Output Variable) sekä koodauksen (luokituksen) määrittely (if...); havaintomatriisiin syntyy siis uusi muuttuja. Asuntojen neliöhinnan uudelleen koodaus halpoihin, keskihintaisiin ja kalliisiin. Muodostetaan uusi muuttuja, joka saa arvot (vaikkapa 1, 2 ja 3) asunnon neliöhinnan perusteella. Frekvenssijakauman saa taulukkona valikosta Analyze Descriptive Statistics> Frequencies... Frekvenssitaulukkoa tehtäessä ohjelma luokittelee muuttujan jokaisen arvon omaan luokkaansa riippumatta siitä montako arvoa muuttujalla on, joten numeeristen muuttujien yhteydessä taulukko on useimmiten käyttökelpoinen vasta, kun muuttuja on ensin luokiteltu (ks. luokituksen teko edellä). Esimerkki 3. Asuntojen luokittelu neliöhinnan perusteella halpoihin, keskihintaisiin ja kalliisiin tapahtuu siten, että muodostetaan esimerkissä 2 esitetty uudelleen koodaus ja tehdään sitten tälle uudelle muuttujalle frekvenssijakauma. Kun uudelleen koodauksen yhteydessä on annettu selitteet koodeille (halpa, keskihintainen, kallis) sekä uudelle muuttujalle (Asunnon hinta) saadaan seuraava taulukko

11 13 missä on asuntojen lukumäärät (Frequency) ja prosentuaaliset määrät (Valid Percent) hintaluokittain sekä kumulatiiviset prosentit (Cumulative Percent). Siis vähän yli puolet myynnissä (otoksessa) olleista asunnoista oli keskihintaisia. Jos aineistossa on puuttuvia tietoja, niin niiden lukumäärä näkyy frekvenssijakaumassa. Kun käyttää uudelleen koodausta, niin on syytä tarkistaa, että havaintoja ja puuttuvia tietoja on saman verran kuin alkuperäisessäkin muuttujassa. 4.2 EHDOLLISTAMINEN Muuttujan frekvenssijakaumaa voidaan tarkastella toisen muuttujan eri luokissa. Voidaan tutkia miten tämä ehdollistettu muuttuja vaikuttaa tarkasteltavan muuttujan jakaumaan vertailemalla ehdollisia prosenttijakaumia. Ehdollisten jakaumien (tai yleensä ehdollistamisen) teon yhteydessä ilmoitetaan ohjelmistolle, että jatkossa halutaan analysoinnit tehtävän jonkun muuttujan (tai muuttujien) eri luokissa erikseen (esimerkiksi miehillä ja naisilla erikseen) antamalla ehdollistava muuttuja valikossa Data Split file... vaihtoehto Compare groups ja valitse malla muuttujaluettelosta ryhmittelymuuttuja; ryhmittelyn purkaminen vaihtoehto Analyze all cases. Tämän määrityksen jälkeen tehtävät analyysit tapahtuvat erikseen kaikissa ehtomuuttujan ryhmissä (myös puuttuvien tietojen ryhmässä!) erikseen. Jos ehtomuuttuja on numeerinen, se on ensin luokiteltava halutulla tavalla. Ehto on päällä siihen asti kuin se otetaan pois. Huom! Split file järjestää havaintomatriisin uudelleen ryhmittelymuuttujan mukaan. Tästä saattaa olla haittaa, jos aineistoon ei ole talletettu havaintoja identifioivaa tunnusmuuttujaa.

12 14 Esimerkki 4. Olkoon aineistossa tietoja vastasyntyneistä lapsista. Halutaan vertailla syntymäpainon (g) (PAINO) jakaumia tytöillä ja pojilla. Voidaan lähteä liikkeelle piirtämällä frekvenssihistogrammin erikseen tytöille ja pojille. Tällöin Split file ehtomuuttujaksi annetaan muuttuja, joka kertoo lapsen sukupuolen (SEX) ja sitten muodostetaan histogrammi muuttujana PAINO. Ehdollistaminen voi tapahtua myös valitsemalla käsittelyyn mukaan vain tietyt tilastoyksiköt. Tämä tapahtuu valikosta Data Select cases... valitsemalla If condition is satisfied ja määrittelemällä sopivan if - ehdon (ehdon purku All cases). Esimerkki 5. Jos halutaan esimerkin 4 aineistossa tarkastella vastasyntyneitä lapsia siten, että jätetään keskoset pois analyyseistä, niin annetaan if -ehto esimerkiksi PAINO > TUNNUSLUKUJA Tunnusluvun avulla pyritään kuvaamaan muuttujan jakaumaa muuttujan arvoista lasketulla luvulla. Kuvataan esimerkiksi jakauman sijaintia sopivan keskiluvun avulla tai muuttujien arvojen vaihtelua hajontalukujen avulla. Muuttujan mitta-asteikko määrää, mitkä tunnusluvut ovat sallittuja käyttää. Keskilukuja ovat moodi, mediaani ja keskiarvo. Moodi on se muuttujan arvo, joka esiintyy useimmin ja sitä voidaan käyttää myös kvalitatiivisten muuttujien yhteydessä. Moodiluokka on usein käyttökelpoinen, kun muuttuja on kvantitatiivisen. Mediaani on sellainen muuttujan arvo, jota pienempiä ja suurempia arvoja on yhtä paljon. Mediaania voidaan käyttää, kun järjestyksellä on tulkinta eli muuttujan on vähintään järjestysasteikollinen. Aritmeettinen keskiarvo on sallittu kvantitatiivisten muuttujien yhteydessä.

13 15 Tunnuslukuja voidaan tarkastella ehdollisina. Ehdollisia keskiarvoja (tai mediaaneja) voidaan käyttää tutkittaessa riippuvuutta kahden muuttujan välillä. Ehdollisten keskiarvojen käyttö riippuvuuden tutkimisessa edellyttää tietysti sitä, että selitettävä muuttuja on kvantitatiivinen. Esimerkki 6. Vaikuttaako sukupuoli lapsen syntymäpainoon? Tällöin lapsen syntymäpaino (PAINO) on selitettävä eli riippuva muuttuja (y) ja sukupuoli (SEX) selittävä eli riippumaton muuttuja (x). Pyritään selvittämään PAINO - muuttujan arvojen vaihtelua sillä, onko lapsi tyttö vai poika. Eräs mahdollisuus riippuvuuden selvittämisessä on keskiarvojen vertailu ryhmittäin, ehdollisten keskiarvojen käyttö. Lasketaan PAINO -muuttujasta keskiarvot tytöillä ja pojilla sekä vertaillaan keskiarvoeroja. Jos ehdolliset keskiarvot poikkeavat toisistaan sanotaan, että SEX -muuttujalla voidaan selittää PAINO -muuttujan vaihtelua. Sanotaan, että PAINO -muuttuja riippuu SEX -muuttujasta. Jos ehdolliset keskiarvot ovat lähes samoja, niin riippuvuutta ei ole. Ks. testaus 6.2. Muuttujan arvot vaihtelevat tilastoyksiköstä toiseen. Vaihtelun voimakkuutta pyritään mittaamaan erilaisia tunnuslukuja käyttäen. Kvantitatiivisten muuttujien yhteydessä vaihtelua mitataan usein varianssin avulla. Varianssi mittaa kuinka tiiviisti muuttujien arvot ovat keskittyneet keskiarvon ympärille. Varianssin neliöjuuri on nimeltään keskihajonta. Alakvartiili ja yläkvartiili ovat mediaanin kaltaisia tunnuslukuja, jotka kuvaavat jakauman sijaintia. Alakvartiili on luku, joka jakaa muuttujan arvot kahteen osaan siten, että korkeintaan 25% havaituista arvoista on pienempiä kuin alakvartiili. Yläkvartiili on luku, joka jakaa muuttujan arvot kahteen osaan siten, että korkeintaan 75% havaituista arvoista on pienempiä kuin yläkvartiili. Alakvartiili, mediaani ja yläkvartiili jakavat muuttujan arvot neljään havaintomääriltään yhtä suuriin osiin. Yhdessä näitä tunnuslukuja kutsutaan kvartiileiksi. Muuttujan arvot voidaan jakaa viiteen, kuuteen, jne. havaintomääriltään yhtä suuriin osiin. Yleisesti näitä osiin jakavia tunnuslukuja kutsutaan fraktiileiksi.

14 16 Jakaumaa kuvaavia erilaisia tunnuslukuja saadaan mm. seuraavilla tavoilla: Analyze Descriptive Statistics> Frequencies... saadaan halutuista muuttujista mm. keskiarvo, mediaani, fraktiilit, moodi, keskihajonta, varianssi, pienin arvo, suurin arvo Descriptives... saadaan halutuista muuttujista mm. keskiarvo, keskihajonta, varianssi, pienin arvo, suurin arvo, vaihteluväli Explore... saadaan mm. keskiarvo, keskihajonta, varianssi, pienin arvo, suurin arvo, vaihteluväli sekä tunnusluvut ehdollisina antamalla (kvalitatiivinen) selittäväksi muuttujaksi Compare Means> Means... saadaan tunnusluvut ehdollisina antamalla ehtomuuttuja (kvalitatiivinen) selittäväksi muuttujaksi. Histogrammin teon yhteydessä saa muuttujan keskiarvon ja keskihajonnan automaattisesti. Ehdollisia jakaumia (tai jakaumia) voidaan havainnollistaa myös laatikko-janakuvion (boxplot) avulla. Kuvio perustuu eri fraktiileihin ja saadaan tehdyksi valikosta Graphs Boxplot... antamalla Variable-kohtaan tutkittava muuttuja ja Category -kohtaan ryhmittelymuuttuja. Esimerkki 7. Tutkittaessa lapsen syntymäpainon riippuvuutta sukupuolesta, voidaan aluksi laske ehdolliset keskiarvot ja piirtää laatikko-jana -kuvio. Jos ehdolliset keskiarvot lasketaan valikosta Compare Means> Means..., niin annetaan Dependent List -muuttujaksi PAINO ja Independent List -muuttujaksi SEX. Näin saadaan tulos

15 17 jossa on ehdolliset keskiarvot (Mean) ja keskihajonnat (Std.Deviation). Näyttäisi siis siltä, että pojat ovat syntyessään keskimäärin tyttöjä painavampia (ks. testaus 6.2.). Painon jakaumissa esiintyvä vaihtelu on myös jonkin verran erilaista; tytöillä keskihajonta on suurempi. Tämä näkyy hyvin myös hyvin laatikko-jana -kuviosta joka on tehty valikosta Graphs>Boxplot... antamalla Variable -kohtaan PAINO ja Category -kohtaan SEX. Laatikko-jana -kuviossa keskimmäinen viiva on syntymäpainon mediaanin kohdalla ja laatikon ylä- ja alareunat ylä - ja alakvartiileissa. Kuviosta nähdään, että tyttöjen jakauma on alempana kuin poikien ja siinä on enemmän vaihtelua. "Laatikothan" sisältävät 50 % havainnoista.

16 18 5. PISTEPARVI JA KORRELAATIOKERROIN Kun tarkastellaan kahta muuttujaa samanaikaisesti, niin on kyse kaksiulotteisesta jakaumasta. Tällöin ollaan kiinnostuneita muuttujien välisestä riippuvuudesta. Kaksiulotteisen jakauman graafinen esitystapa on pisteparvi eli korrelaatiodiagrammi, joka antaa hyvän yleiskuvan mahdollisesta riippuvuudesta ja sen laadusta. Pisteparvi on järkevä piirtää, kun selitettävä on kvantitatiivinen. Tulkinnassa on huomattava selittävän muuttujan mittaasteikko. Pisteparvi saadaan valikosta Graphs Scatter... antamalla selitettävä y pystyakselille ja selittävä x vaaka-akselille. Myös kaksiulotteisista jakaumista voidaan määritellä tunnuslukuja, jotka nyt mittaavat riippuvuuden voimakkuutta. Tällainen tunnusluku on korrelaatiokerroin, joka mittaa kahden kvantitatiivisen muuttujan välistä suoranomaista eli lineaarista riippuvuutta; sen voimakkuutta. Korrelaatiokertoimen ollessa lähellä nollaa lineaarista riippuvuutta ei ole. Täydellinen lineaarinen riippuvuus on silloin, kun korrelaatiokerroin on itseisarvoltaan 1. Korrelaatiokertoimen (korrelaatiomatriisin) voi laskea valikosta Analyze Correlate> Bivariate... (Pearson) antamalla halutut muuttujat.

17 19 Esimerkki 8. Olkoon esimerkin 4 aineistossa myös muuttuja, joka ilmoittaa lapsen syntymäpituuden {PITUUS). Kun piirretään pisteparvi PAINO - muuttuja y -akselille ja PITUUS -muuttuja x - akselille saadaan kuvio josta huomataan voimakas suoranomainen (lineaarinen) riippuvuus. Siis lapsen paino riippuu lineaarisesti pituudesta (ks. tarkemmin 6.4. Regressioanalyysi). Korrelaatiomatriisiksi saadaan Correlations jossa korrelaatiokerroin pituuden ja painon välillä on 0.72 kertoen voimakkaasta lineaarisesta riippuvuudesta (ks. testaus 6.4.).

18 20 6. JOITAIN YLEISESTI KÄYTETTYJÄ ANALYSOINTIMENETELMIÄ Tilastollinen hypoteesi on väittämä populaatiosta, sen jakaumasta ja/tai jakauman parametrista. Hypoteesin testaus tarkoittaa väittämän tutkimista otoksen perusteella. Väitteen paikkansa pitävyyttä tutkitaan otoksen (käytettävissä olevan aineiston) perusteella laskemalla tilanteeseen sopiva nk. testisuure. Tämän testisuureen arvon perusteella joko uskotaan väite tai ei uskota (jolloin vaihtoehtoinen väite hyväksytään). Johtopäätelmän tekeminen perustuu siihen, että selvitetään voidaanko otoksesta laskettua testisuureen arvoa väitteen ollessa tosi pitää "tavanomaisten" arvojen joukkoon kuuluvana vai katsotaanko se harvinaisten arvojen joukkoon kuuluvaksi. Jos testisuureen arvo kuuluu harvinaisten arvojen joukkoon, niin ei uskota väitettä. Mikä sitten on harvinaista? Testauksessa harvinaisiksi arvoiksi katsotaan sellaisten arvojen joukko, jonka todennäköisyys on melko pieni, esim. pienempi kuin Testauksessa onkin tapana ilmoittaa nk. p -arvo, joka kertoo todennäköisyyden saada väitteen ollessa tosi otoksesta saatua arvoa harvinaisempi arvo. Tämä on siis pienin ristitaso, jolla asetettu väite voidaan hylätä. Jos siis testaukseen liittyvä p -arvo on pieni, sanotaan vaikkapa 0.01, niin asetettua väitettä ei uskota; se hylätään ja hyväksytään vaihtoehtoinen väittämä. Se milloin p -arvon katsotaan olevan tarpeeksi pieni, riippuu siitä millainen todennäköisyys sallitaan sille, että tehdään väärä johtopäätelmä; väärä siten, että väittämä hylätään vaikka sen on tosi. Tämä virhetodennäköisyys ei saa olla suuri; sen halutaan usein olevan suuruusluokkaa pienempi kuin 5 %, 2.5 %, 1 %,... Hypoteesin testauksessa asetetaankin siis kaksi väittämää, joista toinen on välttämättä voimassa. Nollahypoteesi H 0, jonka ollessa tosi, testisuuren todennäköisyysjakauma tunnetaan, sekä vaihtoehtoinen hypoteesi H 1. Nollahypoteesi H 0 tulee aina asettaa käytetyn testin sanelemalla tavalla. Seuraavaksi esiteltävissä menetelmissä pyritään selittämään yhtä muuttuja. Selittäviä muuttujia on yksi tai useampia (regressioanalyysi).

19 21 Analysointimenetelmän valintaan vaikuttaa muuttujien mittaustaso. Tässä esityksessä käydään läpi kolme perustyyppiä RISTIINTAULUKKO Kahden kvalitatiivisen muuttujan välinen riippuvuustarkastelu voidaan tehdä ristiintaulukon avulla vertailemalla selitettävän muuttujan ehdollisia prosenttijakaumia. Riippuvuuden merkitsevyys voidaan testata; Testisuureena käytetään x 2 -riippumattomuustestisuuretta ja hypoteesit asetetaan H 0 : ei riippuvuutta H 1 : on riippuvuutta Ristiintaulukointi ja testaus tehdään valikosta Analyze Descriptiv e Statistics> Crosstabs... annetaan sarake-ja rivimuuttujat, lisämääreinä Statistics... -painike>chi-square, X -testisuure Cells... -painike, ehdolliset prosenttijakaumat, "suunta" valitaan siten, että saadaan selitettävän prosenttijakaumat selittäjän luokissa. SPSS muodostaa ristiintaulukon siten, että molempien muuttujien jokainen arvo on omana luokkanaan. Jos on tarve yhdistellä muuttujien arvoja, tehdään se muodostamalla uusi muuttuja havaintomatriisiin (Transform>Recode>).

20 22 Kvantitatiivista muuttujaa voi halutessaan käyttää ristiintaulukoinnissa, kunhan sen ensin luokittelee tekemällä uuden muuttujan havaintomatriisiin. Esimerkki 9. Tarkastellaan eräältä kurssilta saatua kurssipalautetta. Halutaan selvittää, onko opintosuunnalla vaikutusta annettuun palautteeseen. Aineistossa on muuttuja OPINTOJAKSON TYÖLÄYS, joka kertoo vastaajan mielipiteen opintojakson työläydestä (työläs/sopiva/vähätöinen) sekä palautteen antajan opintosuunta (OPSUUNTA). Nyt asetetaan H 0 : Opintosuunta ei vaikuta annettuun arvioon H 1 : Opintosuunta vaikuttaa annettuun arvioon. Kun nyt suoritetaan edellä esitetyllä tavalla ristiintaulukointi saadaan taulukko Opintojakson työläys * OPSUUNTA Crosstabulation Chi-Square Tests Aluksi huomataan, että OPINTOJAKSON TYÖLÄYDEN prosentuaaliset jakaumat opintosuunnittain poikkeavat huomattavasti toisistaan. Mutta ovatko

21 23 erot riittävän suuria, jotta voidaan tehdä päätelmä riippuvuuden olemassaolosta? Tuloksesta (kohta a.) nähdään ensin, että oletuksen testin käyttöön ovat voimassa (pienin teoreettinen (odotettu) frekvenssi 4.68, alle 5 teoreettisia frekvenssejä 16.7%). x 2 -riippumattomuustestisuureen arvo (Pearson Chi-Square) on 7.668, joka voidaan katso harvinaisten arvojen joukkoon kuuluvaksi, jos harvinaisena pidetään sellaisten arvojen joukkoa, joiden todennäköisyys on esim. pienempi kuin Tällöin H 0 hylätään ja H 1 hyväksytään ja tehdään johtopäätelmä, että opintosuunta vaikuttaa annettuun arvioon. Tässä siis p -arvo on Jos halutaankin ottaa vain 1 %:n riski, niin silloin H 0 hyväksytään, koska > Tilastollisten testin suorittaminen tapahtuu periaatteessa kaikissa tilanteissa edellä esitetyllä tavalla. Asetetaan testattava hypoteesi, lasketaan testisuureen arvo ja pienin riskitaso, jolla nollahypoteesi voidaan hylätä. Tämän p -arvon perusteella joko hyväksytään väittämä tai hylätään se. Eri tilanteissa nollahypoteesi, testisuure ja sen jakauma ovat erilaisia ODOTUSARVOJEN YHTÄSUURUUDEN TESTAAMINEN t-testillä Tutkittaessa kvantitatiivisen muuttujan riippuvuutta kvalitatiivisesta muuttujasta, jolla on kaksi luokkaa voidaan käyttää riippumattomien otosten t - testiä kahden populaation keskiarvojen (odotusarvojen) yhtäsuuruuden testaamiseksi. Hypoteesit asetetaan H 0 : populaation keskiarvot ovat samoja ("ei riippuvuutta") H 1 : populaation keskiarvot eivät ole yhtä suuria ("on riippuvuutta")

22 24 Vaihtoehtoinen hypoteesi voidaan asettaa myös yksisuuntaisena, jolloin H 1 : toisen populaation keskiarvo on toista suurempi. Riippumattomien otosten t - testissä oletetaan, että käytössä on riippumattomat satunnaisotokset normaalijakaumista, joiden varianssit ovat yhtä suuret, mutta tuntemattomat. Testisuure, jota käytetään, noudattaa nouahypoteesin ollessa tosi nk. Studentin t -jakaumaa, joka määritellään nk. vapausastein ja on symmetrinen origon suhteen. Siis harvinaisten arvojen joukko muodostuu kaksisuuntaisessa testissä itseisarvoltaan "suurista" arvoista. Riippumattomien otosten t -testi saadaan valikosta Analyze Compare Means> Independent Samples T-test... (riippumattomat otokset) annetaan selitettävä (Test Variable) sekä selittävä, ryhmittely -muuttuja (Grouping Variable). Tuloksena saadaan testisuureen lisäksi myös ehdolliset keskiarvot ja varianssit sekä testisuure varianssien yhtäsuuruuden testaamiseksi. Esimerkki 10. Onko tytöillä ja pojilla eroja syntymäpainossa? H 0 : Painon keskiarvot samoja molemmissa populaatioissa H 1 : Painon keskiarvot eivät samoja molemmissa populaatioissa. Olkoon aineistossa muuttujat PAINO (g) ja SEX. Nyt siis selitetään muuttujaa PAINO, joka on kvantitatiivinen. Selittäjä on SEX -muuttuja, joka on kvalitatiivinen, kaksiluokkainen. Suoritetaan riippumattomien otosten t -testi ja saadaan tulokset Group Statistics Independent Samples Test

23 25 Tässä on siis riippumattomat otokset tyttö- ja poikapopulaatioista. Otoskoot 65 ja 55. Syntymäpainon keskiarvojen erotus on g. Kuten jo aiemmin on todettu painon otosvarianssit ( ja ) poikkeavat toisistaan. Nyt tuloksista löytyy testisuure (Levene's Test for Equality of Variances) hypoteesille H 0 : Populaation varianssit samoja. Koska tähän liittyvä p - arvo on (>0.05), H 0 hyväksytään ja todetaan, että vaatimus varianssien yhtäsuuruudesta voidaan kuitenkin olettaa olevan täytetty. (Jos näin ei olisi, niin t -testin tulokset luettaisiin vastaavasta kohdasta, normaalisuus -oletus jätetään tässä testaamatta.) Varsinaisen testisuureen arvo on siis ja tähän kaksisuuntaiseen testiin liittyvä p -arvo 0.033, yksisuuntaisessa testissä se olisi 0.033/2 (vapausasteet df = 118). Jos riskitasoksi valitaan 5 %, niin nollahypoteesi hylätään (koska p < 0.05) ja tehdään päätelmä, että tytöt ja pojat ovat syntyessään keskimäärin eri painoisia. Jos otettaisiin riski, joka olisi pienempi kuin 3.3 % (vaikkapa 1 %) niin tehtäisiin päinvastainen päätelmä! Tulostuksesta löytyy myös 95% luottamusväli odotusarvojen erotukselle. Testin sijaan voidaan käyttää tätä luottamusväliä johtopäätelmän tekemisessä. Jos luottamusväli sisältää nollan niin populaation keskiarvojen erotus voidaan arvioida olevan nolla (eri tyttö- ja poikapopulaatiossa syntymäpainon keskiarvot samoja!). Tässä luottamusväli, jolle populaatioiden keskiarvojen erotuksen arvellaan kuuluvan, on (15.39, ). Esimerkki 11. Halutaan tutkia, miten asunnon neliöhintaan vaikuttaa saunan olemassaolo (aineisto esim. 1). Koska neliöhinnat ovat hyvin erilaiset keskustaja lähiöalueilla, tutkitaan asiaa erikseen keskustassa ja muualla. Aineistossa on muuttuja, joka kertoo onko kyseessä keskusta-asunto (KESK). Samoin löytyy muuttuja, joka kertoo saunan olemassaolon (SALINA). Suoritetaan riippumattomien otosten t -testi selittäen muuttujaa NELIÖH muuttujalla SAUNA. Tehdään tämä analyysi erikseen keskusta- ja lähiöasunnoille käyttäen ennen t -testin tekoa komentoa Split file, jossa ehtomuuttujaksi annetaan muuttuja KESK. Saadaan seuraavat tulokset:

24 26 Group Statistics Independent Samples Test Huomataan ensin, että molemmissa tilanteissa varianssioletus on kunnossa (p - arvot 0.320, 0.906). Testattaessa odotusarvojen yhtäsuuruutta saadaan keskustaasunnoille t = , p = 0.00 ja lähiöasunnoille t = , p = Siis sauna vaikuttaa asunnoin keskihintaan keskustassa mutta ei lähiössä. Keskustassa saunallisen huoneiston neliöhinta on keskimäärin mk korkeampi kuin saunattoman. Johtopäätelmät voidaan tehdä myös luottamusvälien avulla; keskusta-asunnoissa nolla ei kuulu luottamusvälille, lähiöasunnoissa kylläkin. Esimerkki 12. Tutkitaan lääkkeen vaikutusta suoritukseen. Mitataan koehenkilöiltä suoritus (kvantitatiivisesti) normaalitilanteessa sekä lääkkeen vaikutuksen alaisena. Vaikuttaako lääke suoritukseen? Esimerkissä 12 ei ole kyse riippumattomista otoksista, koska samoilta henkilöiltä on mitattu (kvantitatiivista) ominaisuutta ennen - jälkeen tilanteessa. Nyt tutkitaankin sitä, onko suorituksen muutos peräisin (normaali)jakaumasta, jonka odotusarvo on nolla (H 0 ). Tässä käytetään riippuvien otosten (vastinparien) t-testiä, joka saadaan valikosta Analyze Compare Means> Paired-Samples T-test... annetaan kaksi muuttujaa, toisessa arvot "ennen" toisessa "jälkee

25 VARIANSSIANALYYSI Tutkittaessa kvantitatiivisen muuttujan riippuvuutta kvalitatiivisesta muuttujasta, jolla on useampi kuin kaksi luokkaa voidaan käyttää yksisuuntaista varianssianalyysiä populaatioiden keskiarvojen (odotusarvojen) yhtäsuuruuden testaamiseksi. Tämä on siis yleistys edellä esitetylle riippumattomien otoksien t -testille. Nytkin testattavana hypoteesina on H 0 : populaation keskiarvot ovat samoja ("ei riippuvuutta") H 1 : populaation keskiarvot kaikki eivät yhtä suuria ("on riippuvuutta") Testin käyttöön liittyy samat oletukset kuin t -testissäkin. On tehty riippumattomat otokset normaalijakaumista, joiden varianssit yhtä suuret mutta tuntemattomat. Jos otoksia on kaksi, voi tehdä joko t -testin tai suorittaa varianssianalyysin. Tässä tilanteessa ne ovat identtiset. Varianssianalyysissä käytetään nk. F -testisuuretta odotusarvojen yhtäsuuruuden testaamiseksi. Varianssianalyysi suoritetaan valikosta Analyze Compare Means> One-Way Anova... annetaan selitettävä, riippuva (Dependent) muuttuja sekä selittävä (Factor) muuttuja. Tuloksena saadaan testisuureen lisäksi pyydettäessä (Options...) myös ehdolliset keskiarvot ja varianssit sekä testisuure varianssien yhtäsuuruuden testaamiseksi. F -testisuuretta käytettäessä "suurten" arvojen joukko muodostaa harvinaisten arvojen joukon. Jos saadaan tulos, että odotusarvot eivät kaikki ole yhtäsuuria, voidaan myös tehdä monivertailuja ryhmittäin (PostHoc...). Nimitys yksisuuntainen (varianssianalyysi) tulee siitä, että on yksi selittäjä. Nimitys varianssianalyysi on hieman harhaanjohtava, koska analyysissä ei testata varianssien yhtäsuuruutta (paitsi oletusten tutkimisessa) vaan odotusarvojen yhtäsuuruutta.

26 28 Esimerkki 13. Halutaan tutkia, vaikuttaako tomaattilajike keskimääräiseen satomäärään. Aineistossa on SATO -muuttuja, joka on kvantitatiivinen sekä LAJIKE -muuttuja, joka ilmoittaa käytetyn lajikkeen (kolme lajiketta). Nyt H 0 : sadon odotusarvot ovat samoja kaikilla lajikkeilla ("ei riippuvuutta") H 1 : sadon odotusarvot kaikki eivät yhtä suuria ("on riippuvuutta") Saadaan seuraavat tulokset: SATO Descriptives

27 29 Ensin huomataan, että ehdolliset otoskeskiarvot näyttäisivät poikkeavan toisistaan ainakin verrattaessa lajikkeen 3 keskiarvoja muihin. Kun testataan varianssien yhtäsuuruutta (kolmessa populaatiossa, tarkastellaan satomäärää kolmella lajikkeella), voidaan olettaa niiden olevat yhtäsuuret, koska p = Testattaessa odotusarvojen yhtäsuuruutta saadaan F = ja p = 0.000, joten H 0 hylätään ja tehdään johtopäätelmä, että kaikki lajitteet eivät tuota keskimäärin samanlaista satoa. Missä sitten on eroja? Lajikkeittain vertailu (Multiple Comparisons) kertoo, että eroja on lajikkeiden 3 ja 1 (p = 0.000) sekä 3 ja 2 (p = 0.000) välillä mutta ei lajikkeiden 1 ja 2 välillä (p = 0.879). Jos halutaan selittää kvantitatiivista muuttuja kahdella kvalitatiivisella samanaikaisesti, voidaan mahdollisesti käyttää kaksisuuntaista varianssianalyysiä. Analyysi saadaan tehtyä valikosta Analyze General Linear Model> Univariate... annetaan selitettävä, riippuva (Dependent) muuttuja sekä selittävät (Fixed Factors) muuttujat Kaksisuuntaisessa varianssianalyysissä voidaan tutkia molempien selittäjien omavaikutusta sekä yhdysvaikutusta. Jokaiseen saadaan omat F -testit.

28 REGRESSIOANALYYSI Regressioanalyysillä tutkitaan muuttujan y riippuvuutta muuttujajoukosta x 1, x 2,..., x k. Pyritään löytämään malli, joka kertoisi y:n riippuvuuden selittäjistä. Kaikkien muuttujien oletetaan olevan kvantitatiivisia. Tosin joissain tilanteissa selittäjissä voi olla dikotomisia muuttujia, mikä mallin tulkinnassa on sitten huomioitava tietyllä tavalla. Regressioanalyysin yhteydessä ajatellaan selitettävän muuttujan y riippuvuuden muuttujista x 1, x 2,..., x k olevan muotoa Tavanomainen yhden selittäjän regressioanalyysi tuottaa tulosta lineaarisesti riippuvien muuttujien yhteydessä. Tällöin pisteparveen voidaan sovittaa suora, jonka ympärille pisteiden ajatellaan ryhmittyneen. Tällöin y:n riippuvuus muuttujasta x ajatellaan olevan muotoa

29 31 Yhden selittäjän regressioanalyysissä siis estimoidaan pisteparveen sovitettava suora; suoran vakiokerroin sekä kulmakerroin. Ajatellaan, että y:n arvot määräytyvät keskimäärin x:n arvoista estimoidun suoran yhtälön mukaisesti. Mitä paremmin pisteet ovat keskittyneet suoran ympärille sitä voimakkaampaa on riippuvuus. Korrelaatiokerroin mittaa tätä lineaarisen riippuvuuden voimakkuutta. Otoksesta laskettua korrelaatiokerrointa käyttäen voidaankin testata, onko populaatiossa kahden muuttujan välinen korrelaatiokerroin nolla. Tällöin H 0 : populaation korrelaatiokerroin on nolla ("ei lineaarista riippuvuutta") H 1 : populaation korrelaatiokerroin ei ole on nolla ("on lineaarista riippuvuutta"). Tässä käytetään testisuuretta, joka noudattaa Studentin t -jakaumaa. Harvinaiset arvot (kaksisuuntaisessa testissä) muodostuvat itseisarvoltaan "suurista" arvoista. Kun lasketaan SPSS:llä korrelaatiomatriisi (ks. luku 5), niin saadaan samalla tähän t -testisuureeseen liittyvä p -arvo. Esimerkki 14. Esimerkin 8 aineistossa korralaatiokerroin lapsen syntymäpituuden ja -painon välillä on Kun testataan hypoteesia H 0 : lapsen paino ja pituus eivät riipu lineaarisesti toisistaan, se hylätään, koska p = Lineaarista riippuvuutta siis on ja se voidaan mallittaa suorittamalla regressioanalyysi (ks. esimerkki 15).

30 32 Regressioanalyysissä estimoinnin lisäksi suoritetaan erilaisia mallin uskottavuuden ja hyvyyden tarkasteluja. Ensimmäisenä on selvitettävä voidaanko estimoitujen parametrien perusteella päätellä, että mallin parametri ovat nollasta poikkeavia. Testataan yhden selittäjän mallissa aluksi sitä onko x merkittävä selittäjä. Tällöin testattavana hypoteesina on johon saadaan t -testisuure. Jos x on todettu merkittäväksi selittäjäksi, niin seuraavaksi tutkitaan, onko vakiokertoimen ß 0 syytä olla mallissa. Tällöin Tähänkin saadaan f -testisuure. Lisäksi saadaan laskettua mallin selityskerroin R 2. Ilmoittamalla 100R 2, voidaan puhua mallin selitysasteesta. Yhden selittäjän regressiomallissa 100R 2 = 100(r xy ) 2 kertoen kuinka monta prosenttia y:n vaihtelusta kyseisellä yhden selittäjän mallilla voidaan x:n avulla selittää. R 2 :11a on tämä tulkinta vain silloin, kun mallissa on vakiokerroin. Regressioanalyysin suoritus tapahtuu valikosta Analyze Regression> Linear... annetaan selitettävä, riippuva (Dependent) muuttuja sekä selittävä(t), (riippumattomat, Independent(s)) muuttuja(t), lisävalintana mm. mallinvalintamenetelmä (Method).

31 33 Esimerkki 15. Tarkastellaa lapsen syntymäpainon riippuvuutta -pituudesta. Esimerkissä 8 on pisteparvi, josta nähdään riippuvuus. Kun suoritetaan regressioanalyysi selittäen PAINO -muuttujaa PITUUS -muuttujalla, saadaan tulokset Model Summary ANOVA b Coefficients a

32 34 Useamman selittäjän malliin liittyvät samalla tavalla yksittäisten kertoimien testaukset t -testien avulla. Tällöin tutkitaan sitä, lisääkö kyseisen selittäjän tuonti malliin, muiden jo siellä ollessa, mallin selitysastetta riittävästi. Tällöin Lisäksi voidaan testata F -testillä kaikkien selittäjien yhteisvaikutusta eli tutkia sitä saadaanko y:n vaihtelua selitettyä siten, että otetaan kaikki tarkasteltavat selittäjät samanaikaisesti malliin mukaan. Tämä regressiokertoimien yhteistestaus (kun vakiokerroin on mallissa mukana) voidaan muotoilla Mallin valinta ei aina ole kovin helppoa. Pyritään valitsemaan niin monta merkittävää selittäjää, että selitysaste on mahdollisimman hyvä. On kuitenkin pidettävä mielessä se, että mallin on oltava käyttötarkoitukseensa sopiva ja tulkittavissa oleva. Vaikka on olemassa erilaisia automaattisia mallinvalintamenettelyjä, on niitä syytä käyttää hyvin harkiten.

33 35 Esimerkki 16. Tutkitaan, miten tuotteen myyntiin (SALE) vaikuttaa mainonta (ADVERTISING) ja myyntihenkilöstö (SALESMEN), (Aineisto: Newbold, P., (1995) Statistics for Business and Economics). Kaikkia muuttujia on mitattu tuhansina dollareina. Estimoidaan ensin paras yhden selittäjän regressiomalli ja täydennetään se kahden selittäjän malliksi. Käytetään mallin valinnassa FORWARD -menetelmää. Estimointitulokset ovat

34 36 7. LOPUKSI Oppaassa tarkasteltiin empiirisen tutkimuksen eri työvaiheita ja toteutusta SPSS -ohjelmalla. Seuraavassa lyhyesti yhteenveto tutkimuksen työvaiheista. Kun havaintoaineisto on hankittu, muokataan se analysointia varten havaintomatriisimuotoon. Muuttujien mitta-asteikot on syytä selvittää, jotta analyysit tulee oikein valituksi. Havaintomatriisi talletetaan tietokoneelle siten, että analysoinnin apuvälineenä käytettävä tilastollinen ohjelmisto pystyy sen lukemaan. Tietojen taltioinnin oikeellisuus on syytä tarkistaa. Yleiskuvan saamiseksi aineistosta analysointi aloitetaan muuttujien jakaumien muodostamisella sekä tarpeellisten tunnuslukujen laskulla. Käytetään tarpeen mukaan tilanteeseen sopivia graafisia esityksiä. Jakaumien teon yhteydessä voidaan löytää tallennusvirheitä. Seuraavaksi on vuorossa varsinainen analysointi. Valitaan kuhunkin tilanteeseen käyttökelpoinen menetelmä ja suoritetaan analyysi ja tulkitaan

35 37 tulokset. Jokaiseen analysointivaiheeseen kuuluu siis johtopäätelmien teko. Esimerkiksi aineiston kuvailun yhteydessä voidaan kiinnittää huomio jakauman muotoon. Riippuvuustarkastelujen yhteydessä tehdään johtopäätelmiä riippuvuussuhteista perustaen päätelmien teko analysoinnissa saatuihin tuloksiin. Tilastollisen tutkimuksen keskeisen vaiheen muodostaakin näiden tutkimustulosten esittäminen sellaisessa kirjallisessa asussa, että lukija, jolle tutkimustulokset on tarkoitettu, saa sen sisältämän informaation mahdollisimman helposti, havainnollisesti ja yksikäsitteisessä muodossa. Työ on syytä jäsennellä selkeästi alaotsikointia ja kappalejakoa käyttäen. Kuviot ja taulukot laaditaan yleisten sopimusten mukaisesti, ne numeroidaan ja otsikoidaan. Kuvioiden ja taulukoiden on muodostettava sellaisia itsenäisiä kokonaisuuksia, että lukija voi muuhun tekstiin turvautumatta ymmärtää niissä esitetyn asian. Tässä oppaassa käytettiin vain murto-osaa tarjolla olevista menetelmistä. Menetelmät, joita esiteltiin, ovat ehkä kaikkein tavanomaisempi ja useimmiten kaikilla tilastotieteen perusopintotasoisilla opintojaksoilla esitettyjä. Lopuksi vielä yhteenveto näiden tilastollisten analyysien suorittamisesta SPSS - ohjelmalla: Analyze Descriptive Statistics> frekvenssijakaumat, tunnusluvut, ristiintaulukot Compare Means> t-testit, yksisuuntainen varianssianalyysi General Linear Model> kaksisuuntainen varianssianalyysi Correlate> korrelaatiomatriisi Regression> regressioanalyysi Graphs Bar... pylväs- ja janadiagrammit Pie... piirakat, Boxplot... laatikko-jana-kuviot, Scatter... pisteparvet, Histogram... frekvenssihistogrammit.

36 38 LIITE 1 Joitain huomioita liittyen SPSS -ohjelmiston aiempiin versioihin. Versio 7.5/8.0/9.0. Käynnistettäessä ohjelma avautuu Data Editor -ikkuna sisältäen ohjelman päävalikon. Analysointeja tehtäessä tulokset tulevat automaattisesti avautuvaan Output navigator -ikkunaan. Tämän ikkunan valikko poikkeaa jonkin verran päävalikosta. Versio 6.1/6.0. Käynnistettäessä avautuu ohjelmaikkuna päävalikkoineen, jonka avulla voidaan luoda havaitomatriisi tai ottaa käyttöön tallessa oleva havaintoaineisto ja suorittaa tarpeelliset analyysit. Tämä versio käyttää kaikkiaan kuutta erilaista ikkunaa, joista tarvitaan lähinnä: 1. ohjelmaikkunaa (SPSS application window), joka on aina auki ja sisältää ohjelman päävalikon; 2. aineistoikkunaa (Data editor window); 3. tulostusikkunaa (Output window), johon saadaan tekstimuotoiset, tarvittaessa myös editoitavat, analysointitulokset; 4. ikkunaa, johon tulostuu grafiikka, jota on myös mahdollista muokata (Chart window).

37 39 LIITE 2 Joitain SPSS -oppaita sekä kirjallisuutta, jossa yhdistetty tilastollinen tutkimus sekä SPSS -opastus. Agresti, A. & Finlay, B., Statistical Methods for the Social Sciences, Prentice Hall, Gerber, S. & Voelkl, K., The SPSS guide to The new statistical analysis of data, Springer, Heikkilä, T., Tilastollinen tutkimus. Oy Edita Ab, Kanninen, A., SPSS for Window 9.0, perusteet Oulun yliopisto, ATKkeskus, Kanninen, A., SPSS for Window: menetelmiä, Oulun yliopisto, ATKkeskus, Karjalainen, L., SPSS -perusteet 9.0. Pii-Kirjat Ky, Kinnear, P. &Gray, C, SPSS for Windows Made Simple, Psychology Press, SPSS Base 9.0 User's Guide, SPSS Inc., SPSS Categories 8.0 User's Guide, SPSS Inc., SPSS Regression Models 9.0, SPSS Inc., 1999.

Ohjeita tilastollisen tutkimuksen toteuttamiseksi opintojaksolla. TILTP1 (http://www.uta.fi/~strale/tiltp1.html) SPSS for Windows -ohjelmiston avulla

Ohjeita tilastollisen tutkimuksen toteuttamiseksi opintojaksolla. TILTP1 (http://www.uta.fi/~strale/tiltp1.html) SPSS for Windows -ohjelmiston avulla Ohjeita tilastollisen tutkimuksen toteuttamiseksi opintojaksolla TILTP1 (http://www.uta.fi/~strale/tiltp1.html) SPSS for Windows -ohjelmiston avulla Raija Leppälä (raija.leppala@uta.fi) ALUKSI Tämä opas

Lisätiedot

Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla

Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla 1 Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla Raija Leppälä Opetusmoniste B 53 3. uudistettu painos Matematiikan, tilastotieteen ja filosofian laitos Toukokuu

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla Raija Leppälä Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla TAMPEREEN YLIOPISTO INFORMAATIOTIETEIDEN YKSIKÖN RAPORTTEJA 55/2017 TAMPERE 2017 TAMPEREEN YLIOPISTO

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

2. Aineiston kuvailua

2. Aineiston kuvailua 2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien

Lisätiedot

SPSS ohje. Metropolia Business School/ Pepe Vilpas

SPSS ohje. Metropolia Business School/ Pepe Vilpas 1 SPSS ohje Page 1. Perusteita 2 2. Frekvenssijakaumat 3 3. Muuttujan luokittelu 4 4. Kaaviot 5 5. Tunnusluvut 6 6. Tunnuslukujen vertailu ryhmissä 7 9. Ristiintaulukointi ja Chi-testi 8 10. Hajontakaavio

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana Tilastolliset ohjelmistot 805340A Pinja Pikkuhookana Sisältö 1 SPSS 1.1 Yleistä 1.2 Aineiston syöttäminen 1.3 Aineistoon tutustuminen 1.4 Kuvien piirtäminen 1.5 Kuvien muokkaaminen 1.6 Aineistojen muokkaaminen

Lisätiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. 9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1) 20.9.2018/1 MTTTP1, luento 20.9.2018 KERTAUSTA JA TÄYDENNYSTÄ Tunnusluvut 1) Sijainnin tunnuslukuja Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1) Muita sijainnin tunnuslukuja ala- ja yläkvartiili,

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N 11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

IBM SPSS Statistics 21 (= SPSS 21)

IBM SPSS Statistics 21 (= SPSS 21) Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO 8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

SPSS OPAS. Metropolia Liiketalous

SPSS OPAS. Metropolia Liiketalous 1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä. Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Aineistoihin tutustutaan mm. erilaisten

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä.

Ennen seuraavia tehtäviä tarkista, että KUNNAT-aineistossasi on 12 muuttujaa ja 416 tilastoyksikköä. Tilastollinen tietojenkäsittely / SPSS Harjoitus 3 Tällä harjoituskerralla tarkastellaan harjoituksissa 2 tehtyjä SPSS-havaintoaineistoja KUNNAT, kyselya ja kyselyb. Jos epäilet, että aineistosi eivät

Lisätiedot

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta 4 Riippuvuus 1 Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta x 2 = sisaruksien luku- Tarkastellaan äidin ja lapsen pituuden välistä riippuvuutta havaintomatriisilla, joka on

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla 4 Aineiston kuvaaminen numeerisesti 1 4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla Tarkastellaan lasten syntymäpainon frekvenssijakauman (kuva 1, oikea sarake) muodostamista Excel- ja SPSS-ohjelmalla.

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

ja arvioita ohjelmiston soveltuvuudesta TILTP1 kurssin käyttöön

ja arvioita ohjelmiston soveltuvuudesta TILTP1 kurssin käyttöön 2.10.2002 Analysis Lab tilastoohjelmiston toimintojen esittely ja arvioita ohjelmiston soveltuvuudesta TILTP1 kurssin käyttöön Raportin tekijä Jorma Jokisalo SISÄLLYS 1. JOHDANTO 3 2. YLEISTÄ ANALYSIS

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten.

VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. Tilastollinen tietojenkäsittely / SPSS Harjoitus 1 VIIKON VINKKI: Kannattaa tutustua ensin koko tehtävänantoon ja tehdä tehtävä vasta sitten. 1. Avaa SPSS-ohjelma. Tarkoitus olisi muodostaa tämän sivun

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1 Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1 Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta I Summamuuttujien muodostus Olemassa olevista muuttujista voidaan laskea

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden 1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017 11.1.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 11.1.2018 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017 11.1.2018/2

Lisätiedot

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 Sisällysluettelo ALKUSANAT 4 ALKUSANAT E-KIRJA VERSIOON 5 SISÄLLYSLUETTELO 6 1 PERUSASIOITA JA AINEISTON SYÖTTÖ 8 11 PERUSNÄKYMÄ 8 12 AINEISTON SYÖTTÖ VERSIOSSA 9 8 Muuttujan määrittely versiossa 9 11

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

Tilastomenetelmien lopputyö

Tilastomenetelmien lopputyö Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot