1 TILASTOMENETELMIEN PERUSTEITA



Samankaltaiset tiedostot
Testejä suhdeasteikollisille muuttujille

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Testit järjestysasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Otoskoko 107 kpl. a) 27 b) 2654

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Sovellettu todennäköisyyslaskenta B

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Hypoteesin testaus Alkeet

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Väliestimointi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Testit laatueroasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

MONISTE 2 Kirjoittanut Elina Katainen

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

10. laskuharjoituskierros, vko 14, ratkaisut

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

tilastotieteen kertaus

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Sovellettu todennäköisyyslaskenta B

pisteet Frekvenssi frekvenssi Yhteensä

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Osa 2: Otokset, otosjakaumat ja estimointi

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Tilastollisia peruskäsitteitä ja Monte Carlo

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Kvantitatiiviset menetelmät

Matemaatikot ja tilastotieteilijät

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Kandidaatintutkielman aineistonhankinta ja analyysi

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

031021P Tilastomatematiikka (5 op) viikko 5

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Aineistokoko ja voima-analyysi

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

riippumattomia ja noudattavat samaa jakaumaa.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

HAVAITUT JA ODOTETUT FREKVENSSIT

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Altisteiden ja sairauksien mittaaminen. Biostatistiikan näkökulmasta EPIDEMIOLOGIAN JA BIOSTATISTIIKAN PERUSTEET. L2 kevät 2007

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

805306A Johdatus monimuuttujamenetelmiin, 5 op

Estimointi. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

2. TILASTOLLINEN TESTAAMINEN...

Transkriptio:

1 TILASTOMENETELMIEN PERUSTEITA Insinööritieteissä suoritetaan usein erilaisia mittauksia tai kokeita, joiden tuloksena saadaan numeerisia havaintoaineistoja tutkittavasta ilmiöstä. Hyvinvointiteknologiassa mittauskohteena on usein ihminen, mikä tekee mittauksista ja niiden tulkinnasta erityisen haastavia. Numeerinen havaintoaineisto muodostaa tilastollisen kuvauksen ja analyysin lähtökohdan. Sitä seuraa muuttujien välisten riippuvuuksien etsiminen, ilmiöiden selittäminen ja kehityksen ennustaminen. 1.1 Otanta Perusjoukko eli populaatio on joukko, joka on tutkimuksen kohteena. Perusjoukkona voi olla esim. korkeasta verenpaineesta kärsivät, tietyn yrityksen asiakkaat, vuonna 2005 rekisteröidyt autot, tuotannossa syntyneet koneenosat, pörssissä noteeratut yritykset jne. Kokonaistutkimuksessa tutkitaan koko perusjoukko. Jos ei ole mahdollista tai kannattavaa tutkia koko perusjoukkoa, niin voidaan tutkia perusjoukon osajoukko. Jos tutkittavaa osajoukkoa voidaan perustellusti pitää edustavana, perusjoukko pienoiskoossa, niin sitä kutsutaan otokseksi. Sopivalla otantamenetelmällä pyritään varmistamaan otoksen edustavuus. Parhaiten edustava otos saadaan satunnaisuutta apuna käyttäen (arvonta). Edustavan otoksen avulla on mahdollista tehdä perusjoukkoa koskevia päätelmiä tietyn virhemarginaalin rajoissa.

Jos poimitaan tutkimukseen ne perusjoukon alkiot, jotka ovat 'saatavilla', niin kyseessä on näyte eikä otos. Näytteen valitsija tai näytteen kohteet voivat toimia puolueellisesti, koska näytettä ei valita arpomalla. Esim. Katukysely. Keskellä päivää tehty haastattelu karsii työssäkäyviä vastaajia pois. Mittaaminen Tutkimusongelman kannalta kiinnostavat käsitteet pelkistetään mitattaviksi ominaisuuksiksi eli muuttujiksi. Mittaamalla muuttujien arvoja isolta joukolta tutkimusyksiköitä, saadaan tutkimusaineisto, jota voidaan edelleen käsitellä tilastollisin menetelmin. Tutkijaa kiinnostaa erityisesti muuttujan arvoissa esiintyvä vaihtelu tutkimusyksiköstä toiseen. Tarkastelun kohteena voi olla myös kahden tai useamman muuttujan yhteisvaihtelu. Syy-vaikutus -suhteita selviteltäessä puhutaan riippumattomista (selittävistä) ja riippuvista (selitettävistä) muuttujista. Riippumaton muuttuja on syy ja riippuva muuttuja on vaikutus. 1.2 Mitta-asteikot Luokitteluasteikko o Luokittelussa tutkimusyksiköt jaetaan luokkiin. Tämän perusteella voidaan sanoa ovatko kaksi tutkittua yksikköä samanlaisia vai erilaisia mitatun ominaisuuden suhteen. o Esim. Vastaajat voidaan luokitella miehiin ja naisiin. Valmistetut tuotteet voidaan luokitella virheettömiin ja virheellisiin. Autot voidaan luokitella porrasperäisiin, viistoperäisiin ja farmarimallisiin. Järjestysasteikko o Jos luokat voidaan järjestää yksikäsitteiseen suuruus, paremmuus tai muuhun järjestykseen, niin käytössä on järjestysasteikollinen mittaaminen.

o Esim. Vastaajat voidaan jakaa iän perusteella ikäluokkiin. Ikäluokan mukaan vastaajat voidaan järjestää ikäluokan mukaiseen järjestykseen. o Esim. Digitaalikameroille voidaan Tekniikka-lehden testissä antaa 1-5 tähteä testimenestyksen perusteella. Kamerat voidaan järjestää tähtien lukumäärän mukaiseen paremmuusjärjestykseen. Välimatka-asteikko o Jos ominaisuuden määrää voidaan mitata numeerisesti, niin kyseessä on välimatka-asteikollinen mittaaminen. Esimerkiksi lämpötila voidaan mitata lämpömittarin avulla. Välimatka-asteikolla mitatuille muuttujille on mielekästä laskea muuttujan arvojen erotuksia. Voidaan esim. sanoa, että tänään on 10 astetta lämpimämpi ilma kuin eilen. Suhdeasteikko o Jos ominaisuutta mitataan numeerisesti siten, että ominaisuuden arvolla on yksikäsitteinen nollakohta, niin käytössä on suhdeasteikko. o Esim. liikevoitto euroina, vastaajan kuukausitulot ja tuotteen kestoikä ovat suhdeasteikollisia. 1.3 Tilastolliset tunnusluvut Aritmeettinen keskiarvo on keskiluvuista tunnetuin ja käytetyin. Keskiarvon käyttö edellyttää, että mitattava muuttaja on välimatka-asteikollinen tai suhdeasteikollinen. Tällaisia ovat esimerkiksi pituus, paino, ikä ja hinta. Keskiarvoa ei voi laskea muuttujille, jotka ainoastaan luokittelevat tilastoyksiköitä. Tällaisia ovat esimerkiksi sukupuoli ja koulutus. Keskiarvo voidaan laskea sekä luokittelemattomasta että luokitellusta aineistosta. x + x + L + x x = = 1 n 1 2 n xi n i= 1 n Keskiarvoa voidaan käyttää, kun havaintoarvojen jakauma on yksihuippuinen ja symmetrinen keskiarvon suhteen. Keskiarvo ei ole yleensä sopiva keskiluku kuvaamaan esimerkiksi tulojakauman sijaintia, sillä keskiarvo on herkkä poikkeaville

havainnoille. Seuraavassa kuviossa on esitetty eräässä otantatutkimuksessa mukana olleiden henkilöiden tulojakauma. Muita keskilukuja ovat mediaani (keskimmäinen luku) ja moodi (todennäköisin luku). Keskiarvon tunnus on perusjoukosta laskettuna ja otoksesta laskettuna x (muitakin merkintätapoja on). Keskihajonta on tärkein ja käytetyin hajonnan mitta. Keskihajonta kuvaa havaintoarvojen keskimääräistä etäisyyttä keskiarvosta. n 1 s = ( ) 2 n 1 2 2 xi x s = xi nx n 1 i= 1 n 1 i= 1 Keskihajonnan neliötä kutsutaan varianssiksi. Mitä pienempi on keskihajonta (ja varianssi), sitä tiiviimmin havaintoaineisto on keskittynyt Lasketaan esimerkiksi lukujen 2, 2, 3, 4, 5, 9, 10 keskihajonta ja varianssi. Ensin lasketaan havaintoarvojen keskiarvo jakamalla havaintoarvojen summa havaintojen lukumäärällä (n).

Keskihajontaa ja varianssia laskettaessa huomioidaan jokainen havaintoarvo ja sen poikkeama havaintoarvojen keskiarvosta. Keskihajonnan tunnus on perusjoukosta laskettuna σ ja otoksesta laskettuna s. Vastaavat varianssia kuvaavat tunnukset ovat σ 2 ja s 2. Keskihajonnaksi saatu tulos tarkoittaa, että yksittäiset havaintoarvot sijaitsevat keskimääräisesti 3,3 yksikön päässä havaintoarvojen keskiarvosta (= 5). 1.4 Todennäköisyysjakaumat Data-analyysin kannalta tärkeimpiä todennäköisyysjakaumia ovat binomijakauma, Poissonin jakauma ja normaalijakauma. Edellä mainituista kaikkein useimmiten törmää normaalijakaumaan, jota kutsutaan myöskin Gaussin jakaumaksi. Gaussin jakauma kuvaa havaintojen jakaumaa monille eri koetilanteille ja sitä voidaan myöskin käyttää arvioitaessa muunlaisten jakaumien parametrejä. 2 1 N ( x; µ, σ ) = e σ 2π 2 1 x µ 2 σ µ=perusjoukon keskiarvo σ=perusjoukon keskihajonta x=riippumaton muuttuja Sijoituksella z = x µ σ saadaan normitettu normaalijakauma

N( x;0,1) = 1 e 2π 1 2 x 2 Normitetun normaalijakauman kertymäfunktio kuvaa sitä, kuinka paljon todennäköisyyttä on kertynyt tiettyyn arvoon mennessä.

Kertymäfunktio on normaalijakauman tiheysfunktion integraali. Sitä ei voi laskea analyyttisesti integroimalla, vaan on käytettävä numeerisia menetelmiä. Edellä olevasta kuvasta nähdään, että 68% havaintoarvoista sijoittuu yhden +/- yhden keskihajonnan päähän ja 96% +/- kahden keskihajonnan päähän keskiarvosta. Studentin t-jakauma on todennäköisyysjakauma, jota hyödynnetään normaalijakautuneiden populaatioiden keskiarvon tarkastelussa kun otoskoko on pieni. Yleisesti käytetty t-testi perustuu t-jakaumaan. Studentin t-jakauma on normitetun normaalijakauman kaltainen jakauma, jonka muoto kuitenkin vaihtelee otoskoon mukana. Mitä suurempi otos on kyseessä, sitä lähempänä t-jakauma on normaalijakaumaa. Studentin t-jakauman kehitti aikoinaan Guinnessin olutpanimon panimomestari, joka tutki oluiden ominaisuuksia 1. 1 The t statistic was introduced by William Sealy Gosset for cheaply monitoring the quality of beer brews ("Student" was his pen name) [1]. Gosset was a statistician for the Guinness brewery in Dublin, Ireland, and was hired due to Claude Guinness's innovative policy of recruiting the best graduates from Oxford and Cambridge to apply biochemistry and statistics to Guinness' industrial processes. [2] Gosset published the t test in Biometrika in 1908, but was forced to use a pen name by his employer who regarded the fact that they were using statistics as a trade secret. In fact, Gosset's identity was unknown not only to fellow (statisticians but to his employer the company insisted on the pseudonym so that it could turn a blind eye to the breach of its rules.[ http://en.wikipedia.org/wiki/t-test]

1.5 Tilastollinen testaus Tilastollisilla testeillä testataan tunnusluvuille tai parametreille asetettuja hypoteeseja. Testisuure lasketaan olettaen nollahypoteesin H 0 olevan totta. Jos aineiston perusteella laskettu tunnusluku poikkeaa nollahypoteesista ja aineiston vaihtelu on riittävän pientä suhteessa otoksen kokoon, nollahypoteesi voidaan hylätä valitulla merkitsevyystasolla. Vaihtoehtoisesti nollahypoteesi jää voimaan. Merkitsevyystaso kuvaa testin todennäköisyyttä hylätä nollahypoteesi virheellisesti. Testin voima on todennäköisyys millä nollahypoteesi hylätään kun vaihtoehtoinen hypoteesi H 1 on tosi. Esimerkki: On mitattu luokan opiskelijoiden sykkeet. Tarkoitus on tutkia, onko miesten ja naisten sykearvoissa tilastollisesti merkitsevä ero. Nollahypoteesi: Sykearvoissa ei ole eroa Vaihtoehtoinen hypoteesi: Sykearvoissa on eroa. Tällä kurssilla käsitellään keskiarvon testaamista silloin kun satunnaismuuttujan tiedetään tai voidaan olettaa - noudattavan normaalijakaumaa. Jos mitattuja arvoja on vähintään 30 kpl voidaan käyttää z-testiä. Jos taas mittauksia on alle 30, käytetään t-testiä. Kummassakin tapauksessa testimuuttujan arvo lasketaan kuitenkin samalla tavalla. T-testin käyttö edellyttää, että testattava muuttuja noudattaa perusjoukossa normaalijakaumaa. Z-testiä voi käyttää, vaikka muuttuja ei noudatakaan normaalijakaumaa, mutta silloin otoskoko on oltava vähintään 30. Jos tutkijalla on ennakko-oletus, nollahypoteesi, perusjoukon keskiarvosta, niin otoksen keskiarvoa voidaan verrata nollahypoteesin mukaiseen arvoon. Ennakkooletus voi pohjautua esim. olemassa olevaan teoriaan, vallitsevaan käsitykseen, aikaisempaan tutkimukseen, valmistajan ilmoitukseen jne. Nollahypoteesin rinnalle tutkija asettaa vaihtoehtoisen hypoteesin. Hypoteesin testaus lähtee siitä

olettamuksesta, että nollahypoteesi on totta. Tällöin otoksesta laskettu keskiarvo on peräisin normaalijakaumasta (jos perusjoukon keskihajonta on tunnettu), jonka keskiarvo on nollahypoteesin mukainen. Vastaavasti, jos perusjoukon keskihajontaa ei tunneta, voidaan otoskeskiarvo yhdistää t-jakaumaan. Tunnettua jakaumaa käyttäen voimme laskea, kuinka todennäköistä on saada otoskeskiarvo, joka on vähintään yhtä kaukana nollahypoteesista kuin meidän saamamme. Tätä todennäköisyyttä kutsutaan p-arvoksi. 1.5.1 Erehtymisriski eli p-arvo Mitä pienempi p-arvo on sitä enemmän on syytä kyseenalaistaa nollahypoteesin paikkansapitävyys. Jos nollahypoteesi hylätään, niin hylkäämiseen liittyy erehtymisriski. Tämä erehtymisriski on sama kuin p-arvo. Tutkijasta riippuu, millä erehtymisriskillä hän on valmis hylkäämään nollahypoteesin. Yleisimmin rajana käytetään 5% erehtymisriskiä. Eri suuruisten erehtymisriskien kohdalla voidaan käyttää seuraavia nimityksiä: erehtymisriski alle 10%: tilastollisesti suuntaa antava (p < 0.1) erehtymisriski alle 5%: tilastollisesti melkein merkitsevä (p < 0.05) erehtymisriski alle 1%: tilastollisesti merkitsevä (p < 0.01) erehtymisriski alle 0,1%: tilastollisesti erittäin merkitsevä. (p < 0.001) 1.5.2 Yksi- ja kaksisuuntainen hypoteesi Keskiarvotestauksessa hypoteesi on joko yksi- tai kaksisuuntainen: Nollahypoteesi: Perusjoukon keskiarvo on x. Kaksisuuntainen vaihtoehtoinen hypoteesi: Perusjoukon keskiarvo on eri suuri kuin x. Jos tutkija on kiinnostunut vain poikkeamasta jompaankumpaan suuntaan, niin käytetään yksisuuntaista testiä. Tällöin vaihtoehtoinen hypoteesi on:

Yksisuuntainen vaihtoehtoinen hypoteesi: Perusjoukon keskiarvo on pienempi kuin x (tai suurempi kuin x ). 1.5.3 Testityypin valinnasta Kun testattavana on kaksi ryhmää, tulee miettiä, vastaavatko ryhmät toisiaan yksi yhteen vai ei. Yksi yhteen vastaavuudesta tyypillinen esimerkki on seurantatutkimus, jossa verrataan jotain testisuuretta ennen ja jälkeen jonkin toimenpiteen. Silloin molemmissa vertailtavissa aineistoissa on sama kohde (esim. sama koehenkilö). Tällöin testityyppi on pareittainen (paired, pair-wise) testi. Jos kahdessa testattavassa aineistossa on eri kohteet (koehenkilöt), käytetään kahden otoksen testiä (Two-sample test). Tässä tilanteessa myös kohteita voi olla ryhmissä eri määrä. 1.5.4 Z- ja T-testi Excelissä TTEST(array1;array2;tails;type) Verrataan, eroavatko aineistot array1 ja array2 tilastollisesti merkitsevästi toisistaan. array1 sisältää solujen viittaukset ensimmäiseen vertailtavaan aineistoon array2 sisältää solujen viittaukset toiseen vertailtavaan aineistoon tails type o 1 = yksisuuntainen testi o 2 = kaksisuuntainen testi o 1 = parittainen testi o 2 = kahden otoksen testi (samat varianssit) o 3 = kahden otoksen testi (eri varianssit)

ZTEST(array,µ 0,sigma) Z-testillä tutkitaan, eroaako yksittäinen mittaustulos µ 0 tilastollisesti merkitsevästi vertailuaineiston array keskiarvosta. array sisältää viittaukset soluihin, joita vastaan µ 0 testataan (tässä annetuista soluista lasketaan tunnetun havaintoaineiston keskiarvo, sample mean) µ 0 = testattava luku (hypoteettinen koko populaation keskiarvo, hypotesized population mean). sigma = aineiston keskihajonta (tunnettu) Z-testi antaa todennäköisyyden sille, että testattava luku on suurempi kuin aineiston keskiarvo (yksisuuntainen testi). Kaksisuuntainen testi voidaan laskea seuraavalla kaavalla: =2 * MIN(ZTEST(array,µ 0,sigma),1-ZTEST(array,µ 0,sigma)) 1.5.5 Ei-parametrilliset testit Edellä esitettyjen testien lisäksi on olemassa ns. parametrittomia testejä, joissa testaus perustuu havaintoaineiston järjestämiseen tietyllä tavalla suuruusjärjestykseen. Niissä ei tarvitse olettaa mitään aineiston jakauman muodosta. Esimerkkejä ovat Mann- Whitney-testi, Wilcoxon-testi tai Kolmogorov-Smirnov-testi. Non-parametric statistics is a branch of statistics concerned with nonparametric statistical models and non-parametric statistical tests. Nonparametric statistics are statistics that do not estimate population parameters. In contrast, see parametric statistics.

Non-parametric models differ from parametric models in that the model structure is not specified a priori but is instead determined from data. The term nonparametric is not meant to imply that such models completely lack parameters but that the number and nature of the parameters are flexible and not fixed in advance. Nonparametric models are therefore also called distribution free. Non-parametric (or distribution-free) inferential statistical methods are mathematical procedures for statistical hypothesis testing which, unlike parametric statistics, make no assumptions about the frequency distributions of the variables being assessed. Nonparametric tests have less power than the appropriate parametric tests, but are more robust when the assumptions underlying the parametric test are not satisfied.