Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Samankaltaiset tiedostot
ABHELSINKI UNIVERSITY OF TECHNOLOGY

Harjoitus 7: NCSS - Tilastollinen analyysi

Väliestimointi (jatkoa) Heliövaara 1

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Matemaatikot ja tilastotieteilijät

Käsitteistä. Reliabiliteetti, validiteetti ja yleistäminen. Reliabiliteetti. Reliabiliteetti ja validiteetti

pitkittäisaineistoissa

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Tilastollisia peruskäsitteitä ja Monte Carlo

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

30A02000 Tilastotieteen perusteet

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Shorin algoritmin matematiikkaa Edvard Fagerholm

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tutkimustiedonhallinnan peruskurssi

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma

Harjoituspaketti helmikuuta 2008

Testejä suhdeasteikollisille muuttujille

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy päätöspuiden avulla tarkastellaan vasta seuraavissa harjoituksissa.

pitkittäisaineistoissa

Sovellettu todennäköisyyslaskenta B

Tilastollisten aineistojen kerääminen ja mittaaminen

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN

3.7 Todennäköisyysjakaumia

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Mitä on laadullinen tutkimus? Pertti Alasuutari Tampereen yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

,ܾ jaü on annettu niin voidaan hakea funktion

Testit laatueroasteikollisille muuttujille

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 3

1. Tilastollinen malli??

Reaalifunktioista 1 / 17. Reaalifunktioista

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Sovellettu todennäköisyyslaskenta B

Järvitesti Ympäristöteknologia T571SA

SEKASTRATEGIAT PELITEORIASSA

Pelaisitko seuraavaa peliä?

Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

3.6 Su-estimaattorien asymptotiikka

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

S Havaitseminen ja toiminta

ANNA JA ALEKSI SETELINVÄÄRENTÄJIEN JÄLJILLÄ

ANNA JA ALEKSI SETELINVÄÄRENTÄJIEN JÄLJILLÄ

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

dx=5&uilang=fi&lang=fi&lvv=2014

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Normaalijakaumasta johdettuja jakaumia

D ( ) E( ) E( ) 2.917

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

HAVAITUT JA ODOTETUT FREKVENSSIT

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto

Karteesinen tulo. Olkoot A = {1, 2, 3, 5} ja B = {a, b, c}. Näiden karteesista tuloa A B voidaan havainnollistaa kuvalla 1 / 21

Raamatun lainaukset vuoden 1992 raamatunkäännöksestä.

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

b) Jos Ville kaataisikin karkit samaan pussiin ja valitsisi sieltä sattumanvaraisen karkin, niin millä todennäköisyydellä hän saisi merkkarin?

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin Yliopisto Harjoitus 1, ratkaisuehdotukset

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Transkriptio:

Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi: kontekstin ja sen ajallisen kehitys * määritelmiä * roolit * prosessi * * havaintojen tekeminen Havaintojen tekeminen 1. Mitä laittaa ylös: kuka - mitä - missä - milloin - miten - miksi 2. Miten kirjoittaa: arkikielellä, välttäen abstraktioita, yleistyksiä, tieteellisiä käsitteitä 3. Milloin kirjoittaa: paikan päällä - myöhemmin Otantamonimutkaisia asioita ei voi nähdä ohimennen havainnointi on syventymisprosessi tutkimus loppuu, kun uutta informaatiota ei enää saada (otanta tässä eri asia kuin tilastotieteessä) Haastattelut: merkityksiä ja kokonaisuuksia * määritelmiä * merkityksiä ja kokonaisuuksia, ei teknisiä yksityiskohtia * ihmisten valinta * * lumipallo-otanta * 1

Kysymysrungosta 1. 5-6 kysymystä riittää!!! 2. alkuun helpot kysymykset, loppuun vaikeat ja sensitiiviset 3. lämmittelykysymykset - asiakysymykset - lopettelukysymykset Aina nauhoitus/tallennus: se helpottaa elämää Dokumentit: historiaa ja teknisiä kokonaisuuksia * dokumentti /tyyppejä * hyviä puolia ja vinoumia * julkinen/yksityinen sektori * Lähdekritiikki Ennen kuin lähteeseen luottaa, pitäisi tarkistaa muutama asia: 1. etsittävä originaali lähde 2. tutkittava lähteen konsistenssi 3. punnittava kirjoittajan luotettavuutta: kykyä ja tahtoa kertoa asiat totuudenmukaisesti Muotoilusta tulleita menetelmiä Luotaimet Make toolsit Kokemusprotot, miksei oikeatkin protot Päätöksenteko 2

Tilanne: Tilastollinen esimerkki A väittää, että osaa tunnistaa erehtymättä hyvän kopion alkuperäisestä pelkästään katsomalla esinettä. Miten testata tämä väite? Ratkaisu, askel 1: tutkimusasetelma Tehdään koesarja, jossa annetaan A:lle sarja aitoja esineitä ja kopioita ja pyydetään häntä erottelemaan aidot vain katselemalla. Aidot ja kopiot esitetään satunnaisessa järjestyksessä. Ratkaisu, askel 2: todennäköisyys Jaetaan ratkaisu osiin. Millä todennäköisyydellä A saa valittua 4 aitoa oikein? Niin aitoja kuin kopioita tarvitaan 4 kpl, yht. 8. npermr=n!/(n-r)!, jossa 1. n! kertoma kaikista mahdollisista järjestyksistä, joissa valinta voidaan tehdä (esim. 4! = 4*3*2*1 = 24) 2. n kuvaa luvun, josta kertoma aloitetaan, r montako lukua jatketaan (esim. jos n=8 ja r=2 ja, 8*7, jos r=3, 8*7*6) Nyt halutaan saada 8:sta neljä valintaa oikein, 8P4: 8!/(8-4)! [eli 8*7*6*5*4*3*2*1/4*3*2*1] = 8!/(4!) = 1680/24 = 70 Seuraavassa vaihessa jyvitetään tämä luku erilaisilla tapauksille. Tapaukset: 4 oikein, 3 oikein 1 väärin, 2 oikein 2 väärin, jne. Meillä on siis 70 mahdollista tapaa valita 4 esinettä 8:n esineen joukosta. 3

Ensimmäinen tapaus on, että A saa kaikki oikein. Tapaus on helppo: niitä on vain yksi. Ts. todennäköisyys, että A saa 4 oikein pelkällä onnella on 1/70 = 0.014, eli vähän yli 1%...eli tuurilla näin tapahtuu suhteellisen harvoin. Voimme siis olettaa, että jos A saa 4 oikein kokeessamme, tietää hän asiansa. Entä tn sille, että 3 valintaa menee oikein ja 1 väärin? Huom! Täysin varmoja emme voi olla; sillä yksi vauva 70:stä saisi tehtyä saman valinnan! npermr=n!/(n-r)! 1. Nyt ensin tutkitaan mahdollisuus saada 4:stä 3 valintaa oikein, eli 4P3: 4!/(4-3)! = 4!/(3!) = 24/6 = 4 2. Lisäksi tutkitaan mahdollisuus tehdä 1 väärä valinta neljästä. Yksi väärä voidaan valita 4 mahdollisesta tapauksesta 4 eri tavalla, eli tn=1/ 1P 4 1/[1!/(4-1)!] = 1/(1/4), eli 4 3. Lopuksi määritellään tapausten suhde. Koska nämä kaksi tapahtumaa ovat riippumattomia toisistaan, niiden leikkaus P(AleikkausB) on P(A)P(B), eli 4*4 = 16 Todennäköisyys saada 3 oikein ja 1 väärin 8:sta on siis 16/70 = 0,2285 noin 23%. Tämä tapaus ei riittäne todistukseksi, koska yksi vauva viidestä tekisi oikean valinnan. Todennäköisyys saada 2 oikein ja 2 väärin on samalla tavalla laskien: 4!(4-2)!/2!/(2-1)! * 4!(4-2)!/(2-1)! = [(4*3*2*1/2*1)/(2*1/1)] 2 = 6*6 = 36, eli noin 51%... (eli 36/70*100) TN, frekv. TN, prosenttia TN, kertymä 1 1.429 1.420 16 22.857 24.286 36 51.429 75.714 16 22.857 98.571 1 1.429 100.000 70 100%... ja loput tapaukset (1 oikein 3 väärin, ja 4 väärin) saadaan yksinkertaisesti aiemmista tapauksista. Esim. 4 väärin on 1/70. 4

Ratkaisu, askel 3: päätetään, mitä pidetään merkitsevänä Yleensä tieteessä ajatellaan, että uskomme tuloksen, jos sillä on pieni mahdollisuus tapahtua sattumalta. Tavalliset rajat ovat 5% ja 1%, isoilla aineistoilla myös 1 promille. Kokeessamme siis hyväksymme vain tapauksen, jossa A saa 4 oikein, sillä se tapahtuu sattumalta vain 1 kerran 70:stä. Jo tapaus, jossa 3 menee oikein, tapahtuu joka viidennessä kokeessa. Ratkaisu, askel 4: koesarjan teko, nollahypoteesi ja satunnaistaminen1. Tehdään koesarja(t) ja lasketaan tulosten jakauma 2. nollahypoteesi (valinta on satunnainen) hylätään vain, jos saamme merkitsevän tuloksen (eli nyt kaikki valinnat menevät oikein) 3. esineiden on oltava satunnaistettuja - niistä ei saa saada mitään viitteitä oikeista vastauksista Sama malli yleistyy kaikkeen tilastolliseen tutkimukseenero on, että teidän ei tarvitse yleensä tehdä todennäköisyyslaskelmia. Ne tulevat automaattisesti ohjelmistoista. Tällöin merkitsevyystaso alkaa joustamaan. Jos tutkimme TM:n opiskelijoiden kykyä erotella kopiot ja aidot tuotteet, voimme tehdä edellisen koesarjan 100 opiskelijalle. Voimme esimerkiksi sanoa, että TM:n opiskelijat pystyvät erottamaan 75% varmuudella kopion ja aidon (siis 3 oikein, 1 väärin) 95% todennäköisyydellä. 5

Menetelmää voi mutkistaa. Tutkimalla esimerkiksi taidekasvattajia voidaan tutkia, onko heillä parempi vai heikompi kyky erotella aitoutta verrattuna TM:ään. Tällöin voidaan tutkia koulutuksen merkitystä asiassa. Entä opintojen vaikutus? Eroavatko ykköset ja kolmoset toisistaan eri oppiaineissa? Tutkimus on peliä todennäköisyyttä vastaan 6