Geneettinen analyysi. Tilastotieteen kertausta

Koko: px
Aloita esitys sivulta:

Download "Geneettinen analyysi. Tilastotieteen kertausta"

Transkriptio

1 Kertaus: Luento 1 Todennäköisyyksien perusperiaatteita Testille suotuisten tapauksien joukko Toisensa poissulkevat tapaukset Leikkaus Yhdiste Komplementti Riippumattomat tapahtumat, niiden kertolasku Ehdollinen todennäköisyys Venn-diagrammit Permutaatiot ja kombinaatiot Binomitodennäköisyys Yhteistodennäköisyys

2 Geneettinen analyysi Tilastotieteen kertausta

3 Tilastotieteen rooli biologiassa / genetiikassa Esim. näytteet Tvärminnen kalliolammikoiden vesikirppupopulaatioista, vertaillaan kirppujen kokoa lammikoittain tai vaikkapa muuntogeeninen hiirilinja jonka perusteella pitäisi arvioida tuodun geenin vaikutus hiiren muiden geenien ekspressoitumiseen Miten analysoida tätä informaatiota? Mitä menetelmiä voi käyttää missäkin tilanteessa?

4 Tilastotieteen rooli biologiassa / genetiikassa Tilastotieteen menetelmiä käyttämällä haluamme päätellä jotakin yleistä, koko vesikirppupopulaatiota tai hiiren geeniekspressiotasoa tätä tarkoitusta varten poimitun otoksen/tehdyn kokeen avulla: haluamme selvittää, ovatko eri otokset peräisin samanlaisista populaatioista (esim. ovatko eri lammikoiden vesikirppupopulaatiot keskenään saman vai erikokoisia?) verrata havaittua jakaumaa teoreettisesti ennustettuun

5 Deskriptiivinen eli kuvaileva tilastotiede Aineiston tiivistäminen Hyvin oleellinen osa tilastollista analyysiä on tiivistää ja kuvata datan antamaa informaatiota selkeällä ja ymmärrettävällä tavalla. Esimerkiksi, tutkija on hankkinut kaikkiaan 250 vesikirppua kalliolammikoista. Miten kuvailla aineistoa? Numeerinen ja graafinen lähestymistapa: Vesikirppujen koon keskiarvo ja keskihajonta eri lammikoissa. Piirretään scatter plot, jossa x-akselilla on vesikirpun koko ja y- akselilla asuinlammikon lämpötila. Graafiset menetelmät soveltuvat numeerisia paremmin erilaisten systemaattisuuksien havaitsemiseen aineistossa. Numeeriset ovat taas tarkempia ja objektiivisempia. Koskapa graafiset ja numeeriset lähestymistavat täydentävät toisiaan, on viisasta käyttää aina molempia.

6 Numeerinen vs Graafinen tapa Sama aineisto kuvattuna eri tavoin: Numeerisesti 200 havaintoa joiden keskiarvo on 0.04 ja keskihajonta on havaintoa joiden mediaani on 0, minimi on -4.0 ja maksimi on 2.7 Graafisesti histogrammina sirontakuvana

7 Luokka- ja määrämuuttujat Tilastollista aineistoa käsiteltäessä aineiston muuttujat voidaan laadun perusteella jakaa kahteen ryhmään: Luokkamuuttujat ja määrämuuttujat Luokkamuuttujia ovat esim. väri, sukupuoli määrämuuttujat voidaan edelleen jakaa kahteen alaryhmään: diskreetit muuttujat (esim. raajojen määrä, jälkeläisten määrä) jatkuvat muuttujat (esim. pituus, paino, ikä) Jos tutkittava muuttuja on ainakin intervalliasteikkoinen, voidaan oleellisin tieto tiivistää muutamaan tunnuslukuun, kuten keskiarvoon ja hajontaan. Tilastollista aineistoa voidaan helposti kuvata joillakin melko yksinkertaisilla arvoilla Jos aineisto järjestetään luokkiin, sitä luokkaa, jolla on suurin frekvenssi kutsutaan tyyppiluokaksi tai arvoksi eli moodiksi.

8 Numeerinen aineiston tiivistys Tilastollista aineistoa voidaan helposti kuvata joillakin melko yksinkertaisilla arvoilla Jos tutkittava muuttuja on ainakin intervalliasteikkoinen, voidaan oleellisin tieto tiivistää muutamaan tunnuslukuun, kuten keskiarvoon ja hajontaan. Jos aineisto järjestetään luokkiin, sitä luokkaa, jolla on suurin frekvenssi kutsutaan tyyppiluokaksi tai arvoksi eli moodiksi. Sitä arvoa, joka jakaa aineiston kahteen yhtä suureen osaan, sanotaan mediaaniksi. Jos aineistossa on parillinen määrä muuttujia, mediaani on kahden keskimmäisen arvon puolivälissä

9 Numeerinen aineiston tiivistys Kvartiilit ovat ne arvot, jotka jakavat aineiston neljään yhtä suureen osaan. keskimmäinen kvartiili on sama kuin mediaani yläkvartiilin arvon alle jää kolme neljäsosaa aineistosta, vastaavasti alakvartiilin arvon yläpuolelle jää kolme neljäsosaa aineistosta kvartiilien arvot määräytyvät samalla tavalla kuin mediaaninkin Vaihteluväli on aineiston suurimman ja pienimmän luvun erotus

10 Numeerinen aineiston tiivistys Eri lukuja jotka tiivistävät esimerkkiaineiston Keskiarvo: ja keskihajonta 1.04 Kvartiilit: -4.01, -0.75, 0.00, 0.64, 2.74 Vaihteluväli: 6.8 Huomioita: Keskiarvo ja mediaani eroavat vähän toisistaan. Kvartiilien rajat ja 0.64 ovat lähempänä mediaania ja keskiarvoa kuin mitä keskihajonnan (1.04) perusteella kuvittelisi

11 Esimerkki 20. Alla on esitetty 50 opiskelijan sykkeet Aineiston vaihteluväli on 34 (96-62) ja mediaaniarvo (25.s arvo) on 79 ja 80 puolivälissä, eli 79,5. Vastaavasti 12. ja 13. arvot ovat 74 ja 74, joten alakvartiili on 74. Yläkvartiiliksi saadaan 84, sillä se on 37:nnen (83) ja 38:nnen arvon (85) välissä. Tässä aineistossa vaikuttaisi olevan kaksi moodiarvoa, 80 ja 81. Moodi on helpompi selvittää, jos arvoja yhdistetään luokiksi esim. seuraavan taulukon mukaisesti:

12 Syke-aineisto Syke määrä Nyt moodiluokaksi saadaan yht. 50

13 Keskiarvo Määrämuuttujista koostuvaa aineistoa kuvataan yleisimmin keskiarvolla Aritmeettinen keskiarvo lasketaan summaamalla kaikki arvot ja jakamalla aineiston alkioiden kokonaislukumäärällä x n i1 n x i

14 Huom! Keskiarvo ja mediaani eivät välttämättä ole samansuuruisia Esim. Edellisestä aineistosta saadaan keskiarvoksi 79,1 lyöntiä minuutissa (huomaa ero mediaaniin).

15 Hajonta Keskihajonta, s, kuvaa aineiston keskimääräistä etäisyyttä keskiarvosta (positiivista tai negatiivista) Otetaan havainnon ja keskiarvon erotuksen neliö Keskihajonnan neliö s 2 on varianssi käsiteltäessä otosvarianssia ja -keskihajontaa, nimittäjänä käytetään n-1 pelkän aineistokoon (n) sijaan. s n i1 x i n x 2

16 Keskiarvon keskivirhe Kun halutaan arvioida, kuinka paljon samasta perusjoukosta peräisin olevien otosten keskiarvot vaihtelevat, käytetään keskiarvon keskivirhettä (SE) keskiarvon keskivirhe saadaan jakamalla otoksen keskihajonta otoskoon neliöjuurella Keskiarvon keskivirhe ilmaisee otoksen keskiarvon tarkkuuden, ts. eri toistokerroilla poimittujen otosten keskiarvojen hajonnan S x s n

17 Esimerkki 21. Alla on kahdessa eri kokeessa saadut aineistot. Mitkä ovat niiden keskiarvot ja keskihajonnat? Vastaus: aineistolle a) x s 2 (6 36) 2 (12 36) 2 (37 36) 5 2 (49 36) 2 (64 36) ,6 s s 2 399,6 20

18 Vastaavasti aineistolle b) arvot ovat x=116, s 2 = 10 ja s = 3,16

19 Esimerkki kvartiilien käytöstä tulosanalyysissä Tutkimuksessa testattiin menetelmää oikealla datalla (musta viiva) ja sotketulla datalla (Mishra et al. in review) Tavoitteena oli esittää miten varsinainen ja sotkettu analyysi eroavat toisistaan Datan sotkeminen toistettiin tuhat kertaa Tuhatta viivaa esittävä kuvaaja on sekava Kvartiilien käytöllä kuvaajasta tulee selkeämpi (mukana myös 10% ja 90 % rajat)

20 Inferentiaalinen tilastotiede Tilastollinen päättely Tilastotiedettä käytetään usein apuna päätöksen teossa Onko lääkeyhdiste aiheuttama parannus ollut merkittävä? Onko geenin X aktiivisuus muuttunut selkeästi kahden koeeläinryhmän välillä Tilastotieteitä käytetään myös arvioitaessa parametreja, kuten muutoksia aineistoista Kuinka paljon geenin X aktiivisuus on muuttunut? Kuinka paljon on haitallisia bakteereita järven vedessä? Näihin kysymyksiin pyritään vastaamaan tilastollisen päättelyn avulla. TAI kevyemmin

21 Tilastollinen päättely Tilastollinen päättely tekee usein johtopäätöksiä koko populaatiosta tutkitun otoksen (=näytteen) perusteella. Otos esimerkiksi: satunnaisesti valittu joukko väestöstä Testattava joukko voi olla myös koko populaatio Vaikkapa kaikki tutkittavan eliön geenit Esimerkiksi, eräässä kokeessa 10 koehenkilöä suorittaa tehtävän 24 h valvomisen jälkeen. Koehenkilöiden keskimääräinen tulostaso oli 12 pistettä alempi kuin 10:llä verrokkihenkilöllä, jotka suorittivat kokeen normaalien yöunien jälkeen. Onko ero todellinen, vai voisiko se johtua sattumasta?

22 Tilastollisessa päättelyssä on kaksi päälähestymistapaa: parametrien estimointi ja hypoteesin testaus. Estimoinnissa otosta käytetään jonkin parametrin ja sen luottamusvälien estimointiin. Hypoteesin testauksessa asetetaan nollahypoteesi ja päätellään testin avulla, onko aineisto riittävän erikoinen jotta nollahypoteesi voidaan hylätä. Valvomiskokeessa nollahypoteesi olisi valvomisella ei ole vaikutusta kokeen tulokseen. Käsittelemme tilastollista päättelyä tarkemmin seuraavalla luennolla, jossa tutustumme tilastolliseen testaamiseen.

23 Todennäköisyysjakaumat Esimerkki 22. Mendel risteytti siemenen muodon suhteen eroavia (sileä- ja kurttusiemenisiä herneitä), sukusiitettyjä hernelinjoja keskenään. F1-polvessa kaikki herneet olivat sileitä. F1-polven kasvit risteytettiin jälleen keskenään, ja tulokseksi saatiin jälleen molempia tyyppejä. Mendel esitti hypoteesin, että ominaisuutta kontrolloi yksi geeni, jossa on kaksi alleelia: dominoiva sileän siemenen aiheuttava geeni ja resessiivinen kurttuisen pinnan muodostava.

24 Käsitteitä Määritellään genotyyppi satunnaismuuttujaksi. F2-polvessa mahdollisia genotyyppejä eli satunnaismuuttujan tulosmahdollisuuksia on neljä: AA, Aa, aa, ja aa. Nämä tulosmahdollisuudet määrittävät perusjoukon (tässä F2-polven) otosavaruuden. Otosavaruuden osajoukot voivat määrittää tapahtuman. Tapahtuma koostuu yhdestä tai useammasta arvosta otosavaruudessa. Tässä esimerkissä tapahtuma voisi olla vaikkapa yhden satunnaisesti valitun siemenen genotyyppi.

25 Jos taas tarkastelisimme dominanttien alleelien (A) määrää satunnaisesti valitun herneensiemenen genotyypissä, niin X on satunnaismuuttuja, jonka otosavaruus on = {0, 1, 2}. X jos jos jos aa Aa,aA AA Satunnaismuuttuja: muuttuja, joka kuvaa satunnaisilmiön tapahtumavaihtoehtoja numeerisesti. Jos satunnaismuuttujaksi otetaan siemenen muoto, tulosmahdollisuuksia on kaksi, sileä tai kurttuinen.

26 Satunnaismuuttujan todennäköisyysjakauma on sääntö, joka kertoo, millä todennäköisyyksillä satunnaismuuttuja saa arvonsa. Satunnaismuuttujan todennäköisyysjakauma on täysin määrätty, jos tunnetaan satunnaismuuttujan saamat arvot ja niiden todennäköisyydet. Huomaa, että kaikkien muuttujan arvojen todennäköisyyksien on oltava nollia tai suurempia, ja niiden summan on oltava yksi.

27 Esimerkissä, mikäli Mendelin käsitys herneen siemenen muodon periytymisestä oli oikea, todennäköisyys syntyä sileä herneensiemen on 3/4, kurttuinen 1/4. Summa on yksi. Diskreetillä satunnaismuuttujalla tarkoitetaan satunnaismuuttujaa, joka saa erillisiä arvoja, tai eksaktimmin ilmaistuna, jonka otosavaruus on äärellinen tai numeroituvasti ääretön. Vastaava todennäköisyysjakauma on tällöin diskreetti todennäköisyysjakauma. (Teoreettisen diskreetin jakauman määrittelevää lauseketta kutsutaan pistetodennäköisyysfunktioksi)

28 Jatkuva satunnaismuuttuja on sellainen, joka voi saada arvoja jatkuvasti tietyltä väliltä, kuten esim. pituus tai paino saavat Vastaavaa todennäköisyysjakaumaa kutsutaan jatkuvaksi jakaumaksi. Teoreettisen jatkuvan todennäköisyysjakauman määrittelevää lauseketta kutsutaan tiheysfunktioksi. Tiheysfunktiossa yksittäisen pisteen arvon todennäköisyys on 0, mutta todennäköisyys, että muuttuja saa arvoja joltain väliltä on positiivinen.

29 Teoreettinen jakauma on matemaattinen lauseke, joka kuvaa muuttujan arvojen jakaumaa perusjoukossa. Kertymäfunktio F(x)=P(Xx) niin jatkuville kuin diskreeteillekin satunnaismuuttujille.

30 Satunnaismuuttujan odotusarvo ja varianssi Odotusarvo: Jos satunnaisilmiön numeerisina tulosvaihtoehtoina ovat luvut x 1,x 2,,x n ja niiden todennäköisyydet ovat p 1, p 2,,p n, satunnaismuuttujan odotusarvo kuvaa tuloksen odotettavissa olevaa arvoa. Se määritellään E n ( X ) pi xi p1x1 i1... Tilastotieteen ja matematiikan oppikirjoissa (hiukan matemaattisemmin ilmaistuna) diskreeteille ja jatkuville satunnaismuuttujille E( X ) x x xf p ( x ) ( x) dx p diskreetti jatkuva jossa p x (x i ) tarkoittaa samaa kuin p i ylempänä, ja f x on jatkuvan satunnaismuuttujan tiheysfunktio. i x x i n x n

31 Varianssi on jakauman vaihtelevuuden mitta. Se määritellään Var( X ) x xi x E( X ) E( X ) 2 2 p f x x ( x i ) ( x) dx diskreetti jatkuva Esimerkki 22, jatkoa: Mendelin hernekokeessa määriteltiin satunnaismuuttuja Z, joka sai arvon 0 jos siemen oli kurttuinen ja arvon 1 jos sileä. Niiden todennäköisyydet olivat siis P(Z=0)= ¼ ja P(Z=1)=¾.

32 Odotusarvo yksittäiselle siemenelle on 13/4+01/4=3/4. Se on selvästi lähempänä ykköstä (sileä) kuin nollaa (kurttuinen), kuten odotettavissa onkin sileyden aiheuttavan alleelin dominoivuuden vuoksi. Z:n teoreettinen varianssi on Var ( Z) z E( Z) p( ) i 2 i z i =(0-3/4) 2 1/4+(1-3/4) 2 3/4=3/16

33 Standardijakaumia Kun mikä tahansa aineisto asetetaan järjestykseen se muodostaa (empiirisen) jakauman Teoreettiset jakaumat ovat hyvin tärkeitä tilastotieteessä: esim. binomi- ja Poisson-jakaumat ovat teoreettisia diskreettejä jakaumia Normaalijakauma on tyypillinen esimerkki jatkuvasta jakaumasta, missä periaatteessa on mahdollista saada kaikki arvot negatiivisesta äärettömästä positiiviseen äärettömään.

34 Binomijakauma Binomijakauma on tärkeä diskreetti todennäköisyysjakauma. Jos satunnaiskoetta A toistetaan riippumattomasti n kertaa ja tarkastellaan tapahtumaa A, jonka todennäköisyys yksittäisessä kokeessa on P(A)=p sanotaan A:n esiintymisten lukumäärän n:ssä kokeessa olevan binomiaalisesti jakautunut. Todennäköisyys sille, että A tapahtuu n-kertaisessa toistokokeessa täsmälleen x kertaa, on f ( x) n p x x nx (1 ) p Esimerkiksi tyttöjen lukumäärä vaikkapa nelilapsisessa perheessä on binomijakautunut, samoin resessiivisesti periytyvään sairauteen sairastuneiden lasten lukumäärä sisarussarjassa, joiden vanhemmat ovat heterotsygootteja. Teoreettisesti voidaan osoittaa, että binomijakauman odotusarvo on np, ja varianssi np(1-p).

35 Bin(10,0.3) Binomijakautuneisuuden edellytykset: tapahtumalla on kaksi tulosvaihtoehtoa (tai kategoriaa) tapahtumat ovat toisensa poissulkevat (vain jompikumpi tapahtuu kerrallaan) toistojen tulokset ovat toisistaan riippumattomat

36 Poisson -jakauma Kun n on hyvin suuri, binomitodennäköisyyksien laskemisesta tulee hankalaa: esim. mikä on todennäköisyys että 3000 yksilön populaatiossa on täsmälleen 18 harvinaista fenotyyppiä ilmentävää yksilöä, jos tiedetään fenotyypin esiintymisfrekvenssiksi 0.005? joudutaan laskemaan sekä Onkin hyödyllistä tietää, että binomijakauma lähestyy Poisson-jakaumaa, kun n ja p on pieni. Tällöin np pysyy samana. Jos np merkitään :lla,

37 n x p x (1 p) nx e x x! jossa e on Neperin luku, e 2,718 Jälkimmäinen lauseke on Poisson-jakauman tiheysfunktio Poisson-jakauma approksimoi hyvin binomijakaumaa, kun n20 ja p0,05 Poisson-jakauman odotusarvo ja varianssi ovat keskenään yhtä suuret ().

38 Poisson-jakaumaa noudattavia asioita: Esim. harvinaisen sairauden ilmaantuvuus väestössä Tietyn ajan kuluessa petrimaljalle ilmestyvien bakteerien lukumäärä noudattaa suhteellisen tarkasti Poissonjakaumaa. Tällöin maljan pohja ajatellaan jaetuksi hyvin pieniin alueisiin, joissa kussakin bakteerin esiintymistodennäköisyys on pieni, mutta alueita eli toistoja on paljon. Crossing-overia kuvataan tavallisesti Poisson-prosessilla, jossa niiden lukumäärä kromosomissa on Poissonjakautunut ja sijainnit jakautuvat tasaisesti yli kromosomin.

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Satunnaismuuttujat ja todennäköisyysjakaumat Mitä tänään? Jos satunnaisilmiötä halutaan mallintaa matemaattisesti, on ilmiön tulosvaihtoehdot kuvattava numeerisessa muodossa. Tämä tapahtuu liittämällä

Lisätiedot

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa? 21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä

Lisätiedot

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma

Lisätiedot

30A02000 Tilastotieteen perusteet

30A02000 Tilastotieteen perusteet 30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 20. syyskuuta 2007 Antti Rasila () TodB 20. syyskuuta 2007 1 / 17 1 Kolmogorovin aksioomat σ-algebra Tapahtuman todennäköisyys 2 Satunnaismuuttujat Todennäköisyysjakauma

Lisätiedot

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: 8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi TOD.NÄK JA TILASTOT, MAA0 Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi Kuten tilastojakaumia voitiin esittää tunnuslukujen (keskiarvo, moodi, mediaani, jne.) avulla, niin vastaavasti

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Diskreettejä jakaumia TKK (c) Ilkka Mellin (2007) 1 Diskreettejä jakaumia >> Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma

Lisätiedot

D ( ) Var( ) ( ) E( ) [E( )]

D ( ) Var( ) ( ) E( ) [E( )] Mat-.2620 Sovellettu todennäköisyyslaskenta B / Ratkaisut Aiheet: Diskreettejä jakaumia Avainsanat: Binomijakauma, Diskreetti tasainen jakauma, Eksponenttijakauma, Geometrinen jakauma, Hypergeometrinen

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 12.1.2016/1 MTTTP5, luento 12.1.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja. Luku 1 Johdanto 1.1 Todennäköisyys ja tilastotiede Kurssi käsittelee todennäköisyyslaskentaa ja tilastotiedettä. Laaditaan satunnaisilmiöille todennäköisyysmalleja. Miten hyvin mallit kuvaavat todellisuutta?

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Teema 7: Todennäköisyyksien laskentaa

Teema 7: Todennäköisyyksien laskentaa Teema 7: Todennäköisyyksien laskentaa Teemassa 6 tutustuttiin todennäköisyyden ja satunnaisuuden käsitteisiin sekä todennäköisyyslaskennan perusteisiin. Seuraavaksi tätä aihepiiriä syvennetään perehtymällä

Lisätiedot

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty Juuri 0 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 9..08 Kertaus K. a) Alapaineiden pienin arvo on ja suurin arvo 74, joten vaihteluväli on [, 74]. b) Alapaineiden keskiarvo on 6676870774

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia TKK (c) Ilkka Mellin (2005) 1 Diskreettejä jakaumia Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen jakauma Negatiivinen

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

52746 Geneettinen analyysi

52746 Geneettinen analyysi 52746 Geneettinen analyysi Päivi Onkamo Sampo Sammalisto Jack Leo Pekka Uimari Perinnöllisyystieteen oppiaine, Biotieteiden laitos, Helsingin yliopisto 2011 Sisällysluettelo Johdanto... 3 Luennot... 4

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio TKK (c) Ilkka Mellin (2007) 1 Kertymäfunktio >> Kertymäfunktio: Määritelmä Diskreettien jakaumien

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen MAT-5 Todennäköisyyslaskenta Tentti.. / Kimmo Vattulainen Vastaa jokainen tehtävä eri paperille. Funktiolaskin sallittu.. a) P A). ja P A B).6. Mitä on P A B), kun A ja B ovat riippumattomia b) Satunnaismuuttujan

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Normaalijakaumasta johdettuja jakaumia

Normaalijakaumasta johdettuja jakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2007) 1 Normaalijakaumasta johdettuja jakaumia >> Johdanto χ 2 -jakauma F-jakauma

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 25.10.2016/1 MTTTP5, luento 25.10.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Kertymäfunktio TKK (c) Ilkka Mellin (2005) 1 Kertymäfunktio Kertymäfunktio: Määritelmä Diskreettien jakaumien kertymäfunktiot Jatkuvien jakaumien kertymäfunktiot TKK (c)

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko ÌÓÒÒĐĐÓ ÝÝ ÔÖÙ ØØ Naiiveja määritelmiä Suhteellinen frekvenssi kun ilmiö toistuu Jos tehdas on valmistanut 1000000 kpl erästä tuotetta, joista 5013 ovat viallisia, niin todennäköisyys, että tuote on viallinen

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014 1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

&idx=2&uilang=fi&lang=fi&lvv=2015

&idx=2&uilang=fi&lang=fi&lvv=2015 20.10.2015/1 MTTTP5, luento 20.10.2015 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen MTTTP5, kevät 2016 4.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen 1. Laitosneuvostoon valitaan 2 professoria, 4 muuta henkilökuntaan kuuluvaa jäsentä sekä 4 opiskelijaa. Laitosneuvostoon

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

4. laskuharjoituskierros, vko 7, ratkaisut

4. laskuharjoituskierros, vko 7, ratkaisut 4. laskuharjoituskierros, vko 7, ratkaisut D1. Kone valmistaa kuulalaakerin kuulia, joiden halkaisija vaihtelee satunnaisesti. Halkaisijan on oltava tiettyjen rajojen sisällä, jotta kuula olisi käyttökelpoinen.

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

6. laskuharjoitusten vastaukset (viikot 10 11)

6. laskuharjoitusten vastaukset (viikot 10 11) 6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287

Lisätiedot

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo. Kertaus Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Luokiteltu aineisto. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo. Hajontaluvut luokittelemattomalle

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut). KÄSITTEITÄ POPULAATIO Joukko, jota tutkitaan (äärellinen, ääretön). Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut). Näiden välillä ei aina tehdä eroa, kun puhutaan

Lisätiedot

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 16.11.2017/1 MTTTP5, luento 16.11.2017 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla ~,, ~,,. 16.11.2017/2 Esim. Tutkittiin uuden menetelmän käyttökelpoisuutta

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

3.7 Todennäköisyysjakaumia

3.7 Todennäköisyysjakaumia MAB5: Todennäköisyyden lähtökohdat 4 Luvussa 3 Tunnusluvut perehdyimme jo jakauman käsitteeseen yleensä ja normaalijakaumaan vähän tarkemmin. Lähdetään nyt tutustumaan binomijakaumaan ja otetaan sen jälkeen

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 2.10.2018/1 MTTTP1, luento 2.10.2018 7.4 Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 2.10.2018/2

Lisätiedot

riippumattomia ja noudattavat samaa jakaumaa.

riippumattomia ja noudattavat samaa jakaumaa. 12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta

Lisätiedot

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto Kytkentäanalyysin teoriaa Pyritään selvittämään tiettyyn ominaisuuteen vaikuttavien eenien paikka enomissa Perustavoite: löytää markkerilokus jonka alleelit ja tutkittava ominaisuus (esim. sairaus) periytyvät

Lisätiedot

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Otanta Poisson- Jakaumien tunnusluvut Diskreetit jakaumat Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2

Lisätiedot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45. Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien

Lisätiedot

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia. Tehtävien ratkaisuja 4. Palloja yhteensä 60 kpl. a) P(molemmat vihreitä) = P((1. pallo vihreä) ja (. pallo vihreä)) = P(1. pallo vihreä) P(. pallo vihreä 1. pallo vihreä) = 0.05 (yleinen kertolaskusääntö)

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Verkot ja todennäköisyyslaskenta Verkko Verkko eli graafi muodostuu pisteiden joukosta V, särmien joukosta A ja insidenssikuvauksesta : A V V jossa

Verkot ja todennäköisyyslaskenta Verkko Verkko eli graafi muodostuu pisteiden joukosta V, särmien joukosta A ja insidenssikuvauksesta : A V V jossa Mat-.6 Sovellettu todennäköisyyslaskenta B Mat-.6 Sovellettu todennäköisyyslaskenta B / Ratkaisut Aiheet: Verkot ja todennäköisyyslaskenta Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio Jakaumien

Lisätiedot

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut TILASTO-OPPIA Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut Diskreetit jakaumat ja niiden esittäminen frekvenssitauluna ja kaaviona Jakauma on diskreetti jos tilastomuuttuja voi saada vain

Lisätiedot