031021P Tilastomatematiikka (5 op) kertausta 2. vk:een



Samankaltaiset tiedostot
031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Hypoteesin testaus Alkeet

Testejä suhdeasteikollisille muuttujille

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen aineisto Luottamusväli

Maximum likelihood-estimointi Alkeet

Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) viikko 6

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

031021P Tilastomatematiikka (5 op) viikko 6

031021P Tilastomatematiikka (5 op) viikko 5

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus regressioanalyysiin. Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Regressioanalyysi. Kuusinen/Heliövaara 1

031021P Tilastomatematiikka (5 op) viikko 4

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Testit laatueroasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Harjoitus 9: Excel - Tilastollinen analyysi

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Sovellettu todennäköisyyslaskenta B

MTTTP1, luento KERTAUSTA

tilastotieteen kertaus

MTTTP1, luento KERTAUSTA

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Sovellettu todennäköisyyslaskenta B

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

ABHELSINKI UNIVERSITY OF TECHNOLOGY

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Väliestimointi (jatkoa) Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

Mat Tilastollisen analyysin perusteet, kevät 2007

Harjoitus 7: NCSS - Tilastollinen analyysi

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Testit järjestysasteikollisille muuttujille

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Otoskoko 107 kpl. a) 27 b) 2654

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Sovellettu todennäköisyyslaskenta B

Luento JOHDANTO

HAVAITUT JA ODOTETUT FREKVENSSIT

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Korrelaatiokertoinen määrittely 165

MTTTP1, luento KERTAUSTA

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Teema 8: Parametrien estimointi ja luottamusvälit

dx=5&uilang=fi&lang=fi&lvv=2014

Estimointi. Vilkkumaa / Kuusinen 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Sovellettu todennäköisyyslaskenta B

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

9. laskuharjoituskierros, vko 12-13, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

1. Tilastollinen malli??

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Yleistetyistä lineaarisista malleista

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Transkriptio:

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division

2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11 ja harjoitukset 7-11 Käydään seuraavaksi läpi toisen välikokeen (ja luonnollisesti koko kurssin) kannalta tärkeitä asioita. Jukka Kemppainen Mathematics Division 2 / 10

Luku 7 Piste- ja väliestimointi Estimaatti ja estimaattori: Hyvä estimaattori antaa keskimäärin oikeita arvoja, sillä on pieni varianssi ja havaintojen määrää lisätessä se tarkentuu (harhattomuus, tehokkuus ja tarkentuvuus). Estimaattori on satunnaismuuttuja ja estimaatti sen otoksessa saama arvo. Hyvä estimaattori µ:lle on X ja σ:lle S Odotusarvon µ luottamusväli, kun σ tunnetaan: X µ σ n N(0,1). Odotusarvon µ luottamusväli, kun σ:aa ei tunneta: X µ S t n 1. n Suhteellisen osuuden p luottamusväli: likimain, kun n on suuri. X n p p(1 p) n N(0,1) Jukka Kemppainen Mathematics Division 3 / 10

Esimerkki Esim. Poliisi mittasi 10 auton renkaiden urasyvyyden ja sai tuloksiksi x = 2.8 [mm] ja s = 0.4 [mm]. Määrää renkaiden keskimääräisen urasyvyyden 95% luottamusväli. Jukka Kemppainen Mathematics Division 4 / 10

Luku 8 Hypoteesin testauksesta Hypoteesien H 0 ja H 1 sekä testimuuttujan valinta, riskitaso α, kynnysarvo r 0, yksi- tai kaksisuuntainen testi. Odotusarvon µ Z-testi, kun σ tunnetaan: testimuuttuja X µ σ/ n N(0,1). Odotusarvon T-testi, kun σ:aa ei tunneta: testimuuttuja X µ S/ n t n 1. Suhteellisen osuuden p Z-testi: testimuuttuja X n p N(0,1). p(1 p) n Hajonnan σ χ 2 -testi: testimuuttuja (n 1)S2 σ 2 χ 2 n 1. Jukka Kemppainen Mathematics Division 5 / 10

Odotusarvojen erotuksen Z-testi, kun σ 1 ja σ 2 tunnetaan: testimuuttuja Z = X Y (µ 1 µ 2 ) N(0,1). σ 1 2 + σ2 2 n 1 n 2 Odotusarvojen erotuksen T-testi, kun σ 1 ja σ 2 tuntemattomia: testimuuttuja X Y (µ 1 µ 2 ) T = t 1 n 1 + 1 (n1 1)s1 2+(n n1 2 1)s2 2 +n 2 2. n 2 n 1 +n 2 2 Yhteensopivuuden χ 2 -testi: testimuuttuja k (n i np i ) 2 i=1 np i χ 2 k 1. Jos estimoitavia parametreja on l kappaletta, niin k (n i nˆp i ) 2 i=1 nˆp i χ 2 k l 1. Riippumattomuuden χ 2 -testi: testimuuttuja k l (n ij nˆp iˆq j ) 2 i=1 j=1 nˆp iˆq j χ 2 (k 1)(l 1). Jukka Kemppainen Mathematics Division 6 / 10

Esimerkki Esim. Uuden influenssarokotteen käyttöönottoa varten tehtiin rokotetutkimus, johon osallistui 1000 ihmistä. Koehenkilöille annettiin yksi annos rokotetta, kaksi annosta rokotetta kahden viikon välein tai ei ollenkaan rokotetta. Influenssaan sairastuneita havaittiin seuraavasti Ei rokotetta 1 annos 2 annosta Yhteensä Influenssa 24 9 13 46 Ei influenssaa 289 100 565 954 Yhteensä 313 109 578 1000 Tutki riskitasolla α = 1%, onko rokotteesta ollut hyötyä influenssan ehkäisyssä. Jukka Kemppainen Mathematics Division 7 / 10

Luku 9 Suurimman uskottavuuden (maximum likelihood) menetelmä Estimoitavat parametrit θ 1,...,θ l määrätään riippumattomasta otoksesta (x 1,...,x n ) niin, että L(θ 1,...,θ l ) = n f Xi (x i ;θ 1,...,θ l ) i=1 saavuttaa parametrien suhteen maksiminsa. Usein maksimoidaan L:n sijaan ln L(θ 1,...,θ l ). Maksimi saavutetaan joko parametreja rajoittavan alueen reunalla tai gradientin nollakohdassa. Jukka Kemppainen Mathematics Division 8 / 10

Luku 10 Lineaarinen regressio Korrelaatiokerroin r on lineaarisen riippuvuuden mittari. Laskentakaava löytyy kokeisiin jaettavista kaavoista. Selitysaste on r 2. Regressiosuora on y = ax + b, missä a ja b löydetään pienimmän neliösumman menetelmällä (on annettu kaavoissa). Pisteittäiset residuaalit r i ovat poikkeamia havaittujen y i arvojen ja mallin antamien ennusteiden ŷ i välillä: r i = y i ŷ i. Jukka Kemppainen Mathematics Division 9 / 10

Luku 11 Varianssianalyysi (ANOVA) on odotusarvojen testi usean otoksen k 3 tapauksessa. Testi perustuu otoksien välisen vaihtelun ja otoksien sisäisen vaihtelun vertaamiseen neliösummien ( varianssien) avulla. Testimuuttuja F = SS B/(k 1) SS W /(n k) ANOVA-taulukon laadinta. F(k 1,n k). Testi suoritetaan kuten tilastolliset testit yleensä (ks. Luku 8). Jukka Kemppainen Mathematics Division 10 / 10