031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division
2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11 ja harjoitukset 7-11 Käydään seuraavaksi läpi toisen välikokeen (ja luonnollisesti koko kurssin) kannalta tärkeitä asioita. Jukka Kemppainen Mathematics Division 2 / 10
Luku 7 Piste- ja väliestimointi Estimaatti ja estimaattori: Hyvä estimaattori antaa keskimäärin oikeita arvoja, sillä on pieni varianssi ja havaintojen määrää lisätessä se tarkentuu (harhattomuus, tehokkuus ja tarkentuvuus). Estimaattori on satunnaismuuttuja ja estimaatti sen otoksessa saama arvo. Hyvä estimaattori µ:lle on X ja σ:lle S Odotusarvon µ luottamusväli, kun σ tunnetaan: X µ σ n N(0,1). Odotusarvon µ luottamusväli, kun σ:aa ei tunneta: X µ S t n 1. n Suhteellisen osuuden p luottamusväli: likimain, kun n on suuri. X n p p(1 p) n N(0,1) Jukka Kemppainen Mathematics Division 3 / 10
Esimerkki Esim. Poliisi mittasi 10 auton renkaiden urasyvyyden ja sai tuloksiksi x = 2.8 [mm] ja s = 0.4 [mm]. Määrää renkaiden keskimääräisen urasyvyyden 95% luottamusväli. Jukka Kemppainen Mathematics Division 4 / 10
Luku 8 Hypoteesin testauksesta Hypoteesien H 0 ja H 1 sekä testimuuttujan valinta, riskitaso α, kynnysarvo r 0, yksi- tai kaksisuuntainen testi. Odotusarvon µ Z-testi, kun σ tunnetaan: testimuuttuja X µ σ/ n N(0,1). Odotusarvon T-testi, kun σ:aa ei tunneta: testimuuttuja X µ S/ n t n 1. Suhteellisen osuuden p Z-testi: testimuuttuja X n p N(0,1). p(1 p) n Hajonnan σ χ 2 -testi: testimuuttuja (n 1)S2 σ 2 χ 2 n 1. Jukka Kemppainen Mathematics Division 5 / 10
Odotusarvojen erotuksen Z-testi, kun σ 1 ja σ 2 tunnetaan: testimuuttuja Z = X Y (µ 1 µ 2 ) N(0,1). σ 1 2 + σ2 2 n 1 n 2 Odotusarvojen erotuksen T-testi, kun σ 1 ja σ 2 tuntemattomia: testimuuttuja X Y (µ 1 µ 2 ) T = t 1 n 1 + 1 (n1 1)s1 2+(n n1 2 1)s2 2 +n 2 2. n 2 n 1 +n 2 2 Yhteensopivuuden χ 2 -testi: testimuuttuja k (n i np i ) 2 i=1 np i χ 2 k 1. Jos estimoitavia parametreja on l kappaletta, niin k (n i nˆp i ) 2 i=1 nˆp i χ 2 k l 1. Riippumattomuuden χ 2 -testi: testimuuttuja k l (n ij nˆp iˆq j ) 2 i=1 j=1 nˆp iˆq j χ 2 (k 1)(l 1). Jukka Kemppainen Mathematics Division 6 / 10
Esimerkki Esim. Uuden influenssarokotteen käyttöönottoa varten tehtiin rokotetutkimus, johon osallistui 1000 ihmistä. Koehenkilöille annettiin yksi annos rokotetta, kaksi annosta rokotetta kahden viikon välein tai ei ollenkaan rokotetta. Influenssaan sairastuneita havaittiin seuraavasti Ei rokotetta 1 annos 2 annosta Yhteensä Influenssa 24 9 13 46 Ei influenssaa 289 100 565 954 Yhteensä 313 109 578 1000 Tutki riskitasolla α = 1%, onko rokotteesta ollut hyötyä influenssan ehkäisyssä. Jukka Kemppainen Mathematics Division 7 / 10
Luku 9 Suurimman uskottavuuden (maximum likelihood) menetelmä Estimoitavat parametrit θ 1,...,θ l määrätään riippumattomasta otoksesta (x 1,...,x n ) niin, että L(θ 1,...,θ l ) = n f Xi (x i ;θ 1,...,θ l ) i=1 saavuttaa parametrien suhteen maksiminsa. Usein maksimoidaan L:n sijaan ln L(θ 1,...,θ l ). Maksimi saavutetaan joko parametreja rajoittavan alueen reunalla tai gradientin nollakohdassa. Jukka Kemppainen Mathematics Division 8 / 10
Luku 10 Lineaarinen regressio Korrelaatiokerroin r on lineaarisen riippuvuuden mittari. Laskentakaava löytyy kokeisiin jaettavista kaavoista. Selitysaste on r 2. Regressiosuora on y = ax + b, missä a ja b löydetään pienimmän neliösumman menetelmällä (on annettu kaavoissa). Pisteittäiset residuaalit r i ovat poikkeamia havaittujen y i arvojen ja mallin antamien ennusteiden ŷ i välillä: r i = y i ŷ i. Jukka Kemppainen Mathematics Division 9 / 10
Luku 11 Varianssianalyysi (ANOVA) on odotusarvojen testi usean otoksen k 3 tapauksessa. Testi perustuu otoksien välisen vaihtelun ja otoksien sisäisen vaihtelun vertaamiseen neliösummien ( varianssien) avulla. Testimuuttuja F = SS B/(k 1) SS W /(n k) ANOVA-taulukon laadinta. F(k 1,n k). Testi suoritetaan kuten tilastolliset testit yleensä (ks. Luku 8). Jukka Kemppainen Mathematics Division 10 / 10