6. Kombiaatio-oppi, todeäköisyys ja tilastot 6.1 Satuaisotata takaisipaolla Poimimme 3 alkiota takaisipaolla 1 alkio perusjoukosta. Kuika mota erilaista kolme alkio osajoukkoa voimme saada? Ratkaisu. Vastaus: 178 osajoukkoa. Kuika suurella todeäköisyydellä saamme eljä arpakuutio heitossa kaikkii sama silmäluvu? Ratkaisu. Todeäköisyys o,77 %. 91 Sivu
6. Palauttamato satuaisotata (järjestetty osajoukko) Otata ilma takaisipaoa Pr! ( r)! Poimimme r alkiota alkio perusjoukosta palauttamatta. Järjestyksellä o tässä merkitystä.. Laske, kuika mota eri mahdollisuutta meillä o ottaa 5 korttia 13 korti joukosta, ku otetaa huomioo se järjestys, jossa otamme ämä 5 korttia. Selaa virtuaaliäppäimistö välilehtiä ja valitse Advace. Valitse Pr ja syötä 13,5 Vastaus: Erilaisia 5 korti järjestettyje osajoukkoje määrä o 154 44. Tarkistus: Kertoma symboli löytyy Pr-symboli vasemmalta puolelta. 9 Sivu
6.3 Palauttamato satuaisotata (järjestämätö osajoukko) Satuaisotata palauttamatta. Cr! r!( r)! Poimimme r alkiota alkio perusjoukosta palauttamatta. Järjestyksellä ei ole tässä merkitystä.. Laske motako eri mahdollisuutta siulla o ottaa 5 korttia 13 korti joukosta, ku emme ota huomioo järjestystä, jossa otamme uo 5 korttia. Advace, Cr. Tarkistus: Vastaus: Erilaiste 5 korti järjestämättömie osajoukkoje määrä o 187. 6.4 Biomitodeäköisyys Tarkastelkaamme kokeilua, joka toistuu kertaa. Jokaisella kokeilulla o vai kaksi mahdollista lopputulosta: oistumie tai epäoistumie. Oistumise mahdollisuus o täte sama jokaisessa yrityksessä. Yrityste oistumie ei riipu toisista yrityksistä. Tätä kutsutaa toistokokeeksi ja satuaismuuttuja oudattaa biomijakaumaa. Biomitodeäköisyys Riippumattomie toistoje määrä o. p o todeäköisyys oistumiselle. Oistueide toistoje määrä o k. Heitämme tavallista arpakuutiota 5 kertaa. Kuika suurella todeäköisyydellä saamme kaksi kuutosta? Todeäköisyys yhde kuutose saamisee o 1. Tämä tarkoittaa sitä, että 6 todeäköisyys sille, ettemme saa kuutosta, o 5 6. 93 Sivu
Ratkaisu. Tai Catalog, biomialpdf. Tai vielä vaihtoehtoisesti äi. Todeäköisyys kahde kuutose saamisee o,16. Heitämme arpakuutiota 5 kertaa. Kuika suurella todeäköisyydellä saamme vähitää kaksi kuutosta? Ratkaisu. Vaihtoehtoisesti äi Tai yhteelaskusääöllä. 1 BiomialCD(1,5, ) ataa todeäköisyyde sille, että saamme tai 1 kuutosta 5 heitolla. 6 1 Todeäköisyys kahde kuutose saamisee o site 1 BiomialCD(1,5, ) 6. 94 Sivu
Heitämme tavallista arpakuutiota 7 kertaa. Kuika suurella todeäköisyydellä saamme 1-14 kuutosta? Meidä o siis määriteltävä P(1 X 14), jossa X o kuutoste määrä. Voimme myös esim. Catalog-valiko seq-kometoa pistetodeäköisyyksie laskemiseksi. Valitse päävalikosta Statistics. Valitse Calc. Valitse Oe-Variable. 95 Sivu
Pistetodeäköisyyksie summa o toisea tilastolaskuissa. Voit vaihtoehtoisesti käyttää myös summafuktiota. Todeäköisyys o P(1 X 14),57. 6.5 Biomijakauma Heitämme kolikkoa 5 kertaa. Olkoo X saatuje kruuie määrä. Satuaismuuttuja X oudattaa biomijakaumaa, sillä toistot ovat toisistaa riippumattomia. Oistumise todeäköisyys o tasa p,5. Saamme heitettäessä joko kruua tai klaava. Tee ja piirrä todeäköisyysjakauma yllä maiittuu kokeesee. Syötä tulokset luetteloo list1. Syötä todeäköisyys saada klaava - 5 kertaa luetteloo list. 96 Sivu
5 5 x 5 x 5 Huomaamme, että P( X x),5,5,5, jolloi list o helpompi laatia. x x Valitse päävalikosta Statistics. Valitse SetGraph. Asetukset. Piirrä kuvaaja. 97 Sivu
6.6 Hypergeometrie jakauma (palauttamato otata) Hypergeometrie jakauma, jota satuaismuuttuja X oudattaa. P ( X x) M x N N M x N o perusjouko alkioide lkm, M määräty osajouko alkioide lkm, o ottoje kokoaislukumäärä. Meillä o 1 valkoista ja 8 puaista kuulaa laatikossa ja me otamme satuaisesti laatikosta 5 kuulaa. Kuika suurella todeäköisyydellä saamme valkoista ja 3 puaista kuulaa? Kaava sovellettua. hypergeopdf ataa. Miksi vastaus o sama? Vaihtoehtoisesti voi käyttää hypergeopd-kometoa. 98 Sivu
Meillä o 1 valkoista ja 8 puaista kuulaa laatikossa ja me otamme satuaisesti laatikosta 5 kuulaa. Kuika suurella todeäköisyydellä saamme vähitää 3 puaista kuulaa? 5 1 C(5 x)8cx Joko äi: x 3 18C5 tai: hypergeopdf(3,5,8,18)+hypergeopdf(4,5,8,18)+hypergeopdf(5,5,8,18) taikka yksikertaisimmi: hypergeocdf 6.7 Normaalijakauma Tyypillie esimerkki ormaalijakaumasta löytyy asevelvolliste pituudesta. Asevelvolliste keskiarvo o 18cm ja keskihajota 7cm. Kuika suuri osa asevelvollisista o lyhyempiä kui 19 cm? Ratkaisu kometoje avulla. Tai Statistics, Calc, Distributio, Normal CD. Noi 9,3 % asevelvollisista o lyhyempiä kui 19 cm. 99 Sivu
Kuika suuri osa asevelvollisista ovat pitempiä kui 17 cm? Ku olemme NormCDf-toimio avulla laskeeet kuika mota asevelvollista o lyhyempiä kui 17 cm, voimme ottaa selvää siitä, kuika suuri osa asevelvollisista o pitempiä kui 17 cm seuraavasti 1 PX ( 17). Ratkaisu. Tai Statistics, Calc, Distributio, Normal CD Huomaamme, että o yhtä mota yli 17 cm: pituista asevelvollista kui o alle 19 cm pituisia. Miksi? Kuika suuri osa asevelvollisista asettuu välii [, ], eli keskihajoa sisää keskiarvo 18 cm molemmi puoli? Ratkaisu. Tai Statistics, Calc, Distributio, Normal CD 1 Sivu
Huomaamme, että. 68,3 % asevelvollisista sijoittuu keskihajoa sisää keskiarvo molemmi puoli. Tämä tarkoittaa sitä, että 68,3 % asevelvollisista sijoittuu välille 173 cm - 187 cm. Vaihtoehtoisesti äi: Voimme myös todeäköisyyde laskemisee keskihajoa fuktiota f, joka saadaa ( x x) 1 lausekkeesta f( x ) e. Katsotaapa, kuika voimme laskea todeäköisyyde sille, että satuaisesti valitu asevelvollise pituus o keskiarvosta symmetrisesti yhde hajota-askelee sisällä. Ratkaisu. Graafie ratkaisu Syötä ormaalijakauma fuktio f, joka saadaa lausekkeesta Itegroi ormaalijakauma fuktio 173-187. 1 f( x ) e ( x x) Näi voimme todistaa, että. 68,3% asevelvollisista osuu keskihajoa sisää keskiarvo molemmi puoli. 11 Sivu
Tässä vielä pikaohje Statistics (tai SpreadSheet) sovellukse käyttämisee hajotalaskuissa. Valitse Statistics-valikosta Calc. Distributio ja Normal CD. Syötä arvot. Kuvaaja piirtämie oistuu piirtokuvaketta koskemalla. Resize suuretaa aktiivise ikkua. Näi voimme todistaa, että. 68,3 % asevelvollisista osuu keskihajoa sisää keskiarvo molemmi puoli. Trace toimito kuvaaja yhteydessä äyttää tiheysfuktiolla oleva pistee koordiaatit ja fuktio lausekkee. 1 Sivu
6.8 Murtoviiva Alla oleva taulukko osoittaa öljytuotao määrää eräässä OPEC-maassa vuosie 199 ja 5 välillä. Tuotato o aettu 1 toeia. Vuosiluku 1995 1996 1997 1998 1999 1 3 4 5 1341 1176 155 13 1436 16 163 161 18 175 173 Esitä öljytuotao kehitys tää aikaa murtoviiva avulla. Syötämme vuosiluvut vuodesta 1995 vuotee 5 luetteloo list1 seq-valia avulla. Ku siirrymme Statistics-tilaa, äemme vuosiluvut list1-luettelossa. Tuotatoluvut syötetää luetteloo list. SetGraph, Settig. 13 Sivu
6.9 Tilastollise aieisto luokittelu Miä vuoa öljytuotato o ollut vähäisitä ja miä vuoa tuotato oli suurita? Näi rajoitetusta aieistosta o mahdollista löytää ämä vuodet ilma laskita. Mutta jos aieistoa olisi paljo eemmä, olisi tämä meetelmä suureksi avuksi. Paia oikeaa uolipaiiketta. list o Base List, joka mukaa luokittelu tehdää. List1 vai seuraa mukaa. Vuosilukua ja tuotatoa ei tule erottaa toisistaa aieistoa luokiteltaessa vaa pitää tiedot yhdessä. Öljytuotato oli pieitä vuoa 1997 ja suurita vuoa 3. 14 Sivu
6.1 Keskiarvo, mediaai, kvartiilit, tyyppiarvo ja vaihteluväli Keskiarvo. Kaikkie arvoje summa jaetaa arvoje lukumäärällä. x x x 1 1 h x 1 x x3 h x... h x 3 3 x... h p x p tässä x1, x Ku arvo x i esiityy havaioissa. h i kertaa Frekvessijakaumie keskiarvo x m 1 f 1 m f... m k f k k lukuväliä, joide keskipisteet m1, m,... m k ja vastaavat frekvessit f1, f,... f k Mediaai Tyyppiarvo Vaihteluväli Keskimmäie arvo, ku aieisto lajitellaa kasvavaa järjestyksee. Se aieisto arvo, joka esiityy useimmi. Vaihteluväli= suuri arvo piei arvo Huomaa! Jos havaitoje lukumäärä o parillie luku, mediaai muodostavat kaksi keskimmäistä arvoa tai iide keskiarvo. Toie imitys o moodi. Yläkvartiili Korkeimmat 5 % kerätyistä arvoista. Alakvartiili Pieimmät 5 % kerätyistä arvoista. Kvartiiliväli Kvartiiliväli= yläkvartiili alakvartiili Kvartiilivälii eivät vaikuta suurimmat tai pieimmät 5 % kerätyistä arvoista. Kvartiilivälillä o tämä takia hyvä hajota, silloiki ku materiaali arvot ovat jakautueet epätasaisesti. Kvartiilipoikkeama Kvartiilipoikkeama = Kvartiiliväli / Eräässä kaupugissa tehtii liiketee melumittauksia. Tässä yhteydessä kerättii seuraava data (db) : 5, 54,4 54,8 55,1 55,9 56,1 56,1 57, 57,6 58,1 58, 59,4 59,4 59,9 6,6 6,7 61,1 61,3 6,1 6,3 63, 63,4 63,7 63,9 63,9 64,5 64,8 65,1 65,9 66,5 66,7 67,1 68,9 69,1 7,4 7,8 Laske keskiarvo, mediaai, ylä- ja alakvartiili, tyyppiarvo ja vaihteluväli. 15 Sivu
Syötä mittaustulokset luetteloo list1. Valitse Calc, Oe-Variable. Paia alas-uolipaiiketta. Tässä äemme, että keskiarvo o 61,7 db ja mediaai 61,7 db. Alakvartiili o 57,85 db ja yläkvartiili 64,95 db. Tyyppiarvot ovat 56,1 db, 59,4 db ja 63,9 db. Näitä kolmea arvoa esiityy eite aieistossa. Vaihteluväli o aieisto suurimma ja pieimmä arvo välie alue. maxx mix 7,8 5,8 dvs.,8 db 16 Sivu
Oppilaat saivat matematiika kokeessa tietyllä luokalla seuraavat umerot: 4 3 4 5 6 6 1 4 4 3 6 4 3 3 5 3 3 4 5 1 Laske keskiarvo, mediaai ja vaihteluväli. Syötä koeumerot luetteloo list1 Statistics-tilassa. Selvitetää tässä tehtävässä vaihteeksi keskiarvo, mediaai ja vaihteluväli Mai -sovelluksessa. Tämä ero ataa vaihteluväli. 17 Sivu
6.11 Variassi ja keskihajota Variassi ( x x) ( x x)... ( x x) s x o keskiarvo 1 Satuaismuuttuja hajoa mitta. Keskihajota s ( x x) ( x x)... ( x x) 1 Variassi eliöjuuri. Keskihajota kuvaa sitä, mite suurta vaihtelua käsittelemässämme tilastollisessa materiaalissa esiityy. Voimme kutsua tätä mitattavaa muuttujaa imellä X, sillä keskihajoasta käytetää usei imityksiä x, SD(x) tai s x. Olettakaamme, että meillä o joukko mittauksia arvolle X. Näihi voidaa viitata seuraavasti: x 1, x,..., x. Laskeaksemme keskihajoa o esi laskettava keskiarvo x tai x. Kaava, jolla keskihajota lasketaa, o seuraava: SDx ( ) i 1 ( x x) ( xi x) i 1 Keskihajota o eliöjuuri variassista, joka saadaa seuraavasta: VARx ( ) Keskihajoa kaavassa jakajaa o. Joskus jaetaa poikkeamie eliöide summa tekijällä - 1. Ku poikkeamie eliöide summa jaetaa :llä, tuloksea o perusjouko keskihajota. Otoskeskihajota saadaa jakamalla tekijällä 1. Jos otos o suuri, eli o suuri, sillä ei ole merkitystä jaetaako :llä vai tekijällä 1. Laski tekee ero perusjouko keskihajoa ja otokse keskihajoa välillä. Perusjouko keskihajota o x, ja otokse keskihajota x 1. Voimme tehdä esi laskelmia käsi. i Huajatuotato Eräällä huajatuottajalla o 53 mehiläispesää. Tehdäksee taulukoii käytäölliseksi mehiläisfarmari o luokitellut materiaali. Käsittelemme täte luokiteltua materiaalia. Alla oleva taulukko äyttää mm. huajatuotao kilogrammoissa mehiläispesää kohti yhde tuotatokaude aikaa. Vaikka taulukosta ei ole mahdollista löytää tarkkaa keskipaioa, voimme arvioida likimääräise keskiarvo luokkie luokkakeskuste mukaa. Luokkakeskus saadaa aikaväli todellise alaraja ja todellise yläraja keskiarvoa. 18 Sivu
Saamme seuraava tauluko: Paio [kg] Frekvessi f Luokkakeskus x m Luokkasumma f x m Poikkeamie eliöt kerrottuia frekvesseillä f ( x x ) [1,> 15 15 5 6615 [,3> 7 5 175 847 [3,4> 1 35 35 1 [4,5> 8 45 36 648 [5,6> 7 55 385 57 [6,7> 4 65 6 3364 [7,1> 85 17 48 Summa 53 195 18813 Jotta voisimme täyttää arvot viimeisee palstaa o laskettava keskiarvo. Keskiarvo saadaa f x 195 lausekkeesta x m 36, ja o siis oi 36 kg. 53 m Keskihajota: x i 1 ( x x) i = 18813 18,84, eli 18,84 kg. 53 Mite voimme käyttää laskita apua ratkaistaessa tätä tehtävää? Voimme tietysti syöttää laskimee paioluokat ja frekvessit ja ataa tämä jälkee laskime käsitellä aikaa vievät laskutoimitukset. Mite sitte laski löytää luokkakeskukse arvo? Asetamme alimma raja luokille luetteloo list1 ja ylimmä raja luetteloo list. Frekvessit syötetää luetteloo list3. Sitte syötetää kaava list1+list luetteloo list4. Tämä tarkoittaa sitä, että list4 sisältää luokkie luokkakeskukset 19 Sivu
Calc, Oe-Variable. Tulos Laskelmie mukaa keskiarvo o x 36,3 ja että keskihajota o x 18,84. 6.1 Odotusarvo, variassi ja keskihajota satuaismuuttujalle X Odotusarvo: E( X) x P( X x ) Variassi: Keskihajota: VAR (X ) VARX ( ) ( x EX ( )) PX ( x ) Biomijakaumassa E( X ) p ja VAR( X) p(1 p ) Laskusääöt odotusarvolle ja variassille: E( a bx) a b E( X ) EX ( Y) EX ( ) EY ( ) VAR( a bx ) b VAR( X ) Jos X ja Y ovat toisistaa riippumattomia, seuraava pätee: VAR( X Y) VAR( X ) VAR( Y ) Taulukko osoittaa X: todeäköisyysjakauma. x 3 4 5 6 7 8 1 1 3 4 1 3 1 1 P(X=x) 16 16 8 16 16 4 16 8 16 Laske EX ( ) ja VAR( X ). 11 Sivu
Taulukot list1 ja list. Laskutoimitukset luetteloilla. Luetteloide list1 ja list tulos o luettelossa list3. Näemme, että sum(list3) ataa odotusarvo EX ( ). Variassi VAR( X ),5. Säästämme paljo aikaa käyttäessämme luetteloita tällä tavalla. 111 Sivu
6.13 Luottamusväli Luottamus tekijälle k % välillä z ja z: P( z Z z) k % 95 %: luottamusvälillä o z 1,96. Tämä selviää tutkimalla P( Z z ),975 keskihajotataulukossa. Luottamus- tai varmuusväli luottamusväli Luottamusväli tekijälle p X z, X z p(1 p) p(1 p) p z, p z Tämä pätee, ku p 5 ja (1 p ) 5 Todeäköisyys p % sille, että odotusarvo osuu tälle alueelle. p lasketaa lausekkeesta p X Mittaustulos oudattaa ormaalijakaumaa odotusarvolla 4 keskihajoalla 6. Määritä 8 % luottamusväli arvolle, ku otoskoko o yksi. Valitse päävalikosta Statistics. Calc. Iterval. Tee ämä valiat. Paia Next. 11 Sivu
Syötä arvot. Huomaa, että 8 % =,8. Tulos Luottamusväli o 16,3-31,7. Mitä tapahtuu väli ylä- ja alarajalle, jos C-taso ostetaa 95 %:ii? Kokeile itse. Tutki myös mitä tapahtuu luottamusvälille, jos otoskoko kasvaa. Mikä tulee otoskoo olla, jotta otaa keskiarvo 4 olisi 95% todeäköisyydellä välillä [3,5]? Voimme kokeilla tätä erilaisilla : arvoilla. Ku 138 saamme seuraava väli. Tämä o hyvi lähellä haluttua väliä [3,5]. 113 Sivu
6.14 Hypoteesi testaus Hypoteesi testaus Tutkii, oko todeäköisyydellä p biomijakaumassa tai odotusarvolla ormaalijakaumassa o joki tietty arvo. Biomijakauma Normaalijakauma Vasemmapuoleie testi Oikeapuoleie testi Kaksitahoie testi Nollahypoteesi H: p p Vastahypoteesi H: p p Laske tästä H P-arvo: P( X x ) Nollahypoteesi H: p p Vastahypoteesi H: p p Laske tästä H P-arvo: P( X x ) Nollahypoteesi H: p p Vastahypoteesi H: p p Laske tästä H P-arvo: P( X x ) tai P( X x ) Nollahypoteesi H : Vastahypoteesi H : Laske tästä H P-arvo: P( X x ) Nollahypoteesi H : Vastahypoteesi H : Laske tästä H P-arvo: P( X x ) Nollahypoteesi H : Vastahypoteesi H : Laske tästä H P-arvo: P( X x ) tai P( X x ) Tiety aiee määrä tabletissa tulisi olla 6 mg ja tämä keskihajoa 4 mg. Viidetoista tableti pistokoe osoittaa iide sisältävä tätä aietta keskimääri 4 mg. Oko tämä liia vähä, jos merkitsevyystasoksi o asetettu 1 %? Valitse päävalikosta Statistics. Calc. Test. Tee ämä valiat. Paia Next. 114 Sivu
Syötä tiedot. Next. Tulos Nollahypoteesi: Keskiarvo o kute yllä esitettii 6 mg. Vaihtoehtoie hypoteesi: Keskiarvo 6 mg. Ylimmällä rivillä olemme valieet. Voimme ähdä z-arvo. 1,748. Todeäköisyys löytää 15 äyttee otaassa iiki matala aiee määrä kui 4 mg o vai 4 %, mikäli ollahypoteesi pitää paikkasa. Hylkäämme ollahypoteesi, sillä aiemäärä arvo o liia alhaie 1% merkitsevyystasolla. Vaihdamme hypoteesia ja asetamme keskiarvoksi 46 mg. Koska todeäköisyys p,876 o edellee alle 1%, hylkäämme hypoteesi. 115 Sivu
Vaihdamme keskiarvoksi 47 mg. Tulos Koska p,141 toteuttaa 1% merkitsevyystaso, hyväksymme hypoteesi. 116 Sivu