TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se omiaisuuksia. Hyöty mallie ja eusteide luomisessa. Määritelmä, tilastot = havaitoaieisto: Tilastot ovat tutkimusta varte systemaattisesti kerättyjä ja muistiikirjattuja havaitoja (tietoa jostaki). Havaitoje esitystapoja ovat mm. keski-, hajota- ja muut tuusluvut (esimerkiksi keskiarvo), lisäksi kuviot eli diagrammit sekä taulukot ja matriisit. Pakit, vakuutusyhtiöt, järjestöt ja toimivat elimet, yksittäiset ihmiset = siä hyödytävät ja käyttävät tilastoja ja todeäköisyyksiä. Saota, joka kuuluu VALHE EMÄVALHE TILASTOT pitää joskus hyvi paikkasa. Mitä se tarkoittaa? Havaitoje keruu ja muokkaus Aluksi: Mietitää järkevä tutkimuskohde (rajaus) ja laaditaa tutkimuskysymykset joko käytäö (pako) saelemaa tai pelkästä mielekiiosta. Sitte: Data eli aieisto keruu (tätäki vaihetta pitää miettiä: mite, milloi, kuika paljo/mite pitkää, millaisia virhemahdollisuuksia je.). Määritelmä, populaatio, tapaus, muuttuja: Valitaa perusjoukko eli populaatio. Perusjoukko sisältää tutkimukse kohteet eli tapaukset, joita saotaa tilastoyksiköiksi. Tutkittavaa (tapauste) omiaisuutta saotaa muuttujaksi. Huom! Vaaraa o sekoittaa tapaukset ja muuttuja eli tapauste joki omiaisuus, jota tutkitaa. Tapaukset mielletää x:siksi eli joki fuktio f muuttujaksi. Nyt siis muuttuja o joki perusjouko tapauste omiaisuus, josta ollaa kiiostueita ja jota tutkitaa. 1
Esim. Populaatio: Tilastoyksikkö: Muuttuja: Havaito: Sievi MAA10-ryhmä opiskelijat opiskelija opiskelija pituus TAI opiskelija sytymäaika TAI kuuteleeko opiskelija opea vai ei, je. muuttuja arvo (ei tarvi olla reaaliluku) Määritelmä, otos: Usei perusjoukko o liia iso, jolloi joudutaa ottamaa otos, joka o sopivalla tavalla otettu, s. edustava, osa perusjoukosta. Sopiva tapa tarkoittaa, että jokaisella tilastoyksiköllä eli tapauksella o yhtä suuri mahdollisuus tulla valituksi otoksee. Populaatio Otos =tilastoyksikkö muuttuja havaito Diskreetti ja jatkuva muuttuja Määritelmä, jakauma: Jakaumalla tarkoitetaa tilastollisessa tutkimuksessa selvitety havaitoaieisto muuttuja eli tutkittava perusjouko tapauste joki omiaisuude arvoja. Millaisia arvot ovat ja mite e ovat jakaatueet. Esim. Sievi lukio MAA10: opiskelijoide sytymäajat: 3.1, 4.1, 26.1, 26.1, 26.1, 28.1, 4.2, 5.2, 5.2,, 30.12 Määritelmä, diskreetti ja jatkuva muuttuja sekä jakauma: Jos muuttuja voi saada vai erillisiä arvoja (esim. kurssiarvosaat: 4, 5, 6, 7, 8, 9 ja 10, mutta ei 7,23 tai 2π 6,28), ii muuttuja o diskreetti (discrete=erillie) ja vastaava jakauma o diskreetti jakauma. Jos muuttuja voi saada joltaki väliltä kaikki, eli mikä tahasa arvo, ii muuttuja o jatkuva (esim. pituus, ikä, kuika kaua jaksaa kuuella ope höpiöitä) ja vastaava jakauma o jatkuva jakauma. 2
Frekvessit ja luokittelu Usei havaitoaieisto kootaa taulukoiksi. SYY: suuri iformaatiotiheys pieessä koossa, tämä o positiivista. Toisaalta, pitää osata lukea taulukoita, tämä o egatiivista (moia huijataa esim. väärillä akselisuhteilla). Määritelmä, frekvessi: Muuttuja eri arvoje esiitymiskertoje lukumäärää saotaa frekvessiksi, merkitää f. Frekvessie yhteelaskettu summa o sama kui perusjouko/otokse tilastoyksiköide eli tapauste lukumäärä. Esimerkki (vihkoo) Sievi lukio MAA10 kurssi opiskelijoide pituudet (2 cm tarkkuudella) 170, 156, 172, 166, 166, 156, 162, 160, 158, 160, 160, 170, 158, 160, 166, 168, yht 16 kpl Taulukoidaa (taulu) Määritelmä, suhteellie frekvessi: Suhteellie frekvessi, joka lähes aia lasketaa ja ilmoitetaa prosetteia, o frekvessi suhde tapauste eli tilastoyksiköide lukumäärää. Merkitää f%. Esim. Edellisessä esimerkissä olevie pituuksie 156, 160 ja 172 suhteelliset frekvessit ovat: 156 cm: 160 cm: 172 cm: 2 16 = 1 8 4 16 = 1 4 1 16 = 0,12,5 eli 12,5% = 0,25 eli 25% = 0,0625 eli 6,25% Määritelmä, summafrekvessit: Summafrekvessi, merkitää sf, ilmoittaa kyseisee muuttuja arvoo saakka kertyeet frekvessit (eli lasketaa yhtee) ja suhteellie summafrekvessi, merkitää sf%, vastaavasti prosettiosuude. Esim. Täydeetää taulukkoa. 3
Jos tutkitaa samalla kertaa useita muuttujia, ii saadaa havaitomatriisi. Tämä o kustaustehokasta. Isoje tilastoaieistoje käsittely suoritetaa tietokoeilla, ohjelmistoia mm. R-ohjelmoiti (ilm.) ja SPSS (maksaa/kokeiluversio ilm). Luokittelu ja luokkakeskukset Jatkuva muuttuja aieisto o syytä luokitella. Luokittelu avulla aieisto (jossa voi siis olla paljo eri muuttuja arvoja) omiaisuudet saadaa selkeämmi esii ja mm. tuuslukuje laskemie helpottuu. Esim. Luokitellaa edellisessä esimerkissä olevat pituudet eljää luokkaa. Luokittelemato aieisto oli: 170, 156, 172, 166, 166, 156, 162, 160, 158, 160, 160, 170, 158, 160, 166, 168 Luokiteltu aieisto o (kuki muuttuja arvo vai yhtee luokkaa): Luokka, cm f Luokkakeskus 155 159 160 164 165 169 4 5 4 170 174 3 Täydeetää taulukkoa. Huom! Luokittelu tasavälei, 4 10 luokkaa. 4
Esim. (jatkuu) Luokkarajat eivät aia ole todellisia johtue mm. pyöristyksistä. Näi olle esimmäise luoka todelliset ala- ja ylärajat ovat 1.luokka 155 157 159 2.luokka 154, 5 159, 5 Luokkakeskus o luoka keskellä oleva luku. Se lasketaa ala- ja yläraja keskiarvoa alaraja + yläraja luokkakeskus = 2 Täydeetää taulukkoa. Luokka, cm f Luokkakeskus 155 159 4 160 164 5 165 169 4 170 174 3 157 162 167 172 TOD.NÄK JA TILASTOT, MAA10 Mitta-asteikot ja tuusluvut Havaitoaieisto muuttujat (eli tutkittavat omiaisuudet) voidaa luokitella eri mitta-asteikkoje mukaa. Asteiko valita kertoo, millä tavoi tiettyä omiaisuutta mitataa. Mitta-asteikot: 1. Luokittelu- eli omiaaliasteikko. Ei suuruus tai paremmuusjärjestystä. Keskiluvuista vai moodi eli tyyppiarvo soveltuu. Esimerkiksi sukupuoli: mies, aie, muut (itersukupuolet) veriryhmä: A, B, AB, 0 2. Järjestys- eli ordiaaliasteikko. Laskutoimitukset eivät ole mielekkäitä, mutta järjestys voidaa ataa. Keskiluvuista moodi ja mediaai soveltuvat. Esimerkiksi sotilasarvot: alokas, jääkäri,, keraali 5
Mitta-asteikot (jatkuu): 3. Välimatka- eli itervalliasteikko. Voidaa laskea tilastoyksiköide eli tapauste välisiä eroja = välimatkoja. Esimerkiksi lämpötila. 4. Suhdeasteikko. Voidaa laskea muuttujie arvoje välisiä suhteita ja verrata iitä. Esimerkiksi pituus ja massa. Piei arvo aia olla! Hekilö A: pituus: 170 cm massa: 78 kg Hekilö B: pituus: 150 cm massa: 62 kg Nyt 170 cm 78 kg 150 cm 62 kg hekilö B: massa o siis suhteessa pituutee pieempi kui hekilö A:. (Oko A lihavampi? ei välttämättä bodari). Eli ei pidä tehdä vääriä johtopäätöksiä! Jotta olisi suhteessa sama massa, ii verrato ataa 170 150 = 78 x x = 78 150 170 68,823 kg Keskiluvut Keskiluvuilla kuvataa havaitoarvoje keskimääräistä suuruutta tai laatua. Keskiluvut: 1. Keskiarvo. Ilmoittaa muuttuja keskimääräise suuruude. O tuetui keskiluku, merkitää x (ei vektorimerkitä), joka yhtälö o x = x 1 + x 2 + x 3 + + x = i=1 x i = 1 x i Keskiarvo voidaa laskea myös frekvessie kautta, s. paiotettua keskiarvoa. Ku o kaikkie havaitoje lukumäärä ja k o eri havaitoje, eli luokkie lukumäärä, ii x = i=1 x i = k i=1 k i=1 f i x i = 1 f ix i, k i=1 6
Keskiluvut (jatkuu): 2. Moodi eli tyyppiarvo. Moodi, lyheetää ja merkitää (Mo), o suurita frekvessiä eli suurita muuttuja arvo esiitymiskerra lukumäärää, vastaava lukuarvo. (Kuika mota kertaa esiityy eite esiityvä muuttuja arvo.) Moodi siis soveltuu kaikille mitta-asteikoille. 3. Mediaai. Mediaai, lyheetää ja merkitää (Md), o järjestyksee asetetu havaitoaieisto keskimmäie arvo (parito määrä) tai kahde keskimmäise arvo keskiarvo (parillie määrä). Mediaai vaatii järjestykse eli se soveltuu muille paitsi luokitteluasteikolle, jossa ei ole järjestystä. Muistisäätö: Ku aieisto järjestyksessä, ii koko havaitoaieistosta o 50% mediaai molemmilla puolilla. Esim. Joki muuttuja havaitoarvot ovat 1, 3, 2, 5, 2, 2, 3, 8, 2, 2, 5, 5, 3, 2, 4, 8, 4, 278, yht 18 kpl. Mo havaitoarvo: 1 2 3 4 5 6 7 8 278 frekvessit: 1 6 3 2 3 0 0 2 1 =18 Keskiarvo: Moodi: Mediaai: x = 1+3+2+ +278 18 = 1 1+6 2+3 3+ +1 278 18 Mo = 2, koska kakkoe esiityy 6 kertaa. Laitetaa esi havaitoarvot järjestyksee! 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 8, 8, 278 = 18,83. 9kpl eli 50% 9kpl eli 50% Nyt mediaai o kahde keskimmäise luvu keskiarvo, eli Md = 3 + 3 /2 = 3. 7
Keskiluvut (jatkuu): 1. Paiotettu keskiarvo. Lukuje x 1 + x 2 + + x paiotettu keskiarvo, ku paioia ovat luvut p 1 + p 2 + + p (> 0), o p 1 x 1 + p 2 x 2 + + p x p 1 + p 2 + + p Esim. Eräässä matematiika kokeessa arvosaoje jakauma oli seuraava: 4 5 6 7 8 9 10 1,3 % 9,8 % 15,8 % 20,3 % 23,3 % 23,4 % 6,1 % Laske arvosaoje keskiarvo. Ratkaisu Nyt prosetit ovat s. paioja, jotka summautuvat ykköseksi, saadaa x = 0,013 4 + 0,098 5 + + 0,061 10 1 = 7,491 7,5. 8