TILASTOT: johdantoa ja käsitteitä

Samankaltaiset tiedostot
Tunnuslukuja 27 III TUNNUSLUKUJA

Tilastollinen todennäköisyys

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

3.2 Sijaintiluvut. MAB5: Tunnusluvut

Otantajakauman käyttö päättelyssä

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Mat Tilastollisen analyysin perusteet, kevät 2007

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Tilastotieteen perusteet

Tilastotieteen perusteet

Tilastotieteen johdantokurssi

Vastaus: Kertymäfunktio on F( x) = x, kun 0 x 20. Todennäköisyydet ovat molemmat 1. Frekvenssi f

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Mat Sovellettu todennäköisyyslasku A

Osa 2: Otokset, otosjakaumat ja estimointi

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Til.yks. x y z

Aritmeettinen jono

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

****************************************************************** ****************************************************************** 7 Esim.

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

Epäyhtälöoppia matematiikkaolympialaisten tehtäviin

Tilastolliset menetelmät: Tilastolliset testit

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

KERTAUSHARJOITUKSIA. Tilastojen esittäminen a) vuotiaita tyttöjä Koko väestö Näiden tyttöjen osuus

2.5. Eksponenttifunktio ja eksponenttiyhtälöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

pisteet Frekvenssi frekvenssi Yhteensä

2. Mittaus ja data 2.1. Johdanto Mittaustyypit

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua)

Stokastiikan perusteet Harjoitukset 1 (Todennäköisyysavaruus, -mitta ja -funktio)

811312A Tietorakenteet ja algoritmit, , Harjoitus 4, Ratkaisu

Solmu 3/ toteutuu kaikilla u,v I ja λ ]0,1[. Se on aidosti konveksi, jos. f ( λu+(1 λ)v ) < λf(u)+(1 λ)f(v) (2)

MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai

Osa 2: Otokset, otosjakaumat ja estimointi

8. laskuharjoituskierros, vko 11, ratkaisut

n = 100 x = %:n luottamusväli µ:lle Vastaus:

Tilastolliset toiminnot

1 Eksponenttifunktion määritelmä

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.

4.3 Signaalin autokorrelaatio

Todennäköisyyslaskenta I. Heikki Ruskeepää

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Analyysi A. Harjoitustehtäviä lukuun 1 / kevät 2018

3 Mittaamisen taso ja tilaston keskiluvut

Matematiikan tukikurssi

Til.yks. x y z

Sormenjälkimenetelmät

Kvantitatiiviset menetelmät

Luento 7 Luotettavuus Koherentit järjestelmät

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

4.7 Todennäköisyysjakaumia

Tehtävä 1. Voidaanko seuraavat luvut esittää kahden neliön summina? Jos voidaan, niin kuinka monella eri tavalla? (i) n = 145 (ii) n = 770.

2 avulla. Derivaatta on nolla, kun. g( 3) = ( 3) 2 ( 3) 5 ( 3) + 6 ( 3) = 72 > 0. x =

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Parametrien oppiminen

Tilastolliset menetelmät: Johdanto

6. Kombinaatio-oppi, todennäköisyys ja tilastot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Kvantitatiiviset menetelmät

Tehtäviä neliöiden ei-negatiivisuudesta

Kandidaatintutkielman aineistonhankinta ja analyysi

Markov-ketjun hetkittäinen käyttäytyminen

9.7 Matriisinormit. Vaasan yliopiston julkaisuja 225. Ei siis lainkaan ongelmia defektiivisyydestä.

Todennäköisyyslaskenta sivuaineopiskelijoille. Heikki Ruskeepää

5. Keskiluvut. luokan väliin, ei sen määrääminen tuota vaikeuksia. Näin on seuraavissa esimerkeissä:

Luento 6 Luotettavuus Koherentit järjestelmät

Luentotesti 3. Kun tutkimuksen kävelynopeustietoja analysoidaan, onko näiden tutkittavien aiheuttama kato

Tilastolliset menetelmät: Johdanto

Ehdollinen todennäköisyys

Insinöörimatematiikka IA

Matin alkuvuoden budjetti

3 Lukujonot matemaattisena mallina

j = I A = 108 A m 2. (1) u kg m m 3, (2) v =

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Matematiikan tukikurssi

TILASTO- JA TALOUSMATEMATIIKKA s. 1

Kvantitatiiviset menetelmät

Harjoitustehtävien ratkaisuja

Tarkastellaan ympyräsylinterin käyttäytymistä eri muotoisilla tukipinnoilla. Oletetaan sylinterin vierintävastus merkityksettömäksi.

Ryhmän osajoukon generoima aliryhmä ja vapaat ryhmät

Äärettämän sarjan (tai vain sarjan) sanotaan suppenevan eli konvergoivan, jos raja-arvo lims

Transkriptio:

TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se omiaisuuksia. Hyöty mallie ja eusteide luomisessa. Määritelmä, tilastot = havaitoaieisto: Tilastot ovat tutkimusta varte systemaattisesti kerättyjä ja muistiikirjattuja havaitoja (tietoa jostaki). Havaitoje esitystapoja ovat mm. keski-, hajota- ja muut tuusluvut (esimerkiksi keskiarvo), lisäksi kuviot eli diagrammit sekä taulukot ja matriisit. Pakit, vakuutusyhtiöt, järjestöt ja toimivat elimet, yksittäiset ihmiset = siä hyödytävät ja käyttävät tilastoja ja todeäköisyyksiä. Saota, joka kuuluu VALHE EMÄVALHE TILASTOT pitää joskus hyvi paikkasa. Mitä se tarkoittaa? Havaitoje keruu ja muokkaus Aluksi: Mietitää järkevä tutkimuskohde (rajaus) ja laaditaa tutkimuskysymykset joko käytäö (pako) saelemaa tai pelkästä mielekiiosta. Sitte: Data eli aieisto keruu (tätäki vaihetta pitää miettiä: mite, milloi, kuika paljo/mite pitkää, millaisia virhemahdollisuuksia je.). Määritelmä, populaatio, tapaus, muuttuja: Valitaa perusjoukko eli populaatio. Perusjoukko sisältää tutkimukse kohteet eli tapaukset, joita saotaa tilastoyksiköiksi. Tutkittavaa (tapauste) omiaisuutta saotaa muuttujaksi. Huom! Vaaraa o sekoittaa tapaukset ja muuttuja eli tapauste joki omiaisuus, jota tutkitaa. Tapaukset mielletää x:siksi eli joki fuktio f muuttujaksi. Nyt siis muuttuja o joki perusjouko tapauste omiaisuus, josta ollaa kiiostueita ja jota tutkitaa. 1

Esim. Populaatio: Tilastoyksikkö: Muuttuja: Havaito: Sievi MAA10-ryhmä opiskelijat opiskelija opiskelija pituus TAI opiskelija sytymäaika TAI kuuteleeko opiskelija opea vai ei, je. muuttuja arvo (ei tarvi olla reaaliluku) Määritelmä, otos: Usei perusjoukko o liia iso, jolloi joudutaa ottamaa otos, joka o sopivalla tavalla otettu, s. edustava, osa perusjoukosta. Sopiva tapa tarkoittaa, että jokaisella tilastoyksiköllä eli tapauksella o yhtä suuri mahdollisuus tulla valituksi otoksee. Populaatio Otos =tilastoyksikkö muuttuja havaito Diskreetti ja jatkuva muuttuja Määritelmä, jakauma: Jakaumalla tarkoitetaa tilastollisessa tutkimuksessa selvitety havaitoaieisto muuttuja eli tutkittava perusjouko tapauste joki omiaisuude arvoja. Millaisia arvot ovat ja mite e ovat jakaatueet. Esim. Sievi lukio MAA10: opiskelijoide sytymäajat: 3.1, 4.1, 26.1, 26.1, 26.1, 28.1, 4.2, 5.2, 5.2,, 30.12 Määritelmä, diskreetti ja jatkuva muuttuja sekä jakauma: Jos muuttuja voi saada vai erillisiä arvoja (esim. kurssiarvosaat: 4, 5, 6, 7, 8, 9 ja 10, mutta ei 7,23 tai 2π 6,28), ii muuttuja o diskreetti (discrete=erillie) ja vastaava jakauma o diskreetti jakauma. Jos muuttuja voi saada joltaki väliltä kaikki, eli mikä tahasa arvo, ii muuttuja o jatkuva (esim. pituus, ikä, kuika kaua jaksaa kuuella ope höpiöitä) ja vastaava jakauma o jatkuva jakauma. 2

Frekvessit ja luokittelu Usei havaitoaieisto kootaa taulukoiksi. SYY: suuri iformaatiotiheys pieessä koossa, tämä o positiivista. Toisaalta, pitää osata lukea taulukoita, tämä o egatiivista (moia huijataa esim. väärillä akselisuhteilla). Määritelmä, frekvessi: Muuttuja eri arvoje esiitymiskertoje lukumäärää saotaa frekvessiksi, merkitää f. Frekvessie yhteelaskettu summa o sama kui perusjouko/otokse tilastoyksiköide eli tapauste lukumäärä. Esimerkki (vihkoo) Sievi lukio MAA10 kurssi opiskelijoide pituudet (2 cm tarkkuudella) 170, 156, 172, 166, 166, 156, 162, 160, 158, 160, 160, 170, 158, 160, 166, 168, yht 16 kpl Taulukoidaa (taulu) Määritelmä, suhteellie frekvessi: Suhteellie frekvessi, joka lähes aia lasketaa ja ilmoitetaa prosetteia, o frekvessi suhde tapauste eli tilastoyksiköide lukumäärää. Merkitää f%. Esim. Edellisessä esimerkissä olevie pituuksie 156, 160 ja 172 suhteelliset frekvessit ovat: 156 cm: 160 cm: 172 cm: 2 16 = 1 8 4 16 = 1 4 1 16 = 0,12,5 eli 12,5% = 0,25 eli 25% = 0,0625 eli 6,25% Määritelmä, summafrekvessit: Summafrekvessi, merkitää sf, ilmoittaa kyseisee muuttuja arvoo saakka kertyeet frekvessit (eli lasketaa yhtee) ja suhteellie summafrekvessi, merkitää sf%, vastaavasti prosettiosuude. Esim. Täydeetää taulukkoa. 3

Jos tutkitaa samalla kertaa useita muuttujia, ii saadaa havaitomatriisi. Tämä o kustaustehokasta. Isoje tilastoaieistoje käsittely suoritetaa tietokoeilla, ohjelmistoia mm. R-ohjelmoiti (ilm.) ja SPSS (maksaa/kokeiluversio ilm). Luokittelu ja luokkakeskukset Jatkuva muuttuja aieisto o syytä luokitella. Luokittelu avulla aieisto (jossa voi siis olla paljo eri muuttuja arvoja) omiaisuudet saadaa selkeämmi esii ja mm. tuuslukuje laskemie helpottuu. Esim. Luokitellaa edellisessä esimerkissä olevat pituudet eljää luokkaa. Luokittelemato aieisto oli: 170, 156, 172, 166, 166, 156, 162, 160, 158, 160, 160, 170, 158, 160, 166, 168 Luokiteltu aieisto o (kuki muuttuja arvo vai yhtee luokkaa): Luokka, cm f Luokkakeskus 155 159 160 164 165 169 4 5 4 170 174 3 Täydeetää taulukkoa. Huom! Luokittelu tasavälei, 4 10 luokkaa. 4

Esim. (jatkuu) Luokkarajat eivät aia ole todellisia johtue mm. pyöristyksistä. Näi olle esimmäise luoka todelliset ala- ja ylärajat ovat 1.luokka 155 157 159 2.luokka 154, 5 159, 5 Luokkakeskus o luoka keskellä oleva luku. Se lasketaa ala- ja yläraja keskiarvoa alaraja + yläraja luokkakeskus = 2 Täydeetää taulukkoa. Luokka, cm f Luokkakeskus 155 159 4 160 164 5 165 169 4 170 174 3 157 162 167 172 TOD.NÄK JA TILASTOT, MAA10 Mitta-asteikot ja tuusluvut Havaitoaieisto muuttujat (eli tutkittavat omiaisuudet) voidaa luokitella eri mitta-asteikkoje mukaa. Asteiko valita kertoo, millä tavoi tiettyä omiaisuutta mitataa. Mitta-asteikot: 1. Luokittelu- eli omiaaliasteikko. Ei suuruus tai paremmuusjärjestystä. Keskiluvuista vai moodi eli tyyppiarvo soveltuu. Esimerkiksi sukupuoli: mies, aie, muut (itersukupuolet) veriryhmä: A, B, AB, 0 2. Järjestys- eli ordiaaliasteikko. Laskutoimitukset eivät ole mielekkäitä, mutta järjestys voidaa ataa. Keskiluvuista moodi ja mediaai soveltuvat. Esimerkiksi sotilasarvot: alokas, jääkäri,, keraali 5

Mitta-asteikot (jatkuu): 3. Välimatka- eli itervalliasteikko. Voidaa laskea tilastoyksiköide eli tapauste välisiä eroja = välimatkoja. Esimerkiksi lämpötila. 4. Suhdeasteikko. Voidaa laskea muuttujie arvoje välisiä suhteita ja verrata iitä. Esimerkiksi pituus ja massa. Piei arvo aia olla! Hekilö A: pituus: 170 cm massa: 78 kg Hekilö B: pituus: 150 cm massa: 62 kg Nyt 170 cm 78 kg 150 cm 62 kg hekilö B: massa o siis suhteessa pituutee pieempi kui hekilö A:. (Oko A lihavampi? ei välttämättä bodari). Eli ei pidä tehdä vääriä johtopäätöksiä! Jotta olisi suhteessa sama massa, ii verrato ataa 170 150 = 78 x x = 78 150 170 68,823 kg Keskiluvut Keskiluvuilla kuvataa havaitoarvoje keskimääräistä suuruutta tai laatua. Keskiluvut: 1. Keskiarvo. Ilmoittaa muuttuja keskimääräise suuruude. O tuetui keskiluku, merkitää x (ei vektorimerkitä), joka yhtälö o x = x 1 + x 2 + x 3 + + x = i=1 x i = 1 x i Keskiarvo voidaa laskea myös frekvessie kautta, s. paiotettua keskiarvoa. Ku o kaikkie havaitoje lukumäärä ja k o eri havaitoje, eli luokkie lukumäärä, ii x = i=1 x i = k i=1 k i=1 f i x i = 1 f ix i, k i=1 6

Keskiluvut (jatkuu): 2. Moodi eli tyyppiarvo. Moodi, lyheetää ja merkitää (Mo), o suurita frekvessiä eli suurita muuttuja arvo esiitymiskerra lukumäärää, vastaava lukuarvo. (Kuika mota kertaa esiityy eite esiityvä muuttuja arvo.) Moodi siis soveltuu kaikille mitta-asteikoille. 3. Mediaai. Mediaai, lyheetää ja merkitää (Md), o järjestyksee asetetu havaitoaieisto keskimmäie arvo (parito määrä) tai kahde keskimmäise arvo keskiarvo (parillie määrä). Mediaai vaatii järjestykse eli se soveltuu muille paitsi luokitteluasteikolle, jossa ei ole järjestystä. Muistisäätö: Ku aieisto järjestyksessä, ii koko havaitoaieistosta o 50% mediaai molemmilla puolilla. Esim. Joki muuttuja havaitoarvot ovat 1, 3, 2, 5, 2, 2, 3, 8, 2, 2, 5, 5, 3, 2, 4, 8, 4, 278, yht 18 kpl. Mo havaitoarvo: 1 2 3 4 5 6 7 8 278 frekvessit: 1 6 3 2 3 0 0 2 1 =18 Keskiarvo: Moodi: Mediaai: x = 1+3+2+ +278 18 = 1 1+6 2+3 3+ +1 278 18 Mo = 2, koska kakkoe esiityy 6 kertaa. Laitetaa esi havaitoarvot järjestyksee! 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 8, 8, 278 = 18,83. 9kpl eli 50% 9kpl eli 50% Nyt mediaai o kahde keskimmäise luvu keskiarvo, eli Md = 3 + 3 /2 = 3. 7

Keskiluvut (jatkuu): 1. Paiotettu keskiarvo. Lukuje x 1 + x 2 + + x paiotettu keskiarvo, ku paioia ovat luvut p 1 + p 2 + + p (> 0), o p 1 x 1 + p 2 x 2 + + p x p 1 + p 2 + + p Esim. Eräässä matematiika kokeessa arvosaoje jakauma oli seuraava: 4 5 6 7 8 9 10 1,3 % 9,8 % 15,8 % 20,3 % 23,3 % 23,4 % 6,1 % Laske arvosaoje keskiarvo. Ratkaisu Nyt prosetit ovat s. paioja, jotka summautuvat ykköseksi, saadaa x = 0,013 4 + 0,098 5 + + 0,061 10 1 = 7,491 7,5. 8