Tilastotieteen johdantokurssi

Koko: px
Aloita esitys sivulta:

Download "Tilastotieteen johdantokurssi"

Transkriptio

1 VAASAN YLIOPISTO Tilastotietee johdatokurssi Luetoruko Christia Gustafsso

2 1 SISÄLLYSLUETTELO 1. JOHDANTO Mitä tilastotiede o? Tilastotietee historiaa HAVAINTOAINEISTON HANKINNASTA JA MITTAAMISESTA Havaitoaieisto, havaitomatriisi ja mittaamie Havaitoaieisto hakiasta ja otatameetelmistä YKSIULOTTEINEN EMPIIRINEN JAKAUMA Frekvessijakauma peruskäsitteitä ja luokitus Graafie esitys Yksiulotteise jakauma tuusluvut Keskiluvut Hajotaluvut Yksiulotteise jakauma muita tuuslukuja KAKSIULOTTEINEN EMPIIRINEN JAKAUMA Ristiitaulukko ja kotigessikerroi Korrelaatiodiagrammi ja korrelaatio Järjestyskorrelaatio Regressio TODENNÄKÖISYYSLASKENTAA Kombiatoriikkaa Todeäköisyyde määrittely Ehdollie todeäköisyys ja riippumattomuus TEOREETTISISTA JAKAUMISTA Satuaismuuttujista Diskreeteistä teoreettisista jakaumista Jatkuvista teoreettisista jakaumista TILASTOLLISESTA PÄÄTTELYSTÄ Estimoiista Hypoteesie testauksesta Testaukse pääpiirteet Keskiarvotestejä Prosettilukutestejä Riippuvuustutkimuksee liittyviä testejä yhteesopivuustesti... 8

3 1. JOHDANTO 1.1. Mitä tilastotiede o? Tilasto o empiiristä ilmiötä kuvaava usei taulukkoa esitetty umeerie aieisto. Tilastoiti tuottaa tällaisia eri ilmiöitä kuvaavia aieistoja. Erilaisia empiirisiä ilmiöitä kuvaavissa aieistoissa esiityy samatyyppisiä ogelmia, joide tutkimisessa tilastotieteestä o apua ja muodostetut tilastot ovat tilastollise tutkimukse materiaalia. Tilastotiede o oppiaie, joka aiheea voidaa pitää sattuma ja vaihtelu hallitaa, iformaatio suodattamista datasta sekä mallitamista moille eri tieteealoilla. Tilastotiede o empiirisluotoiste tietoje hakia suuittelua keräämistä deskriptiivie eli järjestämistä esittämistä kuvaileva tilastotiede sekä aalysoitia tilastollie päättely eli tulkitaa iferessi *) koskeva tiede. *) Tilastollie päättely o luoteeltaa iduktiivista, jolloi osajoukkoa koskevat tulokset yleistetää koskemaa koko perusjoukkoa. Tilastotiede o s. meetelmätiede, joka tehtävää o kehittää meetelmiä muide tieteide (esim. talous-, luoo- ja yhteiskutatieteide) empiirisiä ilmiöitä kuvaavie tietoje aalysoitia varte. Empiirie ilmiö voi olla sellaie, joho vaikuttavat vai systemaattiset tekijät (determiistie ilmiö) tai sellaie, joho systemaattiste tekijöide lisäksi vaikuttaa myös sattuma (satuaisilmiö). Sattuma käsitteellä tarkoitetaa satuaisilmiö sitä käyttäytymise osuutta, jota ei voida etukätee tarkkaa eakoida. Usei kuiteki sattuma käyttäytymie oudattaa omia lakejaa. Tilastotiedettä käytetää erityisesti satuaisilmiöide tutkimisee. Tilastotietee lisäksi meetelmätieteitä ovat myös matematiikka ja tietotekiikka. Tilastotiede soveltaa meetelmiä kehittäessää matematiika teoriaa, erityisesti todeäköisyyslaskea teoriaa, siksi tilastotiedettä usei pidetääki sovelletu matematiika eräää osa-alueea (matemaattie eli teoreettie tilastotiede). Tilastotietee ja tietotekiika yhteistä aluetta saotaa tilastolliseksi tietojekäsittelyksi. Usei tilastolliste meetelmie kehittämisvaiheessa iihi liittyy

4 3 vaatimus sovellettavuudesta ja käsitys sovellustilateesta. Oki käyyt usei ii, että raja tilastotietee ja soveltavie tieteide välillä o hämärtyyt, jolloi soveltavie tieteide piirissä o raja-aluetta alettu imittää omalla imellä (esim. epidemiologia, biometria, evirometriikka, psykometriikka, demometria ja ekoometria). Tilastotiedettä voidaa kuiteki soveltaa lähes mihi tahasa tieteesee, koska tilastotietee teoria o yleistä. Esim. 1 Deskriptiivisee eli kuvailevaa tilastotieteesee törmätää päivittäi osakkeide hiamuutoksissa työttömyysluvuissa puolueide kaatusluvuissa lämpötiloissa yms. Esim. Tilastollista päättelyä käytetää mm. tulevaisuude eustamisessa vakuutusyhtiö arvioidessa vakuutukse hitaa laadutarkkailussa Tilastollisessa aalyysissä tutkittavat ogelmat pelkistyvät usei seuraavalaisiksi kysymyksiksi: Millaie tilae o keskimääri? Kuika suuri o prosetuaalie osuus? Kuika suurta o omiaisuude vaihtelu? Oko eroa? Oko samalaisuutta? Oko muutosta? Oko riippuvuutta? Millaista riippuvuus o? Mite tulevaisuudessa? 1.. Tilastotietee historiaa Laajassa mielessä tilastotiedettä harrastettii systemaattiste tietoje keräykse muodossa jo muiaisessa Kiiassa ja Egyptissä (väestökirjapito). Moderi tilastotietee juuret voidaa ajoittaa 1600-luvulle, jolloi eurooppalaiste yhteiskutie kehittyessä tarvittii

5 4 luotettavaa tietoa taloude ilmiöistä (= poliittie taloustiede, joka erästä osa-aluetta saottii yliopistostatistiikaksi) sekä valtio ja väestö tilasta (= poliittie aritmetiikka). Saa tilasto saksa- ja eglaikieliset vastieet Statistik ja statistics viittaavatki saa alkuperäisee merkityksee: valtio kuvaus. Vuoa 166 julkaistii Eglaissa tilastollise tutkimukse urauurtaja Joh Grauti teos Natural ad Political Observatios o the Bills of Mortality. Merkittävästi tilastotietee sytyy ja kehityksee ovat vaikuttaeet myös uhkapeliogelmat. Uhkapeliharrastuste lisäätymise myötä alettii 1600-luvulla tutkia todeäköisyyslasketaa erityisesti Raskassa. Vielä 1700-luvulla ja se jälkeeki havaitoaieistoja käsiteltii varsi alkeellisi meetelmi (yksikertaisia meetelmiä, lähiä kuvailevaa tilastotiedettä). Aalysoiva tilastotietee rialla kulki siitä erilliseä halliollie tilastoiti. Nämä yhdistyivät jossai määri 1800-luvulla, ku matematiika voimakas kehittymie loi tilastotieteelle selkeä teoreettise pohja luvulla alettii luoo-, yhteiskuta- ja käyttäytymistieteissä kiiostua tilastotietee meetelmistä. Tältä ajalta ovat peräisi esim. Gregor Medeli periöllisyyskokeet. Myös matemaattie tilastotiede alkoi kehittyä voimakkaasti 1800-luvu loppupuolella, esimerkiksi korrelaatioteoria ja regressiolai perusteet esitettii v luvu alkupuolella sytyivät moet tilastotietee perusmeetelmistä. Viime vuosikymmeiä tilastotietee teoria ja sovellusalueet ovat laajetueet valtavasti. Tähä o erityisesti vaikuttaut tietojekäsittelymahdollisuuksie kehittymie. Suomekielie saa tilasto otettii käyttöö 1840-luvulla. Ruotsi-Suomi oli esimmäie valtio, jossa alettii sääöllisesti laatia väestötilastoja, esimmäiset tiedot koskivat vuotta Tuolloi Ruotsi-Suome väkiluku oli hekeä. Esimmäie suomekielie tilastokirja Suome Suuriruhtiaa Nykyie Tilasto julkaistii vuoa Vuoa 1865 perustettii Tilastollie toimisto (yk. Tilastokeskus). Vuoa 1905 Karl Willgre julkaisi esimmäise suomalaise tilastotietee oppikirja. Esimmäie tilastotietee professuuri saatii Helsigi yliopistoo vuoa 1945.

6 5. HAVAINTOAINEISTON HANKINNASTA JA MITTAAMISESTA Havaitoaieisto o tilastollise aalyysi perusta, jote o tärkeää, että se o huolella koottu ja esikäsitelty..1. Havaitoaieisto, havaitomatriisi ja mittaamie Tilastollie tutkimus kohdistuu aia joideki tutkimusobjektie muodostamaa joukkoo, joka o tutkimukse perusjoukko eli populaatio eli kohdejoukko. Populaatio rajaamie o tutkimukse esimmäisiä vaiheita. Populaatio alkioita eli tutkimusobjekteja kutsutaa tilastoyksiköiksi eli havaitoyksiköiksi, joista käytetää merkitää a 1, a, a 3, Jos tutkittavaa o kokreettie aieisto, tilastoyksiköt imetää omalla imellää. Esim.3 Tutkittavaa o 0 kpl Suome kutia, joista tiedetää veroprosetti. Tilastoyksikköä o kuta, mutta mikä o populaatio? em. kutie joukko, jos tutkitaa vai äitä kutia (kokoaistutkimus) kaikki Suome kuat (otatatutkimus) tiety suuraluee kuat (otatatutkimus) Huom. Tutkittavista tilastoyksiköistä tehtävät johtopäätökset ulottuvat vai määrättyy populaatioo (vrt. superpopulaatio). Tämä takia populaatio rajaamie o tärkeää. Tilastoyksikköö liittyvistä omiaisuuksista muodostetaa tilastollisia muuttujia, joita merkitää usei, y, z, tai 1,, 3, (Poikkeus: Jos tarkastellaa vai yhtä muuttujaa, merkitä 1 tarkoittaa esimmäise tilastoyksikö -muuttuja arvoa, toise tilastoyksikö -muuttuja arvoa, 3 kolmee tilastoyksikö -muuttuja arvoa je.) Jotta tilastollisia meetelmiä voidaa soveltaa, o tutkittava ilmiö omiaisuudet voitava esittää umeerisesti. Tämä tehdää mittaamalla tilastoyksiköiltä muuttujie arvot eli havaitoarvot. Mittaamisella tarkoitetaa meettelyä (operaatiota, säätöä), jolla tutkittavaa tilastoyksikköö liitetää se tiettyä omiaisuutta kuvaava luku eli mittaluku. Ku tilastoyksikö tarkastelualaie omiaisuus mitataa ja saadaa mittaustulos, saotaa tätä tulosta ko. muuttuja arvoksi. Käytetyt mittaluvut ovat tilastollise tutkimukse lähtökohta, joho tutkimukse oistumie perustuu. O huolehdittava siitä, että muuttujalla o korkea validiteetti (asiamukaisuus) eli muuttuja mittaa sitä omiaisuutta, jota se olisi tarkoitus mitata. Esimerkiksi kysymys Kuika mota kertaa syöt viikossa porkkaaraastetta? ei mittaa

7 6 sitä, pidätkö porkkaaraasteesta vai et. Myös muuttuja reliabiliteeti (pysyvyyde, eisattumavaraisuude) täytyy olla korkea, eli toisistaa riippumattomie samalle tilastoyksikölle tehtyje mittauste tulokset pitäisi olla samat. Erityisesti käyttäytymis- ja yhteiskutatieteissä ovat muuttuja validiteetti ja reliabiliteetti tärkeitä käsitteitä. Tilastolliset muuttujat voivat olla suoraa mitattuja tai teoreettisia muuttujia. Teoreettiste muuttujie (esim. älykkyyde) mittaamisessa käytetää apua idikaattoreita. Älykkyyde idikaattoreita voisivat olla esim. meestymie erilaisissa testeissä, joide tulokset yhdistetää esim. yhdeksi muuttujaksi laskemalla eri testie pistemäärät yhtee. Tilastollie muuttuja o jatkuva (jatkuva-arvoie), jos se voi periaatteessa saada mikä tahasa reaalilukuarvo joltai (järkevältä) väliltä. Vaikka muuttuja olisiki periaatteessa jatkuva, o käytäössä mittaustarkkuus aia äärellie. Jatkuvuude käsite perustuuki ajatuksee, että mittaustarkkuutta voidaa parataa rajatta. Esimerkiksi hekilö ikä o jatkuva muuttuja, vaikka se arvot esitetääki usei kokoaislukuia ( vuotta, 4 vuotta je.). Muuttuja o diskreetti eli epäjatkuva, jos se arvoia voivat olla vai jotki erilliset lukuarvot jollaki välillä. Esimerkiksi sisaruste lukumäärä o epäjatkuva muuttuja, koska se arvoia voivat olla luvut 0 tai 1 tai je. Ku tutkittavilta tilastoyksiköiltä mitataa halutut tutkittavat omiaisuudet, saadaa havaitoaieisto. Havaitoaieisto esitetää usei havaitomatriisia, joka siis koostuu tilastoyksiköide omiaisuuksia kuvaavista muuttujie arvoista. Aieisto o site kvatitatiivie eli s. kova aieisto. 1 j k a1 a ai a i 1 1 i j1 j ji j k1 k ki k Tilastoyksiköitä tässä havaitomatriisissa o kpl (eli vaakarivie lukumäärä). Yhde tilastoyksikö (a i ) eri muuttujie arvot esitetää yhdellä vaakarivillä. Tätä vaakariviä saotaa ko. tilastoyksikö havaitovektoriksi eli profiiliksi. Muuttujia havaitomatriisissa o k kpl (eli sarakkeide lukumäärä). Yhdellä sarakkeella esitetää site kaikista tilastoyksiköistä sama muuttuja ( j ) arvo. Sarake muodostaa site ko. muuttuja jakaumavektori.

8 7 Tilastolliset mitta-asteikot Havaitomatriisissa olevat havaitoarvot äyttävät tavallisilta reaaliluvuilta. Näillä arvoilla o kuiteki myös toie sisältö. Ne kuvaavat jotaki omiaisuutta, ja käytetty esitystapa o vai välie ilmiö tutkimisessa. Tavallisia reaalilukuja voidaa laskea yhtee, jakaa keskeää, iistä voidaa ottaa logaritmeja je. Myös havaitoaieistolle tehtävät tilastolliset operaatiot perustuvat tällaisii laskutoimituksii, mutta äitä operaatioita tehtäessä o aia pidettävä mielessä, että saatu tulos o voitava tulkita empiirisesti mielekkäällä tavalla. Tulkia mielekkyys riippuu muuttuja tilastollisesta mitta-asteikosta. Muuttuja mitta-asteiko tutemie o tärkeää, koska erilaisille muuttujille sopivat vai tietyt tilastolliset tuusluvut ja aalysoitimeetelmät. Mitä korkeampi o mittaustaso, sitä eemmä o käytössä aalyysimeetelmiä. Seuraavassa esitellää mitta-asteikkojako, jossa muuttujat jaetaa eljää ryhmää, jotka esitetää alhaisimmasta korkeimpaa. 1 Nomiaali- eli luokittelu- eli laatueroasteikko Jos tilastoyksiköt aioastaa jaetaa muuttuja perusteella luokkii, mitataa muuttujaa omiaaliasteikolla. Tällöi esimerkiksi kahdesta tilastoyksiköstä voidaa saoa aioastaa, että e ovat joko samalaisia tai erilaisia muuttuja suhtee. Nomiaaliasteikolla muuttuja luokkie imet voidaa korvata umerokoodeilla, jotka voidaa valita vapaasti. Luokkie tai umerokoodie järjestykse vaihtamie ei vaikuta mitekää saatavii tuloksii. Muuttuja-arvoje välisillä aritmeettisilla laskutoimituksilla ei ole mielekästä tulkitaa. Aioastaa lukumäärii perustuvat laskeat ovat järkeviä. Esim. 4 sukupuoli: mies = 1 aie = ammatti: pappi = 1 lääkäri = opettaja = 3 Esim. 5 Liisa o pappi ja Leea o opettaja. Liisalla ja Leealla o eri ammatit. Liisalla ja Leealla o sama sukupuoli. Ordiaali- eli järjestysasteikko Ordiaaliasteikolla voidaa omiaaliasteikollise luokittelu lisäksi joki järjestysrelaatio, joka voidaa ilmaista saoilla "parempi", "vaikeampi", "kauiimpi", Luokittelu lisäksi luokat voidaa asettaa järjestyksee muuttuja mukaa. Muuttuja arvoje välillä vallitsee joki järjestysrelaatio. Mitää lukua ei vertailuu voida kuitekaa ottaa mukaa. Peruslaskutoimitukset eivät ole sallittuja ordiaaliasteikolla.

9 8 Ordiaaliasteikollise muuttuja arvoje koodaus o muute vapaata, kuha olemassa oleva järjestys tulee yksikäsitteisesti määrätyksi. Esim. 6 arvosaa: tyydyttävä = 1 hyvä = kiitettävä = 3 suhtautumie tiettyy väitteesee (s. Likert-asteikko): täysi eri mieltä = 1 jokseeki eri mieltä = ei eri mieltä eikä samaa mieltä = 3 jokseeki samaa mieltä = 4 täysi samaa mieltä = 5 sijoitus maastojuoksu piirimestaruuskilpailuissa Esim. 7 Matti sai tetistä arvosaa hyvä ja Liisa sai arvosaa kiitettävä. (Matti ja Liisa saivat eri arvosaa.) Liisa arvosaa o parempi kui Matilla. 3 Itervalli- eli välimatka-asteikko Itervalliasteikolla voidaa luokittelu ja järjestyksee asettamise lisäksi vertailla muuttuja lisäyste suuruutta keskeää lukuje avulla. Kahde tilastoyksikö a i ja a j välistä eroa muuttuja osalta vastaa muuttuja-arvoje i ja j erotus. Muuttuja-arvoje yhtee- ja väheyslasku o sallittu. Muuos f() = a + b, ku b > 0, säilyttää itervalliasteiko raketee. Asteiko ollapiste o sopimuksevaraie (keiotekoie). Jotkut itervalliasteikolla mitatut muuttujat voivat saada egatiivisiaki arvoja. Esim. 8 lämpötila Celsius- tai Fahreheit-mittarilla mitattua ( Celsius, y Fahreheit; lieaarie muuos y = ) kaleteri mukaa mitattava aika leveys- ja pituusasteet Esim. 9 Vaasa lämpötila o 6 C ja Helsigi + C. (Vaasassa ja Helsigissä o eri lämpötila. Helsigissä o lämpimämpää kui Vaasassa.) Helsigissä 8 C lämpimämpää kui Vaasassa. 4 Suhdeasteikko Jos itervalliasteiko vaatimukset ovat voimassa ja lisäksi o olemassa absoluuttie ollapiste, jossa tarkasteltava omiaisuus "häviää" eli muuttuja määrä o todella olla, o muuttuja mitta-asteikko suhdeasteikko. Yhtee- ja väheyslasku lisäksi voidaa muuttuja-arvoja kertoa ja jakaa keskeää. Muuos f() = a, ku a > 0, o sallittu.

10 9 Suhdeasteikolla voidaa esimerkiksi vertailla, kuika moikertaie tiety tilastoyksikö muuttuja-arvo o toise tilastoyksikö muuttuja-arvoo verrattua. Esim. 10 pituus cm paio kg Esim. 11 Matti paiaa 90 kg ja Liisa 45 kg. (Matti ja Liisa ovat eri paioisia. Matti o paiavampi kui Liisa. Matti paiaa 45 kg eemmä kui Liisa.) Mati paio o kaksikertaie Liisa paioo verrattua. Muuttuja mitta-asteikko ilmoitetaa se toteuttama korkeimma asteiko perusteella Mitta-asteikot jaotellaa vielä kahtee luokkaa: omiaali- tai ordiaaliasteiko muuttujia saotaa kvalitatiivisiksi eli laadullisiksi muuttujiksi. Itervalli- tai suhdeasteiko muuttujia saotaa kvatitatiivisiksi eli määrällisiksi muuttujiksi. Asteikkotyypi määrittämie ei ole välttämättä helppoa eo. tuusmerkkie avulla. Joissaki tilateissa muuttuja tilastollisesta mitta-asteikosta esiityy erilaisia äkemyksiä. Tyypillisesti tällaie muuttuja mittaa mielipidettä (esim. käytetty Likertasteikkoa). Tarkasti ottae ko. muuttuja voi olla esim. järjestysasteiko muuttuja, mutta joskus se ajatellaa oleva välimatka-asteiko muuttuja. Viimeksi maiittu tulkitatapa johtuu siitä, että aieisto käsittelijä mieltää muuttuja-arvoje erotukse umeerise erotukse mukaiseksi... Havaitoaieisto hakiasta ja otatameetelmistä Usei tutkimuksessa o vaivalloisi ja aikaa ja rahaa vaativi vaihe havaitoaieisto hakkimie ja muokkaamie käyttökelpoiseksi tilastollista aalyysiä varte. Kaikkie tilastoyksiköide joukko muodostaa siis tutkimukse populaatio eli perusjouko. Perusjouko osajoukkoa kutsutaa satuaisotokseksi, jos jokaisella perusjouko alkiolla o tuettu positiivie todeäköisyys tulla valituksi otoksee. Jos ko. ehto ei ole voimassa, o kyseessä äyte. Mikäli tiedot kerätää jokaisesta perusjouko alkiosta, o kyseessä kokoaistutkimus. Jos tiedot kerätää otokse avulla, o kyseessä otatatutkimus. Poikkileikkaustutkimuksessa tiedot kerätää useasta eri tilastoyksiköstä tietyllä ajahetkellä. Pitkittäisleikkaustutkimuksessa tilastoaieisto kerätää mittaamalla samaa tai muutamaa tilastoyksikköä eri ajakohtia (aikasarja, erilaiset seuratatutkimukset).

11 10 Havaitoaieisto saadaa valmiista tilastolähteistä ja/tai keräämällä tiedot itse. Valtio osalta tilastoii hoitaa Tilastokeskus, joka toimiasta ja julkaisuista saa tarkempia tietoja esim. www-sivulta Myös muut laitokset, kuat, yritykset ja järjestöt tekevät tilastollisia selvityksiä toimialasa asioista. Osa selvityksistä julkaistaa, osa o tarkoitettu vai sisäisee käyttöö. Lisäksi äillä elimillä o rekistereitä ja muita tietoaieistoja, joista usei o saatavissa tietoja mm. tutkimusta varte. Useimmilla mailla o omat tilastokeskuksesa, joide www-sivuihi löytyy likkejä Tilastokeskukse www-sivuilta. Mikäli havaitoaieistoa ei ole valmiia, joudutaa se kokoamaa tilastoyksikköihi kohdistuvia mittauksia. Otatatutkimus o usei halvempi ja opeampi kui kokoaistutkimus. Koska tilastoyksiköitä o otoksessa vähemmä kui koko populaatiossa, voidaa mittaukset suorittaa huolellisemmi. Jos populaatio o ääretö tai jos tilastoyksikkö joudutaa tuhoamaa mittaustilateessa, ei kokoaistutkimusta voida tehdä. Otatatutkimukse suuittelusta 1. Tavoitteide määrittely täsmetämie tietoje käyttötarkoitus tuloste täsmällisyysvaatimus. Ogelma muutamie tilastolliseksi perusjouko täsmetämie tilastoyksiköt / otatayksiköt muuttujat kohdepopulaatio/kehikkopopulaatio mittausmeetelmät kyselykaavakkeet 3. Otokse poimimie otatameetelmä valita otoskoo määrittämie 4. Aieisto keräämie kysely tai muulaie mittaamie 5. Aieisto käsittely tietoje muokkaus ja aalysoiti 6. Raportoiti tuloste esittämie selväkielisesti Otatameetelmistä Otatameetelmä valitaa liittyy otokse koosta päättämie, joho vaikuttaa haluttu tuloste tarkkuus, tutkimukselle varattu aika ja tietoje keruutapa. Otokse optimikoo määrittämiseksi o kehitetty erilaisia lasketakaavoja, jotka yt sivuutetaa. Karkeasti ottae tutkimustuloste luotettavuus paraee tiettyy rajaa asti otoskoo kasvaessa,

12 11 mutta samalla kustaukset lisäätyvät voimakkaasti. Mielipidetutkimuksissa, jossa kartoitetaa esimerkiksi koko maassa puolueide kaatusta, käytetää usei hekilö otoskokoa. Jos tutkitaa vaikkapa joki yritykse imagoa tietyllä alueella, voi otoskoko olla hekilöä. Yksikertaie satuaisotata (YSO) o otatameetelmie perusmeetelmä. Se o käyttökelpoie, jos perusjoukosta ei ole käytettävissä eakkoiformaatiota. Se etua o myös tuloste lasketahelppous, sillä tilastolliset ohjelmistot olettavat yleesä, että otos o koottu YSO:lla. YSO:ssa jokaisella samakokoisella otoksella o sama todeäköisyys tulla valituksi, ja myös jokaisella tilastoyksiköllä o sama todeäköisyys tulla valituksi. YSO:lla ei välttämättä saada edustavaa otosta, jos perusjoukko o jakaatuut keskeää heterogeeisii ryhmii, joissa alkiomäärät ovat hyvi erilaiset. YSO toteutetaa usei käyttämällä satuaislukuja. Perusjouko alkiot umeroidaa, se jälkee geeroidaa satuaislukuja, ja äitä lukuja vastaavat tilastoyksiköt valitaa otoksee. Systemaattie otata (SO) sopii käytettäväksi silloi, ku perusjoukkoa ei tarkkaa pystytä määrittämää (esim. liikkee asiakastutkimus) tai jos perusjouko alkiot o listattu (esim. valmis rekisteri). SO:ssa poimitaa tilastoyksiköt tasavälei läpi koko populaatio. Ku perusjoukosta valitaa joka k. tilastoyksikkö, o poimitaväli k. Poimita aloitetaa valitsemalla k: esimmäise tilastoyksikö joukosta esimmäie otoksee tuleva alkio, ja tämä jälkee poimitaa systemaattisesti joka k. tilastoyksikkö. Jos perusjoukossa o N tilastoyksikköä ja otokse koko o yksikköä, ii poimitaväli k = N/. Systemaattise otaa etu yksikertaisee satuaisotataa o se, että se o helpompi ja opeampi suorittaa. Systemaattie otata aiheuttaa kuiteki virhettä, jos otatayksiköide arvot kasvavat tai pieeevät systemaattisesti (esim. tilastoyksiköt ovat tutkittava muuttuja suhtee suuruusjärjestyksessä) tai jos poimitaväli pituus o sama kui joki systemaattise jakso pituus. Ryväsotaassa (RO) perusjoukko jaetaa kiiteisii ryhmii eli ryppäisii joki omiaisuude mukaa. Ryppää voi muodostaa esim. kuta, oppilaitos, je. Ryppäistä poimitaa esimerkiksi YSO:lla tutkimuksee tulevat ryppäät. Lopullise otokse muodostavat joko ryppäide kaikki tilastoyksiköt tai iistä voidaa edellee poimia osa esimerkiksi yksikertaisella satuaisotaalla. Ositetussa otaassa (OO) pyritää hyödytämää käytettävissä olevaa taustatietoa tutkittava omiaisuude käyttäytymisestä perusjoukossa. Jos populaatio o jakautuut keskeää heterogeeisii ryhmii site, että ryhmät ovat sisäisesti homogeeisia ja eroteltavissa toisistaa, kaattaa käyttää ositettua otataa. Kutaki ryhmää saotaa ositteeksi ja jokaisesta ositteesta poimitaa eriksee satuaisotos käyttäe esim. YSO:ta tai SO:ta. Eri ositteista otoksee valittavie alkioide lukumäärä määritetää eriksee. Ositetussa otaassa otokse kokoaismäärä jakamista eri ositteide keske kutsutaa kiitiöiiksi. Kiitiöiti voidaa suorittaa usealla eri tavalla. Esimerkiksi tasaie kiitiöiti tarkoittaa sitä, että jokaisesta ositteesta otetaa yhtä mota alkiota otoksee ja suhteellie kiitiöiti sitä, että jokaisesta ositteesta poimitaa otoksee osittee suhteellista osuutta vastaava määrä alkioita.

13 1 3. YKSIULOTTEINEN EMPIIRINEN JAKAUMA 3.1. Frekvessijakauma peruskäsitteitä ja luokitus Jos tutkittavie tilastoyksiköide lukumäärä o suuri, ei havaitomatriisi aia riitä muuttujie jakaumie yleispiirteide selvittämiseksi. Muuttuja yleiset piirteet hukkuvat yksityiskohtie joukkoo. Aieistoa o järjestettävä ja tiivistettävä. Havaitomatriisi sisältämää tietoa voidaa tiivistää esimerkiksi muodostamalla muuttuja (luokiteltu, suora, yksiulotteie) frekvessijakauma. Frekvessijakauma muodostamiseksi muuttuja saamat arvot jaetaa erillisii luokkii, merk. E 1, E,, E k, missä k o luokkie lukumäärä. Luokkaa E i kuuluvie : arvoje lukumäärää saotaa luoka E i frekvessiksi, merk. f i. Ku muuttuja luokat ja luokkia vastaavat frekvessit tuetaa, ii silloi tuetaa : frekvessijakauma. Usei absoluuttiste frekvessie sijasta esitetää frekvessit, jotka o suhteutettu havaitoje kokoaismäärää. Näitä suhteutettuja frekvessejä voidaa käyttää esimerkiksi kahde eri havaitoaieisto frekvessijakaumie vertailuu. Lukua p i = f i saotaa luoka E i suhteelliseksi frekvessiksi ja lukua 100p i saotaa prosetuaaliseksi frekvessiksi. Jos muuttuja o epäjatkuva, o luokkie määrittely yleesä selvää. Luokkia käytetää muuttuja arvoja joko sellaiseaa tai iitä vastaavia koodilukuja. Jos muuttuja luokilla o joki vakiituut esittämisjärjestys tai muuttuja o järjestysasteikolla mitattu, o luokat esitettävä vastaavassa järjestyksessä. Esim. 1 Vuode 009 alussa Suome kutie lääijakauma oli seuraava: (Aieisto peruslähde o Tilastokeskukse tietokaat) Lääi f i p i 100p i Etelä-Suome Läsi-Suome Itä-Suome Oulu Lapi Ahveamaa Yhteesä

14 13 Jos luokkia tulee hyvi paljo ja suuri osa frekvesseistä o pieiä, kaattaa luokkia yhdistellä. Tällöi luokat o yhdisteltävä ii, että samaa luokkaa tulevat arvot kuuluvat mahdollisimma loogisesti yhtee. Jos muuttuja o jatkuva-arvoie, o se luokittelu hakalampaa, koska tällaise muuttuja arvot voivat olla mitä tahasa reaalilukuja joltai väliltä, ja kaikki mitatut arvot voivat olla erisuuruisia. Jos muuttujasta halutaa muodostaa tiivis frekvessijakauma, o luokkie oltava välejä, jotka kattavat muuttuja arvot. Jatkuva muuttuja luokittelussa tietoa häviää, koska yt ei eää ilmoiteta muuttuja havaittuja arvoja vaa luokka, joho havaitoarvo kuuluu. Luokitellu aieisto esitystapa o kuiteki usei selvempi kui luokittelemattoma, koska jatkuva-arvoise muuttuja jakauma esittämie tilastokuvioa perustuu usei luokitteluu. Jatkuva muuttuja luokittelua voidaa hahmottaa seuraavasti: Oletetaa, että luokiteltavia havaitoja o kpl ja e o pyöristetty jolleki mittaustarkkuudelle, merk. d. (Jos mittaustulokset ovat kokoaislukuja, o d = 1, jos mittauksissa o käytetty yhtä desimaalia, ii d = 0.1). 1 Etsitää piei arvo, merk. (1), ja suuri arvo, merk. (). Muuttuja arvoje vaihteluväli muodostaa väli ( (1), () ). Vaihteluväli pituus w = () (1). Päätetää, käytetääkö tasavälistä vai epätasavälistä luokitusta. Luokitus o tasavälie, jos kaikki luokat ovat yhtä leveitä. Jos vai voidaa, kaattaa käyttää tasavälistä luokitusta varsiki silloi, jos luokittelua käytetää esimerkiksi frekvessihistogrammi perustaa. 3 Valitaa luokkie lukumäärä k, (k 3 tai) k. (Jos = 15, ii k 5-7.) Yleesä luokkia o 4-10 kpl. 4 Tasavälisessä luokituksessa määritetää arvio luokkaväli pituudelle c site, että c > k w. Luokkie rajoje o oltava selkeitä, ja siksi c valitaa usei hiuka suuremmaksi kui edellie suhde. Epätasavälisessä luokituksessa eri luokissa luokkaväli pituude saa valita mielivaltaisesti. 5 Muodostetaa luokat site, että e peittävät koko vaihteluväli. Esimmäise luoka pyöristety alaraja pitäisi olla pieempi tai yhtä suuri kui (1). Muut luokat määritellää pyöristettyje luokkarajoje avulla, jotka esitetää samalla mittaustarkkuudella kui muuttujaki o mitattu. 6 Tutkitaa jokaise tilastoyksikö muuttuja arvo, ja määrätää luokkie frekvessit. Yksittäie muuttuja-arvo voi kuulua vai yhtee luokkaa. Esim. 13 Erää ettimyytiyritykse syksy 009 farkkumallistosta tehdyssä otoksessa farkkuje myytihiat euroia ovat suuruusjärjestyksessä: 43, 49, 53, 60, 64, 69, 70, 73, 73, 79, 80, 80, 85, 89, 90, 90, 90, 99, 99, 99, 100, 100, 109, 109, 110, 110, 115, 119, 10, 19, 135.

15 14 Farkkuje eli tilastoyksiköide määrä eo. aieistossa o 31. Myytihita o esitetty kokoaisiksi euroiksi pyöristettyä, jote mittaustarkkuus d = 1. Myytihita-muuttuja mitta-asteikko o suhdeasteikko. Muuttuja piei arvo o 43 ja suuri arvo o 135. Vaihteluväli pituus o site w = = 9. Luokitellaa aieisto viitee tasavälisee luokkaa (, koska 5 31), siis k = 5. 9 Määritetää luokkaväli pituus: c > = 18.4 ja valitaa luokkaväli 5 pituudeksi c = 0. Esimmäise luoka pyöristetyksi alarajaksi o valittu luku 40, koska se pieitä arvoa pieempi tasaluku. Toise luoka pyöristetty alaraja o luokkaväli pituude etäisyydellä esimmäise luoka alarajasta. Esimmäise luoka pyöristetty yläraja o mittaustarkkuude verra pieempi kui toise luoka pyöristetty alaraja. Absoluuttiste frekvessie lisäksi jakaumassa o esitetty prosetuaaliset frekvessit. Farkkuje myytihita ( ) f i 100 p i Yhteesä Mittaustarkkuus d äkyy frekvessijakaumataulukossa site, että se o tiety luoka pyöristety alaraja ja sitä edeltävä luoka pyöristety yläraja erotus. Taulukossa äkyvät pyöristetyt luokkarajat ovat luokkie symboleja. Tasavälisessä luokituksessa edeltävä luoka ja seuraava luoka pyöristettyje alarajoje (ja myös ylärajoje) välie etäisyys vastaa luokkaväli pituutta. Luoka todellie alaraja o ko. luoka pyöristety alaraja ja sitä edeltävä luoka pyöristety yläraja välie pyöristysraja. Ko. todellie alaraja o samalla edeltävä luoka todellie yläraja. Luoka E i todellisesta alarajasta käytetää merkitää L i ja todellisesta ylärajasta merkitää U i. Todellisia luokkarajoja käytetää mm. graafisissa esityksissä sekä tuuslukuje laskemisessa. Luoka E i luokkaväli pituus c i o luoka todellise ylä- ja alaraja erotus eli c i = U i L i. Tasavälisessä luokituksessa luokkaväli pituus o kaikilla luokilla sama ja tällöi siitä voidaa käyttää merkitää c.

16 15 L U Luoka E i luokkakeskus m i o luoka keskipiste eli m i i i. Koska luokittelussa usei katoaa tietoa tilastoyksiköide tarkoista muuttuja-arvoista, tulkitaa luokkakeskus usei ko. luoka havaitoje keskiarvoa. Luokkakeskuksia käytetää mm. tilastokuvioissa. Jos muuttuja o epäjatkuva, itervalli- tai suhdeasteikolla mitattu ja jos muuttujalla o paljo erilaisia arvoja, voidaa muuttujaa kohdella kui se olisi jatkuva. Jos muuttuja o mitattu vähitää järjestysasteikolla, voidaa muuttujalle määrittää summafrekvessi eli kumulatiivie frekvessi F i, joka ilmaisee, kuika mota tilastoyksikköä (havaitoa) kuuluu luokkaa E i tai sitä edeltävii luokkii yhteesä eli eli F i i f j j1 F1 f1 F f1 f F1 f F3 f1 f f3 F Fk f1 f fk f3 Fk 1 fk Edellee saadaa suhteellie summafrekvessi P i F i ja prosetuaalie summa- frekvessi 100P i. Esim. 14 Seuraavassa taulukossa o esitetty farkkuje hia frekvessijakauma lisäksi summafrekvessit, prosetuaaliset summafrekvessit, todelliset luokkarajat ja luokkakeskukset. Farkkuje myytihita f i F i 100 P i L i U i m i Yhteesä 31

17 Graafie esitys Frekvessijakauma voi esittää myös graafisesti. Usei käytetty kuviotyyppi o pylväskuvio. Pylväskuviot muodostuvat joko vaaka- tai pystypylväistä. Pylväide pitaalat (ja tasalevyiste pylväide pituudet) kuvaavat määriä, jote pylvää pituutta osoittava asteiko o hyvä lähteä luvusta 0. Vaakapylväskuvioita tulisi käyttää silloi, ku kuvataa laadullise muuttuja jakaumaa. Muuttuja luokat esitetää pystyakselilla ja vaaka-akselilla kuvataa frekvessit (absoluuttiset, suhteelliset tai prosetuaaliset). Jos muuttuja o omiaaliasteikolla mitattu, esitetää aieisto ii, että yli pylväs o pisi ja muut pylväät piirretää pituusjärjestyksessä. Pylväide välii jätetää pieet raot. Jos muuttuja o järjestysasteikollie, esitetää pylväät luokkia vastaavassa järjestyksessä. Sektoridiagrammia (ympyräkuvio, piirakkakuvio) käytetää laadullise muuttuja jakauma esittämisessä erityisesti silloi, ku halutaa havaiollistaa joki kokoaisuude jakautumista osii. Jokaise luoka kokoa edustaa sektori pita-ala, joka o suoraa verraollie luoka kokoo. Sektorikuvio sijasta kaattaa käyttää vaakapylväsesitystä erityisesti silloi, jos halutaa esittää, että kahde (tai useamma) melko samakokoise ryhmä välillä o kuiteki eroavuutta havaitomäärässä. Esim. 15 Suome kutie lääijakauma vaakapylväskuvioa

18 17 Esim. 16 Suome kutie lääijakauma sektorikuvioa Määrällise epäjatkuva muuttuja jakaumaa voidaa kuvata jaakuviolla, joka o pystypylväskuvio. Jaadiagrammi piirretää ii, että koordiaatistoo piirretää muuttuja arvoje kohdalle kyseiste arvoje frekvessie korkuiset jaat tai pylväät. Esim. 17 Vialliste tuotteide lukumääräjakauma tuote-erissä esitettyä taulukkoa ja jaakuvioa vialliste lkm f i Frekvessihistogrammi o pystypylväskuvio, jota käytetää jatkuville muuttujille. Ku luokitus o tasavälie, histogrammi muodostuu pylväistä, joide leveys o luokkaväli pituus c, korkeus luoka E i frekvessi f i ja katoje kärkipisteiä vaaka-akselilla ovat todelliset luokkarajat. Yleesä kuiteki todelliste luokkarajoje sijasta merkitää vaaka-

19 18 akselille äkyvii "siistit" luvut, jotka ovat lähellä todellisia luokkarajoja (tai luokkakeskuksia). Histogrammissa o pylvää pita-ala tärkeämpi kui korkeus, jote kuvio olisi piirrettävä ii, että luoka frekvessi o suoraa verraollie pylvää pita-alaa. Tämä vaatimus toteutuu helposti tasavälise luokitukse yhteydessä. Esim. 18 Farkkuje myytihitajakauma frekvessihistogrammia Jatkuva määrällise muuttuja frekvessijakauma voidaa esittää myös frekvessimoikulmio avulla. Jokaise luokkakeskukse kohdalle piirretää piste frekvessi (tai suhteellise tai prosetuaalise frekvessi) korkeudelle ja peräkkäiset pisteet yhdistetää toisiisa jaoilla. Frekvessimoikulmio päätepisteet ovat -akselilla s. ollaluokkie (= luokitukse alkuu ja loppuu lisättävie ylimääräiste luokkie) luokkakeskuksissa. Jos ollaluokkia ei voi määrittää, ei frekvessimoikulmiota voi piirtää. Esim. 19 Farkkuje myytihia jakauma frekvessimoikulmioa

20 19 Myös summafrekvessijakauma voidaa esittää kuvioa. Jatkuva määrällise muuttuja summafrekvessijakaumaa kuvataa summakäyrällä. Jokaise luoka todellise yläraja kohdalle piirretää piste summafrekvessi (tai suhteellise tai prosetuaalise summafrekvessi) korkeudelle ja peräkkäiset pisteet yhdistetää toisiisa jaoilla. Summakäyrä lähtee vaaka-akselilta ja ousee :ää asti. Jos summakäyrä muodostetaa prosetuaalisesta summafrekvessijakaumasta, voidaa käyrä avulla selvittää mm. - kuika mota % havaitoarvoista o pieempiä kui luku a - mikä o se muuttuja arvo, jota pieempiä havaitoarvoja o p %. Esim. 0 Farkkuje myytihia prosetuaalie summakäyrä Diskreeti määrällise muuttuja summafrekvessijakaumaa vastaava summakäyrä o porrasfuktio. Vaaka-akselille merkitää muuttuja arvot ja piirretää käyrä, joka saa arvo kohdalla se frekvessi suuruise hyppäykse ja pysyy arvoje välillä edellise arvo kohdalla saamallaa tasolla. Viivakuviota käytetää ee kaikkea aikasarjoje graafisee esittämisee. Tällöi muuttuja kuvaa yleesä yhde tilastoyksikö yhtä omiaisuutta eri ajakohtia. Viivadiagrammissa vaaka-akselilla kuvataa aika ja pystyakselilla kuvataa muuttuja arvot. Sekä vaaka- että pystyakseli voi katkaista. Esim. 1 Hallito- ja toimistotyössä olevie palkasaajie työtapaturmie lukumäärä vuosia (Lähde: Tilastokeskukse PX-Web-tietokaat) vuosi tapaturmie lkm

21 0 Jos muuttuja o mitattu vähitää järjestysasteikolla, voidaa se havaitoarvoje jakautumie esittää laatikko-viikset- eli bo-plot-kuvioa. Tässä kuviossa ei esitetä luokitteluu perustuvaa jakaumaa, vaa kuviosta ilmeee muuttuja tuuslukuje arvoja. Kuviossa piirretää laatikko, joka pohja o alakvartiili korkeudella ja kasi o yläkvartiili korkeudella. Muuttuja mediaai merkitää laatikkoo poikkiviivalla. Laatiko pohjasta ja kaesta piirretää viikset kummalleki puolella laatikkoa. Viiksie piirtämisessä o useita käytätöjä, viiksie päätepisteiä voivat olla esim. piei arvo ja suuri arvo. Viiksie päätepisteiä voivat olla myös 10 %: ja 90 %: fraktiilit, jolloi kuvaa voidaa vielä eriksee merkitä e havaiot, jotka ovat kauempaa jakauma keskikohdasta kui em. fraktiilit. Esim. Farkkuje myytihia laatikko-viikset-kuvio. Kuviossa viiksie päätepisteiä ovat suuri ja piei arvo.

22 1 Määrällise muuttuja jakaumaa voidaa esittää ruko-lehti -kuviolla. Muuttuja-arvoista jätetää esittämättä tietty määrä oikeapuoleisia umeroita. Jäljelle jäävistä muodostetaa esitykse ruko, joka arvot esitetää perättäisiä kokoaislukuia piei luku ylimmällä rivillä ja suuri alimmalla rivillä. Rukoarvoje perää kirjoitetaa lehdet yleesä site, että havaioista pois jätety umero-osuude esimmäiset umerot tulevat oikealle riville suuruusjärjestyksessä. Esim. 3 Seuraavassa o farkkuje myytihitaesimerki ruko-lehti-kuvio, jossa rugo leveys o 10 : 4: 39 5: 3 6: 049 7: : : : : : 09 13: Yksiulotteise jakauma tuusluvut Frekvessijakaumie laatimisella yritetää saada muuttuja keskeiset omiaisuudet helpommi hahmotettaviksi. Usei muuttuja havaitoarvoje sisältämä iformaatio halutaa tiivistää vieläki voimakkaammi. Tällöi lasketaa havaioista tilastollisia tuuslukuja. Sijaitia kuvaavia tilastollisia tuuslukuja saotaa keskiluvuiksi. Hajotaluvuilla puolestaa kuvataa havaitoarvoje vaihtelua eli "hajaatumista" jakauma keskikohda ympärille. O olemassa myös muita jakauma muotoa kuvaavia tilastollisia tuuslukuja Keskiluvut Muuttuja arvoje keskimääräistä suuruutta ja jakauma sijaitia muuttuja-akselilla kuvataa keskilukuje avulla. Moodi (Mo) eli tyyppiarvo o se muuttuja arvo tai luokka, joka frekvessi o suuri. Moodi sopii kaikille mitta-asteikoille, mutta se ei ole aia yksikäsitteie. Vähitää

23 itervalliasteikollise muuttuja luokitellussa aieistossa moodi voidaa tulkita moodiluoka luokkakeskukseksi. Esim. 4 Lääi-muuttuja moodi o Läsi-Suome lääi, koska kutia o eite Läsi- Suome lääissä. Esim. 5 Farkkuje myytihia moodiluokka o kolmas luokka: Moodi voidaa yt tulkita oleva moodiluoka luokkakeskus eli 89.5 eli. 90. (Alkuperäisistä havaioista tarkasteltua moodi ei ole yksikäsitteie: moodiarvoja o kaksi: sekä 90 että 99.) Esim. 6 Erää tilastotietee kurssi opiskelijoista valitussa 19 hekilö otoksessa olivat opiskelijoide iät suuruusjärjestyksessä: 19, 0, 0, 0, 0, 1, 1, 1, 1, 1,,, 3, 3, 5, 6, 9, 4 ja 46. Iä moodiarvo o 1 vuotta. Mediaai (Md) eli keskusarvo o se havaitoarvo, jota pieempiä ja suurempia havaitoarvoja o yhtä paljo. Mediaaia ei voi laskea omiaaliasteikollisesta muuttujasta. Jos havaiot o asetettu ousevaa suuruusjärjestyksee ja kyseessä o luokittelemato aieisto, ii mediaai määrätää seuraavasti: 1 1 parito: Md o keskimmäie havaitoarvo (k), missä k = parillie: etsitää kumpiki keskimmäisistä arvoista. Jos muuttuja o ordiaaliasteikolla mitattu, o mediaai kumpiki äistä arvoista. Jos muuttuja o määrällie, o mediaai keskimmäiste havaitoje keskiarvo eli ( k) (k 1), missä k =. Esim. 7 Edellise esimerki ikä-muuttuja mediaai sijaitsee suuruusjärjestyksessä 19 1 sijalla k = = 10. Sijalla 10 oleva havaitoarvo o 1 vuotta, joka o siis mediaai. Luokitellulle aieistolle mediaai määräämiseksi o kaksi tapaa. Jos muuttuja o ordiaaliasteikollie tai diskreetti kvatitatiivie, ii mediaai määrätää kute edellä. Jatkuva tasavälisesti luokitellu kvatitatiivise muuttuja mediaai lasketaa kaavalla c Md LM FM 1, fm missä

24 L M = mediaailuoka todellie alaraja f M = mediaailuoka frekvessi F M-1 = mediaailuoka edeltävä luoka summafrekvessi c = luokkaväli pituus = havaitoje lkm. 3 Mediaailuokka o esimmäie sellaie luokka, jossa F i. Mediaai voidaa määrätä myös summakäyrä avulla. Esim. 8 Farkkuje myytihia mediaailuokka o kolmas luokka: Mediaai 0 31 Md (Alkuperäisistä havaioista tarkasteltua mediaai o suuruujärjestykse sijalla 16, jote tarkka mediaai o 90.) Mediaai o fraktiilie erikoistapaus. Fraktiilit ovat jakauma "sijaitia" kuvaavia lukuja, vaikka e eivät yleisesti kuvaakaa keskikohtaa. Muuttuja p: proseti fraktiili (p) o sellaie havaitoarvo, jota pieempiä muuttuja arvoista o p %. Tärkeimpiä fraktiileja ovat alakvartiili yläkvartiili Q 1 = (5) Q 3 = (75) mediaai Md = (50) desiilit (10), (0),, (90) Fraktiilit voidaa määritellä muille paitsi omiaaliasteiko muuttujille. Kvartiilie ja fraktiilie määräämisessä käytetää apua mm. summakäyrää. Fraktiili (p) määrittämie voidaa toteuttaa myös seuraavasti. Lasketaa esi fraktiili (p) sijaluku ousevassa suuruusjärjestyksessä: (+1). p/100 = k.d, missä k o kokoaisosa ja d o desimaaliosa ja lopuksi ko. fraktiili saadaa kaavasta (p) = (k) + 0.d. ( (k+1) - (k) ). Esim. 9 Opiskelijoide ikähavaitoja o 19 kpl. Alakvartiili sijaluku o ((19+1). 5/100=) 5.0, jote k = 5 ja d = 0 ja site Q 1 = (5) = (1 0) = 0 vuotta. Yläkvartiili sijaluku o ((19+1). 75/100=) 15.0, jote k = 15 ja d = 0 ja site Q 3 = (75) = (6 5) = 5 vuotta.

25 4 Esim. 30 Farkkuje myytihia prosetuaalisesta summakäyrästä arvioitua hia alakvartiili Q 1 73 ja yläkvartiili Q (Alkuperäisistä havaioista tarkastelua Q 1 = 73 ja Q 3 = 109.) Aritmeettie keskiarvo voidaa laskea itervalli- tai suhdeasteikollisesta muuttujasta. Luokittelemattomalle aieistolle keskiarvo saadaa kaavasta 1 i i1 Esim. 31 Ikä-muuttuja keskiarvo vuotta Luokitellulle aieistolle aritmeettie keskiarvo saadaa kaavalla 1 k f i m i, i1 missä f i m i k = luoka E i frekvessi = luoka E i luokkakeskus = luokkie lkm = havaitoje lkm Huom. Edellä olevaa kaavaa voidaa käyttää, vaikka muuttuja olisi epäjatkuva. Tällöi luokkakeskukset m i korvataa muuttuja arvoilla ja luokkie frekvessit f i korvataa yksittäiste arvoje frekvesseillä. Esim. 3 Farkkuje myytihia aritmeettie keskiarvo luokitellu aieisto perusteella: (Alkuperäisistä havaioista laskettua tarkka aritmeettie keskiarvo o 90.) Olkoo tilastoyksikköä jaettu k:ho ryhmää, joissa o 1,,, k tilastoyksikköä, ja joissa muuttuja keskiarvot ovat 1,,, k. Koko aieisto keskiarvo o

26 5 1 k i i. i1 Esim. 33 Eräällä työpaikalla o aisia 400 ja miehiä 500. Keskitutiasiot ovat vastaavasti 6.58 ja Mikä o työtekijöide keskitutiasio? Keskiarvo o eite käytetty keskiluku, joka o kuiteki herkkä poikkeaville havaioille. Varsiki pieissä havaitoaieistoissa yksiki muista selvästi poikkeava arvo vetää keskiarvoa puoleesa. Joskus äärimmäise isot ja pieet muuttuja-arvot halutaa jättää tarkastelu ulkopuolelle. Tällöi voidaa laskea esimerkiksi 5 %: leikattu keskiarvo, jolloi 5 % pieimmistä ja suurimmista arvoista jätetää pois ja lopuista havaioista lasketaa tavallie keskiarvo. Geometrista keskiarvoa käytetää suhdeasteikolla mitatu muuttuja keskiarvoa silloi, ku halutaa kuvata keskimääräistä suhteellista muutosta. Geometrie keskiarvo voidaa laskea muuttujasta, joka kaikki havaitut arvot ovat positiivisia. Geometrie keskiarvo saadaa laskettua kaavasta G 1. Esim. 34 Tuottee hita 1.5-kertaistui esimmäise vuode aikaa, toisea vuotea se 5- kertaistui ja viimeiseä vuotea 4-kertaistui. Hia suhteelliste muutoste geometrie keskiarvo o G Harmoista keskiarvoa käytetää myös suhdeasteikolla. Harmoie keskiarvo saadaa laskettua kaavasta H. 1 i1i Esim. 35 Matka esimmäie kolmaes ajettii vauhtia 50 km/h, toie kolmaeksella 5 km/h ja viimeisellä 100 km/h. Mikä o keskimääräie vauhti koko matkalla? (Ts. millä vauhdilla ämä välit olisi ajettava, jotta koko

27 6 matkaa meisi sama aika kui todella mei, ja jokaisella kolmaeksella vauhti o sama?) Lasketaa harmoie keskiarvo H Keskilukuje vertailua Aritmeettie keskiarvo o tärkei keskiluku, koska se o helppo laskea. Aritmeettie keskiarvo o herkkä poikkeaville havaioille, se ei ole siis robusti keskiluku. Aritmeettie keskiarvo ei ole välttämättä tyypillisi tai yleisi havaitoarvo. Jos samoista muuttuja arvoista lasketaa kaikki edellä esitetyt keskiarvot (mikä ei yleesä ole mielekästä), ovat tulokset aia järjestyksessä H G. Mediaai o helppo ymmärtää. Se o vakaa keskiluku, joka ei ole herkkä poikkeaville havaioille. Jos muuttuja jakauma o vio, kuvaa mediaai usei aritmeettista keskiarvoa paremmi havaitoje jakaumaa. Mediaaia ei kuitekaa käytetä paljoakaa pitkälle meevissä tilastollisissa operaatioissa. Mediaai ei ole herkkä poikkeaville havaioille, se o robusti keskiluku. Moodi soveltuu kaikille mitta-asteikoille, mutta se o karkea keskiluku. Se ei ole aia yksikäsitteie. Jos muuttuja jakauma o moihuippuie, kuvaa moodi usei mediaaia ja aritmeettista keskiarvoa parempi havaitoje jakaumaa. Moodi o myös robusti keskiluku. symmetrie yksihuippuie jakauma Md Mo

28 7 oikealle loiveeva jakauma Mo Md vasemmalle loiveeva jakauma Md Mo Hajotaluvut Muuttuja arvoje keskimääräistä suuruutta kuvaavat luvut eivät riitä kuvaamaa kaikkia piirteitä muuttuja-arvoje käyttäytymisestä. O myös pystyttävä kuvaamaa sitä, kuika suurta o muuttuja arvoje vaihtelu. Etropia eli satuaisuusaste mittaa sitä, kuika selvästi tai voimakkaasti havaitut muuttuja arvot keskittyvät yhtee tai vai muutamaa luokkaa. Etropia voidaa laskea kaavasta missä k k H pi log pi pi log10 pi, i1 i1 p i k = luoka E i suhteellie frekvessi = luokkie lkm. Etropia soveltuu kaikille mitta-asteikoille. Se o suurimmillaa silloi, ku eri luokkie frekvessit ovat yhtä suuret eli silloi, ku vaihtelu o suurita. Etropia arvosta o vaikeaa ähdä suoraa, kuika suuresta vaihtelusta o kyse, koska siihe vaikuttaa luokkie lukumäärä. Laskettua arvoa voidaa verrata etropia maksimiarvoo Hma log10 k.

29 8 Esim. 36 Kutie lääijakauma etropia Lääi p i log 10 p i p i log 10 p i Etelä-Suome Läsi-Suome Itä-Suome Oulu Lapi Ahveamaa Yhteesä H = ( ).36 H ma = log Vaihteluväli o pieimmä ja suurimma havaitoarvo määräämä väli ( (1), () ). Vaihteluväliä ei voi käyttää omiaaliasteikolla. Luokitellussa aieistossa vaihteluväli muodostavat esimmäise luoka pyöristetty alaraja ja viimeise luoka pyöristetty yläraja. Vaihteluväli pituus w soveltuu itervalli- ja suhdeasteiko muuttujille. Se o suurimma ja pieimmä havaitoarvo erotus eli w = () (1). Luokitellussa aieistossa se o viimeise luoka yläraja ja esimmäise luoka alaraja erotus. Vaihteluväli pituus o helppo laskea, mutta se ei ole yksistää käytettyä hyvä hajotaluku, koska se ottaa huomioo vai muuttuja äärimmäiset arvot. Esim. 37 Lääi vaihteluväliä ei voida määrittää. Esim. 38 Farkkuje myytihia vaihteluväli o (43, 135) ja vaihteluväli pituus o w = = 9. (Luokitellusta aieistosta: farkkuje hia vaihteluväli o (40, 139) ja vaihteluväli pituus 99.) Esim. 39 Opiskelijoide iä vaihteluväli o (19, 46) ja vaihteluväli pituus o 7 vuotta. Muuttuja vaihtelua voidaa kuvata kvartiilivälillä (Q 1, Q 3 ), joka ilmaisee havaitoarvoje keskipaikkeilta sellaise väli, jossa o 50 % keskimmäisistä arvoista. Kvartiiliväli pituus saadaa erotuksea Q 3 - Q 1. Kvartiilipoikkeamalla tarkoitetaa lukua Q Q Q 3 1.

30 9 Kvartiilipoikkeama o vaihteluväli pituutta vakaampi hajotaluku ja kertoo, kuika pitkällä muuttuja-arvovälillä aieisto keskellä olevat 5 % havaioista sijaitsevat. Kvartiiliväli voidaa määrätä ordiaaliasteikolliselle muuttujalle, mutta kvartiiliväli pituus ja kvartiilipoikkeama vasta itervalliasteikolla. Muuttuja-arvoje hajaatumista voidaa pelkä kvartiiliväli tarkastelu sijasta tarkastella paremmi vertailemalla kvartiiliväliä ja vaihteluväliä toisiisa. Esim. 40 Farkkuje myytihia prosetuaallise summakäyrä perusteella arvioitua Q 1 73 ja Q 3 108, jote kvartiiliväli pituus o oi 35 ja kvartiilipoikkeama Q = Esim.41 Opiskelijoide iä kvartiiliväli o (0, 5). Kvartiiliväli pituus o 5 vuotta ja kvartiilipoikkeama.5 vuotta. Käytetyimpiä hajotalukuja ovat variassi s ja keskihajota s, vaikka iide tulkita ei ole ii yksikertaista kui em. hajotaluvuilla. Variassi ja keskihajota voidaa laskea itervalli- tai suhdeasteikollisesta muuttujasta. Keskihajota o variassi positiivie eliöjuuri eli s = s. Variassi kertoo, kuika tiiviisti havaitoarvot ovat keskittyeet keskiarvo ympärille. Jos kaikki mittaustulokset ovat samoja, o s = 0, muulloi s > 0. Keskihajoassa ja variassissa muuttujie arvoje vaihtelu ilmaistaa raketeellisesti samalla tavalla. Keskihajota o kuvailussa havaiollisempi, koska sillä o sama laatu kui muuttuja arvoilla, ja se kertoo, kuika kaukaa keskimääri havaiot ovat keskiarvosta. Variassi o taas parempi teoreettisissa tarkasteluissa. Luokittelemattoma aieisto variassi voidaa laskea kaavalla s 1 i 1 i1 1 i 1 i1 i i1. Esim. 4 Opiskelijoide iä variassi ja keskihajoa lasketa: i i

31 30 s v s = v 7 v Luokitellu aieisto variassi o k k 1 1 s fi mi fimi 1 i1 1 i1 k fimi i1 missä f i m i k = luoka E i frekvessi = luoka E i luokkakeskus = luokkie lkm = havaitoje lkm Esim. 43 Farkkuje myytihia variassi ja keskihajota s s =.79 3 (Alkuperäisista havaioista tarkastelua: s = ja s = 3.4.) Variassi ja myös keskihajoa arvot riippuvat muuttuja mittayksiköstä. Jos muuttujalle tehdää lieaarie muuos y = a + b, ii s y = b s ja sy = b s. Esim. 44 Pituus o mitattu tuumia ja : variassi o 5. Jos pituus mitataa cm:ä eli :lle tehdää muuos y =.54, ii y: variassi s y =.54.5 = Keskiarvoa ja keskihajotaa voidaa hyödytää esimerkiksi muuttuja havaitoarvoje stadardoiissa:

32 31 zi i. s Stadardoitu arvo z i kertoo, kuika moe keskihajoa etäisyydellä havaitoarvo i o keskiarvosta. Stadardoiduille arvoille z i pätee aia, että iide keskiarvo z = 0 ja keskihajota s z = 1. Stadardoitu muuttuja z o pelkkä luku; se o siis riippumato alkuperäise muuttuja mittayksiköstä. Stadardoituja havaitoarvoja voidaa käyttää mm. ku eri havaitoaieistoje tilastoyksiköitä verrataa toisiisa. Esim. 45 Opiskelija osallistui tilastotietee tettii ja sai pistemääräksi 36. Hä osallistui myös talousmatematiika tettii ja sai pistemääräksi 30. Tilastotietee teti pistemäärä keskiarvo oli 9 ja keskihajota 6, talousmatematiika tetissä vastaavat luvut olivat ja 8. Opiskelija tettitulokset stadardoitua ovat z tt 1. ja z tm Opiskelija meestyi tilastotieteessä suhteellisesti paremmi. s Variaatiokerroi V o mittayksiköstä riippumato hajotaluku, jota voidaa käyttää suhdeasteikolla. Variaatiokerroi ilmaisee muuttuja suhteellise vaihtelu. Usei variaatiokerroi ilmaistaa prosettilukua, jolloi luku 100V kertoo, kuika mota % keskihajota o keskiarvosta. Variaatiokerroita käytetää vertailtaessa mittayksiköiltää erilaisia aieistoja. Esim. 46 Opiskelijoide iä variaatiokerroi V = 30 % iä keskiarvosta Iä hajota o site Esim. 47 Farkkuje myytihia variaatiokerroi V = o site 5 % hia keskiarvosta Hia hajota Huom. Käytäössä o havaittu:

33 Yksiulotteise jakauma muita tuuslukuja Jakauma sijaitia ja vaihtelua kuvaavie tuuslukuje lisäksi voidaa mitata jakauma symmetriasta poikkeamista eli vioutta sekä keskittymise terävyyttä tai tylsyyttä eli huipukkuutta. Ko. tuuslukuja määritetää yleesä itervalli- ja suhdeasteiko muuttujille. Jos muuttuja arvot ovat keskittyeet voimakkaasti alimpii luokkii, ja jakaumalla o pitkä hätä oikealle päi, saotaa muuttuja jakaumaa positiivisesti vioksti eli oikealle vioksi tai oikealle loiveevaksi. Jos taas muuttuja arvot ovat keskittyeet ylimpii luokkii, o muuttuja jakauma vasemmalle loiveeva tai vio eli egatiivisesti vio. Symmetrisessä jakaumassa keskiarvo ja mediaai ovat yhtä suuret, ja jakauma muoto oikealle ja vasemmalle keskipisteestä saadaa peilikuvaa. Frekvessijakauma vioude mitta o suure g1 1 3 i i1. 3 s Jos jakauma o täsmällee symmetrie o g 1 = 0 (esim. ormaalijakauma); jos jakauma o vasemmalle loiveeva, o g 1 < 0; jos jakauma o oikealle loiveeva, o g 1 > 0. Peukalosäätöä pidetää usei seuraavaa: symmetriseä jakaumaa pidetää jakaumaa, jolle 0.5 < g 1 < 0.5. Jakaumaa voi tutkia myös huipukkuude avulla. Huipukkuude mittaa o suure

Tilastotieteen perusteet

Tilastotieteen perusteet VAASANYLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso SISÄLLYSLUETTELO. JOHDANTO... 3.. Mitä tilastotiede o?... 3.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN... 6.. Peruskäsitteitä...

Lisätiedot

TILASTOT: johdantoa ja käsitteitä

TILASTOT: johdantoa ja käsitteitä TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se

Lisätiedot

Tilastotieteen perusteet

Tilastotieteen perusteet VAASAN YLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso SISÄLLYSLUETTELO 1. JOHDANTO... 3 1.1. Mitä tilastotiede o?... 3 1.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN...

Lisätiedot

Tunnuslukuja 27 III TUNNUSLUKUJA

Tunnuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 28 Tuuslukuja käytetää, ku tilastoaieistoa havaiollistetaa tiivistetysti yksittäisillä luvuilla. Tuusluvut lasketaa muuttujie arvoje perusteella ja e kuvaavat

Lisätiedot

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä Otatajakauma kuvaa tarkasteltava parametri jakauma eri otoksista laskettua parametria o joki yleesä tuusluku, esim. keskiarvo, suhteellie osuus, riskisuhde, korrelaatiokerroi, regressiokerroi, je. parametria

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mitä tilastotiede o? Mat-.04 Tilastollise aalyysi perusteet, kevät 007. lueto: Johdato Tilastotiede kehittää ja soveltaa meetelmiä: reaalimaailma ilmiöistä johtopäätökset ilmiöitä kuvaavie tietoje perusteella

Lisätiedot

Otantajakauman käyttö päättelyssä

Otantajakauman käyttö päättelyssä Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (004) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo otosjakauma Otosvariassi otosjakauma

Lisätiedot

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme? TKK (c) Ilkka Melli (004) Tilastolliste aieistoje kuvaamie Tuusluvut Laatueroasteikolliste muuttujie tuusluvut Johdatus tilastotieteesee Tilastolliste aieistoje kuvaamie TKK (c) Ilkka Melli (004) Tilastolliste

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa : Otokset, otosjakaumat ja estimoiti Otokset ja otosjakaumat TKK (c) Ilkka Melli (007) 1 Otokset ja otosjakaumat >> Satuaisotata ja satuaisotokset Otostuusluvut

Lisätiedot

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla. Kombiatoriikka, kesä 2010 Harjoitus 2 Ratkaisuehdotuksia (RT) (5 sivua) Käytä tehtävissä 1-3 kombiatorista päättelyä. 1. Osoita, että kaikilla 0 b a pätee ( ) a a ( ) k 1 b b 1 kb Biomikertoime määritelmä

Lisätiedot

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut Mat-2.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Kaksiulotteie ormaalijakauma Mitta-asteikot Havaitoaieisto kuvaamie ja otostuusluvut Avaisaat: Ehdollie jakauma, Ehdollie odotusarvo, Ehdollie variassi,

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (005) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo ja otosvariassi otosjakaumat

Lisätiedot

3.2 Sijaintiluvut. MAB5: Tunnusluvut

3.2 Sijaintiluvut. MAB5: Tunnusluvut MAB5: Tuusluvut 3.2 Sijaitiluvut Sijaitiluvut ovat imesä mukaiset: e etsivät muuttuja tyypillise arvo, jos sellaie o olemassa, tai aiaki luvu, joka lähellä muuttuja arvoja o eite. Sijaitiluvut jaetaa kahtee

Lisätiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot TKK (c Ilkka Melli (004 Johdatus tilastotieteesee TKK (c Ilkka Melli (004 : Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikolliste muuttujie testejä: ja merkkitesti parivertailuille

Lisätiedot

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa. Testimuuttuja kriittie arvo 5 %: merkitsevyystasolla katsotaa taulukosta. Kriittie arvo o 9,488. Koska laskettu arvo 4,35 o pieempi kui taulukosta saatu kriittie arvo 9,488, ii ollahypoteesi jää voimaa.

Lisätiedot

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ). HY / Matematiika ja tilastotietee laitos Tilastollie päättely II, kevät 018 Harjoitus 5B Ratkaisuehdotuksia Tehtäväsarja I 1. (Jatkoa Harjoitus 5A tehtävää ). Moistee esimerki 3.3.3. mukaa momettimeetelmä

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme? TKK (c) Ilkka Melli (4) Johdato Johdatus todeäköisyyslasketaa TKK (c) Ilkka Melli (4) : Mitä opimme? / Tutustumme tässä luvussa seuraavii ormaalijakaumasta (ks. lukua Jatkuvia jakaumia) johdettuihi jakaumii:

Lisätiedot

Tilastollinen todennäköisyys

Tilastollinen todennäköisyys Tilastollie todeäköisyys TOD.NÄK JA TILASTOT, MAA10 Klassisessa todeäköisyydessä oli ehdot: äärellisyys ja symmetrisyys. Tämä tilae o usei mahdoto ts. alkeistapauksia o usei ääretö määrä tai e eivät ole

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla. Kvatitatiivie metodologia verkossa Moitasomallius Pekka Ratae Helsigi yliopisto isältö Moitasomallit Matemaattisia peruskäsitteitä Esimerkki kovariassista Otatavirhe Esimerkki elittävie muuttujie lisäämie

Lisätiedot

8. laskuharjoituskierros, vko 11, ratkaisut

8. laskuharjoituskierros, vko 11, ratkaisut Mat-2.091 Sovellettu todeäköisyyslasku, kevät -05 Heliövaara, Palo, Melli 8. laskuharjoituskierros, vko 11, ratkaisut D1. Oletetaa, että havaiot X i, i = 1, 2,..., 100 muodostavat yksikertaise satuaisotokse

Lisätiedot

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489 Perusjoukko ja otos Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Havaitoyksikkö o empiirise mittaukse kohde Perusjoukko o kaikkie havaitoyksiköide muodostama kokoaisuus Otos o perusjoukkoa

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

****************************************************************** ****************************************************************** 7 Esim.

****************************************************************** ****************************************************************** 7 Esim. 8.3. Kombiaatiot MÄÄRITELMÄ 6 Merkitä k, joka luetaa yli k:, tarkoittaa lause- ketta k = k! ( k)! 6 3 2 1 6 Esim. 1 3 3! = = = = 3! ( 3)! 3 2 1 3 2 1 3 2 1 Laskimesta löydät äppäime, jolla kertomia voi

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todeäköisyyslaskea ja tilastotietee peruskurssi 4A Satuaisotata ja parametrie estimoiti Lasse Leskelä Matematiika ja systeemiaalyysi laitos Perustieteide korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

4.3 Signaalin autokorrelaatio

4.3 Signaalin autokorrelaatio 5 4.3 Sigaali autokorrelaatio Sigaali autokorrelaatio kertoo kuika paljo sigaali eri illä korreloi itsesä kassa (josta imiki). Se o Fourier-muuokse ohella yksi käyttökelpoisimmista sigaalie aalysoitimeetelmistä.

Lisätiedot

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164 86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna

Lisätiedot

Tilastolliset menetelmät: Johdanto

Tilastolliset menetelmät: Johdanto Johdato Tilastolliset meetelmät: Johdato. Tilastotiede tieteealaa. Tilastolliste aieistoje keräämie ja mittaamie 3. Tilastolliste aieistoje kuvaamie Ilkka Melli Johdato Ilkka Melli Johdato Sisällys. TILASTOTIEDE

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

Mat-2.090 Sovellettu todennäköisyyslasku A

Mat-2.090 Sovellettu todennäköisyyslasku A Mat-.090 Sovellettu todeäköiyylaku A Mat-.090 Sovellettu todeäköiyylaku A / Ratkaiut Aiheet: Avaiaat: Tilatollite aieito keräämie ja mittaamie Tilatollite aieitoje kuvaamie Oto ja otojakaumat Aritmeettie

Lisätiedot

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3 LIITTEET... 2 Liite A Stirligi kaava tarkkuudesta...2 Liite B Lagrage kertoimet... 2 Liitteet Liitteet Liite A Stirligi kaava tarkkuudesta Luoollista logaritmia suureesta! approksimoidaa usei Stirligi

Lisätiedot

Tilastolliset menetelmät: Tilastolliset testit

Tilastolliset menetelmät: Tilastolliset testit Tilastolliset meetelmät Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille.

Lisätiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot TKK (c) Ilkka Melli (4) Testit suhdeasteikollisille muuttujille Johdatus tilastotieteesee Testit suhdeasteikollisille muuttujille Testit ormaalikauma parametreille Yhde otokse t-testi Kahde otokse t-testi

Lisätiedot

MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai

MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai MATP53 Approbatur B Harjoitus, ratkaisut Maaatai..05. (Lämmittelytehtävä.) Oletetaa, että op = 7 tutia työtä. Kuika mota tutia Oili Opiskelija työsketelee itseäisesti kurssilla, joka laajuus o 4 op, ku

Lisätiedot

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen T-1.1 Datasta tietoo, syksy 5 Laskuharjoitus.1., ratkaisuja Joui Seppäe 1. Simuloidaa tasoittaista algoritmia. Esimmäisessä vaiheessa ehdokkaia ovat kaikki yhde muuttuja joukot {a}, {b}, {c} ja {d}. Aaltosulkeide

Lisätiedot

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen. 10 Kertolaskusäätö Kahta tapahtumaa tai satuaisilmiötä saotaa riippumattomiksi, jos toise tulos ei millää tavalla vaikuta toisee. Esim. 1 A = (Heitetää oppaa kerra) ja B = (vedetää yksi kortti pakasta).

Lisätiedot

Tilastolliset menetelmät: Johdanto

Tilastolliset menetelmät: Johdanto Tilastolliset meetelmät Johdato Tilastolliset meetelmät: Johdato. Tilastotiede tieteealaa. Tilastolliste aieistoje keräämie ja mittaamie 3. Tilastolliste aieistoje kuvaamie TKK @ Ilkka Melli (006) Tilastolliset

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

Tehtävä 1. Riku Eskelinen DEMOVASTAUKSET Demokerta 3/ vk 15 Tilastomenetelmien peruskurssi TILP150 Tulostuspv Sivu 1/6

Tehtävä 1. Riku Eskelinen DEMOVASTAUKSET Demokerta 3/ vk 15 Tilastomenetelmien peruskurssi TILP150 Tulostuspv Sivu 1/6 Riku Eskelie DEMOVASTAUKSET Demokerta 3/ vk 15 Tilastomeetelmie peruskurssi TILP150 Tulostuspv 05.04.013 Sivu 1/6 Tehtävä 1 Muuttuja MATPIT o luokitteluasteikollie. Muuttuja OPPMIN o järjestysasteikollie.

Lisätiedot

RATKAISUT x 2 3 = x 2 + 2x + 1, eli 2x 2 2x 4 = 0, joka on yhtäpitävä yhtälön x 2 x 2 = 0. Toisen asteen yhtälön ratkaisukaavalla saadaan

RATKAISUT x 2 3 = x 2 + 2x + 1, eli 2x 2 2x 4 = 0, joka on yhtäpitävä yhtälön x 2 x 2 = 0. Toisen asteen yhtälön ratkaisukaavalla saadaan RATKAISUT 8 17 8 a) Paraabelie y x ja y x + x + 1 leikkauspisteet saadaa määritettyä, ku esi ratkaistaa yhtälö x x + x + 1, eli x x, joka o yhtäpitävä yhtälö x x. Toise astee yhtälö ratkaisukaavalla saadaa

Lisätiedot

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus: 1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:

Lisätiedot

Kertaa tarvittaessa induktiota ja rekursiota koskevia tietoja.

Kertaa tarvittaessa induktiota ja rekursiota koskevia tietoja. MATEMATIIKAN JA TILASTOTIETEEN LAITOS Aalyysi I Harjoitus 5. 0. 2009 alkavalle viikolle Ratkaisuehdotuksia ( sivua) (Rami Luisto) Laskuharjoituksista saa pistettä, jos laskettu vähitää 50 tehtävää; 3 pistettä,

Lisätiedot

Ryhmän osajoukon generoima aliryhmä ja vapaat ryhmät

Ryhmän osajoukon generoima aliryhmä ja vapaat ryhmät Ryhmä osajouko geeroima aliryhmä ja vapaat ryhmät LuK-tutkielma Joose Heioe Matemaattiste tieteide tutkito-ohjelma Oulu yliopisto Kevät 2017 Sisältö Johdato 2 1 Ryhmät ja aliryhmät 2 1.1 Ryhmä.................................

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiika tukikurssi Kurssikerta 3 1 Lisää iduktiota Jatketaa iduktio tarkastelua esimerki avulla. Yritetää löytää kaava : esimmäise (positiivise) parittoma luvu summalle eli summalle 1 + 3 + 5 + 7 +...

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiika tukikurssi Kurssikerta 1 Iduktiotodistus Iduktiotodistukse logiikka Tutkitaa tapausta, jossa haluamme todistaa joki väittee P() site, että se pätee kaikilla luoollisissa luvuilla. Eli halutaa

Lisätiedot

3 Lukujonot matemaattisena mallina

3 Lukujonot matemaattisena mallina 3 Lukujoot matemaattisea mallia 3. Aritmeettie ja geometrie joo 64. a) Lukujoo o aritmeettie joo, joka yleie jäse o a 3 ( ) 4 34 4 4 b) Lukujoo o geometrie joo, joka yleie jäse o c) Lukujoo o geometrie

Lisätiedot

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko Moimuuttujameetelmät Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Mikko Mattila 009 1 Yhde muuttuja meetelmät (uivariate statistics): keskiluvut ja hajotaluvut Moimuuttujameetelmät:

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

2.3.1. Aritmeettinen jono

2.3.1. Aritmeettinen jono .3.1. Aritmeettie joo -joo, jossa seuraava termi saadaa edellisestä lisäämällä sama luku a, a + d, a+d, a +3d, Aritmeettisessa joossa kahde peräkkäise termi erotus o aia vakio: Siis a +1 a d (vakio Joo

Lisätiedot

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua)

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua) Algebra I Matematiika ja tilastotietee laitos Ratkaisuehdotuksia harjoituksii 5 (6 sivua) 14.2. 17.2.2011 1. Määritellää kuvaus f : S 3 S 3, f(α) = (123) α. Osoita, että f o bijektio. Mikä o se kääteiskuvaukse

Lisätiedot

Äärettämän sarjan (tai vain sarjan) sanotaan suppenevan eli konvergoivan, jos raja-arvo lims

Äärettämän sarjan (tai vain sarjan) sanotaan suppenevan eli konvergoivan, jos raja-arvo lims 75 4 POTENSSISARJOJA 4.1 ÄÄRETTÖMÄT SARJAT Lukujoo { a k } summaa S a a a a a k 0 1 k k0 saotaa äärettömäksi sarjaksi. Summa o s. osasumma. S a a a a a k 0 1 k0 Äärettämä sarja (tai vai sarja) saotaa suppeeva

Lisätiedot

811312A Tietorakenteet ja algoritmit , Harjoitus 1 ratkaisu

811312A Tietorakenteet ja algoritmit , Harjoitus 1 ratkaisu 83A Tietoraketeet ja algoritmit 06-07, Harjoitus ratkaisu Harjoitukse aiheea o algoritmie oikeellisuus. Tehtävä. Kahvipurkkiogelma. Kahvipurkissa P o valkoisia ja mustia kahvipapuja, yhteesä vähitää kaksi

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa 2: Otokset, otosjakaumat ja estimoiti Estimoitimeetelmät TKK (c) Ilkka Melli (2007) Estimoitimeetelmät >> Todeäköisyysjakaumie parametrie estimoiti Suurimma uskottavuude

Lisätiedot

6. Kombinaatio-oppi, todennäköisyys ja tilastot

6. Kombinaatio-oppi, todennäköisyys ja tilastot 6. Kombiaatio-oppi, todeäköisyys ja tilastot 6.1 Satuaisotata takaisipaolla Poimimme 3 alkiota takaisipaolla 1 alkio perusjoukosta. Kuika mota erilaista kolme alkio osajoukkoa voimme saada? Ratkaisu. Vastaus:

Lisätiedot

Luento 7 Luotettavuus Koherentit järjestelmät

Luento 7 Luotettavuus Koherentit järjestelmät Lueto 7 Luotettavuus Koheretit järjestelmät Ja-Erik Holmberg Systeemiaalyysi laboratorio Aalto-yliopisto perustieteide korkeakoulu PL 00, 00076 Aalto ja-erik.holmberg@riskpilot.fi Määritelmä Tarkasteltava

Lisätiedot

Sormenjälkimenetelmät

Sormenjälkimenetelmät Sormejälkimeetelmät Matti Risteli mristeli@iksula.hut.fi Semiaariesitelmä 23.4.2008 T-106.5800 Satuaisalgoritmit Tietotekiika laitos Tekillie korkeakoulu Tiivistelmä Sormejälkimeetelmät ovat satuaisuutta

Lisätiedot

Tehtäviä neliöiden ei-negatiivisuudesta

Tehtäviä neliöiden ei-negatiivisuudesta Tehtäviä epäyhtälöistä Tehtäviä eliöide ei-egatiivisuudesta. Olkoo a R. Osoita, että 4a 4a. Ratkaisu. 4a 4a a) a 0 a ) 0.. Olkoot a,, R. Osoita, että a a a. Ratkaisu. Kerrotaa molemmat puolet kahdella:

Lisätiedot

Luento 6 Luotettavuus Koherentit järjestelmät

Luento 6 Luotettavuus Koherentit järjestelmät Lueto 6 Luotettavuus Koheretit järjestelmät Ja-Erik Holmberg Systeemiaalyysi laboratorio PL 00, 00076 Aalto ja-erik.holmberg@riskpilot.fi ja-erik.holmberg@aalto.fi Määritelmä Tarkasteltava yksikö luotettavuus

Lisätiedot

Vastaus: Kertymäfunktio on F( x) = x, kun 0 x 20. Todennäköisyydet ovat molemmat 1. Frekvenssi f

Vastaus: Kertymäfunktio on F( x) = x, kun 0 x 20. Todennäköisyydet ovat molemmat 1. Frekvenssi f 0, ku x < 0 Vastaus: Kertymäfuktio o F( x) = x, ku 0 x 0 0, ku x > 0 Todeäköisyydet ovat molemmat 0. Laudatur MAA ratkaisut kertausharjoituksii Tilastoje esittämie 3. a) Tietty kasvi b) Kukkie lukumäärä

Lisätiedot

Eräs matematiikassa paljon hyödynnetty summa on ns. luonnollisten lukujen neliöiden summa n.

Eräs matematiikassa paljon hyödynnetty summa on ns. luonnollisten lukujen neliöiden summa n. POHDIN projekti Neliöide summa Lukujoo : esimmäise jäsee summa kirjoitetaa tavallisesti muotoo S ai i 1. Aritmeettisesta lukujoosta ja geometrisesta lukujoosta muodostetut summat voidaa johtaa varsi helposti.

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat: Mat-.090 Sovellettu todeäköisyyslasku A Mat-.090 Sovellettu todeäköisyyslasku A / Ratkaisut Aiheet: Avaisaat: Otos- ja otosjakaumat Estimoiti Estimoitimeetelmät Väliestimoiti Aritmeettie keskiarvo, Beroulli-jakauma,

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II Otokset MS-A050 Todeäköisyyslaskea ja tilastotietee peruskurssi Lueot, osa II Kaksi hyödyllista jakaumaa 3 Estimoiti G. Gripeberg 4 Luottamusvälit Aalto-yliopisto. helmikuuta 05 5 Hypoteesie testaus 6

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

2. Mittaus ja data 2.1. Johdanto. 2.2. Mittaustyypit

2. Mittaus ja data 2.1. Johdanto. 2.2. Mittaustyypit 2. Mittaus ja data 2.. Johdato Voidaksemme keksiä tosimaailma relaatioita tarkastelemme sitä kuvaavaa dataa, jote esiksi selvitämme, mitä data perimmiltää o. Data kerätää kuvaamalla mielekiitoaluee oliot

Lisätiedot

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Estimoitimeetelmät TKK (c) Ilkka Melli (2005) 1 Estimoitimeetelmät Todeäköisyysjakaumie parametrie estimoiti Momettimeetelmä Normaalijakauma parametrie estimoiti Ekspoettijakauma

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude

Lisätiedot

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33.

Til.yks. x y z 1 2 1 20.3 2 2 1 23.5 9 2 1 4.7 10 2 2 6.2 11 2 2 15.6 17 2 2 23.4 18 1 1 12.5 19 1 1 7.8 24 1 1 9.4 25 1 2 28.1 26 1 2-6.2 33 1 2 33. Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

2-suuntainen vaihtoehtoinen hypoteesi

2-suuntainen vaihtoehtoinen hypoteesi Mat-.6 Sovellettu todeäköisyyslasketa. harjoitukset Mat-.6 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Tilastolliset testit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, F-jakauma,

Lisätiedot

Diskreetin Matematiikan Paja Ratkaisuja viikolle 4. ( ) Jeremias Berg. n(n + 1) 2. k =

Diskreetin Matematiikan Paja Ratkaisuja viikolle 4. ( ) Jeremias Berg. n(n + 1) 2. k = Diskreeti Matematiika Paja Ratkaisuja viikolle 4. (7.4-8.4) Jeremias Berg. Osoita iduktiolla että k = ( + ) Ratkaisu: Kute kaikissa iduktiotodistuksissa meidä täytyy siis osoittaa asiaa. Ns. perustapaus,

Lisätiedot

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1 35 Naiivi Bayes Luokkamuuttua C o Bayes-verko uuri a attribuutit X i ovat se lehtiä Naiivi oletus o, että attribuutit ovat ehdollisesti riippumattomia toisistaa aettua luokka Ku käytössä o Boole muuttuat,

Lisätiedot

811312A Tietorakenteet ja algoritmit, , Harjoitus 4, Ratkaisu

811312A Tietorakenteet ja algoritmit, , Harjoitus 4, Ratkaisu 81112A Tietoraketeet ja algoritmit, 217-218, Harjoitus 4, Ratkaisu Harjoitukse aiheita ovat algoritmie aikakompleksisuus ja lajittelualgoritmit Tehtävä 4.1 Selvitä seuraavie rekursioyhtälöide ratkaisuje

Lisätiedot

Markov-ketjun hetkittäinen käyttäytyminen

Markov-ketjun hetkittäinen käyttäytyminen Matematiika ja systeemiaalyysi laitos 1B Markov-ketju hetkittäie käyttäytymie Tämä harjoitukse tavoitteea o oppia muodostamaa Markov-malleja satuaisilmiöille, piirtämää tiettyä siirtymämatriisia vastaava

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvatitatiiviset meetelmät Pieryhmii ilmoittautumie alkaa ke.. klo 9.00 Ryhmä 1: Jussi Kiue: Esimmäie kokootumie to 4.. klo 14-16, paikka päärak aud IV SPSS-harjoitukset: ti.3. klo 11-13 ja to 7.4. klo

Lisätiedot

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011 Kuvioita, taulukoita ja tunnuslukuja Aki Taanila 2.2.2011 1 Tilastokuviot Pylväs Piirakka Viiva Hajonta 2 Kuviossa huomioitavia asioita 1 Kuviolla tulee olla tarkoitus ja tehtävä (minkä tiedon haluat välittää

Lisätiedot

1 TILASTOMATEMATIIKKA... 2 2 TILASTOTIETEEN PERUSKÄSITTEITÄ... 3 3 MUUTTUJAT... 6 4 FREKVENSSIJAKAUMA... 8 5 AINEISTON LUOKITTELU...

1 TILASTOMATEMATIIKKA... 2 2 TILASTOTIETEEN PERUSKÄSITTEITÄ... 3 3 MUUTTUJAT... 6 4 FREKVENSSIJAKAUMA... 8 5 AINEISTON LUOKITTELU... SISÄLLYSLUETTELO 1 TILASTOMATEMATIIKKA... 2 1.1 JOHDANTO... 2 1.2 LINKKEJÄ... 2 1.3 LÄHTEET... 2 2 TILASTOTIETEEN PERUSKÄSITTEITÄ... 3 2.1 HAVAINTOAINEISTO... 3 2.2 POPULAATIO... 3 2.3 OTOS... 3 2.4 HAVAINTOAINEISTON

Lisätiedot

KERTAUSHARJOITUKSIA. Tilastojen esittäminen. 212. a) 15-19 vuotiaita tyttöjä 156 377 Koko väestö 5 219 732 156 277 Näiden tyttöjen osuus

KERTAUSHARJOITUKSIA. Tilastojen esittäminen. 212. a) 15-19 vuotiaita tyttöjä 156 377 Koko väestö 5 219 732 156 277 Näiden tyttöjen osuus KERTAUSHARJOITUKSIA Tilastoje esittämie. a) -9 vuotiaita tyttöjä 377 Koko väestö 9 73 77 Näide tyttöje osuus 3, 0 % 9 73 b) Pojat ja tytöt: 3 377 + 77 = 39 4 39 4 Osuus koko väestöstä, % 9 73 c) Ikäluokka

Lisätiedot

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia. HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy 08 Harjoitus 3 Ratkaisuehdotuksia Tehtäväsarja I Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var

Lisätiedot

Matematiikan tukikurssi. Kertausta 1. välikokeeseen. Tehtävät

Matematiikan tukikurssi. Kertausta 1. välikokeeseen. Tehtävät Matematiika tukikurssi Kertausta. välikokeesee Tehtävät Algebraa Tämä kappale sisältää rusaasti harjoitustehtäviä. Suurimpaa osaa tehtävistä löytyy ratkaisut lopusta. Syyä rusaasee tehtävämäärää o, että

Lisätiedot

Harjoitukset 1 : Tilastokertaus

Harjoitukset 1 : Tilastokertaus 31C99904, Capstoe: Ekoometria ja data-aalyysi TA : markku.siikae(a)aalto.fi & tuuli.vahapelto(a)aalto.fi Harjoitukset 1 : Tilastokertaus (Palautus 10.1.2017) Palautellaa mielii hiema tilasto-oppia ja todeäköisyyslasketaa.

Lisätiedot

SMG-4200 Sähkömagneettisten järjestelmien lämmönsiirto Ehdotukset harjoituksen 6 ratkaisuiksi

SMG-4200 Sähkömagneettisten järjestelmien lämmönsiirto Ehdotukset harjoituksen 6 ratkaisuiksi SMG-400 Sähkömageettiste järjestelmie lämmösiirto Ehdotukset harjoitukse 6 ratkaisuiksi Tarkastellaa suljetu järjestelmä tehotasaaioa joka o P + P P = P i g out st Oletetaa että verkotetussa alueessa jossa

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiika tukikurssi Kertauslueto. välikokeesee Algebraa Tämäkertaie kurssimoiste sisältää rusaasti harjoitustehtäviä. Syyä tähä o se, että matematiikkaa oppii parhaite itse tekemällä ja laskemalla.

Lisätiedot

1 Eksponenttifunktion määritelmä

1 Eksponenttifunktion määritelmä Ekspoettifuktio määritelmä Selvitimme aikaisemmi tällä kurssilla, millaie potessisarja säilyy derivoiissa muuttumattomaa. Se perusteella määritellää: Määritelmä. Ekspoettifuktio exp : R R määritellää lausekkeella

Lisätiedot

EX1 EX 2 EX =

EX1 EX 2 EX = HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var X,

Lisätiedot

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 18.9.2018/1 MTTTP1, luento 18.9.2018 KERTAUSTA Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4 pyöristetyt todelliset luokka- frekvenssi luokkarajat luokkarajat keskus 42 52 41,5

Lisätiedot

Epäyhtälöoppia matematiikkaolympialaisten tehtäviin

Epäyhtälöoppia matematiikkaolympialaisten tehtäviin Epäyhtälöoppia matematiikkaolympialaiste tehtävii Jari Lappalaie ja Ae-Maria Ervall-Hytöe 0 Johdato Epäyhtälöitä reaaliluvuille Cauchy epäyhtälö Kaikille reaaliluvuille a, a,, a ja b, b,, b pätee Cauchy

Lisätiedot

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin yliopisto Harjoitus 3, ratkaisuehdotuksia

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin yliopisto Harjoitus 3, ratkaisuehdotuksia Todeäköisyyslasketa I, kesä 207 Helsigi yliopisto/avoi yliopisto Harjoitus 3, ratkaisuehdotuksia. Aikaisemma viiko teemaa. Edessäsi o kaksi laatikkoa A ja B. Laatikossa A o 8 palloa, joista puolet valkoisia.

Lisätiedot

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää? Seuraavassa muutamia lisätehtäviä 1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 003: 5, 3, 16, 9, 0, 1, 3,, 19, 5, 19, 11,, 0, 4, 6, 1, 15, 4, 0,, 4,

Lisätiedot

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO 8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet

Lisätiedot

3 Mittaamisen taso ja tilaston keskiluvut

3 Mittaamisen taso ja tilaston keskiluvut 3 Mittaamisen taso ja tilaston keskiluvut Tämä tutkimus on sellainen, että (jos nyt jänisten laskua voidaan mittaamiseksi kutsua) mittaamisessa on eroteltavissa neljä erilaista mittaamisen tasoa, mittausasteikkoa.

Lisätiedot

1. osa, ks. Solmu 2/ Kahden positiivisen luvun harmoninen, geometrinen, aritmeettinen ja + 1 u v 2 1

1. osa, ks. Solmu 2/ Kahden positiivisen luvun harmoninen, geometrinen, aritmeettinen ja + 1 u v 2 1 Epäyhtälötehtävie ratkaisuja. osa, ks. Solmu 2/200. Kahde positiivise luvu harmoie, geometrie, aritmeettie ja kotraharmoie keskiarvo määritellää yhtälöillä H = 2 +, G = uv, A = u + v 2 u v ja C = u2 +

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit Mat-.09 Sovellettu todeäköisyyslasku Mat-.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Estimoiti Luottamusvälit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Estimaattori, Estimoiti, Frekvessi,

Lisätiedot

Tehtävä 1. Voidaanko seuraavat luvut esittää kahden neliön summina? Jos voidaan, niin kuinka monella eri tavalla? (i) n = 145 (ii) n = 770.

Tehtävä 1. Voidaanko seuraavat luvut esittää kahden neliön summina? Jos voidaan, niin kuinka monella eri tavalla? (i) n = 145 (ii) n = 770. JOHDATUS LUKUTEORIAAN (syksy 07) HARJOITUS 0, MALLIRATKAISUT Tehtävä. Voidaako seuraavat luvut esittää kahde eliö summia? Jos voidaa, ii kuika moella eri tavalla? (i) = 45 (ii) = 770. Ratkaisu. (i) Jaetaa

Lisätiedot

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat: Mat-.04 Tilastollise aalyysi perusteet / Ratkaisut Aiheet: Avaisaat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahde riippumattoma otokse t-testit, Nollahypoteesi, p-arvo, Päätössäätö, Testi,

Lisätiedot