Harjoituksia. MAB5: Tilastotieteen lähtökohdat

Koko: px
Aloita esitys sivulta:

Download "Harjoituksia. MAB5: Tilastotieteen lähtökohdat"

Transkriptio

1 MAB5: Tilastotieteen lähtökohdat Harjoituksia Ulkolämpömittari näytti eilen 10 C ja tänään 20 C. Onko tänään kaksi kertaa niin kylmä kuin eilen? Miksi tai miksi ei? : Celsius asteikon nollapiste on mielivaltaisesti valittu eikä edes mittaa kylmyyttä vaan lämpötilaa. Veden jäätymispisteellä on merkitystä lähinnä vain ihmisten kannalta. Se ei ole luonnollinen nollapiste. Ei siis ole kaksi kertaa niin kylmä. Voithan toki sanoa, että tämän päivän astemäärä on kaksi kertaa eilinen astemäärä. Minkä luokkien muuttujia ovat paino, kengännumero, kuukausipalkka, polkupyörän väri ja kaupan myyjän ammattitaito? : suhdelukuasteikko, järjestysasteikko, suhdelukuasteikko, laatueroasteikko ja järjestysasteikko. Määrittele seuraaville arvosanoille järjestys eli tee niistä järjestysasteikon muuttujia. Kaikki aakkoset Kirjaimet L, E, M, C, B, A ja i. : Aakkosjärjestys tai käänteinen. Katso myös b kohdan vastauksen kommenttia. A, B, C, E, i, L, M eli aakkosjärjestykseen tai käänteiseen aakkosjärjestykseen. Oikeastaan voit määritellä järjestyksen ihan mielivaltaisesti ja pitäytyä siinä, mutta saatat kohdata vaikeuksia yrittäessäsi saada muut ymmärtämään! Millaisia asioita kysyisit asiakastyytyväisyyskyselyssä? Esitä kolme tai neljä mahdollisuutta. Mieti, miten muotoilet kysymyksesi. Minkä luokkien muuttujia ne ovat? : Kuinka usein asioit liikkeessämme? Tee luettelo vaihtoehdoista ajattelemasi liikkeen toimialan mukaan: käyntien satunnaisuus contra säännöllisyys. Palvellaanko sinua riittävän nopeasti contra liian innokkaasti? Laati luettelo vastausvaihtoehdoista. Ottavatko myyjät vaarin sinun mielipiteestäsi? Tähän taas vaihtoehdot, jotka kattavat asteikon täysi välinpitämättömyys ripeä vastine. Kaikki muuttujat ovat järjestys- eli ordinaaliasteikon muuttujia. Juniorikerho kokoontuu. Tarkoituksesi on selvittää kerhosta seuraavat seikat: jäsenen ikä, sukupuoli, suosikkibändi, lempiväri, kuukausirahan suuruus, jäsenen kerhossa käymisen aktiivisuus, mielipide jäsenmaksun suuruudesta, kunkin jäsenen sitoutuminen kerhon arvoihin, jäsenen käytännön henkilökohtainen asenne ilmastonlämpenemiseen eli mitä itse teet sekä vielä kerhon jäsenmäärä. Kuinka kattavaan tietoon voit korkeintaan pyrkiä? Minkä otantamenetelmän valitset? Miten keräät tiedot? Mitkä kysymykset ainakin esität? : Juniorikerho voi hyvinkin olla niin pieni, että kaikkien tiedot on mahdollista saada, jolloin sinulla on kokonaisaineisto. Jos kyseessä olisi rekisteröity yhdistys, laki suorastaan vaateisi täydellisen jäsenluettelon olemassaoloa. Ikä:

2 Voi olla, että kirjaimellisen iän sijasta on järkevämpää tallentaa syntymäaika. Tämä saattaa olla tarkka syntymäaika. Usein syntymäaika kirjataan vaan merkkijonona eikä muuna tulkita. Tällöin se jää meidän asteikkomme ulkopuolelle. Jos käytät taulukkolaskentaohjelmaa kerhon jäsenrekisterin ylläpitoon, voit tehdä syntymäajasta päivämääräkentän. Taulukkolaskentaohjelman päivämääräkenttiä voi vähentää toisistaan, mutta ei laskea yhteen. Ne voidaan myös laittaa aikajärjestykseen. Tällöin kyseessä on välimatka-asteikon muuttuja. Kerhossa käymisen aktiivisuus: Oletetaan, että kerho kokoontuu normaalisti kerran viikossa. Silloin voit kysyä jäsenen mukanaolon aktiivisuutta luettelemalla vaihtoehtoja, joista vastaa valitsee yhden: joka viikko, joka toinen viikko, korkeintaan kerran kuussa, ole eka kertaa. Tämä on ordinaaliasteikon muuttuja. Mielipide jäsenmaksun suuruudesta: Myös tämä on luontevasti ordinaaliasteikon muuttuja. Jäsenen sitoutuminen kerhon arvoihin: Tämäkin on ordinaaliasteikon muuttuja. Jos juniorit ovat kovin nuoria, heillä ei ehkä ole omaa, perusteltua mielipidettä. Vastaajan ikä täytyy ottaa huomioon kyselyä laadittaessa. Käytännön henkilökohtainen asenne ilmastonlämpenemiseen eli mitä itse teet: Nuorille aikuisille sopiva kysymys. Nominaaliasteikon muuttuja. Kerhon jäsenmäärä tulee automaattisesti tietoon, jos kysely on kattava, kuten sopii olettaa. Tiedot hankitaan kyselemällä joko niin, että jäsen itse täyttää tai kyselijä auttaa. Tiedonhankintatapa valitaan vastaajien iän mukaan. Miten keräisit tiedot seuraavia tutkimuksia varten? Oman työpaikkasi henkilökunnan palkat. Jos et ole palkkatyössä, kuvittele jokin työpaikka. : Arkaluontoinen aihe monen mielestä! Kuitenkin ammattiliittoa varten tämä tieto saatetaan kerätä ja silloin sen on useampi halukas antamaan kuin muuten vaan tilastoa varten. Tieto on varauduttava keräämään niin, että yksityisen henkilön palkkatiedot eivät tule julki. Siis kirjallinen, anonyymi eli nimetön kysely. Edellyttää käytännössä lomakkeen täyttämistä ja palauttamista nimettömästi. Jonkin sinulle ennestään tuntemattoman yrityksen tai laitoksen henkilökunnan palkat. : Nimetön kysely. Yksittäisen vastaajan henkilöllisyys ei saa missään vaiheessa olla yhdistettävissä mihinkään vastaukseen. Viikon jokaisen keskipäivän keskilämpötila vuoden ajalta. : Jos valmista tilastoa asiasta ei ole, sinun on perustettava mittausasema! Jos kyseessä on viime vuoden hyvin paikalliset tiedot, peli saattaa jo olla menetetty. Ovatko naulatehtaan kahden tuuman naulat todella keskimäärin kaksi tuumaa pitkät? Varmaa on, että joka ikinen naula ei ole tasan kaksi tuumaa pitkä. : Tehdas tuottaa nauloja kappalemääräisesti sellaista tahtia, että laadunvalvonta käyttää systemaattista otantaa ja tämän lisäksi satunnaisotantaa. Systemaattisen otannan periaatteellinen heikkous on siinä, nauloja leikkaava kone saattaa tehdä systemaattisesti viallisia nauloja. Jos tuo systemaattisuus osuus sinun otantasi kanssa sopivasti yksiin, et ehkä huomaa sitä ollenkaan tai saat liian pessimistisen kuvan tuotannon laadusta. Molemmat väärät tulokset tulevat kalliiksi! Siksi kahta eri otostyyppiä.

3 Tarvitset satunnaisen, tuhannen puhelinnumeron haltijan otoksen sähköisestä puhelinluettelosta. : Yksi mahdollisuus on arpoa lähtökohta ja ottaa siitä joka kymmenes kunnes tuhat on kasassa. Mieti itse vielä menetelmä, jonka avulla voit arpoa tuhat satunnaista nimeä luettelosta ilman mitään systemaattisuutta. Kumpi kahdesta limonadista on jossakin valitsemassasi yhdessä ostoskeskuksessa kävijöiden mielestä raikkaamman makuinen. Onko tämä sama kysymys kuin kummasta hän tykkää enemmän? : Mene ao. ostoskeskuksen sisäänkäynnin luo ja kysy. Laita jokainen vastaus muistiin ja laske jälkeenpäin, kuinka moni äänesti tyhjää ja monta ääntä kukin juoma sai. Ihminen, joka tykkää tumman, pehmeän makuisista juomista ei välttämättä pidä juoman raikkautta sen maun mittarina. Frekvenssijakaumien harjoituksia Olet mitannut hippihyppiäispopulaation täysikasvuisten yksilöitten pituudet. Tulokset ovat oheisessa taulukossa. Yksilö Pituus [cm] Järjestä hippihyppiäiset tietokoneella kasvavaan pituusjärjestykseen. Jaa hippihyppiäiset sentin pituisiin luokkiin. Laske kunkin luokan frekvenssi, summafrekvenssi, suhteellinen frekvenssi ja suhteellinen summafrekvenssi. Kuinka moni hippihyppiäinen on pitempi kuin 9,5 cm absoluuttisesti sekä suhteellisesti? Käytä tässä työssä tietokoneen lisäksi laskinta sen mukaan, kuinka laskimesi sopii kuhunkin tehtävään. : Kasvava pituusjärjestys: Jaetaan pituudet luokkiin niin, että täydet sentit ovat luokkakeskuksia. Jako on seuraava: Pituus [cm] Yksilö Erilaiset frekvenssit ovat seuraavassa taulukossa.

4 [7,5;8,5) [8,5;9,5) [9,5;10,5) [10,5;11,5) Yli 9,5 senttisiä yksilöitä on 4 eli 40 prosenttia. Sippo heitti tikkaa viidellä tikalla pyöreään tauluun, jonka keskellä oli valkoinen ympyrä. Jos hän osui tähän ympyrään, hän sai 10 pistettä. Kympin ympärillä oli samankeskiset kehät, joihin osunut tikka tuotti 9 1 pistettä kukin. Jokaisesta tikasta, jonka Sippo heitti ohi taulun, hän kirjasi itselleen nolla pistettä. Sippo kirjoitti muistiin kymmenen heittokierroksen pisteet. Kierros I tikka tikka tikka tikka tikka Kuinka monella kierroksella Sippo sai alle 30 pistettä? Kuinka monella tikalla Sippo sai tarkalleen 8 pistettä? Kuinka monella tikalla Sippo sai vähemmän kuin 5 pistettä? Kuinka monella tikalla Sippo sai enemmän kuin 5 pistettä? Pitäisikö kahdesta viimeksi mainitusta tikkojen määrästä tulla yhteensä 50 kappaletta? : Kysymyksiin vastaamista varten laadin taulukkoja, joita käytän tuloksia laskiessani. Kierros I tikka tikka tikka tikka tikka

5 Ensimmäisen taulukon kukin sarake päättyy sarakesummaan ja rivi summaan, joka on laskettu koko riviltä. Oikean alanurkan sinisellä reunustettu solu sisältää rivisummien ja sarakesummien summan, joka on siis 512 eli tasan kaksi kertaa kaikkien tikkojen ja kierrosten yhteistulos kuten pitää. Kahdeksan pistettä Taulukon, jonka otsikko on Kahdeksan pistettä, vasemman ylänurkan nolla tulee taulukkolaskentaohjelman ehdosta =JOS(B2=8;1;0), kun alkuperäisen datan 1. kierroksen 1. tikan tulos joka siis oli 2 on solussa B2. Muut tulokset oikean alanurkan vihreällä reunustettua ja hennommalla vihreällä taustalla olevaa mustaa 6 lukuun ottamatta on alimmaisen rivin eli keltaisen vaakaviivan alle jäävän rivin summa. Sippo sai kahdeksan pistettä siis kuudella tikalla. Alle viisi pistettä Vastaavasti taulukon, jonka otsikko on Alle viisi pistettä, vasemman ylänurkan ykkönen tulee taulukkolaskentaohjelman ehdosta =JOS(B2<5;1;0), kun alkuperäisen datan 1. kierroksen 1. tikan tulos joka siis oli 2 on solussa B2. Muut tulokset oikean alanurkan vihreällä reunustettua ja hennommalla vihreällä taustalla olevaa mustaa 22:a lukuun ottamatta on taas alimmaisen rivin eli keltaisen vaakaviivan alle jäävän rivin summa. Sippo sai alle viisi pistettä siis 22 tikalla. Vastaavalla tavalla saadaan selville, että Sippo sai yli viiden tuloksen 24 tikalla. Kahden viimeisen luvun summa on = 46 eikä siitä voi tulla 50. Kun otat summaan mukaan vielä ne tikat, joilla tulos oli tasan 5 neljä kappaletta on summa 50, kuten pitäisi. Laske harjoituksen 2 jokaisen mahdollisen pistemäärän frekvenssi ja suhteellinen frekvenssi. :

6 Tässä tehtävässä kannattaa käyttää taulukkolaskentaohjelman LASKE.JOS funktiota. Sen nimi englanninkielisessä ohjelmassa on COUNTIF. Jos heittotulokset ovat soluissa B2:K6, esimerkiksi =COUNTIF($B$2:$K$6;A10) ja =LASKE.JOS($B$2:$K$6;A10) laskevat, kuinka monta solussa A10 olevaa lukua taulukossa B2:K6 on. Huomaa, että solun A10 tietotyypin täytyy olla luku, samoin koko taulukon B2:K6 jokaisen solun. Järjestä harjoituksen 2 tulokset nousevan kierroksen numeron ja nousevan tikan numeron mukaiseen järjestykseen: toisen kierroksen 3. tikka = (2;3) ja kolmannen kierroksen toinen tikka on (3;2). Laita ne siis aikajärjestykseen. Käytä sinulle parhaiten sopivaa merkintää kunkin kierroksen ja sen kunkin tikan erottamiseksi muista. Edellä oleva on vain esimerkki. Laske sitten harjoituksen 2 summafrekvenssit ja suhteelliset summafrekvenssit. Kehittyykö Sipon heittotarkkuus? : Frekvenssit: Kierroksen numero Osuman frekvenssi Suhteelliset frekvenssit:

7 Kierroksen numero Osuman suhteellinen frekvenssi 0 25,0 % 25,0 % 0,0 % 25,0 % 25,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 1 20,0 % 20,0 % 20,0 % 20,0 % 20,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 2 66,7 % 0,0 % 33,3 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 3 20,0 % 40,0 % 20,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 20,0 % 0,0 % 4 0,0 % 0,0 % 40,0 % 0,0 % 0,0 % 20,0 % 0,0 % 20,0 % 20,0 % 0,0 % 5 0,0 % 0,0 % 0,0 % 50,0 % 25,0 % 25,0 % 0,0 % 0,0 % 0,0 % 0,0 % 6 0,0 % 0,0 % 0,0 % 25,0 % 25,0 % 25,0 % 0,0 % 0,0 % 25,0 % 0,0 % 7 0,0 % 20,0 % 0,0 % 0,0 % 0,0 % 20,0 % 20,0 % 20,0 % 0,0 % 20,0 % 8 0,0 % 0,0 % 0,0 % 0,0 % 16,7 % 16,7 % 33,3 % 0,0 % 16,7 % 16,7 % 9 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 28,6 % 28,6 % 14,3 % 28,6 % 10 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 50,0 % 0,0 % 50,0 % Suhteelliset summafrekvenssit: Kierroksen numero Osuman suhteellinen 025,0 % 50,0 % 50,0 % 75,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % summafrekvenssi 120,0 % 40,0 % 60,0 % 80,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 266,7 % 66,7 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 320,0 % 60,0 % 80,0 % 80,0 % 80,0 % 80,0 % 80,0 % 80,0 % 100,0 % 100,0 % 4 0,0 % 0,0 % 40,0 % 40,0 % 40,0 % 60,0 % 60,0 % 80,0 % 100,0 % 100,0 % 5 0,0 % 0,0 % 0,0 % 50,0 % 75,0 % 100,0 % 100,0 % 100,0 % 100,0 % 100,0 % 6 0,0 % 0,0 % 0,0 % 25,0 % 50,0 % 75,0 % 75,0 % 75,0 % 100,0 % 100,0 % 7 0,0 % 20,0 % 20,0 % 20,0 % 20,0 % 40,0 % 60,0 % 80,0 % 80,0 % 100,0 % 8 0,0 % 0,0 % 0,0 % 0,0 % 16,7 % 33,3 % 66,7 % 66,7 % 83,3 % 100,0 % 9 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 28,6 % 57,1 % 71,4 % 100,0 % 10 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 0,0 % 50,0 % 50,0 % 100,0 % Kyllä Sippo vaikuttaa oppivaiselta tikanheittäjältä, sillä huonot osumat vähenevät ja hyvät lisääntyvät turnauksen edetessä.

8 Valitse tarkoituksenmukaisin luokittelu, kun a) mitataan autojen nopeudet viidenkympin rajoitusalueella; b) tilastoidaan uimaretkellä käytettäviä kulkuvälineitä; c) tilastoit lukemiesi kirjojen sivumääriä. Viimeisessä kohdassa vaikuttimesi on, onko jokin kirjan sivumäärä sopivampi kuin muut, kun valitset vapaa-ajan lukemista. : a) Yhtä ainoaa oikeaa tarkoituksenmukaista luokittelua ei ole olemassa tässä(kään) tapauksessa. Yksi mahdollisuus on määritellä luokat Ei ylinopeutta, Lievä ylinopeus, Suuri ylinopeus ja Törkeä ylinopeus. Tarkat nopeudet, jotka ilmoitetaan kilometreinä tunnissa, riippuvat ainakin vuorokaudenajasta ja paikasta, jota tarkkaillaan. b) Luokat olkoot Aikaa on, Matka on pitkä, Tehdään retki ja Viikonlopun rantaloma. Luokkaan Aikaa on kuuluvat sitten käveleminen, hidas pyöräily ja vaikkapa hölkkä. Luokkaan Aikaa on sopivat pyöräily, kun matka ei ole ihan lyhyt ja kävely, kun kolmi-vuotias ajaa kolmipyöräisellään. Luokkaan Matka on pitkä laitetaan kilpapyörä, mopo ja auto. Tehdään retki luokka on auto- tai mp-retkelle sopiva luokka. Viikonlopun rantaloma tehdään varmaan linjaautolla, junalla tai omalla autolla, ja nämä ajoneuvot siis tähän luokkaan. Koska sama ajoneuvo näyttää löytyvän nyt useammasta kuin yhdestä luokasta, ajoneuvoon on liitettävä luetellut määreet tai luokat on määriteltävä uudelleen. c) Oletetaan, että valittavana olevien kirjojen sivumäärät vaihtelevat välillä [100;1500]. Kun kriteerinä on vapaa-ajanlukemiseen sopivan kokoinen kirja, haluat määritellä luokat niin, että yksi luokka on Tarkalleen sopivan kokoiset, Melkein sopivan kokoiset, Luultavasti liian isot, Turhan pienet. Mahdottomat lomalukemiseksi ja Muut. Viimeksi mainittu luokka on niitä tapauksia varten, joita et osaa ennakoida. Tähän voisi sopia kirja, jonka sivumäärä on 101, kirjoittaja on Erwin Schrödinger ja kirjan kieli on saksa. Esimerkkinä olkoon luokka Tarkalleen sopivan kokoiset. Sivumäärä voisi olla välillä [160;250[. Pyöristetään sivumäärät lähimpään kymmeneen. Luokittele harjoituksen 2 tiedot. Luokitellaan kunkin heittokierrosten tulos. Koska tikanheitto on tarkkaa puuhaa tikkahan sitä paitsi putoaa, jos heitto yltää vain melkein tauluun saakka jokainen piste on oma luokkansa. Mieti, mitä 10 sentin (absoluuttinen) mittausepätarkkuus merkitsee tuulessa heiluvan, noin 30 metriä pitkän puun tapauksessa! Ei ole mitään käytännöllistä keinoa yrittää mitata 10 sentin tarkkuudella. Voi sanoa, että sellaista tulosta ei ole olemassa. Harjoituksia frekvenssien kuvaamisesta Näitten tehtävien avulla on tarkoitus harjoitella mahdollisimman hyvän ja havainnollisen tilastokaavion laatimista. Tilastoilla valehtelemista emme harjoittele. Erään kunnallisvaalien ehdokaslistahahmotelman koko oli 55 henkeä. Listan jäsenten ammatit jakautuivat seuraavan kaavion mukaisesti.

9 Ehdokkaat 11 % 5 % 5 % 9 % 27 % 13 % Hierojia Opiskelijoita Kotiäitejä Maanviljelijöitä Etätyöntekijöitä Konsulentteja Toimittajia 30 % Laske kuvan tietojen perusteella kuinka monta kutakin ammattialan edustajaa ehdokkaana oli. Etätyöntekijät 0,27 55 = 15 Hierojia 0,05 55 = 3 Konsulentteja 0,11 55 = 6 Kotiäitejä 0,13 55 = 7 Maanviljelijöitä 0,30 55 = 16 Opiskelijoita 0,09 55 = 5 Toimittajia 0,05 55 = = 55 Laadi harjoituksen 1 tiedoista pylväsdiagrammi (histogrammi, pylväs, palkki). Jos käytössäsi on graafinen laskin, tee tämä harjoitus sillä. Vertaa tekemääsi pylväsdiagrammia tehtävän 1 sektoridiagrammiin. Kumpi kuva, piirakka vai pylväsdiagrammi, olisi sopinut paremmin lähdeaineistoksi ehdokkaitten ammattialojen frekvenssien laskemiseen? Perustele vastauksesi.

10 Ammattiryhmät Lukumäärä Hierojia Konsulentteja Opiskelijoita Toimittajia Ammatti

11 Maaliskuu Vuosi indeksi Lähde: Tilastokeskus

12 Oheisessa taulukossa on vuosien maaliskuun kuluttajahintaindeksi (Lähde: ). Taulukon mittakaava on sellainen, että vuoden 1951 lopun hintatasoa merkitään 100 pisteellä. Laadi asiaa kuvaava diagrammi. Valitse juuri tämän tehtävän tilanteeseen sopiva kuvaajatyyppi. Kuluttajahintaindeksi 1800 Indeksin arvo maaliskuussa Vuosi Kyseessä on aikasarja. Sitä voidaan kuvata viivadiagrammilla, tarkemmin sanoen frekvenssimonikulmiolla. Mikään yksinkertainen, matemaattinen yhtälö ei kuvaa tätä käyrää. Oheiseen kuvaan olen valinnut xy kuvion eli kaavion, jonka taulukkolaskentaohjelma piirtää, kun sille annetaan pisteluettelo. Piirrä esimerkin 23 käyrä niin, että vaaka-akselilla on tilausten määrä. Mieti, onko tämä kuvio yhtä helposti tulkittava kuin alkuperäinen.

13 Vuodet Oheisessa taulukossa annetaan tietoja Suomessa muutamana lähimenneisyyden vuotena tutkimus- ja kehittämistoimintaan tehdyistä investoinneista. Se perustuu Tilastokeskuksen tietoihin. Toisessa sarakkeessa on tutkimus- ja kehittämistoimintaan liittyvissä olevien henkilöiden määrä, kolmannessa sarakkeessa tähän toimintaan käytetty aika niin sanottuina miestyövuosina ja viimeisessä sarakkeessa tutkimukseen ja kehittämiseen käytetyt varat miljoonina euroina. Olet poliittisesti sitoutumattoman lehden toimittaja. Tehtäväsi on antaa mahdollisimman värittymätön kuva yritysten käytännön kiinnostuksesta tutkimus- ja kehittämistoimintaa kohtaan taulukon kattamana aikana. Kuten huomaat, vuosi 1996 puuttuu taulukosta. Tilastovuosi Henkilöä Työvuosia Miljoonia Vihje: Jos käytät taulukkolaskentaohjelmaa tämän kurssin harjoitustehtävien tekemiseen, niin sinun kannattaa tutustua sen Liitä määräten toimintoon. Maalaa ensin taulukko, jossa tehtävän data on ja paina sitten CTRL-C. Tämän pitäisi toimia selaimessakin. Jos ei toimi, tarvitset kärsivällisyyttä Jos siis voit kopioitta taulukon sisällön Windows in leikepöydälle kuten kuvasin, valitse datan maalaamisen jälkeen taulukko-ohjelmassa

14 Muokka Liitä määräten Saat eteesi oheisen kuvan mukaisen tai vastaavan dialogi-ikkunan. Huomaa siinä erityisesti ruksi kohdassa Transponoi. Tilastodiagrammin lukijan kannalta selvin tapa käsitellä tämä tehtävä on laatia kaksi erillistä pylväs- tai palkkidiagrammia. Toinen esittää investointien rahallista arvoa, toinen investoituja miestyövuosia. Nämä diagrammit olisi mahdollista piirtää yhteen kuvaan, mutta kahden eri kuvan lukeminen on helpointa. Valitaan palkkidiagrammi eli pylväsdiagrammi, jonka pylväät ovat vaakasuorassa. Puuttuva vuosi 1996 otetaan mukaan ilman investoinnin määrää. Erityisesti täytyy huomata, että lukijalle ei väitetä, että vuonna 1996 tuotekehitykseen ei investoitu mitään! Lukijalle kerrotaan joko tekstissä tai kaaviossa, että vuoden 1996 tiedot puuttuvat. Lukija voi halutessaan arvata, että vuoden 1996 investointien arvo on vuosien 1995 ja 1997 investointien keskiarvo. Tällaista mittaustulosten välisen arvon arvaamista sanotaan interpoloimiseksi.

15 Investoinnit tuotekehitykseen Kalenterivuosi Tieto puuttuu Miestyövuosia Investoinnit tuotekehitykseen Vuosi Tieto puuttuu Miljoonaa markkaa

16 Kahden muuttujan jakauman harjoituksia Piirrä Esimerkin 27 pisteet ja regressiosuora samaan kuvaan. Hippihyppiäiset Pituus ja paino Paino, g ,0 14,5 15,0 15,5 16,0 16,5 Pituus, cm Esitä korrelaatiokertoimen r tulkinta janana. Seuraavassa on yksi mahdollisuus esittää regressiokertoimen tulkinta graafisesti. Haluat ehkä itse valita ainakin värit eri tavalla, jos satut olemaan puna - viher värisokea. Minun kuvassani punainen on vasemmalla ja vihreä oikealla, mikä on vastakkainen järjestys esimerkiksi liikennevaloihin verrattuna. r 0 0,3 0,6 0,8 1 heikko kohtalainen huomattava voimakas

17 Miksi Esimerkin 28 käyrä ei voi olla eksponentiaalinen? bx Muotoa a e olevan eksponenttifunktion kuvaaja ei vaihda merkkiään. Emme tarkastele muotoa a e bx + c olevia käyriä, jollainen voisi vaihtaa merkin. Tässä a, b ja c ovat vakioita. Kokeile Esimerkin 30 yhtälöä laskemalla auton nopeus antamalla x:lle joitakin arvoja. Laske aika, jona auton nopeus on 20,5 m/s, aika, jona auton nopeus on 7 m/s ja aika, kun auton nopeus on 21,9 m/s. Piirrä kaikki Esimerkin 30 regressiosuorat samaan kuvaan. Esimerkin 30 yhtälö on y = 0, kun aika x on välillä 0 x < 71 y = 0, 989x 69, 8, kun 71 x 93 y = +21, 9, kun 93 < x 140. Kun auton nopeus on 20,5 m/s, kyseessä on keskimmäisen yhtälön tilanne, joten 20,5 = 0,989x 69,8, josta x = 91,3. Auton nopeus on siis 20,5 metriä sekunnissa, kun kello näyttää aikaa 91,3 sekuntia. Kun auton nopeus on 7 m/s, ollaan yhtälön edelleen keskimmäisen yhtälön vaikutuspiirissä. Ajaksi saadaan 77,7 sekuntia eli noin 78 sekuntia. Kun nopeus on 21,9 m/s, kello näyttää aikaa 93 sekuntia tai enemmän. Seuraava taulukko esittää erään bakteeriviljelmän massan kasvua ajan funktiona. Sovita siihen eksponenttifunktio eli laadi kasvua kuvaava eksponentiaalinen malli. Tehtäväsi on siis etsiä b t funktion y = m 2 parametrit m ja b. Muuttuja t on aika. Laske saamasi kaavan avulla massat ajanhetkinä eli muuttujan t arvoilla 2 tuntia, 30 minuuttia, 25 minuuttia ja 3 tuntia. Aika, min Solumassa, mg Kun aika t on minuutteja, vakiot m ja b ovat: m = 10

18 1 b = 30 Yhtälöksi saadaan siis m( t) massa ajan funktiona. m( 2h) = 0,625 mg m( 30min) = 5 mg m(25min) = 17,8 mg m(3h) = 640 mg. t =, missä t on siis edelleen aika minuutteina ja missä m(t) on Eksponentiaalinen kasvu Massa, mg Aika, min