2.6 Frekvenssien kuvaamisesta



Samankaltaiset tiedostot
1.9 Harjoituksia. Frekvenssijakaumien harjoituksia. MAB5: Tilastotieteen lähtökohdat. a) Kaikki aakkoset b) Kirjaimet L, E, M, C, B, A ja i.

Valitse aineisto otsikoineen maalaamalla se hiirella ja kopioimalla (Esim. ctrl-c). Vaihtoehtoisesti, Lataa CSV-tiedosto

1 Funktiot, suurin (max), pienin (min) ja keskiarvo

Harjoituksia. MAB5: Tilastotieteen lähtökohdat

2.3 Voiman jakaminen komponentteihin

OKLV120 Demo 7. Marika Peltonen

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Tilastolliset toiminnot

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Ohjeet Libre Officen käyttöön

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

5.3 Ensimmäisen asteen polynomifunktio

v1.2 Huom! Piirto-ohjelmissa asioita voi tehdä todella monella tavalla, tässä esitellään yksi esimerkkitapa tällaisen käyrän piirtämiseen.

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Jatkuvat satunnaismuuttujat

Aluksi Kahden muuttujan lineaarinen yhtälö

Diagrammeja ja tunnuslukuja luokkani oppilaista

GEOS 1. Ilmastodiagrammi Libre Office Calc ohjelmalla

4. Funktion arvioimisesta eli approksimoimisesta

MONISTE 2 Kirjoittanut Elina Katainen

TAULUKKO, KAAVIO, SMARTART-KUVIOT

2016/07/05 08:58 1/12 Shortcut Menut

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Kaikkiin tehtäviin laskuja, kuvia tai muita perusteluja näkyviin.

14 Jatkuva jakauma. Käsitellään kuitenkin ennen täsmällisiä määritelmiä johdatteleva

3.7 Todennäköisyysjakaumia

Kolmioitten harjoituksia. Säännöllisten monikulmioitten harjoituksia. Pythagoraan lauseeseen liittyviä harjoituksia

Kenguru 2012 Junior sivu 1 / 8 (lukion 1. vuosi)

Til.yks. x y z

H6: Tehtävänanto. Taulukkolaskennan perusharjoitus. Harjoituksen tavoitteet

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

GEOS. Diagrammit LibreOfficeohjelmistolla

Datatähti 2019 loppu

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

CEM DT-3353 Pihtimittari

Näillä sivuilla Tilastomatematiikan esimerkit, joissa käsitellään tietokoneen käyttöä tilastollissa operaatioissa, on tehty Excel versiolla.

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

Anne-Mari Näsi EXCELIN PIKAKÄYTTÖOHJE (EXCEL 2007)

Excel syventävät harjoitukset

Kenguru 2012 Student sivu 1 / 8 (lukion 2. ja 3. vuosi)

1.1 Tilastotieteen peruskäsitteitä

1.1 Funktion määritelmä

Tämä luku nojaa vahvasti esimerkkeihin. Aloitetaan palauttamalla mieleen, mitä koordinaatistolla tarkoitetaan.

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Ohje tekstinkäsittelyharjoitus 10. Pöytäkirja, jossa käytetään ylätunnistetta. Tehtävän aloitus

1.4 Funktion jatkuvuus

Matikkaa KA1-kurssilaisille, osa 3: suoran piirtäminen koordinaatistoon

GeoGebra-harjoituksia malu-opettajille

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

LABORAATIOSELOSTUSTEN OHJE H. Honkanen

Matematiikan tukikurssi, kurssikerta 1

Excel Perusteet Päivi Vartiainen 1

Teema 7: Todennäköisyyksien laskentaa

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Kenguru Student (lukion 2. ja 3. vuosi) sivu 1 / 6

7. laskuharjoituskierros, vko 10, ratkaisut

Monivalintamuuttujien käsittely

Ma Tänään rapistelemme ja mittailemme sanomalehteä.

Juha Haataja

11. laskuharjoituskierros, vko 15, ratkaisut

ARVOSANA-HARJOITUKSEN RATKAISU

3 Raja-arvo ja jatkuvuus

Kenguru 2012 Cadet (8. ja 9. luokka)

Webropol 3.0 tulosten raportointi. Aki Taanila

Ma8 Todennäköisyys ja tilastot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.


LibreOfficen kaavaeditori

Matematiikan ilmiöiden tutkiminen GeoGebran avulla

Excel-harjoitus 1. Tietojen syöttö työkirjaan. Taulukon muotoilu

Integrointi ja sovellukset

Ohje. Perusdiabetesseurantataulukko: OpenOffice 3.2 Ohjeen versio: 1.0

Aktivoi dokumentin rakenteen tarkistamiseksi piilomerkkien näyttäminen valitsemalla valintanauhasta Kappale-kohdasta painike Näytä kaikki.

MAB3 - Harjoitustehtävien ratkaisut:

Avaa ohjelma ja tarvittaessa Tiedosto -> Uusi kilpailutiedosto

Kenguru 2014 Junior sivu 1 / 8 (lukion 1. vuosikurssi)

Luento 7 Taulukkolaskennan edistyneempiä piirteitä Aulikki Hyrskykari

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

9. Vektorit. 9.1 Skalaarit ja vektorit. 9.2 Vektorit tasossa

2. a- ja b-kohdat selviä, kunhan kutakuinkin tarkka, niin a-kohta 1 p b-kohta 1 p

Monikulmiot 1/5 Sisältö ESITIEDOT: kolmio

Opiskelun ja työelämän tietotekniikka (DTEK1043)

Määrällisen aineiston esittämistapoja. Aki Taanila

Syksyn 2015 Lyhyen matematiikan YO-kokeen TI-Nspire CAS -ratkaisut

Kenguru 2015 Ecolier (4. ja 5. luokka)

MATEMATIIKAN KOE, LYHYT OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Taulukkolaskennan perusteet Taulukkolaskentaohjelmat

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Matematiikan tukikurssi, kurssikerta 3

KAAVAT. Sisällysluettelo

TILASTOT JA TODENNÄKÖISYYS

4.1 Kaksi pistettä määrää suoran

TIETOKONE JA TIETOVERKOT TYÖVÄLINEENÄ

2 Pistejoukko koordinaatistossa

Nuorten hyvinvointi tilastotietokannan käyttöohjeet Tieke

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Transkriptio:

MAB5: Tilastotieteen lähtökohdat 2.6 Frekvenssien kuvaamisesta Pelkästä taulukosta, jollaisia näit edellä, on vaikea saada kunnolla selvää. Ainakin ison taulukon tapauksessa on laadittava kaavio, jos asiasta haluaa ymmärtää jotain. Tämä johtuu siitä, että ihminen on melkoisen visuaalinen eli kuvallinen olio. Millainen kuvatyyppi valitaan, riippuu tilanteesta. Etenen niin, että ensin esittelen lyhyesti kuvaajatyyppejä ja sitten tarkennan esimerkkien avulla sinulle näin muodostunutta mielikuvaa. Taidanpa aloittaa luettelolla en siis kuvalla. Esittelen jatkossa seuraavat kuvaajat. Sulkeissa mainitsen jonkin muuttujatyypin, jota esittämään mainittu kuvaaja sopii. Pylväsdiagrammi (diskreetti muuttuja) Palkkidiagrammi (diskreetti muuttuja) Sektoridiagrammi eli piirakkakuvio (diskreetti muuttuja, osuudet kokonaisuudesta) Histogrammi (jatkuva muuttuja) Frekvenssimonikulmio (jatkuvan muuttujan frekvenssijakauma) Porrasdiagrammi (diskreetin muuttujan summafrekvenssi) Summakäyrä eli summapolygoni (jatkuvan muuttujan summafrekvenssi) Esimerkkejä frekvenssien kuvaamisesta Pylväsdiagrammi Kuvataan Sipon tikanheittotuloksia pylväsdiagrammin avulla. Esimerkki 14 Kuvassa on siis pylväsdiagrammi, joka kuvaa Sipon kuvitteellisen tikanheittoturnauksen tulokset harjoituksesta 2. Vaaka-akselilla ovat heittokierrokset numerojärjestyksessä, pystyakselilla kunkin kierroksen viiden tikan yhteistulos.

45 Tikanheitto 40 35 30 Pisteet 25 20 15 10 5 0 I 2 3 4 5 6 7 8 9 10 Kierrokset No, kehittyykö Sipon heittotarkkuus (Harjoitus 4)? Tämä kuvio vastaa kysymykseen vielä selvemmin kuin frekvenssitaulukon silmäileminen. Tein tämän kuvion maalaamalla ensin kaksi riviä: kierrosten numeroitten rivin ja pisterivin. Kuva ohessa. Alimmalla rivillä, joka tässä kuvassa näkyy mustana kuten taulukon ylinkin rivi, on kunkin kierroksen tikkojen yhteispisteet. Näitten kahden rivin taustat ovat mustat, koska ne on maalattu, kuten alan termi kuuluu. Huomaa, että tuon alimman eli summarivin tekemisestä ei ole puhuttu mitään, ei ainakaan harjoituksen määrittelyssä. Tämän jälkeen valitsin ohjelmassa Lisää Kaavio Ruksaa Ensimmäinen rivi selitteenä, paina Seuraava ja ruksaa Tietojoukot: Rivit. Kokeile eri vaihtoehtoja: esimerkiksi, maalaa myös noitten kahden väliin jäävät rivit! Kokeile vielä muita juttuja! Huomaa saadun kaavion eräs pylväsdiagrammi seuraavat piirteet: Pylväät eivät ole kylki kyljessä, vaan niitten välissä on selvä tyhjä tila Pylvään korkeus kuvaa suoraan pisteitten määrää.

Kuvioni kaikki pylväät ovat saman levyiset. Jos piirrät eri levyiset pylväät, valitse pylvään pinta-ala suoraan verrannollisesti pistemäärään. Tällöin pylvään ala siis kuvaa pistemäärää. Jatketaan tästä palkkidiagrammin parissa. Palkkidiagrammi Käytetään Sipon tikanheittotuloksia jälleen. Esimerkki 15 Tikkaturnaus Kierrokset I 2 3 4 5 6 7 8 9 10 0 3 5 8 10 13 15 18 20 23 25 28 30 33 35 38 40 43 45 Kierroksen pisteet Käytännössä tämä on vain eräs pylväsdiagrammin versio. Taulukkolaskentaohjelmassa valinnat ovat eräässä vaiheessa kuvan mukaiset.

Kerrataan tässä se, mitä äsken sanottiin pylväsdiagrammista. Huomaa saadun kaavion eräs palkkidiagrammi seuraavat piirteet: Palkit eivät ole kylki kyljessä, vaan niitten välissä on selvä tyhjä tila Palkin korkeus kuvaa suoraan pisteitten määrää. Kuvioni kaikki palkit ovat saman levyiset. Jos piirrät eri levyiset palkit, valitse palkin pinta-ala suoraan verrannollisesti pistemäärään. Tällöin palkin ala siis kuvaa pistemäärää. Sektoridiagrammi Sektoridiagrammin eli tuttavallisemmin piirakkakuvion ajatus on esittää kokonaisuuden osien suhteelliset osuudet sektoreihin jaetun ympyrän avulla. Mitä isompi osa ympyrää sitä isompi osa kokonaisuutta! Esimerkki 16 Sipon tikanheittoturnaus tarjoaa mahdollisuuden arvioida sektoridiagrammin avulla vaikkapa kunkin kierroksen pisteiden jakautumista tikkojen kesken. Koska Sippo arvelee, että hänen heittotaitonsa kehittyvät koko ajan, niin hän katsoo kuinka mones tikka antaa parhaan tuloksen. Se on tieto, jonka hän saa edellä olevasta taulukosta. Vai mitä arvelet, kun katsot seuraavaa sektoridiagrammia? Hän tahtoo kuitenkin nähdä myös, kuinka suuri subjektiivinen suhteellinen ero heittojen välillä on. Sippo piirtää kaksi sektoria, yhden ensimmäisestä ja yhden viimeisestä kierroksesta. Kopioidaan molemmat heittotulokset tähänkin. Seuraavat kaksi sektoridiagrammia esittävät Sipon 1. ja 10. heittokierrosta. Koko sektori esittää siis 1. kierroksen tapauksessa yhteensä 8 pistettä ja 10. kierroksen tapauksessa 43 pistettä. Kierros I 10 1. tikka 2 9 2. tikka 0 8 3. tikka 2 9 4. tikka 1 7 5. tikka 3 10 8 43

1. heittokierros 10. heittokierros 1. tikka 2. tikka 3. tikka 4. tikka 5. tikka 1. tikka 2. tikka 3. tikka 4. tikka 5. tikka Ja vielä kerran ruksi eri paikkaan. Lisäksi maalasin tietenkin kierrosnumeron lisäksi molemmille asianmukaisen pistesarakkeen. Kuten huomaat, olen valinnut 1. kierroksen tuloksia kuvaamaan erilaisen sektorin kuin 10. kierrosta varten. Missähän 1. kierroksen 2. tikan siivu on? Ja sitten maalaan molemmat tulokset ja laitan ne samaan kuvaajaan. Mihin ruksi nyt laitetaan, kun valitaan kuvaajan tyyppi? 1. ja 2. heittokierros 1. tikka 2. tikka 3. tikka 4. tikka 5. tikka Esimerkki 17 Tehdään taulukosta piirakkakuvio. Tällä kertaa samankokoisiin luokkiin. seuraavasta aineisto ei ole luokiteltu Tieliikenneonnettomuuksissa vuonna 1994 loukkaantuneet ikäryhmittäin 0 5 6 9 10 14 15-17 18-20 21-24 25 34 35-44 45-54 55-64 65 74 75 129 241 489 816 774 672 1304 1109 1049 662 509 326 Lähde:

Ilmeisiä eroja lukuun ottamatta seuraava kuvio saadaan taulukkolaskentaohjelmalla aikaan samalla tavalla kuin edelliset kuvaajat. Loukkaantuneet ikäryhmittäin 1994 0 5 6 9 10 14 15-17 18-20 21-24 25-34 35-44 45-54 55-64 65 74 75 Taulukkolaskentaohjelmistot tarjoavat toinen toistaan räväkämpiä keinoja tehdä näyttäviä kuvaajia. Muista kuitenkin, että diagrammi tai sen komeus eivät ole itsetarkoitus. Diagrammin tehtävä on tarjota informaatiota mahdollisimman selvällä, helppolukuisella ja yksiselitteisellä tavalla. Tähän tuloksen on päästävä totuutta mahdollisimman tarkoin noudattaen. Kuvaaja ei saa olla komea luettavuuden kustannuksella. Mieti siis, miksi valitsen juuri tämän kuvaajatyypin ja vaihtoehdon? Antaako kolmiulotteinen ns. 3D kuvaaja sittenkään enemmän tietoa kuin kaksiulotteinen (2D)? Kenen show: asiallisen tiedon vai näyttävyyden? Tämän muistutuksen jälkeen haluan toisaalta rohkaista sinua käyttämään mielikuvitusta. Kyllä kuvaaja saa mielellään olla niin kaunis, että siinä silmä lepää. Täytyy vain muistaa tilastojen ja niitten antamien tulosten perimmäinen tarkoitus ja tavoite. Filosofi peräänkuuluttaisi ehkä diagrammin hyvettä. Histogrammi Histogrammi näyttää pylväsdiagrammilta, jonka pylväät on laitettu kylki kylkeen kiinni. Kuitenkin histogrammilla ja pylväsdiagrammilla on selvä, periaatteellinen ero. Histogrammilla kuvataan

jatkuvan muuttujan frekvenssijakaumaa kun taas pylväsdiagrammilla kuvataan epäjatkuvan muuttujan jakaumaa. Tämä kelpaa muistisäännöksi, jonka avulla on helppo muistaa kumpi on kumpi: jatkuvan muuttujan kuvaajassa ei ole aukkoja. Histogrammin pylväitten korkeus valitaan niin, että se vastaa frekvenssiä tai suhteellista frekvenssiä. Toinen mahdollisuus on kuvata frekvenssiä tai suhteellista frekvenssiä pylvään pintaalan avulla. Luokkakeskus kirjoitetaan vaaka-akselille, luokan keskelle. Jos käytät luokkarajoja, kirjoita ne vaaka-akselille, luokan reunoille. Esimerkki 18 Koska en onnistunut laatimaan histogrammia OpenOffice 2.1:llä, käytän MS - Excel 2000:a. Sinä saatat olla taitavampi. Nämä kaksi ohjelmaa muistuttavat toisiaan paljon. Usein ohje, joka pätee OpenOffice:lle, pätee myös Excelille. Seuraavat ohjeet laadin MS - Excel 2000:n mukaan. Myös kuvion tuotin tällä ohjelmalla. Kuvio perustuu oheiseen, joka on ollut esillä aiemmin taulukkoon. Laadi ensin pylväsdiagrammi: Maalaa molemmat sarakkeet ilman otsikoita. Valitse sitten Lisää Kaavio... Paina Seuraava >. Valitse Sarja. Kirjoita Nimi kenttään vaikkapa Luokkakeskukset ja Luokka-akselin (X) otsikot: - kenttään =Taul2!$A$2:$A$11 sekä Arvot kenttään =Taul2!$B$2:$B$11 sekä kenttään, mikäli arvot ja otsikot ovat noissa soluissa. Nyt dialogi-ikkunasi pitäisi olla seuraavan näköinen. Luokkakeskus Frekvenssi 193,25 68 488,75 51 784,25 62 1079,75 51 1375,25 57 1670,75 65 1966,25 60 2261,75 71 2557,25 59 2852,75 57 Paina Seuraava >. Käytä seuraavia kuvia lisäohjeina. Ensimmäisenä dialogin Otsikot sivu.

Valitse Selite ja poista ruksi kohdasta Näytä selite. Paina Seuraava > ja sitten Valmis. Klikkaa hiiren vasemmalla eli ykköspainikkeella kaaviota varmuuden vuoksi jonkin pylvään kohdalta. Klikkaa sitten hiiren oikealla eli kakkospainiketta. Valitse Muotoile arvosarjat ja sitten Asetukset. Aseta Välin leveys kentän arvoksi 0. Tätä vastaavaa ominaisuutta en löytänyt OpenOffice 2.1:stä. Katso kuvaa.

Paina OK. Nyt sinulla on seuraava kaavio. Kokeile taas erilaisia ohjelmistosi tarjoamia vaihtoehtoja. Huomaa, että voit muun muassa muuttaa kaaviosi kokoa joustavasti. Männyn pituusjakauma 80 70 60 Frekvenssit 50 40 30 20 10 0 193,25 488,75 784,25 1079,75 1375,25 1670,75 1966,25 2261,75 2557,25 2852,75 Luokkakeskukset Frekvenssimonikulmio Frekvenssimonikulmion kaavioon kirjoitetaan Vaaka-akselille (x - akselille) kirjoitetaan luokat Luokan kohdalle merkitään pisteellä luokan frekvenssi tai sen suhteellinen frekvenssi niitä vastaavalle etäisyydelle vaaka-akselista Kuvaajana on monikulmio, joka kulkee jokaisen frekvenssiä vastaavan pisteen kautta ja joka alkaa ja päättyy vaaka-akselille Esimerkki 19 Käytetään Esimerkistä 18 tuttua taulukkoa, kun piirretään frekvenssimonikulmio. Koska frekvenssimonikulmio alkaa määritelmän mukaan vaaka-akselilta ja myös päättyy sille ja koska tällainenkaan kuvaaja ei kirjaimellisesti kuulu OpenOffice.org:n valikoimiin, joudumme lisäämään tyhjän luokan taulukon alkuun ja loppuun. Sitä varten kopioin mainitun taulukon tähän ja teen tarvittavat muutokset. Maalaa taas muuten koko taulukko, mutta jätä otsikot ulkopuolelle. Tee sitten seuraavat tai vastaavat valinnat ohjelmassasi. Minulla on taas OpenOffice.org 2.1 käytössä. Valitse siis ensin Lisää Kaavio Sitten: Luokkakeskus Frekvenssi 0 0 193,25 68 488,75 51 784,25 62 1079,75 51 1375,25 57 1670,75 65 1966,25 60 2261,75 71 2557,25 59 2852,75 57 3148,25 0

Ensimmäinen sarake selitteenä ja Seuraava >> Viivat: listan 1. vaihtoehto ja Seuraava >> Järjestyksessä valikon neljäs eli rivin viimeinen eli Symbolit ja Seuraava >> Ota ruksi pois kohdasta Selite ja laita ruksi kohtaan Näytä esikatselussa tekstielementit. Kirjoita kaavion ja akselien otsikot Vaihdettuani ensin viivan värin ja paksuuden sain seuraavan kaavion. Frekvenssi 75 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 Mäntytutkimus 0 193,25 488,75 784,25 1079,75 1375,25 1670,75 1966,25 2261,75 2557,25 2852,75 3148,25 Luokka Porrasdiagrammi Porrasdiagrammi muodostuu vaakasuorista janoista. Se kuvaa diskreetin muuttujan summafrekvenssejä tai suhteellisia summafrekvenssejä. Joissain tilanteissa tämä kaaviotyyppi sopii sektoridiagrammin rinnalla täydentämään sitä. Koska luokkarajat määritellään niin, että luokkavälin alaraja on mukana luokkavälissä, mutta yläraja ei, niin porrasdiagrammikin piirretään siten, että kukin luokka katetaan sellaisella vaakasuoralla janalla, joka alkaa luokan alarajasta ja päättyy ylärajaan. Janan alkupiste on suljettu ja loppupiste avoin. Näin porrasdiagrammin janoista muodostuu ikään kuin nousevat portaat. Esimerkki 20 Piirretään Sipon tikanheiton kehittymistä 10 kierroksen aikana kuvaava diagrammi. Tehdään se esimerkin vuoksi käyttämällä suhteellista summafrekvenssiä kuvaavaa porrasdiagrammia. Lähtömateriaalina käytämme oheista taulukkoa. Kierros I 2 3 4 5 6 7 8 9 10 1. tikka 2 0 1 5 8 7 8 7 8 9 2. tikka 0 3 3 1 0 8 9 10 4 8 3. tikka 2 7 2 0 5 4 8 9 3 9 4. tikka 1 3 4 5 6 6 7 9 6 7 5. tikka 3 1 4 6 1 5 9 4 9 10 8 14 14 17 20 30 41 39 30 43 sf: 8 22 36 53 73 103 144 183 213 256 sf%: 3,13 8,59 14,06 20,70 28,52 40,23 56,25 71,48 83,20 100,00

Alarajan 8 arvo 3,13 [%] saadaan laskenta-arkin (Excel 2000) kaavalla =100*SUMMA($C$9:C9)/SUMMA($C$9:$L$9), missä oletetaan, että ensimmäinen frekvenssi (arvo 8) on solussa C9. Muut otsikon Suhteellinen summafrekvenssi, % alla olevat prosenttiluvut saadaan kopioimalla tämä kaava muihin soluihin. Huomaa, että yllä olevassa, ensimmäisen luvun laskevassa kaavassa soluosoite C9 on kolmeen kertaan: kaksi kertaa dollarimerkeillä ympäröitynä, yhden kerran ilman. Kehitys 110,00 100,00 90,00 80,00 Kasautuneet, % 70,00 60,00 50,00 40,00 30,00 20,00 10,00 0,00 1 2 3 4 5 6 7 8 9 10 Kierros Summakäyrä eli summapolygoni Summakäyrää eli summapolygonia käytetään havainnollistamaan jatkuvan muuttujan summafrekvenssiä tai suhteellista summafrekvenssiä. Se piirretään siten, että luokan frekvenssin kertymän arvo merkitään kaavioon seuraavan luokan alarajan kohdalle. Nämä pisteet yhdistetään murtoviivalla, joka alkaa nollasta. Esimerkki 21 Luokkakeskus Frekvenssi 0 0 193,25 68 488,75 51 784,25 62 1079,75 51 1375,25 57 1670,75 65 1966,25 60 2261,75 71 2557,25 59 2852,75 57 3148,25 0

Käytetään Esimerkin 19 tilastoa. Kopioidaan se tähän. Summakäyrää käytetään nimensä mukaisesti summafrekvenssien kuvaamiseen toisin kuin Esimerkin 19 porrasdiagrammissa. Siksi tehdään tarvittavat laskut uuteen taulukkoon. Liitän sen taas tähän mukaan. Luokan alaraja Frekvenssi Summafrekvenssi 0,0 0 0 45,5 68 0 341,0 51 68 636,5 62 119 932,0 51 181 1227,5 57 232 1523,0 65 289 1818,5 60 354 2114,0 71 414 2409,5 59 485 2705,0 57 544 3000,5 601 Summapolygoni 700 Frekvenssien kumul. summat 600 500 400 300 200 100 0 0,0 45,5 341,0 636,5 932,0 1227,5 1523,0 1818,5 2114,0 2409,5 2705,0 3000,5 Luokkien alarajat Huomaa taulukon sinisellä merkityt arvot. Tarvitsin ne jotta sain taulukkolaskentaohjelmani ymmärtämään, mitä haluan. Tässä esimerkissä Excel 2000 ja OpenOffice.org näyttivät olevan tasavertaiset kumppanit. Huomaa myös seuraavat yleiset huomiot, jotka koskevat summapolygonia.

Ensimmäisen luokan frekvenssi on sama kuin siihen saakka kertynyt summafrekvenssi. Tämä arvo merkitään toisen luokan alarajan kohdalle. Kahden ensimmäisen luokan frekvenssien summa merkitään kolmannen luokan alarajan kohdalle. Näin jokainen n. summa merkitään n + 1. luokan alarajan kohdalle. Jakauman kuvaaja alkaa vaaka-akselilta, sillä pienimpään alarajaan mennessä ei ole kertynyt mitään Summakäyrän eli summapolygonin kuvaaja muodostuu edellä kuvatut pisteet päätepisteinä piirretyistä janoista. Mukaan on piirrettävä vielä viimeistä luokkaa seuraavan luokan alaraja, jotta viimeinenkin summa saadaan mukaan! Tässäkin mielessä on hyvä, että luokat ovat samanpituiset Diagrammien yhdistelemisestä Jos kasvatat luokan kokoa, saat ainakin johonkin rajaan saakka paremman yleiskuvan tilanteesta. Jos teet päinvastoin ja kavennat luokkia, saat esiin lisää yksityiskohtia, mutta metsän näkeminen puilta kärsii. Otan esiin yhden mahdollisuuden yrittää saada samaan kuvaan vähän molempia. Esimerkki 22 Tein oheisen kaavion Excel 2000:lla niin, että annoin ohjelmalle pituusluokat kerran ja lukumäärät kahteen kertaan sekä valitsin ensin kuvaajatyypiksi pylväät. Puitten lukumäärä 80 70 60 Lukumäärät 50 40 30 20 10 0 0,0 45,5 341,0 636,5 932,0 1227,5 1523,0 1818,5 2114,0 2409,5 2705,0 3000,5 Pituusluokat Sitten vaihdoin kahden seuraavan kuvan mukaisessa dialogissa toisen kuvaajan tyypiksi viivan asianmukaisin asetuksin.

Huomaa, että kuvaajan viiva kulkee luokkakeskusten kautta. Aikasarjoista Aikasarja on ajan funktiona yhtä pitkin aikavälein tehty ja muistiin merkitty havaintojen joukko. Asian voi ilmaista myös niin, että kun seuraat jotain ilmiötä aina yhtä pitkien aikojen kuluttua ja kirjaat havaintosi muistiin aikamerkintöjen kera, teet aikasarjan. Aikasarjoja ovat muiden muassa keskipäivän lämpötila paikkakunnalla potilaan kuume mitattuna tunnin välein kaupungin kerrostaloneliön keskihinta kvartaaleittain lehden levikki vuosittain Sinä osaat jatkaa tämän luettelon tekemistä ainakin riittävän pitkäksi! Usein aikasarjaa ei tehdä pelkästään sitä varten, että saadaan jälkikäteistä tietoa jonkin asian tilasta. Usein tätä tärkeämpää on käyttää aikasarjaa tilastoidun suureen tulevan kehityksen ennustamiseen. Kun näin menetellään, joudutaan olettamaan, että aikasarjan avulla on löydetty sääntö, jota 1. tutkimuksen kohde on noudattanut tähän saakka 2. tutkimuksen kohde noudattaa jatkossakin riittävän kauan. Esimerkki 23

Oheisessa taulukossa on erään aikakauslehden vuositilausten määrä vuodesta 1990 alkaen. Lehden levikkipäällikkö sanokaamme Erkki haluaisi arvata lehtensä vuoden 2008 tilausmäärän. Koska 1990 -luvun alun lamaa lukuun ottamatta tilausten määrä näyttää kasvavan huomattavan tasaisesti. Mielessä on kuitenkin, että vuoden 2007 tilauskanta on peräti 3 % suurempi kuin vuoden 2006 tilauskanta. Pitäisikö tämä tulkita satunnaisena hyppäyksenä vai onko tilauskannan kasvu todella nousussa? Vuonna 1999 tapahtuu samanlainen hyppäys. Erkki päättää tehdä taulukon, johon hän kirjaa jokaisen vuoden tilausten määrän kasvun prosentteina edelliseen vuoteen verrattuna ja siitä edelleen trendikäyrän eli trendiviivan. Diskreetin muuttujan trendikäyrä on frekvenssimonikulmio, jonka vaaka-akselilla on aika. Esimerkiksi vuoden 1992 luvun 3 % hän saa jakamalla vuoden 1992 tilaukset vuoden 1991 levikillä. Tästä hän vähentää ykkösen ja ilmaisee saamansa desimaaliluvun prosentteina. Piirtämänsä trendikäyrää katsottuaan hän päättää, että kahden prosentin kasvu on turvallisin valinta. Täten hän arvaa vuoden 2008 tilausten määräksi 16216 kappaletta. Vuosi Tilaukset, kpl 1 990 12 000 1 991 12 300 1 992 12 669 1 993 12 416 1 994 12 291 1 995 12 414 1 996 12 601 1 997 12 840 1 998 13 110 1 999 13 503 2 000 13 746 2 001 14 021 2 002 14 315 2 003 14 573 2 004 14 894 2 005 15 147 2 006 15 435 2 007 15 898 Tilausten määrän muuttuminen 4,00 % 3,00 % 2,00 % Muutos, % 1,00 % 0,00 % -1,00 % 1 991 1 992 1 993 1 994 1 995 1 996 1 997 1 998 1 999 2 000 2 001 2 002 2 003 2 004 2 005 2 006 2 007-2,00 % -3,00 % Vuosi

Huomaa, että mikään ei estä puhumasta frekvenssimonikulmiosta tai summakäyrästä viivadiagrammina. Erilaisia jakaumia Frekvenssijakaumat, jotka olen tähän mennessä esitellyt, ovat olleet ulkonäöltään lähinnä satunnaisesti polveilevia kuin metsän silhuetti. Monet käytännön tilanteissa tärkeät jakaumat ovat kuitenkin säännöllisemmän näköisiä. Ne ovat usein jatkuvan muuttujan jakaumia. Säännöllisellä jakaumalla tarkoitan tässä yhteydessä jakaumaa, jolle voidaan kuvitella pystysuora, jonka paikalla olevan peilin kautta katsottuna kuvio ei näyttäisi muuttuvan. Näistä tärkein on normaalijakauma eli Gaussin kellokäyrä tai vain Gaussin käyrä. Seuraava kuva esittää juuri sitä. Sen symmetria-akseli on y akseli. Kuvaajan sininen viiva jatkuu loputtomiin molempiin suuntiin lähestyen koko ajan nollaa sitä koskaan saavuttamatta.

Tutkimme tätä myöhemmin lisää. Todetaan tässä kuitenkin, että esimerkiksi miesten tai naisten pituudet keskittyvät tällä tavalla jonkin tavallisimman arvon keskimitan ympärille. Yksinkertaisin jakauma on tasainen jakauma. Sitä esittää pelkkä vaakasuora. Jos jokin muuttuja on tasaisesti jakautunut, sen kaikki arvot ovat yhtä suuret. Tästä kelpaa esimerkiksi vaikkapa noppa, jonka kaikki kuusi silmälukua ovat yhtä todennäköiset. Yhtä todennäköiset tarkoittaa sitä, että kun 1 heität noppaa todella monta kertaa, saat jokaista silmälukua suunnilleen yhtä paljon eli 16,7% 6 kaikista heitoista. Asian voi ilmaista myös niin, että jokaisen heiton frekvenssi on sama, kun heittoja on paljon. Toinen esimerkki on lotto. Pitkällä aikavälillä jokainen lottopallo esiintyy yhtä monta kertaa. Nopan jakauma TN 1,000 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000 0 1 2 3 4 5 6 7 Silmäluku Nopan silmäluku on diskreetti muuttuja. Jatkuva tasainen jakauma olisi vain vaakasuora viiva: Tasainen 4,00 3,50 3,00 2,50 2,00 1,50 1,00 0,50 0,00-5,00 5,00

Esimerkiksi tasaisella järven jäällä olevasta kepistä kahteen suuntaan [-5m ; +5 m] mitattu lumensyvyys saattaa jokaisessa mittauspisteessä olla 2,5 senttiä. Esimerkkinä vinosta jakaumasta mainittakoon työpaikan palkkojen jakauma. Tunnettu tosiseikka lienee, että firman toimitusjohtaja saa talon korkeinta palkkaa ja että väliaikainen juoksuhenkilön määräaikainen sijainen saa puolestaan pienintä palkkaa. Muut ovat sitten tietenkin sillä välillä. Oheinen kuva esittää tätä mukailevaa, täysin fiktiivistä tilannetta. Sen vaaka-akselilla on palkan suuruus ja pystyakselilla kyseistä palkkaa nauttivien henkilöiden lukumäärä eli frekvenssi. Vinolle jakaumalle on ominaista se, että frekvenssit painottuvat asteikon jompaankumpaan päähän. Kuvassa kuvaajan korkein kohta on pienempien palkkojen päässä. Frekvenssi 14 12 10 8 6 4 Palkat 2 0 0 499 500 999 1000 1499 1500 1999 2000 2499 2500 2999 3000 3499 Euroa / kk Kuinka valehtelen tilastoilla: varo näitä Vanhan sanonnan mukaan asioitten järjestys on seuraava: valhe, emävalhe, tilasto. Tämä juontanee juurensa siitä, että sinänsä oikea tilastokaavio voidaan saada näyttämään melkein miltä tahansa. Keinoja on monia. Kaikki nämä ovat kuitenkin sellaisia, että tarkkaavainen kaavion lukija saa kyllä asiasta selon. Kokonaan erikseen ovat sitten virheellisin menetelmin saadut tulokset. Kaavioissa käytetyt koristeetkin saattavat johtaa katsojaa harhaan viemällä huomion itse asiasta. Siksi niittenkin käyttämisessä kannattaa olla säästäväinen. Seuraavan esityksen lähtökohtana on oikea data, jota esittävää kaaviota rukataan tarkoitushakuisesti.

Esimerkki 24 Olkoon meillä seuraava jonkin työpaikan palkkojen jakautumista kuvaava taulukko. Kumpi Palkkojen jakautuminen Lukumäärä 14 12 10 8 6 4 2 0 3500-3999 3000 3499 2500 2999 2000 2499 1500 1999 1000 1499 500 999 0 499 Palkkaluokka osapuoli käyttää palkkaneuvotteluissa kumpaa kaaviota? Palkkojen jakautuminen 14 12 10 Lukumäärä 8 6 4 2 0 3500-3999 3000 3499 2500 2999 2000 2499 1500 1999 1000 1499 500 999 0 499 Palkkaluokka Esimerkki 25 Kaksi kilpailevaa automerkkiä, X ja Y, mainostavat myyntinsä kehittymistä. Molempien kaavio perustuu oheiseen yhteiseen taulukkoon. Vanha, vakaa merkki X mainostaa ehkä seuraavalla kaaviolla, mikäli se ylipäätän on kilpailusta kiinnostunut: Myynti, kpl X Y 2005 2500 500 2006 3000 1200

Uudempi tulokas taas ehkä laatisi samasta taulukosta seuraavan kaavion: 4500 Me ja kilpailija 4250 4000 3750 Ostettu, kpl Myyntikausi 2005 2006 3500 3250 3000 2750 2500 2250 Me ja kilpailija 2000 2005 2006 Myyntikausi 0 250 500 750 1000 1250 1500 1750 2000 2250 2500 2750 3000 Ostettu. kpl Y X X Y

Nämä ovat sangen kärjistettyjä esimerkkejä. En missään tapauksessa väitä, että palkkaneuvottelijat tai autojen maahantuojat tai kauppiaat todella käyttävät tällaisia keinoja. Näitten esimerkkien ainoa tarkoitus on näyttää, miten muun muassa on mahdollista, että tosiin faktoihin perustuva tilastokaavio voi todellakin johtaa harhaan. Esimerkki 26 Sirpalepuolue pyrkii esiin ja mainostaa sen mukaisesti. Kannatus XXX YYY ZZZ TTT UUU MEIDÄN kannatus on keltaisella. XXX 24 YYY 24 ZZZ 25 TTT 25 UUU 2