Oma nimesi Tehtävä 3.1 1 (5) Taulukot ja niiden laatiminen Tilastotaulukko on perinteinen ja monikäyttöisin tapa järjestää numeerinen havaintoaineisto tiiviiseen ja helposti omaksuttavaan muotoon. Tilastoissa taulukoita on kahta perustyyppiä: analyysitaulukoita ja matriiseja. Matriiseilla tarkoitetaan laajoja periaatteessa kaikki havaintoaineiston muuttujat kattavia taulukoita, Ne julkaistaan yleensä muusta aineistosta erillään, esimerkiksi painetun raportin liitteenä. Matriisi tarjoaa aineistoon perehtyvälle mahdollisuuden tarkastella sitä omista lähtökohdistaan, tehdä omia johtopäätöksiään ja tarkistaa muiden tekemiä päätelmiä. Matriisiakin suunniteltaessa on otettava huomioon esitysväline. Kaikki olennaiset tiedot tulee esittää siten, ettei niitä tarvitse erikseen selata näkyviin: Taulukon otsikon sekä rivien ja sarakkeiden otsikoiden pitää näkyä yhdellä sivulla, aukeamalla tai kuvaruudulla. Analyysitaulukot ovat osa aineiston raportointia yhdessä tilastografiikan ja raporttitekstin kanssa. Parhaimmillaan analyysitaulukko kirkastaa esitetyn asian lukijalleen nopeasti ja tiivistetysti, tuoden samalla esiin kuvattavan ilmiön keskeisimmät piirteet. Molempiin taulukkomuotoihin pätevät periaatteessa samat säännöt, mutta analyysitaulukoissa on mahdollista tiivistää enemmän. Kuvio 1. Taulukko ja sen osat Otsikot Taulukon tarkastelun lähtökohta on otsikko. Otsikkojen tulee selkeästi erotella taulukot toisistaan, jotta ne voidaan koota erilliseksi taulukkoluetteloksi. Taulukko-otsikossa tulisi kertoa 1) mikä on tutkittava joukko, 2) mitä asiaa (muuttujaa) taulukko kuvaa ja miten se on luokiteltu, 3) mikä on havaintojen ajankohta ja 4) millaista mittayksikköä mittarissa käytetään. Jos kaikki asiat kirjoitetaan otsikkoon, se paisuu helposti turhan pitkäksi. Esimerkiksi mittayksiköt voi jättää pois taulukon otsikosta ja ilmoittaa rivitai sarakeotsikoissa. Tämä on perusteltua erityisesti, jos samaan taulukkoon on koottu tietoja, joissa käytetään eri mittayksikköjä. Liian pitkäksi paisuvaa otsikkoa voi myös tukea alaviitteillä.
Oma nimesi Tehtävä 3.1 2 (5) Rivi- ja sarakeotsikot Solut Rivi- ja sarakeotsikoista eli taulukkopäistä löytyvät tarkasteltavien muuttujien ja niiden luokkien nimet mahdollisimman selkeästi. Jos on käytetty hierarkkista luokittelua, on se tuotava selkeästi esiin. Silloin kun taulukossa käytetään useampia mittayksiköitä, yksiköt on esitettävä rivin tai sarakkeen otsikossa. Soluihin on koottu havainnot taulukkopään jäsennysten mukaan. Kun taulukkoon kootaan useampia muuttujia, puhutaan ristiintaulukoinnista. Seuraavassa esimerkkitaulukossa on koulun oppilaiden pituus ja sukupuoli taulukoitu ristiin: Taulukko 1. Tytöt ja pojat pituuden mukaan luokiteltuna Pituus cm Sukupuoli Tytöt 100 119 80 10 Pojat 120 139 140 120 140 159 100 150 160 180 10 50 Kussakin aineistoruudussa kerrotaan niiden havaintojen määrä, joilla on sekä sarakkeen että rivin ominaisuus. Esimerkkitaulukossa ensimmäisen rivin vasemmanpuoleisessa solussa ilmoitetaan 100 119 -senttisten tyttöjen lukumäärä ja oikeanpuoleisessa samankokoisten poikien määrä. Näin saadaan selville havaintoaineiston sisäisiä riippuvuuksia. Esimerkkitaulukko osoittaa, että tässä tutkitussa ryhmässä pojat ovat keskimäärin pitempiä kuin tytöt. Luvut taulukossa Prosenttien esittäminen Hyvässä taulukossa on aina selkeästi esitetty, onko prosenttiluvut laskettu sarakkeittain vai riveittäin. Tämä käy ilmi merkitsemällä taulukkopäähän (sarake- tai riviotsikkoon tai niiden välittömään läheisyyteen) prosentin merkki ja kirjoittamalla prosenttijakauman loppuun summa, joka on yleensä sata. Tietenkin myös absoluuttisista luvuista lasketun summan solu tulee merkitä siten, että se erottuu muista soluista. Jos laskemissuunta ei käy ilmi, lukijan täytyy se erikseen tarkistaa. Prosenttien kantaluku on luku, josta laskettuja osuuksia prosenttiluvut kuvaavat. Prosenttijakaumia vertailtaessa on aina kiinnitettävä huomiota prosenttien kantalukuihin. Mitä pienempi prosenttilaskun kantaluku on, sitä enemmän prosenttijakaumat sisältävät satunnaisvaihtelua. Prosenttien laskemista sataa pienemmistä kantaluvuista tulisi välttää. Kantalukua koskevan tiedon tulee löytyä prosenttien summasolun (= 100 %) vierestä (ks. ensimmäinen taulukko). Lukujen pyöristäminen Kovin monta numeroa sisältävien lukujen esittäminen varsinkaan analyysitaulukoissa ei ole suotavaa. Lukujen mahdollinen jatkokäyttö vaatii kuitenkin toisinaan, että havaintojen lukumäärä esitetään taulukoissa mahdollisimman tarkasti. Niitä luettaessa kannattaa pyöristää lukuja
Oma nimesi Tehtävä 3.1 3 (5) mielessään riittävästi ja etsiä suuria linjoja. Esimerkiksi otostutkimuksissa ei yleensä saada tuloksia, joiden tosiasiallinen tarkkuus ylittäisi kolmen merkitsevän numeron tarkkuuden. Tarkat luvut on luontevinta esittää liitematriiseissa ja pyöristää luvut analyysitaulukoissa. Merkintätavat ja viitteet Taulukko 2. Merkintätapoja taulukossa - ei yhtään 0 alle 0,5. tieto ei loogisesti mahdollinen.. tietoa ei ole saatu, se on liian epävarma esitettäväksi, tai sitä ei tietosuojasyistä saa esittää * lukuun liitettynä kertoo, että kyseessä on ennakkotieto Alaviitteissä kerrotaan yksittäiseen soluun, riviin tai sarakkeeseen mahdollisesti liittyviä erityistietoja. Alaviitteessä on maininta esimerkiksi siitä, jos tieto on eri vuodelta kuin otsikko ilmoittaa, jos tieto eroaa käsitteellisesti otsikon ilmoittamasta tai on laadultaan poikkeava muista tiedoista (esimerkiksi saatu eri lähteestä). Jos esitetyssä aikasarjassa on vertailua haittaava katkos, se pitää merkitä selvästi joko soluun tai alaviitteellä.
Oma nimesi Tehtävä 3.1 4 (5) Lähdeviite Taulukon alla tulee tarvittaessa kertoa myös taulukon lähde. Lähdeviite on erityisesti tarpeen silloin, kun käytetään useammasta lähteestä poimittuja taulukoita.
Oma nimesi Tehtävä 3.1 5 (5) Lähde Tilastokeskus 2006. Verkkokoulu. Luettavissa: http://tilastokoulu.stat.fi/verkkokoulu_v2.xql?page_type=sisalto&course_id= tkoulu_tlkt&lesson_id=2&subject_id=1. Luettu 20.10.2013