Tilastotieteen rooli uuden tieteellisen tiedon tuottamisessa

Samankaltaiset tiedostot
Tilastotieteen rooli uuden tieteellisen tiedon tuottamisessa Mitä tilastotiede on?

Tilastotieteen rooli uuden tieteellisen tiedon tuottamisessa Tieteen ja tutkimuksen lähtökohtia

Laadullinen tutkimus. KTT Riku Oksman

TUKIMATERIAALI: Arvosanan kahdeksan alle jäävä osaaminen

Teoreettisen viitekehyksen rakentaminen

hyvä osaaminen

TUKIMATERIAALI: Arvosanan kahdeksan alle jäävä osaaminen

Mitä on laadullinen tutkimus? Pertti Alasuutari Tampereen yliopisto

TIEDONINTRESSI. Hanna Vilkka. 10. huhtikuuta 12

Yhteistyöaineiden edustajan puheenvuoro

hyvä osaaminen. osaamisensa tunnistamista kuvaamaan omaa osaamistaan

Politiikka-asiakirjojen retoriikan ja diskurssien analyysi

KTKP040 Tieteellinen ajattelu ja tieto

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

arvioinnin kohde

Tieteellinen tutkimus, käytännölliset odotukset tutkijan valinnat

Sisällönanalyysi. Sisältö

arvioinnin kohde

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Tiede ja tutkimus (Teemaopintokurssi TO1.1)

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Matemaatikot ja tilastotieteilijät

Käsitteistä. Reliabiliteetti, validiteetti ja yleistäminen. Reliabiliteetti. Reliabiliteetti ja validiteetti

Psykologia tieteenä. tieteiden jaottelu: TIETEET. EMPIIRISET TIETEET tieteellisyys on havaintojen (kr. empeiria) tekemistä ja niiden koettelua

Tieteenfilosofia 3/4. Heikki J. Koskinen, FT, Dos. Helsingin yliopisto / Suomen Akatemia

Harjoitus 7: NCSS - Tilastollinen analyysi

Laadullisen tutkimuksen luonne ja tehtävät. Pertti Alasuutari professori, Laitoksen johtaja Yhteiskuntatieteiden tutkimuslaitos

Pro gradu -tutkielmien arvostelu maantieteessä

HAVAINTO LÄhde: Vilkka 2006, Tutki ja havainnoi. Helsinki: Tammi.

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotiede käytännön tutkimuksessa, kesä 2003

Otannasta ja mittaamisesta

TUTKIMUSOTTEITA TIEDONINTRESSIN NÄKÖKULMA

Tieteenfilosofia 4/4. Heikki J. Koskinen, FT, Dos. Helsingin yliopisto / Suomen Akatemia

Tilastotiede ottaa aivoon

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Tilastotiede ottaa aivoon

Lauri Hellsten, Espoon yhteislyseon lukio Mika Setälä, Lempäälän lukio

MATEMAATTIS- LUONNONTIETEELLINEN OSAAMINEN

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Etiikan mahdollisuudesta tieteenä. Henrik Rydenfelt Helsingin yliopisto

Kvantitatiivisen aineiston analyysi

SP 11: METODOLOGIAN TYÖPAJA Kevät Yliopistonlehtori, dosentti Inga Jasinskaja-Lahti

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

Yhteiskuntafilosofia. - alueet ja päämäärät. Olli Loukola / käytännöllisen filosofian laitos / HY

LAADULLISEN TUTKIMUKSEN OMINAISLAATU

Tutkiva Oppiminen Varhaiskasvatuksessa. Professori Lasse Lipponen PED0031, VARHAISPEDAGOGIIKKA

Tarvitseeko informaatioteknologia matematiikkaa?

Verkko-oppiminen: Teoriasta malleihin ja hyviin käytäntöihin. Marleena Ahonen. TieVie-koulutus Jyväskylän lähiseminaari

Gradu-seminaari (2016/17)

Miten tutkimuksen tietovarannot liittyvät etiikkaan ja viestintään? Tutkimusaineiston elinkaari

KIRJALLISUUTTA 1. Tieteen etiikka KIRJALLISUUTTA 3 KIRJALLISUUTTA 2 KIRJALLISUUTTA 4 KIRJALLISUUTTA 5

Kvalitatiivinen tutkimustoiminta

Farmaseuttinen etiikka

TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN

Mitä taitoja tarvitaan tekstin ymmärtämisessä? -teorian kautta arkeen, A.Laaksonen

Rauman normaalikoulun opetussuunnitelma 2016 Fysiikka vuosiluokat 7-9 KUVA PUUTTUU

Kielellisten merkitysten tilastollinen ja psykologinen luonne: Kognitiivisia ja filosofisia näkökulmia. Timo Honkela.

Mitä eri tutkimusmetodeilla tuotetusta tiedosta voidaan päätellä? Juha Pekkanen, prof Hjelt Instituutti, HY Terveyden ja Hyvinvoinnin laitos

Matematiikka ja tilastotiede. Orientoivat opinnot /

Tutkintojen, oppimäärien ja muiden osaamiskokonaisuuksien sijoittuminen vaativuustasoille

Työelämävalmiudet: Oivallus-hankeken seminaari

Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto

Kandidaatintutkielman arviointikriteerit

6 TARKASTELU. 6.1 Vastaukset tutkimusongelmiin

FYSIIKKA_ opetussuunnitelma-7_9_maol

Yleistä lukion ainevalinnoista

Rekisterit tutkimusaineistona: tieteenfilosofis-metodologiset lähtökohdat

Joustavuus ja eettisyys: Opiskelija osaa tehdä päätöksiä ja toimia itsenäisesti terveystieteiden eettisten perusteiden mukaisesti

INNOVAATIOIDEN SUOJAAMINEN LIIKESALAISUUKSIEN JA PATENTTIEN AVULLA: YRITYKSIIN VAIKUTTAVIA TEKIJÖITÄ EU:SSA TIIVISTELMÄ

Sovellettu todennäköisyyslaskenta B

Tavoitteet ja sisällöt, 7. luokka

Teoria tieteessä ja arkikielessä. Teoriat ja havainnot. Teorian käsitteitk. sitteitä. Looginen positivismi ja tieteen kielen kaksitasoteoria (1)

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

MITÄ EETTINEN ENNAKKOARVIOINTI ON? Veikko Launis Lääketieteellinen etiikka Turun yliopisto

Tieteen julkisuus ja tiedeviestintä. Esa Väliverronen

P5: Kohti Tutkivaa Työtapaa Kevät Tehtävä 3. Murtonen Lehtinen Olkinuora. ja näiden näkemysten yhteys sekä

BIOS 1 ja OPS 2016 OPS Biologian opetussuunnitelma Opetuksen tavoitteet

EDUTOOL 2010 graduseminaari


Ohjelmistojen mallintaminen, mallintaminen ja UML

Talousmatematiikan perusteet ORMS.1030

PSYKOLOGIA Opetuksen tavoitteet Aihekokonaisuudet Arviointi

Kuvattu ja tulkittu kokemus. Kokemuksen tutkimus -seminaari, Oulu VTL Satu Liimakka, Helsingin yliopisto

1. Tilastollinen malli??

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Pisan 2012 tulokset ja johtopäätökset

Tilastollisen tutkimuksen vaiheet

pitkittäisaineistoissa

Tekniikan alan kesäkandiseminaari Tiede ja tieteen pelisäännöt. Stina Giesecke Vanhempi yliopistonlehtori

Matematiikka tai tilastotiede sivuaineena

5.10 Kemia. Opetuksen tavoitteet

Johdantoa. Jokaisen matemaatikon olisi syytä osata edes alkeet jostakin perusohjelmistosta, Java MAPLE. Pascal MathCad

Talousmatematiikan perusteet ORMS.1030

5.6.3 Matematiikan lyhyt oppimäärä

Oppimistavoitematriisi

KVANTITATIIVINEN TUTKIMUS

Mitä on tutkimus ja tutkijan työ? Luonnonvarakeskus

Työelämäläheisyys ja tutkimuksellisuus ylemmän amktutkinnon. Teemu Rantanen yliopettaja

MONOGRAFIAN KIRJOITTAMINEN. Pertti Alasuutari

Transkriptio:

1 Tilastotieteen rooli uuden tieteellisen tiedon tuottamisessa Tiede ja tutkimus Tiede on järjestelmällistä ja järkiperäistä uuden tiedon hankintaa. Tieteellinen tutkimus on tutkivan subjektin ja tutkimusobjektin välistä vuorovaikutusta. Järkiperäisyyden (rationaalisuuden) vaatimus asettaa ehtoja tieteelliselle ajattelutavalle: tiede ei voi nojautua yksilölliseen vaistoon tai intuitioon, suostutteluun, propagandaan tai jumalalliseen ilmoitukseen, vaan tiedon perustelun on tapahduttava tiedeyhteisön hyväksymän tutkimusmenetelmän avulla. (Haaparanta & Niiniluoto 1986, 7.) Yleisiä tieteellisen menetelmän kriteereitä ovat objektiivisuus, kriittisyys, autonomisuus ja edistyvyys. Tiede on subjektiivista, jos sen tuloksiin vaikuttavat yksityisten tutkijoiden henkilökohtaiset mieltymykset, toiveet ja ennakko-oletukset. Tiede on objektiivista, kun sen tulosten sisältö vastaa tutkimuskohteen ominaisuuksia. Kunkin aikakauden tieteellinen tieto on aina ollut enemmän tai vähemmän subjektiivista, sidoksissa ajallisesti muuttuviin ajattelutapoihin. Tieteen subjektiivisuutta voidaan kuitenkin vähentää noudattamalla julkisuusperiaatetta eli hyväksymällä tieteen tuloksiksi vain tiedeyhteisössä käydyn kriittisen keskustelun tulokset. Tieteen kriittisyys ilmenee niinä vaatimuksina, joita hypoteesin eli tutkijan esittämälle tutkittavan ongelman ratkaisuehdotuksen perustelemiselle, testaamiselle ja hyväksymiselle on asetettu: tieteellisten hypoteesien tulee olla intersubjektiivisesti testattavissa eli niillä täytyy olla yhdessä sopivien lisäoletusten kanssa sellaisia seurauksia, joiden totuus tai virheellisyys voidaan julkisesti tarkistaa. Tieteen autonomisuus ilmenee siinä, että tieteen tulosten arvioiminen on tieteellisen yhteisön oma asia, johon tieteen ulkopuolella olevat ryhmät eivät saa vaikuttaa. Tieteessä ei siis ole hyväksyttävää vedota siihen, että väitteen totuus olisi toivottavaa tai epätoivottavaa esimerkiksi poliittisista, uskonnollisista tai moraalisista syistä. Tieteen edistyminen merkitsee kasvun eli tulosten määrällisen lisääntymisen ohella sitä, että virheellisiä hypoteeseja tai teorioita korvataan uusilla tuloksilla, jotka ovat tosia tai ainakin vähemmän virheellisiä kuin aikaisemmat. (Haaparanta & Niiniluoto 1986, 15-17.)

2 Tieteelliselle ajattelulle on Eskolan (1982) mukaan tunnusomaista myös se, että se pohtii ja kehittelee omia paradigmojaan, oman toimintansa perusteita. Näitä perusteita ei voida mekaanisesti johtaa empiirisistä havainnoista eli siitä miltä asiat näyttävät. Tästä seuraa se perustava ero, että kun arkiajattelu tyytyy järjestämään havaintonsa spontaanisti mieleen nousevien teorioiden avulla, kehittää tiede teoriaa kriittisesti ja määrätietoisesti rationaalisen ajattelun keinoin. Jokaisen tutkimuksen lähtökohtana on - tai ainakin pitäisi olla - tiedollisen uteliaisuuden, käytännön tarpeiden tai teorian kehittämispyrkimyksen herättämä ongelma, johon tutkimuksen avulla etsitään vastausta (Eskola 1967, 9). Tutkimus yrittää toisin sanoen käsittää sekä tutkitun ilmiön että sen tajunnassa synnyttämät spontaanit mielikuvat tai arkipäivän teoriat. Tutkimus antaa kuitenkin aina vajavaisen kuvan tutkimuskohteesta (Alkula ym. 1994, 20). Ensinnäkin havaittava tieto ei mitenkään pysty kattamaan kaikkea tutkimuskohteeseen liittyvää ja toisaalta ymmärtämiseen tarvittava havaintomaailman hahmotus tuottaa ideologisesti ja historiallisesti sitoutuneita yksinkertaistavia sekä luonteeltaan usein hyvin teoreettisia abstraktioita. Tutkimus edellyttää arkikieltä täsmällisempää kommunikaatiota, joten ongelmaan liittyvien käsitteiden huolellinen määritteleminen ja erittely tarpeellista, sillä vaikka määritelmät eivät korvaa empiiristä tietoa, ne kyllä vaikuttavat tiedon järjestymiseen ja sen perusteella tehtäviin päätelmiin (Eskola 1967, 25). Koska monet luonnontieteelliset ilmiöt ovat luonteeltaan varsin pysyviä, voidaan niihin liittyen tehdä luotettavasti laajojakin yleistyksiä, selityksiä voidaan empiirisesti testata ja matemaattisia esityksiä voidaan hedelmällisesti kehittää. Toisin kuin luonnontieteissä, yhteiskuntatieteissä tarkastellaan usein ilmiöitä, jotka eivät suurelta osin ole toistettavia ja jotka vaihtelevat huomattavasti ajan myötä; tieto ei voi kasaantua tavanomaisessa tieteellisessä mielessä, koska se ei kykene ylittämään historiallisia rajojaan. Lisäksi käsitteet ovat harvoin arvovapaita ja useimmat niistä voidaan korvata toisilla käsitteillä, joilla on hyvin erilainen arvosisältö. Vaikka tämä teoreettisten käsitteiden arvottava lataus näyttää osaksi olevan tarkoituksellista, niin arvoihin sitoutuminen on toisaalta miltei väistämätön sosiaalisen olemassaolon sivutuote ja yhteiskunnan jäseninä meillä on tuskin mahdollisuutta irtautua arvoistamme, kun pyrimme ammatillisiin päämääriin. (Gergen 1973.) Normatiivisten tai arvopainotteisten valintojen tunnistaminen saattaa olla vaikeaa, mutta myös päinvastainen ongelma on olemassa: tutkimusta arvioidaan siihen perustellusti tai perusteettomasti kiinnitettyjen arvonäkökohtien mukaan. Vaikka on mahdotonta päästä neutraaliuteen ja objektiivisuuteen olisi tämä pulma silti pystyttävä tiedostamaan. Omien arvojen mahdollisimman selvä eksplikointi on yksi keino, jolla yritetään ratkaista piiloarvojen vaikutusta tutkimukseen. (Alkula ym. 1994, 11-12.)

3 Kun yhteiskunnan rakenne ja toiminta on ehdollinen siinä käytettävän merkitysjärjestelmän suhteen, joudutaan myös kysymys mittaamisesta asettamaan suhteessa tähän käsitejärjestelmään. Jotta pystyttäisiin mittaamaan yhteiskunnallisia ilmiöitä, joudutaan tekemään erilaisia kompromisseja mittauksen eksaktisuus- ja systemaattisuusvaatimusten ja arkikielen monimerkityksisyyden välillä. Kvantitatiiviset ja kvalitatiiviset menetelmät, samoin kuin niiden sisäiset vaihtoehdot ja erilaiset menettelytavat voivat täydentää toisiaan jossain tutkimusongelmassa, mutta ne voivat kilpailla keskenään jossain toisessa yhteydessä. (Alkula ym. 1994, 12-13.) Tässä esityksessä on Alkulan ja kumppaneiden (1994, 13) teoksen kaltaisesti lähtökohtana metodologinen pluralismi: kaikkia menetelmiä voi soveltaa hyvin tai huonosti, mutta niitä voi käyttää myös luovasti väärin. Tavoitteena on esitellä tilastotieteen tarjoamia keinoja käytännön tutkimusongelmien ratkaisuun. Pelkkien menetelmien kuvaamisen sijaan pyritään hahmottamaan tilastotieteellisen ajattelun perusteita ja siihen kuuluvien elementtien välisiä suhteita. Kun tutkimuksessa käytetään tilastotieteen menetelmiä, on yleensä tapana puhua kvantitatiivisesta tutkimuksesta (vastakohtanaan kvalitatiivinen tutkimus). Omasta mielestäni näin kärjistävää jakoa ei ole tarkoituksenmukaista käyttää - se vain luo keinotekoisia raja-aitoja ongelmanratkaisuun sopivien menetelmien soveltamiselle. Mitä tilastotiede on? Opinto-oppaan mukaan tilastotiede on reaalimaailmaa koskevan tiedon keräämisen, käsittelyn, analysoinnin sekä johtopäätösten teon tietoa ja taitoa. Lyhyemmän määritelmän mukaan tilastotieteen päämääränä on tuottaa ymmärrystä havaintoaineistossa piilevästä informaatiosta. Tilastotiedettä on luonnehdittu myös "maalaisjärjen tehostukseksi", jossa sattuma ja systemaattisuus pyritään erottamaan toisistaan; tilastotiede auttaa mallintamaan asioita ja luo näin järjestystä elävän elämän moniselkoisuuteen. Tilastotieteen nimi tuo useimmille mieleen tilastot. Ilkka Mellin (1996, 1) aloittaa tilastotieteen määrittelyn kuitenkin kertomalla heti aluksi, mitä tilastotiede ei ole: tilastotiede ei ole oppia tilastoista ja niiden tekemisestä. Kokonaan toinen asia on se, että tilastot ovat usein tilastotieteen soveltajan tutkimuskohteena ja tilastojen laadinnassa käytetään apuna tilastotieteen menetelmiä;

4 tilastotieteen käyttöalue on paljon tätä laajempi. Tilastojen keräämisestä ja laadinnasta eli Tilastokeskus -tyyppisestä tilastotuotannosta käytetään yleensä nimitystä tilastotoimi, jotta se erottuisi yleisemmästä tilastollisesta tutkimuksesta. Mellin (1996, 2) luonnehtii tilastotiedettä seuraavasti: Tilastotiede koostuu numeeristen tietojen jalostamisen menetelmistä, joita tilastotieteilijät kehittävät ja joita tilastotieteen soveltajat käyttävät käsitellessään numeerisia tutkimusaineistoja. Tässä pragmaattisessa luonnehdinnassa tilastotiede siis määritellään "työkalupakin" kautta - toisin sanoen tilastotieteen alaan kuuluvaksi tulkitaan sellaiset ongelmanasettelut, joissa ainakin yksi pakista löytyvä työkalu näyttelee merkittävää osaa. Menetelmien kautta tulkittuna määritelmä jää kuitenkin pohjimmiltaan makuasiaksi, sillä jokaisen pakkiin kertyy perusarsenaalin jälkeen lähinnä oman kiinnostuksen mukaisia työkaluja. Mellin (1996, 2) toteaakin kokoavasti, että saadakseen selville mitä tilastotiede on, pitää opiskella tilastotiedettä ja sen käyttöä. Tilastotieteen tulkitaan sijoittuvan tieteiden kentässä menetelmätieteiden joukkoon matematiikan, filosofian ja tietojenkäsittelytieteen rinnalle. Menetelmätieteille on ominaista se, että ne kehittävät työkaluja muiden tieteiden tutkimusongelmien ratkaisemiseksi, mutta niillä on myös oma itsenäinen, sovelluksista vapaa teorianmuodostuksensa. Tilastotieteen muista menetelmätieteistä erottavana tärkeimpänä tekijänä mainitaan usein se, että tilastotieteellisissä tutkimusasetelmissa on tavallisesti mukana sattuma muodossa tai toisessa. Tilastollisten menetelmien avulla pyritään kuvaamaan ja erottamaan tutkittavien ilmiöiden säännönmukaiset ja satunnaiset piirteet. (Mellin 1996, 2.) Tilastotieteeksi voidaan siis tulkita niin teoreettis-matemaattiset kuin soveltavan tietojenkäsittelyllispainotteiset lähestymistavat. Oheisessa kuvassa on esitetty hahmotelma näiden suhteista toisiinsa. Kuvan kentässä "neutraali" tilastotiede olisi origossa ja näin ollen käytännössä kohdattavan tilastotieteen voisi hahmottaa enemmän tai vähemmän satunnaisena vaelteluna keskipisteen ympärillä tutkijan kiinnostuksen kohteiden mukaan. Matematiikka Soveltava Teoreettinen Tietojenkäsittely

5 Aineisto ja ongelmalähtöisyys Tilastotieteessä aineisto on ratkaisevassa asemassa. Aineiston käyttäminen on se tekijä, joka erottaa tilastotieteen matematiikasta; pelkkä menetelmien kehittäminen on matematiikkaa. Toisaalta pelkkään aineistoon keskittyminen on tietojenkäsittelyä, joksi tilastotiedettä ei voi myöskään puhtaasti tulkita. Professori Seppo Mustonen on todennut, että tilastotiedettä pitäisi oikeastaan kutsua tietojenkäsittelytieteeksi, ellei nimi olisi jo varattu toisen tieteenalan (computer science) käyttöön. Suomen kielessä tietojenkäsittely nimittäin ymmärretään laajemmassa mielessä ohjelmoitavissa olevaksi automatisoimiseksi, jota tilastotiede ei perusolemukseltaan suinkaan ole. Kvantitatiivisia aineistoja on perinteisesti pidetty objektiivisina faktoina asioiden tilasta. Jokainen käytännön aineistojen kanssa tekemisissä ollut kuitenkin tietää, että asia ei ole ihan niin suoraviivainen. Kuten jo aikaisemmin todettiin, erityisesti ei-teknisten sovellusten osalta aineistoa on lisäksi tulkittava siinä sosiaalisessa ja historiallisessa kontekstissa, josta se on peräisin. Irvine ja kumppanit (Irvine ym. 1979, 3) toteavat osuvan provosoivasti, että nämä ennakkoehdot johtavat siihen, että aineistoa ei kerätä vaan se tuotetaan. Tuotetun aineiston perusteella ei löydetä vaan luodaan tuloksia, mutta tämä ei tarkoita, etteivätkö tulokset olisi käyttökelpoisia. Järkevän käytön ehtona on kuitenkin menetelmien, aineiston ja tutkittavan ilmiön pintaa syvemmälle ulottuva tuntemus - menetelmien oletukset on osattava ottaa huomioon ja toisaalta odottamattomien tulosten syyt on pystyttävä jäljittämään. Ongelmalähtöisyys on yksi tilastotieteen historian vedenjakajia. Omasta mielestäni hedelmällisimmillään analyysi on ymmärtävän eksploratiivista ja paradigmojen rajoja ennakkoluulottomasti rikkovaa. On pystyttävä valitsemaan ja käyttämään menetelmiä, jotka antavat aineistosta vastauksia haluttuihin kysymyksiin on käytettävä niin yksinkertaisia menetelmiä kuin mahdollista, mutta ei yhtään yksinkertaisempia. Toisin sanoen ongelmanratkaisussa tarvitaan metodisen osaamisen lisäksi välttämättä myös substanssitietoutta, jotta pystytään arvioimaan ongelmanasettelun ja tulosten tarkoituksenmukaisuutta. Tutkijan tieteelliset ja yhteisölliset sitoumukset heijastuvat välttämättä tutkimuksen kulkuun, mutta toimijuuden ei silti tarvitse olla (enemmän tai vähemmän) luovaa toistoa tietyn menetelmän ja käsitteellisen maailman rajoissa (vrt. Ronkainen 1998). Myös tutkimuksen aikana tehdyt havainnot vaikuttavat varmasti lopullisiin johtopäätöksiin, sillä juuri ne syventävät aineiston ja ilmiön tuntemusta. Parhaimmillaan tuloksena on yksityiskohtainen ja periaatteessa myös toiston mahdollistava vakuuttava kuvailu tutkimusprosessin etenemisestä ja saatujen tulosten järkevyydestä.

6 Toisaalta tilastollisen ja matemaattisen päättelyn osaamisen välttämättömyys voi johtaa tutkittavan ilmiön kannalta täysin epäoleelliseen tekniseen näpertelyyn. Niin sanottu kolmannen tyypin virhe onkin saada oikeita vastauksia vääriin kysymyksiin (vrt. Hand 1994). Yleinen mielipide asettaa kuitenkin helposti yhtäläisyysmerkit tieteellisyyden ja matemaattisuuden välille ilman perusteluja. Samalla mielikuvien tasolla elää käsitys menetelmätieteiden vaikeudesta, ja tällöin teknistä esitystä käyttävää tutkijaa pidetään lahjakkaana, koska hän kykenee käyttämään vaikeita menetelmiä. Edelleen kuvitellaan virheellisesti, että tällainen esitys sinänsä takaa sen, että tutkimus on ideologisesti vähemmän sitoutunutta kuin muu tutkimus (Ilmakunnas 1998). Tilastotieteen muuttuva rooli Tilastotiede on saanut alkunsa siitä, että yhteiskunnan modernisoituessa yhteiskunnasta on tarvittu yhä enemmän tietoja sen hallinnon tarpeisiin. Samalla on syntynyt tarve kehittää menetelmiä, joiden avulla tilastojen luotettavuutta on voitu parantaa ja jotka toisaalta mahdollistavat tilastoihin perustuvien johtopäätösten teon. Suurin osa tilastotieteen menetelmistä on alun perin kehitetty jonkin konkreettisen tutkimusongelman innoittamana. Koska kiinnostuksen kohteena olevat ilmiöt ovat sekä ajallisesti että kulttuurillisesti riippuvia, ei menetelmien perusteitakaan voida niiden matemaattisuudesta huolimatta välttämättä pitää neutraaleina (MacKenzie 1979). Tilastotiedettä on kritisoitu sen "positivismista". Positivistisessa lähestymistavassa lähtökohtana on, että ilmiöt noudattavat luonnontieteiden tapaan universaaleja lakeja ja että ilmiöiden käyttäytymisen lait on mahdollista johtaa hierarkkisesti muutamasta yleisestä peruslaista; positivisteille selittäminen ja ennustaminen ovat pohjimmiltaan samoja asioita. Kritiikkiä on esitetty muun muassa siitä, että sosiaalitieteissä "aineisto" koostuu sosiaalisista merkityksistä, joiden tulkinta ja ymmärtäminen edellyttää muutakin kuin havaitun aineiston - esimerkiksi tekstiä luettaessa tavoitteena on ymmärtää sitä eikä vain tarkastella erillisiä kirjainmerkkejä ja niiden yhdistelmiä. Myös universaalien lakien edellyttämää arvovapautta on helppo arvostella. (Keat 1979.) Vaikka monilla tilastotiedettä hyödyntävillä tutkijoilla on ollut ja on edelleen puhtaan positivistisia ajatuksia, ei tilastotiede kuitenkaan itsessään ole sitoutunut mihinkään yksittäiseen paradigmaan. Jos kvantitatiivinen mittaus pystyy antamaan tutkittavasta ilmiöstä tutkimusongelman kannalta relevanttia tietoa, voidaan aineiston analyysissa käyttää tilastollisia menetelmiä. Menetelmät eivät välttämättä ole järkeviä, mutta ne ovat joka tapauksessa eksplikoitavissa, jolloin jokainen voi arvioida saatuja tuloksia suhteessa aineistoon, sen ennakkoehtoihin ja käytettyihin menetelmiin (vrt. Alkula ym. 1994, 22).

7 Heikkojen laskentamahdollisuuksien aikana tilastotieteen opetus oli hyvin teoreettispainotteisista ja analyysien tekeminen käytännössä varsin työlästä. Nopeasti kehittyneiden tietojenkäsittelyllisten resurssien myötä tilastotiede on kuitenkin muuttanut luonnettaan suuntaan, jossa monimutkaisiakin analyyseja on mahdollista käytännössä tehdä nappia painamalla, vaikka menetelmien teoreettisesta taustasta ei tietäisikään mitään. Toisin sanoen tietokoneiden ja tilastollisten ohjelmistojen helppokäyttöisyys on johtanut siihen, että tilastollisia ohjelmistoja on mahdollista käyttää ymmärtämättä mistä on itse asiassa kysymys. (vrt. Nicholls 1999.) Nykyään tilastoja ja tilastotiedettä käytetäänkin esimerkiksi tiedotusvälineissä paljon väärin. Väärinkäyttö on usein tahatonta ja johtuu usein toimittajien puutteellisesta koulutuksesta, mutta myös tahallista väärinkäyttöä esiintyy. Väärinkäyttöön syyllistyvät valitettavan usein myös tutkijat. Tilastotieteen menetelmät vaativat soveltajiltaan paljon. Monet tilastolliset menetelmät ovat vaikeita ja niitä soveltavat valitettavan usein sellaiset tutkijat, joilla on tilastotieteestä vain perustiedot, jos sitäkään. (Mellin 1996, 7.) Vaikka helppokäyttöisistä tilasto-ohjelmistoista on riittävät perustaidot omaaville käyttäjille erittäin paljon hyötyä, voi kuitenkin käydä niin, että koneiden sekä ohjelmistojen käytön opettaminen ja opettelu rajoittaa itse tilastotieteen opettamiselle ja opettelulle jäävää aikaa. Tässä esityksessä ei paneudutakaan yksittäisten ohjelmistojen saloihin tai ongelmiin - tavoitteena on johdatella ymmärtämään niitä ajattelutapoja, jotka ovat ominaisia tilastolliselle tutkimukselle. Tilastotieteen sovellusaloja ja suhde muihin tieteisiin Tilastotiedettä käyttävät apuvälineenään kaikki tieteenalat, joissa analysoidaan numeerista tietoa. Siten kaikki empiiriset tieteet hyödyntävät tilastollisia menetelmiä. Esimerkiksi luonnontieteet kuten fysiikka ja kemia, biotieteet kuten biologia, lääketiede ja maatalous- ja metsätieteet, yhteiskuntatieteet kuten sosiologia ja kansantaloustiede sekä humanistiset tieteet kuten arkeologia, historia ja kielitiede soveltavat tilastollisia menetelmiä tutkimusaineistojensa analyysiin. Itse asiassa kaikki kokeellinen tutkimus käyttää apunaan tilastollisia menetelmiä. (Mellin 1996, 6.) Koska tilastotieteellä on sovelluksensa miltei kaikilla empiiristä tutkimustoimintaa harrastavilla tieteenhaaroilla, on erittäin vaikeata, usein jopa mahdotonta, rajata tilastotieteen ja muiden tieteiden tutkimuskenttiä. Tästä tieteiden päällekkäisyydestä johtuen on otettu käyttöön nimityksiä, joilla

8 halutaan tuoda korostetusti esiin kyseinen tutkimusalue jo pysyvät aseman saavuttaneiden oppiaineiden välimaastossa. Niinpä esimerkiksi ekonometria on tilastotieteen ja kansantaloustieteen välinen "rajatiede"; sekä tilastotieteen että kansantaloustieteen tutkintovaatimuksiin kuuluu ekonometrisia oppikirjoja. (Vasama & Vartia 1970, 12.) Erilaisiksi tilastotieteen nimityksiksi voidaan tulkita muiden muassa väestötiede eli demografia, psykometriikka, sosiometria, ekonometria, management science, induktiologiikka, informaatioteoria, matemaattinen tilastotiede, todennäköisyyslaskenta, systeemiteoria, stokastiikka, laskennalliset menetelmät, data mining, knowledge discovery, hahmontunnistus, tekoäly, koneoppiminen, neurolaskenta, laadun tarkkailu, teknometria, operaatioanalyysi, koesuunnittelu, statistinen mekaniikka, kemometria, biometria, biostatistiikka, teoreettinen epidemiologia, genetiikka ja niin edelleen. Tilastotieteellisen ajattelun keskeiset elementit Pfannkuch ja Wild (2000) esittävät artikkelissaan joukon elementtejä, jotka luovat perustan tilastotieteelliselle ajattelulle. Elementit on kuvattu niin yleisellä tasolla, että ne eivät enää ole sidoksissa yksittäiseen ongelmaan, vaan heijastelevat kaikille ongelmanasetteluille yhteisiä piirteitä. Ensimmäinen elementti on satunnaisvaihtelun huomioiminen. Toisin sanoen tilastotieteellisessä ajattelussa erotetaan systemaattinen ja satunnainen vaihtelu toisistaan. G.E.P. Boxin sanoin: "Knowledge about our world is, and always must be, partial knowledge." Abstraktin mallin tasolla ilmiötä voidaan kuvata yhtälöllä y = f(x) + e, jossa y on selitettävä ilmiö, x on tunnettu ja havaittu "selittäjä", f on selittäjän funktio eli se kuvaa selittäjän vaikutusmekanismin selitettävään ilmiöön nähden ja e on virhetermi, joka kuvaa ilmiön selittämätöntä osaa. Toinen keskeinen elementti tilastotieteellisessä ajattelussa on tutkittavan ilmiön ja ongelman hahmottaminen sellaiseksi "järjestelmäksi", että siitä saatava aineisto auttaa paremmin ymmärtämään tätä järjestelmää niin substanssi- kuin tilastotieteellisessäkin mielessä.

9 Järjestelmällä tarkoitetaan tässä yhteydessä joukkoa toisiinsa liittyviä asioita tai osia, jotka toimivat yhdessä tai ovat jonkinlaisessa yhteydessä siten, että niiden voidaan ajatella muodostavan eriteltävissä olevan kokonaisuuden. Tilastollinen malli on matemaattinen kuvaus siitä, kuinka järjestelmässä tapahtuu muutoksia. Nämä määritelmät tarvitsevat tuekseen kuvauksen järjestelmään liittyvistä olioista, ilmiöistä ja toisaalta myös rajoituksista. Hahmottaminen ilmenee kolmessa vaiheessa: operationalisoidessa todellinen ilmiötä kuvaava järjestelmä kvantitatiiviseksi kuvaukseksi järjestelmästä, kokeiltaessa järjestelmästä mitattavissa olevaa aineistoa järjestelmää kuvaavassa tilastollisessa mallissa ja muotoillessa mallista saatavia tuloksia sellaiseen muotoon, että ne auttavat ymmärtämään mitä aineisto kertoo todellisesta ilmiöstä. Kolmantena tilastollisen ajattelun elementtinä voidaan pitää tilastollisten mallin muodostamista ja niihin perustuvaa päättelyä. Oleellista mallin muodostamisessa on, että sitä varten tehtävät abstraktiot ja oletukset sisältävät ongelmanasettelun kannalta keskeiset tekijät sellaisella tavalla, ettei oletuksiin liittyvä informaation häviäminen kyseenalaista saatavia tuloksia. Puhtaasti mallin tasolla olevaa ajattelua keskeisempää on sen takana olevien ideoiden sisäistäminen: vaikutusten eritteleminen on vaikeata, mutta tilastollinen malli on yksi tapa ajatella, kuinka erittely voidaan tehdä. Itse asiassa tilastotieteellinen ajattelu on siis tulkittavissa "maalaisjärjen" formalisoinniksi. Tilastollisia tarkasteluja tehdään, koska substanssitietous ei aina riitä haluttuun käyttöön. Erityisesti päätöksentekoa ja joskus myös pelkkää ymmärtämistä varten on tarpeellista yhdistää tilastotieteen keinoja sekä substanssitietoutta, jotta ongelma saadaan ratkaistua vakuuttavalla ja perustellulla tavalla. Tavoitteena on tällöin siis substanssitietouteen perustuen tuottaa uutta tietoa hyödyntäen tilastotieteen keinoja siten, että uusi tieto lisää myös substanssitietoutta. Toisin sanoen tilastollista ajattelua ja substanssitietoutta ei tulisi liikaa irrottaa toisistaan. Optimaalisin tilanne olisi sellainen, että jokainen tutkija olisi tilastotieteilijä (ja jokainen tilastotieteilijä tutkija). Muiksi tilastollisen ajattelun osatekijöiksi voidaan mainita muiden muassa rikas mielikuvitus ja toisaalta kriittinen ajattelu. Ilman mielikuvitusta uusia yhteyksiä ei keksi etsiä ja ilman kriittistä pohdiskelua tulosten vakuuttavuus voi kärsiä.

10 Kirjallisuus: Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994): Sosiaalitutkimuksen kvantitatiiviset menetelmät. WSOY. Juva. Eskola, Antti (1967): Sosiologian tutkimusmenetelmät 2. WSOY. Porvoo. Eskola, Antti (1982): Vuorovaikutus, muutos ja merkitys. Tammi. Helsinki. Gergen, Kenneth J. (1973): Social Psychology as History. Journal of Personality and Social Psychology 26:2, 309-320. (Suomeksi: Sosiaalipsykologia historiana. Psykologia 26(1991):2, Psykologian helmiä.) Haaparanta, Leila & Niiniluoto, Ilkka (1986): Johdatus tieteelliseen ajatteluun. Helsingin yliopiston filosofian laitoksen julkaisuja 3/1986. Yliopistopaino. Helsinki. Hand, David J. (1994): Deconstructing Statistical Questions (with discussion). Journal of the Royal Statistical Society. Series A (Statistics in Society) 157: 3, 317-356. Ilmakunnas, Seija (1998): Kansantaloustiede ja tilastot - Mersulla lehmipolkua pitkin? Teoksessa: Paananen ym. 1998. Irvine, John & Miles, Ian & Evans, Jeff (1979): Demystifying Social Statistics. Pluto Press. London. Keat, Russel (1979): Positivism and Statistics in Social Science. Teoksessa: Irvine ym. 1979. MacKenzie, Donald (1979): Eugenics and the Rise of Mathematical Statistics in Britain. Teoksessa: Irvine ym. 1979. Mellin, Ilkka (1996): Johdatus tilastotieteeseen. 1.kirja. Tilastotieteen johdantokurssi. Helsingin yliopiston tilastotieteen laitoksen julkaisuja. Yliopistopaino. Helsinki. Nicholls, Des (1999): Future Directions for the Teaching and Learning of Statistics at the Tertiary Level. Bulletin of the International Statistical Institute, 52nd Session, Proceedings, Book 1, 125-128. Paananen, Seppo & Juntto, Anneli & Sauli, Hannele (toim.) (1998): Faktajuttu - tilastollisen sosiaalitutkimuksen käytännöt. Vastapaino. Tampere. Pfannkuch, Maxine & Wild, Chris J. (2000): Statistical Thinking and Statistical Practice: Themes Gleaned from Professional Statisticians. Statistical Science 15: 2, 132-152. Ronkainen, Suvi (1998): Kaikuva empiirisyys - surveyn epistemologiset mahdollisuudet. Teoksessa: Paananen ym. 1998. Vasama, Pyry-Matti & Vartia, Yrjö (1970): Johdatus tilastotieteeseen osa 1.Ylioppilastuki ry. Helsinki.