Vetosuhde eli odds ratio, lyhyesti OR, liittyy



Samankaltaiset tiedostot
805306A Johdatus monimuuttujamenetelmiin, 5 op

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

Jatkuvat satunnaismuuttujat

Voiko turkulaisten kirjoittamista artikkeleista yli 100 % olla kvantitatiivisia? Vetosuhteen (odds ratio) ja vedon (odds) tulkintaa 1

6*. MURTOFUNKTION INTEGROINTI

LIITE 1 VIRHEEN ARVIOINNISTA

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Kvanttimekaniikan tulkinta

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

Nollasummapelit ja bayesilaiset pelit

1. Otetaan perusjoukoksi X := {0, 1, 2, 3, 4, 5, 6, 7}. Piirrä seuraaville kolmelle joukolle Venn-diagrammi ja asettele alkiot siihen.

Matematiikan tukikurssi, kurssikerta 3

5.2 Ensimmäisen asteen yhtälö

Yleistetyistä lineaarisista malleista

Todennäköisyys (englanniksi probability)

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Matematiikan tukikurssi

2.3 Juurien laatu. Juurien ja kertoimien väliset yhtälöt. Jako tekijöihin. b b 4ac = 2

MONISTE 2 Kirjoittanut Elina Katainen

MAB3 - Harjoitustehtävien ratkaisut:

Laskuharjoitus 2 ( ): Tehtävien vastauksia

Testit laatueroasteikollisille muuttujille

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Matematiikan tukikurssi

1 Kannat ja kannanvaihto

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Matematiikan tukikurssi

Ohjelmoinnin perusteet Y Python

Matematiikan tukikurssi

TEHTÄVIEN RATKAISUT. Luku Kaikki luvut on kokonaislukuja. Luonnollisia lukuja ovat 35, 7 ja 0.

Oma nimesi Tehtävä (5)

MATEMATIIKKA. Matematiikkaa pintakäsittelijöille. Ongelmanratkaisu. Isto Jokinen 2017

Harjoitus 7: NCSS - Tilastollinen analyysi

Matemaatikot ja tilastotieteilijät

Lukuohje. Oulun yliopisto

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Liite artikkeliin Intohimo tasa-arvoon

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

T Luonnollisten kielten tilastollinen käsittely

Korkeusmallien vertailua ja käyttö nitraattiasetuksen soveltamisessa

Negatiiviset luvut ja laskutoimitukset

4. Funktion arvioimisesta eli approksimoimisesta

Aluksi Kahden muuttujan lineaarinen yhtälö

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

LIITE 1 VIRHEEN ARVIOINNISTA

MAB3 - Harjoitustehtävien ratkaisut:

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

LASKENNALLISEN TIETEEN OHJELMATYÖ: Diffuusion Monte Carlo -simulointi yksiulotteisessa systeemissä

1 Määrittelyjä ja aputuloksia

a) (1, 0735) , 68. b) Korkojaksoa vastaava nettokorkokanta on

30A02000 Tilastotieteen perusteet

Matematiikan tukikurssi: kurssikerta 10

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Tenniksen pistelaskusäännöt, lukio/ammatilliset oppilaitokset

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

LIITE 1 VIRHEEN ARVIOINNISTA

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Vastaukset. 1. a) 5 b) 4 c) 3 d) a) x + 3 = 8 b) x - 2 = -6 c) 1 - x = 4 d) 10 - x = a) 4 b) 3 c) 15 d) a) 2x. c) 5 3.

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

8.1. Tuloperiaate. Antti (miettien):

Tehtävänanto oli ratkaista seuraavat määrätyt integraalit: b) 0 e x + 1

Segregaation eri ilmenemismuodot ja sukupuolten palkkaerot

Matematiikan tukikurssi

Matematiikan tukikurssi

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

LAADULLISESTA SISÄLLÖNANALYYSISTÄ

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

7. Resistanssi ja Ohmin laki

Talousmatematiikan perusteet: Luento 4. Potenssifunktio Eksponenttifunktio Logaritmifunktio

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta

KOMPLEKSILUVUT C. Rationaaliluvut Q. Irrationaaliluvut

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

1.3 Prosenttilaskuja. pa b = 100

Kompleksiluvut., 15. kesäkuuta /57

Tilastotiede ottaa aivoon

Funktion raja-arvo. lukumäärien tutkiminen. tutkiminen

3.7 Todennäköisyysjakaumia

Tekijä Pitkä matematiikka Suoran pisteitä ovat esimerkiksi ( 5, 2), ( 2,1), (1, 0), (4, 1) ja ( 11, 4).

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollinen päättely II, kevät 2017 Harjoitus 2A

pitkittäisaineistoissa

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Materiaalinäytteiden qpcr-tulosten tulkinnasta

Alkuaineita luokitellaan atomimassojen perusteella

1 Ensimmäisen asteen polynomifunktio

Matematiikan tukikurssi

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

SEKASTRATEGIAT PELITEORIASSA

3.4 Rationaalifunktion kulku ja asymptootit

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos...

Talousmatematiikan perusteet: Luento 7. Derivointisääntöjä Yhdistetyn funktion, tulon ja osamäärän derivointi Suhteellinen muutosnopeus ja jousto

Opetusmateriaali. Tutkimustehtävien tekeminen

Transkriptio:

Metsätieteen aikakauskirja t i e t e e n t o r i Hannu Rita Vetosuhde (odds ratio) ei ole todennäköisyyksien suhde Johdanto Vetosuhde eli odds ratio, lyhyesti OR, liittyy suhteellisten osuuksien ja todennäköisyyksien kuvaamiseen ja vertailuun. Tavanomainen käsitys näyttää olevan, että vetosuhde voitaisiin suoraan tulkita todennäköisyyksien suhteena. Näin ei ole. Suhteellisia osuuksia kohdataan usein metsällisessä tutkimuksessa. Valtion metsien käyttöä tutkittaessa voidaan selvittää, kuinka suuri virkistyskäyttäjien osuus eri väestöryhmissä on (Pouta ym. 2004). Biologinen osuudella kuvattavissa oleva ilmiö on esimerkiksi tiettyyn ajanhetkeen mennessä itäneiden männyn siementen määrä tietyssä siemenerässä (Leinonen ja Rita 1995). Muotovian esiintymisen yleisyyttä kuvataan viallisten saheiden osuutena koko erässä (Haikola 2004). Yleensä tutkimuskysymykset johtavat vertailemaan suhteellisia osuuksia. Onko valtion maiden virkistyskäyttäjien osuus erilainen työväestön ja toimihenkilöiden joukossa? Kuinka siemenen alkuperä vaikuttaa sen itämisherkkyyteen? Vaikuttaako alkuperä enemmän kuin idätyslämpötila? Kuinka saheen asema kuivauspinossa vaikuttaa muotovian esiintymiseen? Onko vaikutus suurempi tanakalla kakkosnelosella kuin taipuisalla seitenkasinelosella? Tarkastelen tässä kirjoituksessa vetosuhteen käsitettä empiiristen sovellutusten näkökulmasta. Kaikki tapahtuu matemaattisesti keveällä tasolla. Tavoitteena on selkeyttää vetosuhteen tulkinnallista pohjaa ja tasoittaa tietä sen käytölle. Vetosuhde on osuuksien vertailun oiva työkalu. Osuuksien vertaamisesta Olemme tottuneet vertaamaan kvantitatiivisten suureiden arvoja niiden erotuksen avulla. Jos aamulämpötila on 5 ºC ja päivällä mittarinäyttö on 10 ºC, sanomme lämpötilan nousseen 5 ºC, sillä lukemien etäisyys lukusuoralla on 10 5 = 5. Jos 5 % naisista käyttää valtion alueita tietyn ulkoiluaktiviteetin harrastamiseen ja kyseinen osuus on miehillä 10 %, käyttäjien osuus on miehillä 5 prosenttiyksikköä suurempi kuin naisilla. Jos naisten käyttäjäosuus on 50 % ja miesten 55 %, on erotus ennallaan. Kuitenkin osuuksien erilaisuus tuntunee nyt useimmista vähäisemmältä kuin osuuksien 5 % ja 10 % välinen. Kuinka tämä erojen erilaisuus voitaisiin ottaa huomioon erojen suuruutta kuvattaessa? Hyvä askel tähän suuntaan on osuuksien vertaaminen suhteellisesti: osuus 10 % on kaksinkertainen osuuteen 5 % verrattuna, mutta osuuksien 50 % ja 55 % suhde on vain 1,1 (= 0,55 / 0,50). Suhteellinen vertaaminen osoittautuu ongelmalliseksi lukuarvoltaan suurien osuuksien tapauksessa. Voidaan kysyä, mikä osuus on yhtä paljon suurempi osuuteen 50 % verrattuna kuin osuus 10 % on osuuteen 5 % verrattuna? Suhteellisesti verrattaessa vastaus on tietysti 2 50 % = 100 %. Entäpä jos aloitetaan osuudesta 55 %? Kahdella kertominen johtaa lukuarvoon 110 %, joka voidaan esittää osuutena vain propagandistisessa kirjallisuudessa. Sama ongelma esiintyy erotukseenkin perustuvassa vertailussa: se saattaa johtaa osuuden mahdottomiin ykköstä suurempiin tai jopa negatiivisiin arvoihin. 207

Metsätieteen aikakauskirja 2/2004 Tieteen tori Tarvitaan siis sellainen tapa kuvata kahden osuuden erilaisuutta, eräänlainen osuuksien etäisyyden mitta, joka on pätevä koko suhteellisen osuuden arvoalueella. Tällainen mitta kunnioittaa suhteellisen osuuden olemusta, jonka mukaan välin 0 % 100 % ulkopuolella olevat arvot ovat loogisesti mahdottomia. Tarkoitukseen sopii vetosuhde. Veto ja vetosuhde (odds ja odds ratio) Veto Vetosuhde (odds ratio) käyttää nimensä ratio mukaisesti suhdetta vertailun keinona. Suhteellinen vertaaminen ei kuitenkaan kohdistu osuuksiin sellaisenaan, vaan niistä johdettuihin suureisiin, vetoihin (odds). Odds-termin virallinen (?) käännös on vedonlyöntisuhde, joka on paitsi pitkä myös varsin voimakkaasti uhkapeliallegoriaan nojaava. Odds ratio on puolestaan käännetty vedonlyöntisuhteiden osamääräksi, minkä vetosuhde selättää ainakin lyhyydellään (suomennoksista enemmän ks. Rita 2003, s. 40). Yhteyksistä vedonlyöntiin puhutaan tämän artikkelin liitteessä. Mihin tahansa osuuteen (suhteelliseen osuuteen, todennäköisyyteen) p liittyy veto (odds) v(p), joka määritellään kaavalla v(p) = p / (1 p) (1) Veto on aina positivinen luku. Osuuksiin 5 % ja 10 % liittyvät vedot ovat v(0,05) = 0,05 / (1 0,05) = 0,0526 ja v(0,10) = 0,10 / (1 0,10) = 0,1111. Osuutta 50 % vastaa veto v(0,50) = 1 ja osuutta 55 % veto v(0,55) = 1,2222. Siten 50 % on osuus, jota pienemmät arvot vastaavat ykköstä pienempiä vetoja ja sitä suuremmat ykköstä suurempia. Vedolla ei ole ylärajaa: osuutta 1 vastaava veto on ääretön. Kääntäen, jos veto v tunnetaan, on sitä vastaava osuus tai todennäköisyys p helposti laskettavissa: p = v / (1 + v) (2) Jos v(p) = 38, on p = 38 / (1 + 38) = 38 / 39 = 0,974. Tarkistus antaa v(0,974) = 0,974 / (1 0,974) = 37,46; suurempi tarkkuus murtoluvuilla laskien olisi antanut tarkalleen oikean tuloksen. Jokaista osuutta vastaa tietty veto; jokaista vetoa tietty osuus. Veto on vain toinen tapa kuvata osuuksia. Tämä tapa vastaa sitä osuuksien tarkastelun logiikkaa, johon logit-mallit perustuvat. Hyvä esitys logit-malleista on Collett 1991. Vetosuhde Vetosuhteen (odds ratio, OR) avulla kuvataan sitä, kuinka etäällä toisistaan kaksi todennäköisyyttä tai suhteellista osuutta ovat. Vetosuhde on nimensä mukaisesti kahden vedon suhde. Se vertaa osuuksia tai todennäköisyyksiä vertaamalla niitä vastaavia vetoja suhteellisesti. Osuuksia p 1 ja p 2 vastaava vetosuhde VS (OR) on VS = v(p 2 ) / v(p 1 ) = [p 2 / (1 p 2 )] / [p 1 / (1 p 1 )] (3) Esimerkiksi osuuksien 5 % ja 10 % välinen vetosuhde on VS = v(0,10) / v(0,05) = 0,1111 / 0,0526 = 2,1111 sillä v(0,05) = 0,0526 ja v(0,10) = 0,1111. Toisin kirjoitettuna tämä on v(0,10) = 2,1111 v(0,05) Osuutta 10 % vastaava veto on siten 2,1111-kertainen osuutta 5 % vastaavaan vetoon verrattuna. Koska itse osuuksien 5 % ja 10 % suhde on tasan 2, ei vetosuhde suoraan kerro osuuksien tai todennäköisyyksien suhdetta. Se kertoo määritelmänsä mukaisesti vetojen suhteen eli v(p 2 ) = VS v(p 1 ) (4) missä VS on osuuksien p 1 ja p 2 välinen vetosuhde. Osuuksilla 50 % ja 55 % on vedot v(0,55) = 1,2222 ja v(0,50) = 1,0000, joten niiden välinen vetosuhde on 1,2222. Tulos on selvästi pienempi kuin osuuksia 5 % ja 10 % vertailtaessa saatu vetosuhde 2,1111. Osuudet 50 % ja 55 % ovat siis vetosuhteella mitattuna lähempänä toisiaan kuin osuudet 5 % ja 10 %. Entä mikä osuus on yhtä kaukana osuudesta 50 % 208

Tieteen tori Metsätieteen aikakauskirja 2/2004 kuin 10 % on osuudesta 5 %? Koska vetosuhde VS = v(0,10) / v(0,05) = 2,1111, on löydettävä sellainen osuus p, jolla v(p) = 2,1111 v(0,50) = 2,1111, sillä v(0,5) = 1. Yhtälöstä v(p) = p / (1 p) = 2,1111 saadaan p = 2,1111 / (1 + 2,1111) = 0,6786 eli 68 %. Osuudet 68 % ja 50 % ovat siten yhtä kaukana toisistaan kuin osuudet 10 % ja 5 %. Myös esimerkiksi osuuksien 97,568 % ja 95 % välinen vetosuhdeetäisyys on 2,1111. Vetosuhteen avulla voidaan siis mielekkäästi verrata myös hyvin suuria (ja pieniä) osuuksia. Sopii vielä huomata, että osuuksien sama lukusuoraetäisyys ei takaa niiden samanlaista vetosuhde-etäisyyttä. Joitakin huomioita Vetosuhteen ja osuuksien suhteen suhde Aiemmin todettiin, että osuuksien suhde (risk ratio) sopii huonosti osuuksien vertailuun erityisesti suurehkojen osuuksien kohdalla. Pienillä osuuden p arvoilla veto v(p) on suunnilleen yhtä suuri kuin itse osuus p. Tämä toteutuu täydellisesti, kun p = 0, mutta vielä v(0,05) = 0,0526 on lähellä vastaavaa osuutta 5 %. Pienillä osuuksilla vetosuhdekin on siten suunnilleen yhtä suuri kuin osuuksien suhde. Esimerkiksi osuuksien 5 % ja 10 % vetosuhde 2,1111 on lähellä lukua 2, joka on vertailtavien osuuksien suhde. Suuremmilla osuuksilla ero kasvaa: osuuksien 50 % ja 55 % välinen vetosuhde 1,2222 poikkeaa suhteen arvosta 1,1000 jo noin 10 %. Hyvin suurien osuuksien suhde on väistämättä lähellä arvoa yksi, onhan suhteen kumpikin tekijä lähellä ykköstä. Vastaava vetosuhde voi olla rajattoman suuri: esimerkiksi osuuksien 99,00 % ja 99,99 % vetosuhde on noin 1000. Vetosuhteen valttina on sen kelpoisuus koko osuuksien arvoalueella osuuksien suhteen toimintaalueen rajoittuessa pieniin osuuksiin. Osuuksien arvot ja niiden vertaaminen Jos tiedetään lämpötilan nousseen 5 ºC, ei vielä tiedetä, mitkä lämpötilat olivat vertailun kohteena. Jos tiedetään vetosuhteen arvo, ei vielä tiedetä, mitkä osuudet ovat olleet vertailun kohteena. Vetosuhteen arvoksi saadaan 2,1111, kun verrataan esimerkiksi osuuksia 5 % ja 10 % tai 50 % ja 68 %. Itse asiassa on olemassa ääretön määrä sellaisia osuuspareja, joihin liittyy sama vetosuhde. Otetaanpa mikä tahansa osuus, voidaan annettua vetosuhteen arvoa kohti etsiä sellainen osuus, jonka vetosuhde annetun osuuden kanssa on tuo ennalta kiinnitetty arvo (kaavat 2 ja 4). Jos tavoitteena on kertoa vaikkapa valtion alueiden virkistyskäytön yleisyydestä toimihenkilöiden ja työväestön keskuudessa, on ilmoitettava käyttäjien osuudet noissa ryhmissä. Vaikkapa näin: toimihenkilöistä käyttäjiä on 50 %, mutta työväestöstä peräti 68 %. (Nämä lukuarvot eivät vastaa todellista tilannetta. Ks. Pouta ym 2004, tämän niteen sivut 193 206.) Jos lisäksi halutaan kertoa osuuksien erilaisuuden määrästä, ilmoitetaan vetosuhde, joka tässä tapauksessa on 2,1111. Näin havaittua eroa voidaan verrata jonkun muun eron suuruuteen, esimerkiksi toimihenkilöryhmän sisäiseen, ylempien ja alempien toimihenkilöiden väliseen eroon. Tällaisen vertailun takana on neljä osuutta. Tuloksissa voidaan raportoida paitsi itse osuudet myös niiden erilaisuutta kuvaavat vetosuhteen arvot. Kysymyksessä ei ole joko tai -tilanne, vaan osuuksilla ja niiden vertailulla kuvataan tutkimuskohteen eri piirteitä. Kuvattavien piirteiden valinta määräytyy tutkimuskysymyksestä. Aika usein kannattanee toimia kuin Nalle Puh: Otatko keksejä vai hunajaa? Kyllä, kiitos! Vetosuhde ja muutoksen suunta Vetosuhteessa yhdistyy kaksi asiaa: kuinka suuri muutos tai ero on ja mihin suuntaan se tapahtuu. Erotukseen perustuvassa vertailussa muutoksen suunta ilmaistaan etumerkin avulla: 10 5 = 5, mutta 5 10 = 5. Vetosuhde puolestaan on ykköstä pienempi, kun verrataan pienempää osuutta suurempaan ja ykköstä suurempi, kun verrataan suurempaa pienempään. Vertaamisen järjestyksestä tai suunnasta riippuen osuuksien 5 % ja 10 % välinen vetosuhde on 2,1111 tai 0,47368. Näistä vetosuhteiden arvoista ei suoraan näe, että molemmat vastaavat etäisyyttä osuuksien 5 % ja 10 % välillä, vaan tätä varten on laskettava käänteisluku: 2,1111 1 = 0,47368. Vertailukelpoisuuden parantamiseksi eh- 209

Metsätieteen aikakauskirja 2/2004 Tieteen tori dotan, että vetosuhde ilmaistaan aina lukua yksi suurempana arvona eli vertaamalla suurempaa osuutta pienempään. Erikseen kerrotaan, mihin suuntaan muutos tapahtui. Näin muutosta 5 % 10 % vastaa vetosuhde 2,1111 ja muutosta 10 % 5 % vetosuhde 2,1111 1 ; tässä eksponentti 1 kertoo, että on tapahtunut vähenemistä, ei kasvua, vaikka vetosuhteen lukuarvo 2,1111 ykköstä suurempana houkuttaisikin ajattelemaan näin. Muutosten yhtäsuuruus näkyy nyt yhtä helposti kuin huomataan lukujen 5 ja 5 tietty samankaltaisuus. Eksponentilla 1 ilmaistaan siis muutoksen suunta, kun lukusuoraetäisyyteen eli erotukseen perustuvassa vertailussa siihen käytetään etumerkkiä. Vertaamisen suuntaan liittyvä ongelma voidaan joskus ratkaista yksinkertaisesti vertailuarvoa muuttamalla: verrataanko osuutta 5 % osuuteen 10 % vai toisin päin. Mutta jos vertailtaviin osuuksiin liittyy esimerkiksi ajallinen aspekti, on vertailuarvon vaihtaminen ongelmallista: ei ole luontevaa verrata entistä arvoa tulevaan, jos on kyse ajallisen muutoksen suuruuden kuvaamisesta. Soveltamista Pouta ym (2004) (tämän niteen sivut 193 206) arvioi aineistoperusteisesti, että hiihdon harrastajien joukossa virkistyskäyttöön varustettujen valtion alueiden käyttäjiä on 30 % (Pouta ym 2004, taulukko 3). Tämän perusteella laskettu vedon arvo on 0,3 / 0,7 = 0,4286. Poudan ym. taulukossa 4 on verrattu käytön yleisyyttä mm. hiihdon harrastajien ja sitä harrastamattomien joukossa antamalla vetosuhteen arvo 2,196. Koska vetosuhteessa verrataan hiihtäjiä ei-hiihtäjiin, on käyttäjien osuuden veto hiihtämättömien joukossa 0,4286 / 2,196 = 0,1952 (kaavasta 4); vastaava osuus on 0,1952 / (1 + 0,1952) = 0,1633 (kaava 2). Poudan ym. (2004) taulukko 4 kertoo myös, kuinka paljon etäisyys virkistyskäyttöön varustetulle valtion alueelle vaikuttaa käyttöherkkyyteen: etäisyydessä tapahtuvaa 100 kilometrin lisäyksen vaikutusta kuvaava vetosuhde on 0,4365. Ottamalla käänteisluku saadaan 2,2910. Näin nähdään, että kun etäisyys kasvaa 100 km, on vastaava käyttöä alentava vaikutus suunnilleen yhtä suuri kuin hiihtoharrastuksen puuttumisen vaikutus, onhan 0,4365 1 suunnilleen sama kuin 2,1960 (Pouta ym. 2004, taulukko 4). Yhdysvaikutusten tutkiminen saattaisi tuoda asiaan vielä lisää valaistusta. Vetosuhde ja exp(b)-merkintä Tilasto-ohjelmistojen tulostuksissa vetosuhde löytyy Odds ratio tai OR-sarakkeesta; toisinaan otsikkona on mystisehkö exp(b), missä B puolestaan on luku, joka tavallisesti löytyy sarakkeelta Coefficient (kerroin). Pouta ym. 2004 antaa taulukon 4 sarakkeessa Kerroin rivillä Hiihdon harrastaja luvun 0,786. Sen yhteys samassa taulukossa Odds ratio -sarakkeessa esitettyyn vetosuhteeseen on esitystarkkuuden puitteissa 2,196 = exp(0,786). Virkistysalueen etäisyyden vaikutusta sen käyttöön kuvaa samasta taulukosta löytyvä kerroin 0,829, jota vastaava vetosuhde on 0,4365 = exp( 0,829). Vetosuhde on ykköstä pienempi, koska itse kerroin on negatiivinen. Kerroin B on hiihdon harrastajien ja sitä harrastamattomien osuuksien p 2 ja p 1 vetojen ero logaritmisella asteikolla: B = lnv(p 2 ) lnv(p 1 ), kuten voidaan helposti tarkistaa osuuksista 30 % ja 16,33 % lähtien. Kerroin on vertailtavien osuuksien erotus ns. logistisella asteikolla. Logaritmin ominaisuuksien perusteella B = ln[v(p 2 ) / v(p 1 )]; logaritmoinnin avulla vetosuhteen pohjana olevan suhteellinen vertaaminen muuttuu logistisen asteikon etäisyyteen perustuvaksi vertailuksi. Suure ln v(p) tunnetaan osuuden p logit-arvona, ja sillä on merkitystä osuuksia tarkastelevien logit-mallien matematiikassa. Lopuksi Vanhan tilastotieteen puitteissa ongelmalliset suureet siis muuten kuin normaalisesti jakautuneet oli ja on tapana hoitaa muunnoksilla, joista osuuksien tapauksessa ensinnä tullee mieleen arcsin -muunnos. Regressio- ja varianssianalyysit toimitetaan sitten muunnetuilla arvoilla. Näin menetellen saataneen ainakin laadullisesti samanlainen tilastollisten merkitsevyyksien kirjo kuin vetosuhdetta hyödyntävillä logit-malleilla. Mutta logit-mallien tarjoama tilastollis-tekninen oi- 210

Tieteen tori Metsätieteen aikakauskirja 2/2004 keellisuus ei ole niiden ainoa anti: muunnettuihin arvoihin nojattaessa saattaa menetys syvemmällä, sisältötulkinnan tasolla olla huomattava. Milloin muuntaja viimeksi esitteli osuuksiaan ja niiden erilaisuutta sillä asteikolla, josta tilastolliset argumentit kumpusivat eli arcsin -asteikolla? Vai onko muunnettujen ja alkuperäisten arvojen vastaavuus niin selvä, että tulokset kääntyivät kuin itsestään toiselle asteikolle? Oliko kaikilla muuntajilla selvä käsitys siitä, onko arcsin -muunnetulla asteikolla havaittu 10 (kulma-asteen) suuruinen ero suuri vai pieni? Entä käsitys kohinan suuruudesta, molemmilla asteikoilla? Logit-mallien käyttö sellaisten ilmiöiden tarkastelussa, jotka ilmaisevat itseään meille suhteellisten osuuksien kautta, tuo mukanaan näille ilmiöille luontaisen tavan kuvata ilmiön piirteitä: vetosuhteet. Vetosuhdetta käytettäessä puhutaan kohdetta kunnioittaen, sen olemusta heijastavalla kielellä. Ja jos aineiston analyysissä käytettävä tilastollinen malli pystyy näin ilmentämään ilmiön olemusta, sen voi ajatella olevan hyödyllinen työkalu metsällistä sisältöä koskevia päätelmiä tavoiteltaessa. Aiemmin mainittu 10 asteen ero vastaa jo tuttua vetosuhteen arvoa 2,1111, joka syntyy mm. osuuksia 50 % ja 68 % verrattaessa. Kiitokset Keskustelut Eija Poudan kanssa vetosuhteen käytöstä valtion alueiden virkistyskäyttötutkimuksessa johtivat viime kädessä tämän kirjoituksen alullepanoon. Lea Hiltunen ja Jari Valkonen ovat vaikuttaneet tekstin selkeytymiseen. Viitteet Haikola, T. 2004. Sahatavaran muotovikoihin vaikuttavat tekijät. Helsingin yliopisto, metsävarojen käytön laitos. Pro gradu työn käsikirjoitus. Leinonen K. & Rita, H. 1995. Interaction of prechilling, temperature, osmotic stress, and light in Picea abies seed germination. Silva Fennica 29(2): 95 106. Rita, H. 2003. Arveita vedoista. Yliopisto 5 6/2003. Collett, D. 1991. Modelling binary data. Chapman & Hall. London. Pouta, E., Sievänen, T. & Neuvonen, M. 2004. Virkistyskäyttöön varustettujen valtion alueiden käyttäjät ja käytön määrä eri väestöryhmissä. Metsätieteen aikakauskirja 2/2004: 193 206. FT Hannu Rita, KEOT*-projekti, Helsingin yliopiston metsävarojen käytön laitos Sähköposti hannu.rita@helsinki.fi Liite: Pelimiehen tulkinta vedon arvolle. Sanotaan jopa, että uhkapelit aikoinaan olivat todennäköisyyslaskennan synnyn pontimena. Tämä on kovin yksinkertaistavaa ja unohtaa kokonaan sen kulttuurisen kontekstin, jossa todennäköisyyslaskenta syntyi ja kehittyi. Todennäköisyyden perustarkasteluissa tarvittava matematiikka oli tuolloin tekniikkana ollut olemassa ehkä jopa tuhansia vuosia. Lisäksi uhkapelien historia ulottuu pitkälle aikaan ennen ajanlaskumme alkua. Uhkapelien rooli todennäköisyyslaskennan kehityksessä onkin enemmän heuristinen, se tarjoaa yksinkertaisen mallin todennäköisyyden käsitteen tarkastelun avuksi. Hyödynnämme seuraavassa tätä allegoriaa vedon käsitteen havainnollistamiseksi. Ajatellaan, että voidaan lyödä vetoa jonkin tapahtuman esiintymisen puolesta siten, että tapahtuman esiintyessä voitetaan yksi euro. Voidaan esimerkiksi lyödä vetoa sen puolesta, että USA:n joukot poistuvat Irakin maaperältä vuoden 2005 loppuun mennessä. Jos tapahtuma todellakin esiintyy, voitetaan yksi euro. Voitto tarkoittaa nettovoittoa eli vedonlyöntiin panostettu rahasumma saadaan takaisin 211

Metsätieteen aikakauskirja 2/2004 Tieteen tori ja sen päälle pannaan vielä se voittoeuro. Kuinka paljon tällaiseen peliin kannattaa tai uskaltaa panostaa? Piintynyt peliaddikti sanoo: antaa mennä kaikki vaan. Mutta objektiivisempi analyysi tukeutuu arvioon tapahtuman esiintymistodennäköisyydestä. Kuinka paljon kannattaa, on järkevää, lyödä vetoa sellaisen tapahtuman esiintymisen puolesta, jonka esiintymisen todennäköisyys on p? Vedonlyöntiä pidetään kannattavana, jos peli pitkällä tähtäyksellä on sekä pelaajalle ja vedon vastaanottajalle reilu eli kumpikin pysyy (keskimäärin) omillaan. Tällaisen reilun pelin panoksen antaa todennäköisyyttä p vastaava veto: jos peliin sijoitetaan v(p) euroa, tullaan pitkällä tähtäyksellä voittamaan ja häviämään yhtä paljon. Jos voittoon johtavan tapahtuman todennäköisyys on p = 0,01, on vastaava reilun pelin veto v(p) = v(0,01) = 1/99 = 0,010101 Pelaaja häviää panoksensa, jonka suuruus on 1 / 99 euroa keskimäärin 99 kertaa sadassa pelissä: menetystä sadassa pelissä tulee siten keskimäärin 99 (1/99) = 1 euro. Toisaalta sadassa pelissä hän keskimäärin voittaa yhden kerran eli yhteensä keskimäärin yhden euron. Näin voitot ja tappiot kumoavat toisensa ja kaikki ovat onnellisia pohjoisessa tasa-arvon maassa. Jos voiton todennäköisyys on 0,99, kannattaa yksittäisellä pelikerralla panostaa v(0,99) = 99 euroa! Tämä johtuu siitä, että panoksen suuruinen menetys esiintyy keskimäärin vain kerran sadassa panostuksessa. Toisaalta 99 kertaa sadasta pelaaja voittaa yhden euron ja taas menee tasan. Jos voittotodennäköisyys on 0,5, on reilun pelin panos 1 euro: joka toisella kerralla menetetään se, mikä joka toisella kerralla voitetaan. Vedonlyöntiyrittäjien antamat kertoimet ovat yleensä vetojen käänteislukuja. Niiden tulkinta on: kuinka paljon pelaaja voittaessaan saa yhden euron panoksella. Jos panosta ei erikseen palauteta voittaneelle pelaajalle, on kertoimesta vielä vähennettävä ykkönen, jotta reilun pelin tulkintaa voitaisiin käyttää. Se, vastaavatko kerrointen laskemiseen käytetyt todennäköisyydet todellisia mahdollisuuksia, onkin toinen juttu. Kertoimien virheellisyys onkin vedonantajan kulujen kate ja liikevoiton lähde. 212