Rottien hyvinvointiin ja stressiin vaikuttavat tekijät Tiedonlouhinnan harjoitustyö Juha Mehtonen jmehtone@student.uef.fi Joni Mönttinen jmontti@cs.joensuu.fi i
YLEISKUVAUS AIHEESTA (JONI MÖNTTINEN) Tutkimuksen kohteena oli rottien stressi ja sen vaikutusta rottiin. Data koostuu sadoista pyydystetyistä rotista, joille on tehty ruumiin avaukset ja erilaisia fysiologisia mittauksia. Pyydystys paikkoina oli: Konneveden kaatopaikka, Juankosken turkistarha ja Keskimmäisen kaatopaikka. Näiden lisäksi mukana on myös muutama laboratorio rotta. Tästä datasta pyritään etsimään rottien stressiin vaikuttavia tekijöitä. Apuna voidaan käyttää tunnettuja stressi indikaattoreita, kuten mahahaavoja ja lisämunaisen painoa. Kiinnostavia kysymyksiä ovat esimerkiksi, että miten eri paikat eroavat toisistaan? Miten stressaantuneet rotat ovat verrattuna laboratorio rottiin? Miten stressi indikaattoreiden arvot näkyvät muissa mitatuissa muuttujissa? Keskimmäisen kaatopaikalla myrkytetään rottia kesäisin säännöllisesti. Miten tämä on havaittavissa? Lisäksi pyritään löytämään sukupuolten väliset erot ja määrittämään, että kuinka suuri stressi tekijä lisääntyminen on naarasrotille.
Data (Juha Mehtonen) Datassa oli 686 riviä ja 44 muuttujaa. Muuttujista 24 oli uniikkeja rotilta saatuja mittauksia ja loput 20 mittauksista johdettuja muuttujia. Data on kerätty useiden vuosien aikana Konneveden ja Keskimmäisen kaatopaikoilta sekä Juankosken turkistarhalta pyydetyiltä rotilta. Mukana datassa oli myös 113 laboratoriorottaa erilaisista kontrollikokeista vertailuksi luonnonrotille. Luonnonrottia on pyydystetty alun perin tutkimukseen, jonka tavoitteena on vertailla stressin vaikutusta rottiin. Datassa on pääasiassa rottien fysiologisilla mittauksilla saatavia mittauksia: Pyyntipaikka, -päivä ja -vuosi Sukupuoli Lopettamistapa Mahahaavan tila Naaraan tila (kantava, imettävä, imettävä ja kantava, neitsyt, synnyttänyt eikä imettävä tai kantava) Painomittauksia (yksikkö g): Ruho, lisämunuaiset, maksa, perna, sydän, kateenkorva, umpisuoli, kivekset, gonadien ympärillä oleva rasva, BAT (ruskean rasvan määrä lapaluiden välissä), suolet, kohtu, aivot Pituusmittauksia (yksikkö cm): häntä, ruho, käpälä, suolet Virheellisiä arvoja datassa oli havaittavissa vain muutamia, jotka saattoivat johtua yksinkertaisesti siitä, että jonkin muuttujan arvo on mitattu väärälle muuttujalle. Kuitenkin datassa oli hyvin paljon samassa skaalassa olevia muuttujia, joten on hyvin mahdollista, että tällaisia virheellisiä arvoja on useampia. Puuttuvia arvoja oli myös hyvin monessa muuttujassa. Osalta rotista ei joitakin mittauksia ole tehty ollenkaan. Arviolta n. 20 % datasta sisältää kaikkien muuttujien arvot. Jos tarkasteltavista muuttujista karsitaan hännän, ruhon, käpälän ja suolten pi-
tuus sekä suolten, kohdun ja aivojen paino, n. 85 % datasta sisältää jäljelle jäävien muuttujien arvot.
Esiprosessointi (Juha Mehtonen) Datan siivous aloitettiin poistamalla rivejä, joista puuttui olennaisten muuttujien arvoja. Osa muuttujien arvoista puuttui järjestelmällisesti tietyltä ryhmältä rottia mutta ne jätettiin mukaan. Ensimmäisissä mallinnuksissa käytimme vain muuttujia, joiden arvot oli lähes kaikilla rotilla mitattu. Syvemmässä analyysissä otimme mukaan muuttujia, joiden arvoja puuttui enemmän. Paino Lisämunuaiset Maksa Perna Sydän Kateenkorva Umpisuoli Ka 264.7 94.40 13.56 1.265 1.074 0.2726 3.587 Md 275.0 90 12.90 1.20 1.080 0.3357 3.30 Sd 100.185 41.380 6.021 0.617 0.409 0.123 1.880 BAT Gon.rasva Häntä Ruho Kivekset Suolen pituus Ka 0.3744 2.806 15.94 20.45 2.368 147.4 Md 0.3425 1.730 16.50 21.0 2.805 146.0 Sd 0.207 4.594 2.114 2.899 1.200 24.697 Taulukko 1. Muuttujien keskiarvot (Ka), mediaanit (Md) ja keskihajonnat (Sd) Taulukossa 1. on esitetty joitakin keskeisiä muuttujia ja niille laskettuja tunnuslukuja. Muuttujat noudattavat melko hyvin normaalijakaumaa, mutta käyttämämme mallinnusmenetelmät eivät edes oleta normaalijakautuneisuutta datalta. Puuttuvien arvojen poistamisen jälkeen muuttujat diskretoitiin riippuvuusanalyysiä varten. Jokainen jatkuva muuttuja jaettiin kolmeen luokkaan siten, että luokkien frekvenssit olivat suurin piirtein samat. Tämä todettiin päteväksi jaotteluksi, koska visuaalisessa tarkastelussa emme huomanneet muuttujissa selviä laaksokohtia, joiden kohdalta jakaa muuttujia luokkiinsa. Visuaalisessa tarkastelussa huomasimme myös hyvin muuttujien normaalijakautuneisuuden.
Ainoa poikkeus tähän jaotteluun oli pyyntipäivä-muuttuja, jossa huomattiin selvät rajat, minkä perusteella jakaa muuttuja kolmeen luokkaan; talvi-kevät, kesä, syksy-alkutalvi.
Mallinnus (Juha Mehtonen, Joni Mönttinen) Riippuvuusanalyysissä käytettiin Kingfisher-ohjelmaa, jolla pyrittiin löytämään diskretoitujen muuttujien välisiä riippuvuussääntöjä käyttäen hyvyysmittana Fisherin p:tä. Koska muuttujia oli paljon, täytyi erilaisia riippuvuussääntöjä etsiä paljon. Etsimme Kingfisherillä tuhat parasta riippuvuussääntöä käyttäen treshold-arvona -50, jotta saataisiin paljon riippuvuussääntöjä. Luokittelulla pyrittiin etsimään mahahaavoille hyviä luokittelijoita. Mahahaavat ovat oleellisia stressi indikaattoreita, joten luokittelulla voidaan löytää stressiin vaikuttavia tekijöitä. Laboratorio rotilla ei juurikaan löytynyt maha haavoja, joten ne poistettiin luokittelusta. Datassa oli yhteensä 106 mahahaavallista rottaa, joiden lisäksi valittiin satunnaisesti toiset 106 mahahaavatonta rottaa. Mahahaava muuttujan arvot jaettiin kahteen ryhmään: 1 = ei mahahaavaa ja 2 = mahahaava. Luokittelussa käytetystä datasta kaikkien sisäelinten painoista laskettiin niiden paino ruumiinpainon suhteen, joten käytetyt muuttujat olivat: aika, paino, sukupuol, naartila, mahahaav, paikka, lisamunratio, maksaratio, pernaratio, sydanratio, thymusratio, umpisuolratio, gonratio ja batratio. Luokittelu toteutettiin Weka-ohjelmalla käyttämällä J48 päätöspuuta, jonka parametreina oli confidencefactor = 0.25, minnumobj = 2, numfolds = 5. Muita kokeiltuja luokittelu menetelmiä oli RepTree, MultilayerPerceptron, BayesNet ja bagging. Nämä menetelmät eivät tuottaneet yhtä hyviä tuloksia, joten keskityttiin J48 luokitteluun.
Tulokset (Juha Mehtonen, Joni Mönttinen) Riippuvuusanalyysin tuloksista sai heti selville, että yleisesti on voimassa, että fysiologisista mittauksista saadut arvot korreloivat toinen toistensa kanssa. Muutama esimerkki: pienimaksa pienisydan lyhythanta -> pienipaino fr=113 (0.1647), cf=0.926, gamma=4.443, delta=0.128, M=-2.031e+02 pienisydan lyhytumpisuol -> pienipaino fr=112 (0.1633), cf=0.875, gamma=4.198, delta=0.124, M=-1.848e+02 pienilisamun pienigonrasva -> pienipaino fr=94 (0.1370), cf=0.904, gamma=4.336, delta=0.105, M=-1.517e+02 Haasteeksi tuli siis löytää riippuvuuksia, jotka poikkeavat tästä kaavasta. Laboratoriorotille löytyi aikaisemmista poikkeava havainto, mistä voidaan päätellä laboratoriorottien pernojen olevan keskimäärin pienempiä kuin luonnonrotilla vaikka muuten laboratoriorotat olivatkin suurikokoisia: pieniperna suuribat pitkaumpisuol -> labra fr=24 (0.0350), cf=0.889, gamma=5.396, delta=0.029, M=-3.794e+01 Urosrotille havaittiin muihin ruumiinosiin verraten pienempikokoinen lisämunainen: pienilisamun -> uros fr=136 (0.1983), cf=0.599, gamma=1.447, delta=0.061, M=-2.617e+01 Ruskean rasvan määrän havaittiin olevan suurimmillaan talvella (ja alkukeväästä): suuribat -> talvikevat fr=133 (0.1939), cf=0.586, gamma=1.718, delta=0.081, M=-4.677e+01 Lisääntymässä olevilla rotilla havaittiin suuri lisämunuainen: lisaantyva -> suurilisamun fr=143 (0.2085), cf=0.659, gamma=2.009, delta=0.105, M=-7.979e+01 Turkistarhan rotilla havaittiin ruskean rasvan määrän olevan keskivertaista korkeampi muuhun ruumiiseen nähden:
pienipaino pieniperna keskibat lyhythanta -> turkistarha fr=12 (0.0175), cf=0.857, gamma=7.000, delta=0.015, M=-2.163e+01 pienipaino pieniperna keskibat lyhytruhonpit -> turkistarha fr=12 (0.0175), cf=0.857, gamma=7.000, delta=0.015, M=-2.163e+01 Edellä löydetyissä tuloksissa löytyi kaikista riippuvuussäännöistä useita variaatioita, joiden perusteella pystyi päättelemään tällaiset riippuvuudet oikeiksi. Lisääntymässä olevien rottien suuri lisämunuainen johtuu yksinkertaisesti siitä syystä, että lisääntyminen aiheuttaa luonnoneläimille suurta stressiä ja stressi ilmenee suurentuneena lisämunuaisena. Koska naarasrotat ovat sulanmaan aikana lähes koko ajan lisääntyvässä tilassa, voi tämä selittää urosrottien keskivertoa pienemmän lisämunuaisen koon. Lisämunuaisten luokittelu tehtiin kaikille havainnoille, eikä sukupuolia eroteltu, joten uroksien keskivertoa pienemmät lisämunuaiset voisivat sukupuolittaisessa luokittelussa osoittautua olevan samassa suhteessa muihin ruumiinosiin.ruskean rasvan määrä talvella ja alkukeväästä johtunee luonnollisesta selviytymiskeinosta talvisin, jolloin rasva auttaa pitämään ruumiin lämpimänä. Turkistarhan rotilla ruskean rasvan korkeampi määrä selittyy sillä, että yksilöt, joilla tämä havaittiin, ovat pyydetty lopputalvesta.
Mahahaavojen luokittelussa luodut J48 -päätöspuut olivat kaikki suurin piirtein tällaisia: Luokittelun hyvyys arvioitiin 10 kertaisella ristiin validoinnilla. Luokittelun keskineliö virhe oli 0.6269, joka on melko korkea. Tavoitteena oli saada alle 0.5 virheellä oleva luokittelija, mutta tämä oli paras luokittelu, jonka sain tehtyä. Saaduista tuloksista huomataan riippuvuusanalyysissa jo saatuja tuloksia. Kuten lisääntymisen aiheuttama stressi, joka lisää mahahaavojen määrää. Tämän lisäksi päätöspuusta voidaan havaita, että pyyntipaikka on puun juuressa, joten se vaikuttaisi olevan mahahaavojen tärkein luokittelija. Tästä voidaan myös nähdä paikkojen eroavaisuudet.
Turkistarhan rotat ovat talvella pyydystettyjä, joten lisääntyminen ei ole siellä vaikuttamassa stressiin. Sen sijaan huomataan, että ruskean rasvan alhainen määrä näyttäisi vaikuttavan vatsahaavoihin. Rotilla ruskean rasvan määrä kertoo rottien sopeutumisesta kylmään, joten vatsahaavalliset rotat ovat heikommin sopeutuneita, joka aiheuttaa lisää stressiä. Kaatopaikkojen rottia vertailemalla huomataan, että molemmat päätöspuun oksat jakautuvat ajan mukaan eli kesän (1) ja talven (2). Keskimmäisen kaatopaikasta tiedetään, että siellä myrkytetään rottia säännöllisesti kesäisin. Tämän puun perusteella on vaikea tehdä varmoja johtopäätöksiä, mutta naaras rottien kohdalla huomataan, että korkea painoisilla rotilla on vähemmän vatsahaavoja, eikä samanlaista tilannetta voida löytää mistään muualta päätöspuuta. Painavammat rotat saattavat kestää myrkkyjä paremmin, joten ne säilyvät terveempinä pieniin rottiin verrattuna.