Omiikka Lajienvälinen genomien ja ilmiasujen vertailu Imre Västrik ja Tomi Mäkelä Ihmisen perimän selvittäminen on paljastunut tuhansia aiemmin tuntemattomia geenejä, joiden tehtävistä ei ole mitään käsitystä. Siksi nyt pyritään selvittämään systemaattisesti geenien toimintaa sekä molekyylitasolla että organismin tasolla. Eräs toiminnalliseen genomiikkaan kuuluvista menetelmistä on eri lajien genomien vertailu, jossa pyritään löytämään samankaltaisuuksia eri lajeilla esiintyvien vastingeenien välillä. Esimerkiksi sukkulamadosta on löydetty geneettisin menetelmin solujen polarisaatioon liittyvän signalointiketjun geenit, joille puolestaan voidaan osoittaa homologit ihmisgenomista ja tehdä tämän perusteella hypoteesi myös niiden tehtävästä. Geenilähtöisten kysymyksenasetteluiden lisäksi vertailevassa genomiikassa voidaan käyttää ilmiasujen eli fenotyyppien vertailua, jossa esimerkiksi pyritään löytämään laajasta, koko genomin kattavasta hiirimutanttikokoelmasta kiinnostuksen kohteena olevan taudin hiirimalli. Laajat fenotyyppikokoelmat eri malliorganismeista tulevatkin olemaan yksi välttämätön työkalu pyrittäessä ymmärtämään geenien toimintaa monimutkaisessa biologisessa verkostossa. Näistä mutanttipankeista löydettävät tautien eläinmallit ovat soveltuvin osin myös oiva työkalu hoitokokeiluissa. Genomitiedon räjähdysmäinen kasvu on avannut uusia ovia molekyylilääketieteen kehitykselle (Peltonen-Palotie 2001). Tämä liittyy toisaalta siihen, että isolla osalla tavallisistakin taudeista on geneettinen komponentti. Lisäksi parantuneet edellytykset selvittää geenien tehtäviä edistävät tautien patogeneesin ymmärtämistä ja voivat johtaa rationaalisten hoitojen kehittämiseen. Vaikka merkittävä osa ihmisen geeneistä ja niiden tuottamista valkuaisista on jo alustavasti tunnistettu, valtaosalle ei ole vielä pystytty edes ehdottamaan tehtävää riippumatta siitä, tarkoitetaanko biokemiallista tehtävää (esim. kinaasi), solutason tehtävää (esim. osallistuminen johonkin signaalinvälitysreittiin) tai tehtävää organismin tasolla (esim. aivojen kehitys). Uusien ja tuntemattomien geenien tehtävien selvitystä hankaloittaa se, että yksittäiselläkin geenituotteella voi olla hyvin erilainen tehtävä eri kudoksissa tai eri kehitysvaiheissa. Tästä syystä useiden erilaisten menetelmien käyttäminen geenin tehtävien selvityksessä on aina hyödyllistä ja usein välttämätöntä. Toiminnallisessa genomiikassa pyritään selvittämään systemaattisesti geenien ja niiden tuotteiden tehtäviä käyttämällä»liukuhihnastrategioita» (high-throughput strategies) geenien, proteiinien tai kudosten tasolla, kuten tämän teemanumeron muissa artikkeleissa on kuvattu. Käytettävien menetelmien tulee siksi olla tehokkaita, usein automaattisia. Menetelmien avulla pystytään laajentamaan aiemmin yksittäiselle geeneille tehtyjä analyysejä, kuten geeniekspressiotasojen, proteiinien rakenteen ja proteiinien keskinäisten interaktioden tai poistogeenisen hiiren analyysiä. Käsitteellisesti toiminnallinen genomiikka voidaan jakaa geenilähtöiseen ja ilmiasu- eli fe- Duodecim 2002;118:1167 75 1167
notyyppilähtöiseen lähestymistapaan (kuva 1). Geenilähtöisessä lähestymistavassa käytetään genomitietoa uusien geenien tunnistamisessa, kloonaamisessa ja geenituotteiden toiminnan selvityksessä. Fenotyyppilähtöisessä lähestymistavassa analysoidaan fenotyyppejä sattumanvaraisten mutaatioiden seulonnoista (esim. hiirimutanttikokoelma) tai luonnollisesti esiintyvistä varianteista (esim. ihmisen perinnölliset sairaudet) ja tunnistetaan geenien toimintoja kloonaamalla fenotyypin aiheuttava geeni tai geenit ilman aiempaa tuntemusta taudin molekulaarisista mekanismeista. Systemaattisia ja globaaleja fenotyyppilähtöisiä lähestymistapoja kutsutaan myös fenogenomiikaksi (Rossant ja McKerlie 2001). Geeni- ja fenotyyppilähtöinen lähestymistapa täydentävät toisiaan useilla tasoilla ja Geenilähtöinen strategia: geeneistä toimintoihin Geenien luettelointi Vertaileva genomiikka Lajien välisten samaa tehtävää suorittavien geenien tunnistaminen Fenotyyppeihin liittyvien geenien tai alleelivarianttien tunnistus Luetteloitujen geenien ekspressioanalyysi Proteomiikka/rakenteellinen genomiikka Molekulaaristen fenotyyppien analyysi: globaali RNA/ proteiiniprofilointi yhdessä mahdollistavat geenien muutosten (genotyyppien) ja ilmiasujen (fenotyyppien) välisten korrelaatioiden muodostamisen. Systemaattinen kokonaisvaltainen lähestymistapa tuo tähän analyysiin uuden ulottuvuuden: tietojen yhdistäminen eri analyyseistä auttaa muodostamaan hypoteeseja laajoistakin molekyyliverkostoista, jotka liittyvät solun spesifiseen toimintaan (Vidal 2001). Ihmisen ja useiden malliorganismien genomien selvitys on korostanut malliorganismien merkitystä ihmisten geenien toiminnan ymmärtämisessä. Lisäksi geeni- ja fenotyyppilähtöisen lähestymistavan yhdistämisessä malliorganismit ovat aivan keskeisessä asemassa. Niiden kautta tuleva tieto geenien toiminnasta in vivo täydentää oleellisella tavalla bioinformatiikan, bioke- Genotyypitys Proteiinien tunnistaminen Proteiinien rakenteen selvitys Proteiini-proteiini-interaktiokarttojen muodostus Proteiinien ligandien tunnistus Ilmiasujen eli fenotyyppien anatominen, fysiologinen ja käytöksen luokitus Geenin tai proteiinin aktiivisuuden muuttaminen Geenin toiminnan ymmärtäminen Signalointipolkujen tunnistaminen Laajojen mutanttikokoelmien luonti malliorganismeihin Monogeeniset ja kompleksiset perinnölliset taudit Ilmiasulähtöinen strategia: yksilön ominaisuuksista geeneihin Kuva 1. Kaavio kahdesta toisiaan täydentävästä strategiasta toiminnallisessa genomiikassa: geenilähtöinen ja ilmiasulähtöinen strategia erotettuna keinotekoisesti toisistaan. Tutkimuksen kulku ja merkittävimmät menetelmät on osoitettu nuolikaavioin. Vertailevan genomiikan tehtävänä on toimia yhtenä näitä kahta lähestymistapaa yhdistävänä tekijänä. Kuva mukailtu Yaspon (2001) esityksestä. 1168 I. Västrik ja T. Mäkelä
mian ja molekyylibiologian keinoin saavutettua molekyylitason tietoa. Jäljempänä esitetään, miten sekä genomien että fenotyyppien vertailu eri lajien kesken on uusi tärkeä työkalu geenien tehtävien ja sairauksien selvittämisessä. Genomien vertailu geenien tehtävien selvityksessä Ihmisen genomiprojektin ensimmäisen vedoksen valmistuminen v. 2001 kohdisti yleisen mielenkiinnon vertailevaan genomiikkaan (comparative genomics). Useimmiten tässä ajatellaan lajien välistä vertailua, mutta yhtä hyvin vertailua voidaan tehdä yksilöiden, isolaattien tai populaatioiden välillä. Kahden tai useamman lajin genomin vertailu paljastaa evoluution aiheuttamia muutoksia, jotka ovat muotoilleet genomin rakennetta ja sisältöä. Tämän lisäksi vertailun avulla voidaan tunnistaa konservoituneita sekvenssejä, jotka ovat säilyneet evoluutiopaineessa. Genomitiedon kannalta kiinnostavat lajit. Mikrobiologit ovat toimineet uranuurtajina vertailevan genomiikan käytössä eri mikrobien ominaisuuksien selvittämiseksi (Käyhty 2000). Esimerkiksi enemmän virulentin ja vähemmän virulentin Streptococcus pneumoniae -kannan genomien vertailu voi auttaa virulenssigeenien tunnistamisessa. Samojen kantojen kaikkien ilmentyvien geenien (transkriptomin) tai proteiinivalikoiman (proteomi) vertailu voi auttaa tässä analyysissä. Parhaillaan selvitetään aktiivisesti ihmisen genomin lisäksi viiden selkärankaisen genomia: hiirien (Mus musculus), rotan (Rattus norvegicus), seeprakalan (Danio rerio) ja kahden pallokalalajin (Tetraodon nigroviridis ja Fugu rubripes). Näistä hiiri, rotta ja seeprakala on valittu, koska kyseisiä lajeja käytetään laajasti malleina, ja pallokalat on valittu siksi, että niiden genomit ovat erityisen kompakteja (Sariola ym. 2000). Alkeellisempien lajien erityisesti hiivan, banaanikärpäsen ja sukkulamadon geenikartat ovat olleet valmiina jo jonkin aikaa ja tarjonneet hyödyllisen vertailupohjan jo nyt. Geenien tunnistaminen genomitiedosta. Genomin emäsjärjestyksen tarkastelu tietokoneen näytöllä tai paperilla ei ole kovin informatiivista ihmisen silmin katsottuna kyseessä on lopultakin vain neljää eri kirjainta sisältävä pitkä jono. Kirjainketju ei liputa, mistä jokin geeni alkaa, ja vielä vähemmän se sisältää sellaisia vinkkejä kuin»nämä 100 emästä paljastavat, että tämä yksilö tulee sairastumaan Alzheimerin tautiin». Silti kyseinen tieto on tässä kirjainketjussa, ja solun DNA:ta lukeva ja siitä RNA:ta ja proteiineja tekevä koneisto ymmärtää informaation mutta valitettavasti me emme vielä tiedä, miten. Yksi bioinformatiikan haastavista tehtävistä onkin ollut kehittää ohjelmistoja, jotka pyrkivät tunnistamaan geenejä DNA-sekvenssistä mutta nämä ohjelmat ovat edelleen kaukana täydellisistä. Jos tunnemme ennalta lähetti- RNA:n emäsjärjestyksen tai valkuaisaineen aminohappojärjestyksen, voimme nimetä näitä vastaavaan kohdan genomissa vastaavaksi geeniksi. Tämä kuitenkin edellyttää kyseisen geenin emäsjärjestyksen aiempaa tuntemista. Tätä tietoa on kertynyt runsaasti erityisesti lähetti- RNA:ta vastaavien cdna-kloonien systemaattisen sekvensoinnin myötä (EST-projektit, expressed sequence tags). Tosin kyseisissä projekteissa ovat pitkät geenisekvenssit aliedustettuina sekä matalalla tasolla tai hyvin rajallisessa kudoksessa tai kehitysvaiheessa ilmentyvät geenit. Näissä tilanteissa apu voi löytyä lajien välisten genomien vertailusta. Geenien säätelyalueiden vertailu. Geenien proteiinia koodaavien alueiden tunnistaminen genomin emäsjärjestyksestä on jo sinänsä haastavaa työtä. Mutta proteiinia koodaavien alueiden ulkopuolella on myös tärkeitä geenin säätelyalueita, joiden tutkimus on tuskin lapsenkengissään. Tällä saralla vertailevaan genomiikkaan on asetettu suuria toiveita, koska nämä säätelyalueet ovat usein säilyneet evoluutiossa. Konservoituneet alueet geenien koodaavien alueiden ulkopuolella ovat osoitus näiden alueiden merkityksestä geenin luennan säätelyssä tai muissa geenin toiminnoissa (»imprinting», kromatiinin rakenne, kromosomien pariutuminen). Vastingeenit ja geeniluettelot. Genomeja vertailtaessa pyritään yleensä ensimmäiseksi tunnistamaan vastingeenit (ortologit) ja sukulaisgeenit vertailtavissa lajeissa. Nämä vertailut aut- Lajienvälinen genomien ja ilmiasujen vertailu 1169
tavat osaltaan laatimaan lajikohtaisia geeniluetteloita, joihin kerätään kustakin geenistä kaikki saatavilla oleva informaatio ja josta puolestaan on tehokkaat yhteydet muihin geeneihin, joilla on toiminnallisia samankaltaisuuksia (Vihinen ja Lehväslaiho 2000). Tehokkaat ja täydentyvät geeniluettelot ovat edellytys mielekkäälle bioinformatiikalle ja vertailevalle genomiikalle. Jo nykyisten geeniluetteloiden vertailu on tuonut esiin mielenkiintoisia yksityiskohtia, kuten sen, että ihmisellä on ilmeisesti vain alle kaksi kertaa enemmän geenejä kuin sukkulamadolla. On kuitenkin selvää, että korkeampien lajien geenituotteiden lukumäärää kasvattavat merkittävästi geeniluennan säätelyn monimuotoisuus, vaihtoehtoinen silmukointi sekä proteiinien modifikaatiot. Perusgeenistö säilyy lajista toiseen. Monien ihmissolun perustoimintojen ja kudosten kehitysohjelmien hämmästyttävä samankaltaisuus muiden lajien vastaavien ohjelmien kanssa mahdollistaa mielekkäät vertailut. Tämän takia jo nyt on pystytty sijoittamaan alustavasti merkittävä määrä ihmisen genomista löytyneitä aiemmin tuntemattomia geenejä tiettyyn toimintaryhmään komparatiivisen genomiikan keinoin (taulukko 1) vertailemalla ihmisen genomia hiivan, banaanikärpäsen ja sukkulamadon genomeihin. Kaikille näille lajeille yhteisiä geenejä on tunnistettu noin 1 400; ihmiselle ja banaanikärpäselle yhteisiä geenejä on lähes 3 000. Useimmat näistä ihmisen ja alkeellisempien organismien ortologeista liittyvät solujen perustoimintoihin, kuten RNA-transkriptioon, solun jakautumiseen, proteiinien solunsisäiseen kuljetukseen ja metaboliaan. Myös signaalinvälityksessä esiintyvät proteiinit ovat usein samankaltaisia, vaikka ne eivät välttämättä johdakaan samoihin vasteisiin eri lajeissa (kuva 2). Mielenkiintoista on, että konservoituneessa geenijoukossa on lukuisia geenejä, joiden mutaatiot liittyvät tiettyihin ihmisten tauteihin. Esimerkiksi xeroderma pigmentosum -taudin aiheuttavat mutaatiot geeniryhmässä, jonka toiminta liittyy säteilyn aiheuttamien DNA-vaurioiden korjaukseen. Kaikille taudin aiheuttaville geeneille on olemassa vastineet eli ortologit mm. hiivasoluissa. Vastikään ymmärrettiin että xeroderma pigmentosumin oireisto ei liity ainoastaan DNAvaurioiden korjaukseen vaan myös transkriptioon, ja tässä havainnossa hiivaortologit olivat merkittävässä asemassa (Bergman ja Egly 2001). Toisaalta on myös selvää, ettei vastingeenien toiminta ole välttämättä samanlainen lajista toiseen. Jos aiemmin tuntemattoman ihmisgeenin vastingeenin toiminta banaanikärpäsessä liittyy kärpäsen karvoitukseen, ihmisgeeni ei välttämättä liity karvaiseen selkään. Vaikka sama geeni pystyttäisiin tunnistamaan monestakin lajista, yllättävän usein sen toimintaa ei tunneta millään tasolla. Myös tällöin tunnistaminen alkeellisimmista lajeista voi kuitenkin osoittautua hyödylliseksi, koska toiminnan selvitys näissä lajeissa on usein merkittävästi hel- Taulukko 1. Vertailevan genomiikan verkko-osoitteita. Nimi Verkko-osoite Selitys National Center for Biotechnology http://www.ncbi.nlm.nih.gov/tools/ Genomitiedon yleisportaalin työkaluja Information European Bioinformatics Institute www.ebi.ac.uk Yleisportaali genomitietoon Ensembl www.ensembl.org Genomien annotaatio HomoloGene www.ncbi.nlm.nih.gov/homologene Homologisten geenien vertailu eri lajeissa COG http://www.ncbi.nlm.nih.gov/cog Homologisten proteiinien vertailu eri lajeissa COPSE copse.molgen.mpg.de Homologisten proteiinien vertailu eri lajeissa KEGG www.genome.ad.jp Proteiiniperheet, systeemibiologia Signal Transduction Knowledge www.stke.org Geeneistä signaalitransduktioreitteihin Environment Celera www.celera.com Kaupallinen, ekspressioanalyysit Proteome BioKnowledge Library https://www.incyte.com/proteome/ Kaupallinen, lajien välinen geenien ja proteiinien databases.jsp vertailu 1170 I. Västrik ja T. Mäkelä
pompaa ja edullisempaa. Toisinaan voi jopa syntyä hyödyllinen malli, jossa voidaan testata geenin toimintaa estäviä tai stimuloivia pienimolekyylisiä yhdisteitä. Vertailevan genomiikan ongelmat. Komparatiivisen genomiikan rajoitukset liittyvät ennen kaikkea bioinformatiikkaan. Pohjan luovat hyvät geeniluetteloista muodostetut tietokannat. Koko genomin DNA-sekvenssin hyödyllisyys tulee esiin vasta, kun tästä tiedosta saadaan luotettavasti tunnistettua geenit ja muodostettua lajikohtaiset geeniluettelot. Tämä on ollut yksi bioinformatiikan suurista haasteista, mutta edelleenkään tätä tarkoitusta varten luodut tietokoneohjelmat eivät toimi moitteetta. Erityisesti ihmisgenomissa esiintyvät pitkät geenit, joissa pienien eksonien (esim. 50 emästä) välissä voi olla valtavia introneja (yli 200 000 emäsparia), ovat hankalia poimittavia, ja niistä jäävät usein puuttumaan geenien päät. Problematiikkaa kuvaa pitkään jatkunut väittely ihmisten geenien lukumäärästä. Toistaiseksi ihmisgeenejä on pystytty kirjaamaan eli annotoimaan noin 24 000 (www.ensembl.org/homo_sapiens/stats). Muidenkin lajien genomien osalta on ollut vaikea määrittää luotettavasti geenien lukumäärää. Yhtenä ongelmana ovat bioinformatiikan keinoin alustavasti tunnistetut hyvin lyhyet geenit, joista osan on havaittu koodaavan myös RNA:ta. Nyt pohditaan, mitkä kaikki näistä ovat»oikeita» geenejä (Johnston 2000). Toisena ongelmana bioinformatiikan keinoja soveltavassa komparatiivisessa genomiikassa on, miten tunnistaa ortologit eri lajeista. Joissakin lajeissa tehtävää vaikeuttaa koko genomin duplikaatio. Toisaalta sekvenssien vaihdellessa merkittävästi lajista toiseen voi olla vaikea tunnistaa lähintä homologia; ehdokkaita voi olla useita, jolloin toiminnan ekstrapoloiminen on vaikea tehtävä. Näiden esimerkkien valossa on selvää, että valtavasta kehityksestään huolimatta bioinformatiikka ei tule yksinään selviytymään vertailevan genomiikan haasteesta. Sen rinnalle tarvitaan sekä geenilähtöisiä että fenotyyppilähtöisiä kokeellisia menetelmiä. Siirryttäessä mallinta- MAP-kinaasisignalointi ihmisessä EGF SHC GDP GTP EGFR Grb2 SOS Ras ptyr SH2 SH3 GAP Raf MEKK MEK JNKK MAPK ERK MAPK JNK Elk-1 c-fos c-jun DNA MAP-kinaasisignalointi banaanikärpäsessä Grk Egfr Drk Sos Ras85D +p +p +p MAPK +p Dorsaalinen Ph1 Dsor1 Rolled kuviointi Gap1 Kuva 2. Esimerkki vertailevan genomiikan keinoin rakennettavista tietokannoista: yhden keskeisen signaalitransduktioreitin (MAP-kinaasi, MAPK) vertailu ihmisen ja banaanikärpäsen välillä. Ihmisen osalta on kuvattu kahden MAPK-perheeseen kuuluvan kinaasin (ERK, JNK) signalointi ja banaanikärpäsen osalta kolme eri signalointireittiä, joihin yksi MAPK (Rolled) osallistuu. Näpäytettäessä mitä tahansa proteiinia (= laatikkoa) reitin varrella ilmestyy tietokoneen ruutuun linkki, joka kertoo kyseisen proteiinin ja sitä vastaavan geenin sekvenssin sekä antaa jatkolinkkimahdollisuuksia, joista selviää muuta tietoa kyseisestä proteiinista (www.genome.ad.jp). Lajienvälinen genomien ja ilmiasujen vertailu 1171
maan kompleksisia ihmistauteja on myös selvää, että selkärangattomien malliorganismien rinnalle tarvitaan lähempänä ihmistä olevia lajeja, joista ylivoimaisesti suosituimmaksi on noussut hiiri. Systemaattiset fenotyyppikokoelmat malliorganismeissa Geenien toiminnan selvityksessä tärkeintä ja usein mielenkiintoisinta on toiminta organismin tasolla. Tässä mielessä bioinformatiikan keinoin tehdyt vertailut antavat vain viitteitä, ja vastauksia varten täytyy aikaansaada malliorganismissa mutaatiota tutkittaviin geenihin, minkä jälkeen voidaan analysoida sitä seuraava ilmiasu eli fenotyyppi. Vaihtoehtona tälle geenilähtöiselle paradigmalle on tunnistaa malliorganismista kiinnostava fenotyyppi ja sen jälkeen pyrkiä tunnistamaan sen taustalla oleva geeni. Molempien näiden menettelytapojen toteuttamiskelpoisuus riippuu oleellisesti siitä, miten kohteena oleva malliorganismi soveltuu tarkoitukseen. Yksittäisen geenin tapauksessa työmäärä ei ole kohtuuton missä tahansa yleisesti käytetyssä malliorganismissa, mutta systemaattisiin ja globaaleihin menettelytapoihin siirryttäessä malliorganismien rajoitukset tulevat selvästi esiin. Toiseksi merkittäväksi kysymykseksi systemaattisissa fenotyyppianalyyseissa tulee, millä taajuudella yksittäisen geenin mutaatio aiheuttaa fenotyypin. Toistaiseksi tätä tietoa on käytettävissä hiivasta (50 %) ja banaanikärpäsestä (20 %) (Yaspo 2001). Geenilähtöiset strategiat fenotyyppikokoelmien luomisessa. Geenien poistoon perustuvat strategiat vaativat aiemman tiedon poistettavista geenilokuksista, ja tämä tieto on jo nyt tai varsin pian saatavissa kaikista relevanteista malliorganismeista. Siksi geenilähtöinen strategia onkin teoriassa oikea tapa ryhdyttäessä selvittämään bioinformatiikan keinoin ennustettujen geenien toimintaa. Hyvä esimerkki kattavammasta geenilähtöisestä strategiasta on leivinhiiva, jonka kaikki 6 300 geeniä on systemaattisesti poistettu ja fenotyypit analysoitu. Tämä on johtanut puheisiin lähestyvästä hiivatutkimuksen»kulta-ajasta», jolloin kaikkien geenien toiminta tunnetaan ennuste on ajoitettu vuoteen 2010. Tämän jälkeen voitaisiin seurata tehokkailla mikrosirujärjestelyillä erilaisissa koejärjestelyissä kaikkia solun tapahtumia samanaikaisesti (Johnston 2000). Hiivageenien poistamisessa käytettiin hyväksi tässä lajissa hyvin toimivaa homologista rekombinaatiota. Erityisen myönteistä tässä YKO-projektina (yeast knock out) tunnetussa kansainvälisessä projektissa on se, että koko YKO-kokoelma on vapaasti kenen tahansa käytettävissä (taulukko 2). Toinen hyvä tapa poistaa geenilähtöisesti geenien toimintoja on käyttää ns.»knock-down»- strategioita, joissa kohteena olevaa geeniä ei poisteta vaan sen ilmentyminen estetään. Tehokkain ja merkittävin näistä on ns. RNA interference (RNAi), jossa geenisekvenssiä vastaava lyhyt kaksijuosteinen RNA estää spesifisesti kyseisen geenin mrna:n translaation. Menetelmä Taulukko 2. Systemaattisiin fenotyyppikokoelmiin liittyviä verkko-osoitteita. Nimi Verkko-osoite Selitys Online Mendelian Inheritance in Man www.ncbi.nlm.nih.gov/entrez/query. Ihmisen geneettisten tautien luettelo (OMIM) fcgi?db=omim Saccharomyces Genome Deletion sequence-www.stanford.edu/group/ Hiivageenien systemaattiseen poistoon liittyvä Project yeast_deletion_project tieto Mouse Genome Informatics http://www.informatics.jax.org/ Hiirimutanttien ja alleelien luettelo searches/allele_form.shtml Center for Modeling Human Disease http://www.cmhd.ca Tautimallien luominen hiirissä Neuroscience Mutagenesis Facility http://www.jax.org/nmf/ Neuraalisten fenotyyppien luominen kemiallisella mutageneesillä hiirissä Mouse Mutagenesis for Develop- http://www.mouse-genome.bcm. Kehitysbiologisia fenotyyppejä kemiallisella mental Defects tmc.edu/enu/enuhome.asp mutageneesillä BayGenomics http://baygenomics.ucsf.edu/ Hiirigeenien poisto»gene-trap»-menetelmällä German Genetrap Consortium http://tikus.gsf.de/ Hiirigeenien poisto»gene-trap»-menetelmällä 1172 I. Västrik ja T. Mäkelä
toimii erittäin hyvin sukkulamadossa, jota varten se alun perin kehitettiinkin ja jossa sitä on käytetty geenien toiminnan systemaattiseen estoon (Fraser ym. 2000). RNAi:n»knock-down» eroaa»knock-out»-strategiasta sikäli, että geenin toiminnan poisto on väliaikaista eikä periytyvää. Sukkulamadon osalta saatiin selkeä fenotyyppi 14 %:ssa testatuista geeneistä. Mielenkiintoinen havainto näissä tutkimuksissa oli se, että konservoituneiden geenien toiminnallinen poisto aiheutti usein varhaisen alkiokehityksen keskeytymisen, kun taas konservoitumattomien geenien poistosta seuranneet fenotyypit olivat usein myöhemmin kehityksessä ilmentyviä. RNAi on yksinkertaisuutensa ja nopeutensa vuoksi erittäin houkutteleva tekniikka geenien toiminnan poistamiseen, ja sen on osoitettu toimivan sukkulamadon lisäksi banaanikärpäsessä (Kennerdell ja Carthew 200) ja ainakin jollain teholla myös hiiressä (Wianny ja Zernicka- Goetz 2000). Eräitä muitakin»knock-down»- strategioita on menestyksellisesti käytetty. Näistä merkittävin ehkä»morpholino-targeting», jossa estetään geenien translaatio ja joka on RNAi:tä joustavampi (Heasman 2002). Menetelmää on käytetty menestyksekkäästi mm. luomalla holoprosenkefalian eläinmalli seeprakalassa (Nasevicius ja Ekker 2000). Poistogeenisten hiirten tuottaminen on huomattavasti työläämpää verrattuna edellä esitettyihin tapoihin poistaa tai vähentää geenin toimintaa. Tämä liittyy varsin epätehokkaaseen homologiseen rekombinaatioon mutta myös monimutkaisemman eliön hitaampaan sukupolvikiertoon ja hiirten ylläpidon vaatimuksiin. Tästä syystä valtaosa hiiren geeninpoistoista on tehty yksi kerrallaan, ja niiden kokonaismäärä on edelleen varsin pieni koko genomin mittakaavassa. Fenotyyppilähtöiset strategiat fenotyyppikokoelmien luomisessa. Fenotyyppilähtöisissä menetelmissä luodaan tai kerätään suuri joukko eri fenotyyppejä jostain malliorganismista tietämättä, missä geenissä mutaatio tai mutaatiot ovat ja välittämättä siitä. Tätä menettelytapaa on käytetty suppeassa määrin jo pitkään, paljon ennen geenien tuntemusta. Suositut lajit ovat olleet hiiva ja hiiri ja nyttemmin myös seeprakala. Merkittäviä spontaanin tai kemiallisen mutageneesin kautta tutkituista hiirimutanteista ovat ob- ja db-hiirimutantit. Kun nämä ilmiasut aiheuttavat geenit kloonattiin, löydettiin leptiini (Zhang ym. 1994) ja sen reseptori (Chen ym. 1996), mikä avasi kokonaan uuden tutkimussuunnan kehon painon säätelyssä. Spontaani hiirimutantti mnd puolestaan paljastui eläinmalliksi suomalaiseen tautiperintöön kuuluvalle pohjoiselle epilepsialle (Ranta ym. 1999). Spontaaneja hiirimutaatioita on kuitenkin rajallinen määrä. Tämän vuoksi on jo pitkän aikaa pyritty tietoisesti laajentamaan fenotyyppikokoelmia. Usein tähän on pyritty käyttämällä kemiallista mutageenia, joka aiheuttaa sattumanvaraisesti muutoksia geeneihin. Mutageneesin jälkeen tunnistetaan mahdollisimman monta erilaista ilmiasua, jotka mahdollisuuksien mukaan luokitellaan ryhmiin. Kemiallisen mutageneesin seurauksena syntyviin fenotyyppeihin liittyy kuitenkin merkittävä ongelma: mutatoituneen geenin tunnistaminen on varsin työlästä ja muistuttaa perinteistä tautigeenin etsimistä, joka alkaa geenilokuksen kartoittamisella. Tätä ongelmaa on pyritty ratkaisemaan esimerkiksi keräämällä kaikista luokitelluista ilmiasuista siittiöitä ja DNA:ta. Tällöin voidaan selvittää, löytyykö DNA-kokoelmasta jonkin tietyn kiinnostuksen kohteena olevan geenin mutaatio ilmiasukokoelmaan (Coghill ym. 2002). Linkkejä kemiallisen mutageneesin kautta luotuihin ilmiasukokoelmiin on esitetty taulukossa 2. Geenien pyydystäminen in vivo. Fenotyyppija geenilähtöisten strategioiden välimaastoon asettuu geenien pyydystäminen in vivo (gene trapping). Siinä insertoidaan sattumanvaraisesti eri puolelle esimerkiksi hiiren genomia ns. reportteri, joka aktivoituu insertoituessaan jonkin geenin sisään inaktivoiden samalla myös kyseisen geenin toiminnan (kuva 3). Menetelmän etu kemialliseen mutageneesiin nähden piilee siinä, että ennen hiirten tekoa voidaan mutatoituneista alkion kantasoluista selvittää nopeasti, mihin geeneihin mutageneesi on kohdentunut. Siksi useita isoja systemaattisia»gene-trap»-hankkeita on käynnissä; valitettavasti kaikki niistä eivät ole julkisia. Joitakin julkisia hankkeita on esitelty taulukossa 2 (Rossant ja McKerlie 2001). Lajienvälinen genomien ja ilmiasujen vertailu 1173
Kuva 3. Systemaattinen geeninkaappaus (gene trapping) kaavamaisesti esitettynä. Menetelmässä poistetaan sattumanvaraisesti toiminnasta hiiren geenejä käyttäen tarkoitukseen kehitettyjä geeninkaappausvektoreita. Geeninpoisto tapahtuu soluviljelmässä alkion kantasoluissa (ES-solut). Kun poistogeenisistä kantasoluista tai hiiristä on löydetty mielenkiintoisia ilmiasuja, niitä aiheuttavat geenit ovat tunnistettavissa nopeasti. Sekä ajan että rahan säästämiseksi kaikkien poistogeenistä hiirtä suunnittelevien tutkimusryhmien kannattaa tarkistaa, ettei heidän geeninsä löydy näiltä listoilta. Lopuksi Toiminnallisen genomiikan menetelmät tuottavat valtavan määrän tietoa geenien ilmentymisprofiileista, geenituotteiden keskinäisistä interaktioista ja geeninpoistojen aiheuttamista ilmiasuista. Vähitellen tietokannat laajenevat, kun mukaan tulee esimerkiksi eri kehitysvaiheiden ilmenemisprofiileja. Näitä tietokantoja voidaan jo nyt käyttää uusien linkkien löytämiseen ja relevanttien hypoteesien tekoon aiemmin tuntemattomien geenien toiminnasta. Erityisesti silloin, kun bioinformatiikan työkalut mahdollistavat tietokantojen ristivertailun, uusia linkkejä löytyy. Dramaattisimmat esimerkit ovat toistaiseksi peräisin leivinhiivasta tehdyistä tietokannoista: vertailemalla geenien ekspressioprofiileja ja proteiinien interaktiokarttoja pystyttiin ennustamaan (ja myöhemmin varmistamaan) uusia linkkejä solun stressivasteessa (Ge ym. 2001). Leivinhiivan tutkimus onkin kulkenut jatkuvasti muutaman vuoden edellä toiminnallisen genomiikan saralla (Makarow 1996). Yhä tärkeämmäksi tuleva mahdollisuus yhdistää eri tietokannoista tulevaa tietoa (ns. systeemibiologia, ks. taulukko 1 ja Kitano 2002) asettaa melkoisen haasteen myös niille varsin lukuisille tahoille, jotka luovat ja keräävät tietokantoja. Erityisen huolenaiheen akateemiselle tutkimukselle aiheuttaa ei-julkisten tietokantojen lisääntyvä määrä. Oikeuksia tietokantoihin ja niiden vertailuun ostetaan kaupallisilta tahoilta kovaan hintaan, ja tästä huolimatta voidaan joutua neuvottelemaan käyttöoikeuksista (Nature neuroscience 2002). Onneksi näyttää siltä, että nämä ei-julkiset tietokannat tarjoavat lisähyötyä julkisiin tietokantoihin nähden vain rajallisen ajan ainakin merkittävimpien sovellusten kannalta. 1174 I. Västrik ja T. Mäkelä
Kirjallisuutta Bergman E, Egly JM. Trichothiodystrophy, a transcription syndrome. Trends Genet 2001;17:279 86. Chenb H, Charlat O, Tartaglia LA, ym. Evidence that the diabetes gene encodes the leptin receptor: identification of a mutation in the leptin receptor gene in db/db mice. Cell 1996;84:491 5. Coghill EL, Hugill A, Parkinson N, ym. A gene-driven approach to the identification of ENU mutants in the mouse. Nat Genet 2002;30: 255 6. Fraser AG, Kamath RS, Zipperlen P, ym. Functional genomic analysis of C. elegans chromosome I by systematic RNA interference. Nature 2000;408:325 30. Ge H, Liu Z, Church GM, Vidal M. Correlation between transcriptome and interactome mapping data from Saccharomyces cerevisiae. Nat Genet 2001;29:482 6. Heasman J. Morpholino oligos: making sense of antisense? Dev Biol 2002;243:209 14. Johnston M. The yeast genome: on the road to the Golden Age. Curr Opin Genet Dev 2000;10:617 23. Käyhty H. Mitä hyötyä on meningokokin geenikartasta? Duodecim 2000; 116:2739 40. Kennerdell JR, Carthew RW. Heritable gene silencing in Drosophila using double-stranded RNA. Nat Biotechnol 2000;18:89 8. Kitano H. Systems biology: a brief overview. Science 2002;295:1662 4. Makarow M. Hiivasolun perimänsalat julki. Duodecim 1996;113:1737. Nasevicius A, Ekker SC. Effective tgargeted gene»knockdown» in zebrafish. Nat Genet 2000;26:216 20. Nature neuroscience. Mining the mouse genome. Nat Neurosci 2002;5:81. Peltonen-Palotie L. Miten perimähankkeen valmistuminen vaikuttaa mahdollisuuksiimme selvittää sairauksien patogeneesiä? Duodecim 2001;117:939 44. Ranta S, Zhang Y, Ross B, ym. The neuronal ceroid lipofuscinoses in human EPMR and mnd mutant mice are associated with mutations in CLN8. Nat Genet 1999;23:233 6. Rossant J, McKerlie C. Mouse-based phenogenomics for modelling human disease. Trends Mol Med 2001;7:502 7. Sariola H, Thesleff I, Makarow M. Hiiriä, hiivoja ja kärpäsiä mitä malliorganismien geenit kertovat elämästä ja sen evoluutiosta. Duodecim 2000;116:1734 41. Vidal M. A biological atlas of functional maps. Cell 2001;104:333 9. Vihinen M, Lehväslaiho H. Geenitietokannat ja niiden käyttö. Duodecim 2000;116:1759 62. Wianny F, Zernicka-Goetz M. Specific interference with gene function by double-stranded RNA in early mouse development. Nat Cell Biol 2000;2:70 5. Yaspo ML. Taking a functional genomics approach in molecular medicine. Trends Mol Med 2001;7:494 501. Zhang Y, Proenca R, Maffei M, ym. Positional cloning of the mouse obese gene and its human homologue. Nature 1994;372:425 32. IMRE VÄSTRIK, FT vastrik@ebi.ac.uk EMBL-European Bioinformatics Institute, Wellcome Trust Genome Campus Hinxton, Cambridge, CB10 1SD United Kingdom TOMI MÄKELÄ, professori Haartman-instituutti ja HYKS-laboratoriodiagnostiikka Biomedicum Helsinki 00014 Helsingin yliopisto Lajienvälinen genomien ja ilmiasujen vertailu 1175