Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko

Samankaltaiset tiedostot
Inferring Trichoderma reesei gene regulatory network

Vangin dilemma häiriöisessä ympäristössä Markov-prosessina (valmiin työn esittely) Lasse Lindqvist

Menetelmä Markowitzin mallin parametrien estimointiin (valmiin työn esittely)

Implementation of Selected Metaheuristics to the Travelling Salesman Problem (valmiin työn esittely)

Tuotantoprosessin optimaalinen aikataulutus (valmiin työn esittely)

Peliteorian soveltaminen hajautettujen järjestelmien protokollasuunnittelussa (valmiin työn esittely)

Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely)

Optimaaliset riskinalentamisportfoliot vikapuuanalyysissä (valmiin työn esittely)

Minimilatenssiongelman ratkaisualgoritmeja (valmiin työn esittely)

Algoritmit 2. Luento 13 Ti Timo Männikkö

Monitavoitteiseen optimointiin soveltuvan evoluutioalgoritmin tarkastelu

Kirjallisuuskatsaus sisäpistemenetelmiin ja niiden soveltamiseen eri optimointiluokille (valmiin työn esittely)

Algoritmit 2. Luento 12 To Timo Männikkö

Vesivoimaketjun optimointi mehiläisalgoritmilla (Valmiin työn esittely)

Search space traversal using metaheuristics

Monte Carlo -menetelmä optioiden hinnoittelussa (valmiin työn esittely)

Lineaaristen monitavoiteoptimointitehtävien

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto

Trimmitysongelman LP-relaksaation ratkaiseminen sarakkeita generoivalla algoritmilla ja brute-force-menetelmällä

1. Tilastollinen malli??

Stokastinen optimointi taktisessa toimitusketjujen riskienhallinnassa (valmiin työn esittely)

Optimization of Duties in Railway Traffic (valmiin työn esittely)

Kustannustehokkaat riskienhallintatoimenpiteet kuljetusverkostossa (Valmiin työn esittely)

"Geenin toiminnan säätely" Moniste sivu 13

Informaation leviäminen väkijoukossa matemaattinen mallinnus

Kompleksiset sarjat ja potenssisarjat

Vedonlyöntistrategioiden simulointi ja evaluointi

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 8: Newtonin iteraatio. Taso- ja avaruusintegraalit

Arkkitehtuurien tutkimus Outi Räihä. OHJ-3200 Ohjelmistoarkkitehtuurit. Darwin-projekti. Johdanto

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Geneettiset algoritmit

Yhtäläisyydet selkärankaisten aivoissa, osa II. Niko Lankinen

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 1, Kevät 2018

Seurantalaskimen simulointi- ja suorituskykymallien vertailu (valmiin työn esittely) Joona Karjalainen

Lisäinformaation arvo monikriteerisessä projektiportfoliovalinnassa (valmiin työn esittely)

Lentotiedustelutietoon perustuva tykistön tulenkäytön optimointi (valmiin työn esittely)

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Kopulafunktiot. Joonas Ollila 12. lokakuuta 2011

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Demo 1: Simplex-menetelmä

Puhelintukiasema-antennin säteilykuvion mittaus multikopterilla (Valmiin työn esittely)

Matematiikan tukikurssi

H Prosessi- ja kokonaisarkkitehtuurityökalu palveluna Liite 17 Käytettävyyden arviointi

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely)

Talous- ja velkaneuvonta: Asiakasrekisteri. Tarjousten vertailu. Tiivistelmä

Työvuorosuunnittelun optimointi (valmiin työn esittely)

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mallipohjainen klusterointi

pitkittäisaineistoissa

Parametrin estimointi ja bootstrap-otanta

Kaksintaistelun approksimatiivinen mallintaminen (valmiin työn esittely)

Kuvioton metsäsuunnittelu Paikkatietomarkkinat, Helsinki Tero Heinonen

Vastausehdotukset analyysin sivuainekurssin syksyn välikokeeseen

Otannasta ja mittaamisesta

. Kun p = 1, jono suppenee raja-arvoon 1. Jos p = 2, jono hajaantuu. Jono suppenee siis lineaarisesti. Vastaavasti jonolle r k+1 = r k, suhde on r k+1

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Bioteknologian perustyökaluja

Cubature Integration Methods in Non-Linear Kalman Filtering and Smoothing (valmiin työn esittely)

Tutkimustiedonhallinnan peruskurssi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

Lineaaristen monitavoiteoptimointitehtävien ratkaiseminen Bensonin algoritmilla

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Hyvän käytännön kuvaus 1

Batch means -menetelmä

Sovellettu todennäköisyyslaskenta B

f (28) L(28) = f (27) + f (27)(28 27) = = (28 27) 2 = 1 2 f (x) = x 2

Päätösanalyysi Teknologföreningenin kiinteistöuudistuksen tukena (valmiin työn esittely)

Dynaaminen allokaatio ja riskibudjetointi sijoitusstrategioissa

Preliminäärikoe Tehtävät Pitkä matematiikka / 3

Matemaattinen Analyysi

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

Määrittelydokumentti

1 Kompleksiluvut. Kompleksiluvut 10. syyskuuta 2005 sivu 1 / 7

Dynaamiset regressiomallit

Älykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach

Lineaaristen monitavoiteoptimointitehtävien ratkaiseminen Bensonin algoritmilla

2. Uskottavuus ja informaatio

TIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta. Yliassistentti Jussi Hakanen syksy 2010

Juuri 6 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty Vastaus: Määrittelyehto on x 1 ja nollakohta x = 1.

Maksimit ja minimit 1/5 Sisältö ESITIEDOT: reaalifunktiot, derivaatta

TTY Mittausten koekenttä. Käyttö. Sijainti

n. asteen polynomilla on enintään n nollakohtaa ja enintään n - 1 ääriarvokohtaa.

läheisyydessä. Piirrä funktio f ja nämä approksimaatiot samaan kuvaan. Näyttääkö järkeenkäyvältä?

1. Lineaarinen optimointi

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen

Anna jokaisen kohdan vastaus kolmen merkitsevän numeron tarkkuudella muodossa

Matemaatikot ja tilastotieteilijät

Spektrofotometria ja spektroskopia

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Funktiojonot ja funktiotermiset sarjat Funktiojono ja funktioterminen sarja Pisteittäinen ja tasainen suppeneminen

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Vastakkainasettelullinen riskianalyysi asejärjestelmien vaikuttavuusarvioinnissa

Tutkimustiedonhallinnan peruskurssi

Polkuriippuvuus trade-off-painotuksessa (valmiin työn esittely)

Luento-osuusosuus. tilasto-ohjelmistoaohjelmistoa

Transkriptio:

Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko 04.11.2013 Ohjaaja: Merja Oja Valvoja: Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeudet pidätetään.

Taustaa Sellulaasientsyymien hinnalla on suuri vaikutus biopolttoaineiden tuotantokustannuksiin T. reesei on teollisuudessa yleisimmin käytetty sellulaasituottaja Aikaisempi tutkimus keskittyi ylituottajakantojen kehittämiseen Tuoreempi tutkimus pyrkii: Ymmärtämään sellulaasigeenien säätelymekanismeja Tutkimaan ylituottajakantojen hyödyllisten mutaatioiden vaikutusmekanismia Trichoderma reesei

Taustaa Tunnettuja positiivisia säätelijöitä: Xyr1 Ace2 HAP kompleksi Lae1 Xyl1p Tunnettuja negatiivisia säätelijöitä : Cre1 Ace1 Portnoy et al., 2011

Tavoite Uusien, testattavien säätelijäehdokkaiden muodostus saatavissa olevan transkriptiodatan perusteella Säätelijäehdokkaiden todellinen vaikutus voidaan varmentaa laboratoriokokeilla Erityisen kiinnostavia geenejä ovat sellulaasisynteesin ja erityksen säätelijät Module networks menetelmän soveltaminen ja sen arviointi T. reesein geeniverkoston säätelyn ennustamisessa

Transkriptomi Kaikkien geenien aktiivisuus yhdellä ajanhetkellä yhdessä organismissa tai populaatiossa Tässä tutkielmassa käytetty transkriptomidata oli sarja mittauksia eri olosuhteissa Yhteensä reilut 10 000 geeniä Sarja A sisälsi 66 olosuhdevertailua ph, lämpötila, hiilenlähde yms. Sarja B sisälsi 49 aikavertailua

Menetelmä Module networks menetelmä Geenit jaetaan moduleihin, joilla on yksilöllinen säätelyohjelma Geenien aktiivisuus normaalijakautunutta kunkin lehden sisällä EM-algoritmia käytettiin modulirakenteen luomiseen Kaksi askelta: Säätelyohjelman muodostaminen Rakenteen muodostaminen Algoritmi on toteutettu Genomica-ohjelmassa Segal et al. 2003

Ongelma EM-algoritmissa on bayesiläinen tavoitefunktio Lukuisia muuttujia, joiden vaikutuksesta tavoitefunktiolla on useita paikallisia ääriarvokohtia Tällä hetkellä ei ole olemassa tapaa löytää funktion globaali maksimi Tavoitefunktio suppenee helposti pieniin arvoihin Satunnaisaskel vaimenevalla todennäköisyydellä Hyvin vaihteleva lopputulos samoilla parametreillä

Ratkaisu Algoritmi ajettiin yli 1000 kertaa kummallekin datasetille Kunkin modulin säätelyohjelman säätelijät pisteytettiin Geenit klusteroitiin pistemäärien perusteella käyttäen hierarkista klusterointia ja k-means-algoritmia Tuloksena geeniryhmiä, joita säätelevät samat geenit Kullekin geenille annettiin rooli vastaavien säätelijöiden pisteiden ja pistejakauman perusteella Esim. Yksittäinen vahva säätelijä

Tulokset Löytyi useita korkean pistemäärän regulaattoreita 95 sellulaasisäätelijää Tämän tason päätelmät eivät olisi mahdollisia yksittäisten Genomicatulosten perusteella Toisto välttämätöntä Klusterointimenetelmä vaikutti klusterien rakenteeseen, mutta ei ennustettuihin sellulaasisäätelijöihin Aiemmin löydettyjä säätelijöitä ei löytynyt 95 säätelijäehdokkaan joukosta Tämä on kuitenkin perusteltavissa monen puuttuvan säätelygeenin osalta

Menetelmän rajoitteet Analyysi pohjautuu transkriptomidataan Monet geenisäätelyverkoston tasot jäävät menetelmän ulottumattomiin Genomica-ohjelman muuttaminen ei ollut mahdollista Menetelmä ei pysty ottamaan huomioon ehdollista aktiivisuutta Loogiset rakenteet saattavat hämätä algoritmia Menetelmä saattaa valita kaksi kilpailevaa geeniä säätelijöiksi samaan aikaan Jos säätelijät selittävät samaa osaa varianssista, luultavasti vain toinen voi pitää paikkansa

Päätelmät Module networks menetelmä Kykenee löytämään perustellusti uusia säätelijäehdokkaita EM-algoritmin toisto on tulosten kannalta välttämätöntä Algoritmissa ja menetelmän muissa vaiheissa on myös parannettavaa Hypoteesit Sellulaasisäätelijäehdokkaat ovat lupaavia Korkean pistemäärän saavuttaneet säätelijät ovat hyvin vahvoja Nämä hypoteettiset säätelijät eivät kuitenkaan säätele sellulaasigeenejä Tulokset tarjoavat hyödyllisiä hypoteesejä T. reesein genomin kattavasta geenisäätelyverkostosta