Proteiinien kontaktiresidyjen ennustaminen. Tuomo Hartonen Teoreettisen fysiikan syventävien opintojen seminaari
|
|
- Hannu Turunen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Proteiinien kontaktiresidyjen ennustaminen Tuomo Hartonen Teoreettisen fysiikan syventävien opintojen seminaari
2 Terminologiaa Aminohappo = proteiinien rakennuspalikka, luonto käyttää 20 erilaista Aminohapporesidy = tietty aminohappo (monomeeri) aminohappojen muodostamassa ketjussa (polymeerissä) Proteiini = biomolekyyli joka koostuu yhdestä tai useammasta aminohappoketjusta, luonnon työjuhta Kontaktiresidy = proteiinin 3D-rakenteessa toisen residyn kanssa vuorovaikuttava aminohapporesidy Proteiinien kontaktiresidyjen ennustaminen 2
3 Esitelmän rakenne Taustaa Proteiinien rakenne, proteiiniperheet, proteiinidatapankit Kontaktiresidyjen ennustaminen (DCA, Direct Contact Analysis) Pottsin malli kuvaa residyjen korrelaatioita Mallin parametrit uskottavuutta optimoimalla Kuinka hyvin malli toimii? Yhteenveto Proteiinien kontaktiresidyjen ennustaminen 3
4 Rakenteen luokittelu Primäärinen Kovalenttiset/peptidisidokset Sekundäärinen Vetysidokset Tertiäärinen Hydrofobiset vuorovaikutukset, suolasillat, vetysidokset... Kvaternäärinen Ei-kovalenttiset vuorovaikutukset Proteiinien kontaktiresidyjen ennustaminen Kuva: Wikipedia, 4 Protein Structure
5 Proteiiniperheet ovat sukulaisproteiinien kokoelmia Proteiiniperhe on kokoelma evolutionaarisesti läheisiä proteiineja, joilla on yhteinen kantaisä Proteiinit järjestetään perheisiin aminohapposekvenssien rinnastuksen (SA, sequence alignment) avulla Kuva: Wikipedia, Proteiinien kontaktiresidyjen ennustaminen Sequence Alignment 5
6 Proteiinidatapankit: rakenteet ja muuta tietoa Proteiinien kolmiulotteiset rakenteet avoimesti saatavilla Tietokannat sisältävät myös primääriset rakenteet ja muuta tietoa proteiineista Proteiinit järjestetty perheittäin fylogeneettiset puut, MSA:t (monen sekvenssin rinnastus, multiple sequence alignment) Esim. PFAM perhettä, jokaisessa kymmenistä tuhansiin proteiineja Mahdollistavat rakenteiden tilastollisen ennustamisen! Proteiinien kontaktiresidyjen ennustaminen 6
7 Proteiinin rakenteen ennustaminen (PSP) Proteiinin 3D-rakenteen ennustamista primäärisen rakenteen perusteella Sovelluskenttä laaja Lääkekehitys (lääkkeiden vuorovaikutukset) Bioteknologia (keinotekoiset entsyymit jne.) Tässä esitelmässä käsitellään kontaktiresidyjen ennustamista Kontaktiresidyjen tunteminen EI vielä kerro 3Drakennetta, mutta auttaa esim. laskostumissimulaatioissa Proteiinien kontaktiresidyjen ennustaminen 7
8 Kontaktiresidyt voidaan löytää MSA:n avulla Tarkoitus selvittää proteiinin 3D-rakenteessa kosketuksissa toisiinsa olevat aminohapporesidyt primäärisen rakenteen perusteella Improved contact prediction in proteins: Using pseudolikelihoods to infer Potts models, M.Ekeberg, C.Lövkvist, Y.Lan, M.Weigt, E.Aurell, arxiv: Tämä voidaan tehdä etsimällä korrelaatioita MSA:sta Taustalla hypoteesi siitä, että lähekkäin kolmiulotteisessa rakenteessa olevat residyt kehittyvät yhdessä evoluution kuluessa Proteiinien kontaktiresidyjen ennustaminen 8
9 MSA-esimerkki Kuva: arxiv: , M.Ekeberg et. al Proteiinien kontaktiresidyjen ennustaminen 9
10 Epäsuorat korrelaatiot haittaavat oikean rakenteen löytämistä Vuorovaikutukset synnyttävät kahdenlaisia korrelaatioita: suoria: aminohappo A muuttuu, koska sen kanssa vuorovaikuttava aminohappo B muuttuu epäsuoria: aminohappo C muuttuu koska se on aminohapon A vieressä aminohappoketjussa, ja A muuttuu koska se vuorovaikuttaa B:n kanssa Epäsuorat korrelaatiot eivät siis vastaa todellisia pitkän kantaman vuorovaikutuksia -> halutaan oppia malli, joka erottaa suorat ja epäsuorat korrelaatiot Proteiinien kontaktiresidyjen ennustaminen 10
11 Pottsin malli pystyy kuvaamaan empiiriset korrelaatiot Pottsin malli on yksinkertaisin empiiriset korrelaatiot tuottava malli σ on N:n pituinen aminohapposekvenssi ja jokainen σ i voi saada yhden 21:stä arvosta (yksi jokaiselle aminohapolle ja yksi aukolle rinnastuksessa) h i ja J ij ovat mallin vapaat parametrit Proteiinien kontaktiresidyjen ennustaminen 11
12 Uskottavuusfunktion maksimointi antaa oikeat parametrit Tehtävä on siis löytää parametrit siten, että malli tuottaa samat korrelaatiot jotka voidaa laskea MSA:sta Uskottavuusfunktio kertoo todennäköisyyden generoida k.o data tietyillä parametreilla Uskottavuusfunktio on statistisen mallin parametrien funktio, jonka maksimiarvo antaa parametrit, jotka kuvaavat dataa parhaiten Proteiinien kontaktiresidyjen ennustaminen 12
13 Pseudouskottavuuden optimointi on laskennallisesti kevyempää Uskottavuusfunktion laskeminen vaatii tilasumman laskemista -> laskennallisesti raskasta Approksimoidaan uskottavuutta pseudouskottavuudella, joka on ehdollinen todennäköisyys havaita yksi muuttuja kun kaikkien muiden muuttujien tilat tiedetään Oikeastaan etsitään negatiivisen pseudouskottavuuden logaritmin minimiä -> laskennallisesti helpompaa Proteiinien kontaktiresidyjen ennustaminen 13
14 Parametrit kertovat vuorovaikutusten voimakkuuden Vuorovaikutusten voimakkuutta kuvaa qxq matriisi (q=aminohappojen lukumäärä) Vuorovaikutusten voimakkuuksien järjestämiseksi tarvitaan skalaarisuure Ekeberg et. al. käyttävät Frobeniuksen normia Proteiinien kontaktiresidyjen ennustaminen 14
15 plmdca pähkinänkuoressa (Pseudo Likelihood Minimization DCA) 1) Lasketaan MSA:sta korrelaatiot 2) Minimoidaan Pottsin mallin pseudouskottavuusfunktio käyttäen empiirisiä korrelaatioita sidosehtoina 3) Lasketaan vuorovaikutusten voimakkuudet saaduista malleista käyttäen Frobeniuksen normia Tässä jätetty yksityiskohtia pois (mm. fylogeneettiset korjaukset) Proteiinien kontaktiresidyjen ennustaminen 15
16 Vertailu kokeellisiin tuloksiin Mallin antamaa ennustetta kontaktiresidyistä verrataan proteiinidatapankeista saatuihin 3D-rakenteisiin Kristallografiakuvissa ei lue minkä aminohapporesidyjen välillä on vuorovaikutus Määritetään vuorovaikuttavat residyt residyjen välisten etäisyyksien avulla Proteiinien kontaktiresidyjen ennustaminen 16
17 Residyjen välisten etäisyyksien histogrammi (3D-rakenteessa) 1,5Å:n piikki: Peptidisidokset naapuriaminohappojen välillä Piikit 3-5Å ja 7-8Å epätriviaaleja 3D-rakenteesta johtuvia Kuva: arxiv: , M.Ekeberg et. al Proteiinien kontaktiresidyjen ennustaminen 17
18 Y-akseli: oikein ennustettujen kontaktien osuus kaikista ennustetuista kontakteista X-akseli: Ennustettujen kontaktien määrä N=aminohappoketjun pituus B eff =Rinnastettujen sekvenssien lukumäärä Mukana vain parit joille i-j >4 Oikeaa kontaktien lukumäärää ei tiedetä (tarkistamatta) -> tarvitaan pisteraja kontakteille Kuva: arxiv: , M.Ekeberg et. al Proteiinien kontaktiresidyjen ennustaminen 18
19 Y-akseli: vuorovaikutuspisteet pseudouskottavuuden minimoinnilla X-akseli: Keskeiskenttämallilla Suurempi lukuarvo -> vahvempi vuorovaikutus Hyvin toimiva malli erottaa vihreät ja punaiset pisteet toisistaan! Kuva: arxiv: , M.Ekeberg et. al Proteiinien kontaktiresidyjen ennustaminen 19
20 Potts ja pseudouskottavuus, +/- Ennusteet lähempänä todellisia rakenteita kuin aiemmilla malleilla, ennustukset eivät silti täydellisiä (kaikki vihreät ja punaiset pisteet eivät erotu toisistaan) Keskeiskenttämalli-algoritmin suoritusaika pöytäkoneella muutama sekunti, pseudouskottavuuden maksimoinnin suoritus voi viedä monta tuntia jos proteiiniperheessä on monta rinnakkaista sekvenssiä Pottsin mallissa rinnastusten aukkoja kohdellaan kuin oikeita aminohappoja, tuskin oikeutettua? Proteiinien kontaktiresidyjen ennustaminen 20
21 Yhteenveto Proteiinidatapankit mahdollistavat tilastolliset lähestymistavat proteiinien rakenteen ennustamiseen Pottsin malli yhdistettynä pseudouskottavuuden maksimointiin ennustaa hyvin kontaktissa olevat residyt proteiinin aminohappoketjussa Mallin ongelmana on tällä hetkellä sen hitaus Proteiinien kontaktiresidyjen ennustaminen 21
22 Kiitos! Kuva: xkcd.com/ Proteiinien kontaktiresidyjen ennustaminen 22
Aukkoja sekvensseissä. Tuomo Hartonen Teoreettisen fysiikan syventävien opintojen seminaari
Aukkoja sekvensseissä Tuomo Hartonen Teoreettisen fysiikan syventävien opintojen seminaari 25.04.13 Terminologiaa Aminohappo = proteiinien rakennuspalikka, proteiinit rakentuvat 22:sta erilaisesta, 20
LisätiedotDNA, RNA ja proteiinirakenteen ennustaminen
S-114.500 Solubiosysteemien perusteet Harjoitustyö Syksy 2003 DNA, RNA ja proteiinirakenteen ennustaminen Ilpo Tertsonen, 58152p Jaakko Niemi, 55114s Sisällysluettelo 1. Alkusanat... 3 2. Johdanto... 4
LisätiedotS-114.3812 Laskennallinen Neurotiede
S-114.381 Laskennallinen Neurotiede Projektityö 30.1.007 Heikki Hyyti 60451P Tehtävä 1: Virityskäyrästön laskeminen Luokitellaan neuroni ensin sen mukaan, miten se vastaa sinimuotoisiin syötteisiin. Syöte
LisätiedotSignaalien generointi
Signaalinkäsittelyssä joudutaan usein generoimaan erilaisia signaaleja keinotekoisesti. Tyypillisimpiä generoitavia aaltomuotoja ovat eritaajuiset sinimuotoiset signaalit (modulointi) sekä normaalijakautunut
LisätiedotTILASTOLLINEN OPPIMINEN
301 TILASTOLLINEN OPPIMINEN Salmiakki- ja hedelmämakeisia on pakattu samanlaisiin käärepapereihin suurissa säkeissä, joissa on seuraavat sekoitussuhteet h 1 : 100% salmiakkia h 2 : 75% salmiakkia + 25%
LisätiedotOsakesalkun optimointi
Osakesalkun optimointi Anni Halkola Epäsileä optimointi Turun yliopisto Huhtikuu 2016 Sisältö 1 Johdanto 1 2 Taustatietoja 2 3 Laskumetodit 3 3.1 Optimointiongelmat........................ 4 4 Epäsileän
LisätiedotOsakesalkun optimointi. Anni Halkola Turun yliopisto 2016
Osakesalkun optimointi Anni Halkola Turun yliopisto 2016 Artikkeli Gleb Beliakov & Adil Bagirov (2006) Non-smooth optimization methods for computation of the Conditional Value-at-risk and portfolio optimization.
LisätiedotSekvenssien rinnastus. Rinnastus: helppoa tai vaikeaa
Sekvenssien rinnastus Rinnastus: helppoa tai vaikeaa Kaksi tai useampia (DNA tai proteiini) sekvenssejä: miten samankaltaisia sekvenssit ovat missä sekvenssikohdissa samankaltaisuutta esiintyy Kattava
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Lisätiedot1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI
1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI Edellä esitelty Bayesiläinen luokittelusääntö ( Bayes Decision Theory ) on optimaalinen tapa suorittaa luokittelu, kun luokkien tnjakaumat tunnetaan Käytännössä tnjakaumia
LisätiedotJuuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty
Juuri 0 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 9..08 Kertaus K. a) Alapaineiden pienin arvo on ja suurin arvo 74, joten vaihteluväli on [, 74]. b) Alapaineiden keskiarvo on 6676870774
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. marraskuuta 2007 Antti Rasila () TodB 30. marraskuuta 2007 1 / 19 1 Lineaarinen regressiomalli ja suurimman uskottavuuden menetelmä Minimin löytäminen
LisätiedotMalliratkaisut Demo 4
Malliratkaisut Demo 4 1. tehtävä a) () = 2+1. Funktio on lineaarinen, joten se on unimodaalinen sekä maksimoinnin että minimoinnin suhteen. Funktio on konveksi ja konkaavi. b) () = (suurin kokonaisluku
LisätiedotNeuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
Lisätiedot1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI
1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI Edellä esitelty Bayesiläinen luokittelusääntö ( Bayes Decision Theory ) on optimaalinen tapa suorittaa luokittelu, kun luokkien tnjakaumat tunnetaan Käytännössä tnjakaumia
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotMännyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto 9.6.2003
Männyn laaturajojen integrointi runkokäyrän ennustamisessa Laura Koskela Tampereen yliopisto 9.6.2003 Johdantoa Pohjoismaisen käytännön mukaan rungot katkaistaan tukeiksi jo metsässä. Katkonnan ohjauksessa
LisätiedotHenkilötunnus - Biokemian/bioteknologian valintakoe. Sukunimi Etunimet Tehtävä 1 Pisteet / 20
elsingin yliopisto/tampereen yliopisto enkilötunnus - Biokemian/bioteknologian valintakoe Sukunimi 24. 5. 2004 Etunimet Tehtävä 1 Pisteet / 20 Solujen kalvorakenteet rajaavat solut niiden ulkoisesta ympäristöstä
LisätiedotSisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3
Lisätiedot10. Esitys ja kuvaus
10. Esitys ja kuvaus Kun kuva on ensin segmentoitu alueisiin edellisen luvun menetelmin, segmentoidut pikselit kootaan esittämään ja kuvaamaan kohteita muodossa, joka sopii hyvin jatkokäsittelyä varten.
LisätiedotDiskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi
TOD.NÄK JA TILASTOT, MAA0 Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi Kuten tilastojakaumia voitiin esittää tunnuslukujen (keskiarvo, moodi, mediaani, jne.) avulla, niin vastaavasti
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
Lisätiedot2.4 Pienimmän neliösumman menetelmä
2.4 Pienimmän neliösummn menetelmä Optimointimenetelmiä trvitn usein kokeellisen dtn nlysoinniss. Mittuksiin liittyy virhettä, joten mittus on toistettv useit kertoj. Oletetn, että mittn suurett c j toistetn
LisätiedotIntegrointialgoritmit molekyylidynamiikassa
Integrointialgoritmit molekyylidynamiikassa Markus Ovaska 28.11.2008 Esitelmän kulku MD-simulaatiot yleisesti Integrointialgoritmit: mitä integroidaan ja miten? Esimerkkejä eri algoritmeista Hyvän algoritmin
LisätiedotKorvausvastuun ennustejakauma bootstrap-menetelmän avulla
Korvausvastuun ennustejakauma bootstrap-menetelmän avulla Sari Ropponen 13.5.2009 1 Agenda Korvausvastuu vahinkovakuutuksessa Korvausvastuun arviointi Ennustevirhe Ennustejakauma Bootstrap-/simulointimenetelmä
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
LisätiedotEsimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotOhjeita fysiikan ylioppilaskirjoituksiin
Ohjeita fysiikan ylioppilaskirjoituksiin Kari Eloranta 2016 Jyväskylän Lyseon lukio 11. tammikuuta 2016 Kokeen rakenne Fysiikan kokeessa on 13 tehtävää, joista vastataan kahdeksaan. Tehtävät 12 ja 13 ovat
LisätiedotEsimerkki 1: auringonkukan kasvun kuvailu
GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin
LisätiedotJohdatus tekoälyn taustalla olevaan matematiikkaan
Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 3. luento 17.11.2017 Neuroverkon opettaminen (ohjattu oppiminen) Neuroverkkoa opetetaan syöte-tavoite-pareilla
LisätiedotP(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu
1. Tyhjentävä tunnusluku (sucient statistics ) Olkoon (P(X = x θ) : θ Θ) todennäköisyysmalli havainnolle X. Datan funktio T (X ) on Tyhjentävä tunnusluku jos ehdollinen todennäköisyys (ehdollinen tiheysfunktio)
LisätiedotJäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä
Jäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä Hypermedian jatko-opintoseminaari 2008-2009 20.3.2009 Jaakko Salonen TTY / Hypermedialaboratorio jaakko.salonen@tut.fi
LisätiedotKertausta 1.kurssista. KEMIAN MIKROMAAILMA, KE2 Atomin rakenne ja jaksollinen järjestelmä. Hiilen isotoopit
KEMIAN MIKROMAAILMA, KE2 Atomin rakenne ja jaksollinen järjestelmä Kertausta 1.kurssista Hiilen isotoopit 1 Isotoopeilla oli ytimessä sama määrä protoneja, mutta eri määrä neutroneja. Ne käyttäytyvät kemiallisissa
LisätiedotTietorakenteet ja algoritmit syksy Laskuharjoitus 1
Tietorakenteet ja algoritmit syksy 2012 Laskuharjoitus 1 1. Tietojenkäsittelijä voi ajatella logaritmia usein seuraavasti: a-kantainen logaritmi log a n kertoo, kuinka monta kertaa luku n pitää jakaa a:lla,
LisätiedotMATEMATIIKKA 5 VIIKKOTUNTIA. PÄIVÄMÄÄRÄ: 8. kesäkuuta 2009
EB-TUTKINTO 2009 MATEMATIIKKA 5 VIIKKOTUNTIA PÄIVÄMÄÄRÄ: 8. kesäkuuta 2009 KOKEEN KESTO: 4 tuntia (240 minuuttia) SALLITUT APUVÄLINEET: Eurooppa-koulun antama taulukkovihkonen Funktiolaskin, joka ei saa
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotTIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta. Yliassistentti Jussi Hakanen syksy 2010
TIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta Yliassistentti Jussi Hakanen jussi.hakanen@jyu.fi syksy 2010 Evoluutiopohjainen monitavoiteoptimointi MCDM ja EMO Monitavoiteoptimointi kuuluu
Lisätiedot4.2.2 Uskottavuusfunktio f Y (y 0 X = x)
Kuva 4.6: Elektroniikassa esiintyvän lämpökohinan periaate. Lämpökohinaa ε mallinnetaan additiivisella häiriöllä y = Mx + ε. 4.2.2 Uskottavuusfunktio f Y (y 0 X = x) Tarkastellaan tilastollista inversio-ongelmaa,
LisätiedotMenetelmä Markowitzin mallin parametrien estimointiin (valmiin työn esittely)
Menetelmä Markowitzin mallin parametrien estimointiin (valmiin työn esittely) Lauri Nyman 17.9.2015 Ohjaaja: Eeva Vilkkumaa Valvoja: Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla
LisätiedotBIOMOLEKYYLEJÄ. fruktoosi
BIMLEKYYLEJÄ IMISEN JA ELINYMPÄ- RISTÖN KEMIAA, KE2 Ihminen on käyttänyt luonnosta saatavia, kasveissa ja eläimissä esiintyviä polymeerejä eli biopolymeerejä jo pitkään arkipäivän tarpeisiinsa. Biomolekyylit
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotHarha mallin arvioinnissa
Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö
Lisätiedot11. laskuharjoituskierros, vko 15, ratkaisut
11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa
LisätiedotMalliratkaisut Demo 4
Malliratkaisut Demo 4 1. tehtävä a) f(x) = 2x + 21. Funktio on lineaarinen, joten se on unimodaalinen sekä maksimoinnin että imoinnin suhteen. Funktio on konveksi ja konkaavi. b) f(x) = x (pienin kokonaisluku
LisätiedotNumeeriset menetelmät TIEA381. Luento 8. Kirsi Valjus. Jyväskylän yliopisto. Luento 8 () Numeeriset menetelmät / 35
Numeeriset menetelmät TIEA381 Luento 8 Kirsi Valjus Jyväskylän yliopisto Luento 8 () Numeeriset menetelmät 11.4.2013 1 / 35 Luennon 8 sisältö Interpolointi ja approksimointi Funktion approksimointi Tasainen
LisätiedotMUOVIA MAIDOSTA. AVAINSANAT: Arkikemia Proteiinit Denaturoituminen Polymeerit Happamuus
MUOVIA MAIDOSTA KOHDERYHMÄ: Työ voidaan tehdä kaikenikäisien kanssa. Teorian laajuus riippuu ryhmän tasosta/iästä. Alakoululaisille muovin valmistusta tehdessä puhutaan verkottumisesta ja muovin verkottuneesta
Lisätiedot58131 Tietorakenteet (kevät 2009) Harjoitus 11, ratkaisuja (Topi Musto)
811 Tietorakenteet (kevät 9) Harjoitus 11, ratkaisuja (Topi Musto) 1. Bellmanin-Fordin algoritmin alustusvaiheen jälkeen aloitussolmussa on arvo ja muissa solmuissa on arvo ääretön. Kunkin solmun arvo
Lisätiedot13.11. Tulosten arviointi. tulosten arviointi. voimmeko luottaa saamiimme tuloksiin?
13.11. tulosten arviointi Tulosten arviointi voimmeko luottaa saamiimme tuloksiin? onko osa saaduista tuloksista sattumanvaraisia? mitkä OSAT puusta ovat luotettavimpia? 1 KONSENSUSDIAGRAMMI Useita yhtä
LisätiedotKuva 1: Funktion f tasa-arvokäyriä. Ratkaisu. Suurin kasvunopeus on gradientin suuntaan. 6x 0,2
HY / Matematiikan ja tilastotieteen laitos Vektorianalyysi I, syksy 018 Harjoitus Ratkaisuehdotukset Tehtävä 1. Olkoon f : R R f(x 1, x ) = x 1 + x Olkoon C R. Määritä tasa-arvojoukko Sf(C) = {(x 1, x
LisätiedotT Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1
T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
Lisätiedot5.6.3 Matematiikan lyhyt oppimäärä
5.6.3 Matematiikan lyhyt oppimäärä Matematiikan lyhyen oppimäärän opetuksen tehtävänä on tarjota valmiuksia hankkia, käsitellä ja ymmärtää matemaattista tietoa ja käyttää matematiikkaa elämän eri tilanteissa
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
LisätiedotMoniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotJohdatus tekoälyn taustalla olevaan matematiikkaan
Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 2. luento 10.11.2017 Keinotekoiset neuroverkot Neuroverkko koostuu syöte- ja ulostulokerroksesta
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotIlkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotInversio-ongelmien laskennallinen peruskurssi Luento 7
Inversio-ongelmien laskennallinen peruskurssi Luento 7 Kevät 2012 1 Tilastolliset inversio-ongelmat Tilastollinen ionversio perustuu seuraaviin periaatteisiin: 1. Kaikki mallissa olevat muuttujat mallinnetaan
LisätiedotREAKTIOT JA TASAPAINO, KE5 KERTAUSTA
KERTAUSTA REAKTIOT JA TASAPAINO, KE5 Aineiden ominaisuudet voidaan selittää niiden rakenteen avulla. Aineen rakenteen ja ominaisuuksien väliset riippuvuudet selittyvät kemiallisten sidosten avulla. Vahvat
LisätiedotGeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin
Lisätiedot7. laskuharjoituskierros, vko 10, ratkaisut
7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotSisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
LisätiedotKonsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari
Konsensusongelma hajautetuissa järjestelmissä Niko Välimäki 30.11.2007 Hajautetut algoritmit -seminaari Konsensusongelma Päätöksen muodostaminen hajautetussa järjestelmässä Prosessien välinen viestintä
LisätiedotDiskreetin matematiikan perusteet Laskuharjoitus 2 / vko 9
Diskreetin matematiikan perusteet Laskuharjoitus 2 / vko 9 Tuntitehtävät 9-10 lasketaan alkuviikon harjoituksissa ja tuntitehtävät 13-14 loppuviikon harjoituksissa. Kotitehtävät 11-12 tarkastetaan loppuviikon
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotLuento 10: Optimointitehtävien numeerinen ratkaiseminen; optimointi ilman rajoitusehtoja
Luento 10: Optimointitehtävien numeerinen ratkaiseminen; optimointi ilman rajoitusehtoja Seuraavassa esitetään optimointitehtävien numeerisia ratkaisumenetelmiä, eli optimointialgoritmeja, keittokirjamaisesti.
LisätiedotMS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 2: Usean muuttujan funktiot
MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 2: Usean muuttujan funktiot Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Syksy 2016 Antti Rasila (Aalto-yliopisto)
LisätiedotMoniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?
TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä
LisätiedotSisällys. 16. Ohjelmoinnin tekniikkaa. Aritmetiikkaa toisin merkiten. Aritmetiikkaa toisin merkiten
Sisällys 16. Ohjelmoinnin tekniikkaa Vaihtoehtoisia merkintöjä aritmeettisille lauseille. Useiden muuttujien esittely ja alustaminen yhdellä lauseella. For-lause lyhemmin. If-else-lause vaihtoehtoisesti
LisätiedotBM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 1, Kevät 2018
BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 1, Kevät 2018 1. (a) Tunnemme vektorit a = [ 5 1 1 ] ja b = [ 2 0 1 ]. Laske (i) kummankin vektorin pituus (eli itseisarvo, eli normi); (ii) vektorien
LisätiedotKombinatorinen optimointi
Kombinatorinen optimointi Sallittujen pisteiden lukumäärä on äärellinen Periaatteessa ratkaisu löydetään käymällä läpi kaikki pisteet Käytännössä lukumäärä on niin suuri, että tämä on mahdotonta Usein
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotMallipohjainen klusterointi
Mallipohjainen klusterointi Marko Salmenkivi Johdatus koneoppimiseen, syksy 2008 Luentorunko perjantaille 5.12.2008 Johdattelua mallipohjaiseen klusterointiin, erityisesti gaussisiin sekoitemalleihin Uskottavuusfunktio
Lisätiedot16. Ohjelmoinnin tekniikkaa 16.1
16. Ohjelmoinnin tekniikkaa 16.1 Sisällys Vaihtoehtoisia merkintöjä aritmeettisille lauseille. Useiden muuttujien esittely ja alustaminen yhdellä lauseella. For-lause lyhemmin. If-else-lause vaihtoehtoisesti
LisätiedotMonitavoiteoptimointi
Monitavoiteoptimointi Useita erilaisia tavoitteita, eli useita objektifunktioita Tavoitteet yleensä ristiriitaisia ja yhteismitattomia Optimaalisuus tarkoittaa yleensä eri asiaa kuin yksitavoitteisessa
LisätiedotMS-A0004/A0006 Matriisilaskenta
4. MS-A4/A6 Matriisilaskenta 4. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto..25 Tarkastellaan neliömatriiseja. Kun matriisilla kerrotaan vektoria, vektorin
Lisätiedot766334A Ydin- ja hiukkasfysiikka
1 76633A Ydin- ja hiukkasfysiikka Luentomonistetta täydentävää materiaalia: 3 5-3 Kuorimalli Juhani Lounila Oulun yliopisto, Fysiikan laitos, 011 Kuva 7-13 esittää, miten parillis-parillisten ydinten ensimmäisen
LisätiedotA ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.
Esimerkki otteluvoiton todennäköisyys A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä. Yksittäisessä pelissä A voittaa todennäköisyydellä p ja B todennäköisyydellä q =
LisätiedotTrichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko
Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko 04.11.2013 Ohjaaja: Merja Oja Valvoja: Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta
LisätiedotJatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
LisätiedotMaximum likelihood-estimointi Alkeet
Maximum likelihood-estimointi Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Maximum likelihood-estimointi p.1/20 Maximum Likelihood-estimointi satunnaismuuttujan X
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotVastakkainasettelullinen riskianalyysi asejärjestelmien vaikuttavuusarvioinnissa
1 Vastakkainasettelullinen riskianalyysi asejärjestelmien vaikuttavuusarvioinnissa Toteuttaja: Aalto-yliopisto Johtaja: Ahti Salo Hankkeelle myönnetty MATINE-rahoitus: 69 204 2 Tutkimusryhmä Aalto-yliopisto
LisätiedotNumeeriset menetelmät TIEA381. Luento 6. Kirsi Valjus. Jyväskylän yliopisto. Luento 6 () Numeeriset menetelmät / 33
Numeeriset menetelmät TIEA381 Luento 6 Kirsi Valjus Jyväskylän yliopisto Luento 6 () Numeeriset menetelmät 4.4.2013 1 / 33 Luennon 6 sisältö Interpolointi ja approksimointi Polynomi-interpolaatio: Vandermonden
Lisätiedot16. Ohjelmoinnin tekniikkaa 16.1
16. Ohjelmoinnin tekniikkaa 16.1 Sisällys For-lause lyhemmin. Vaihtoehtoisia merkintöjä aritmeettisille lauseille. Useiden muuttujien esittely ja alustaminen yhdellä lauseella. If-else-lause vaihtoehtoisesti
LisätiedotSimplex-algoritmi. T Informaatiotekniikan seminaari , Susanna Moisala
Simplex-algoritmi T-6.5 Informaatiotekniikan seminaari..8, Susanna Moisala Sisältö Simplex-algoritmi Lähtökohdat Miten ongelmasta muodostetaan ns. Simplextaulukko Miten haetaan käypä aloitusratkaisu Mitä
LisätiedotSisällys. 17. Ohjelmoinnin tekniikkaa. Aritmetiikkaa toisin merkiten. for-lause lyhemmin
Sisällys 17. Ohjelmoinnin tekniikkaa for-lause lyhemmin. Vaihtoehtoisia merkintöjä aritmeettisille lauseille. Useiden muuttujien esittely ja alustaminen yhdellä lauseella. if-else-lause vaihtoehtoisesti
LisätiedotLaskennallinen menetelmä puun biomassan ja oksien kokojakauman määrittämiseen laserkeilausdatasta
Laskennallinen menetelmä puun biomassan ja oksien kokojakauman määrittämiseen laserkeilausdatasta Pasi Raumonen, Mikko Kaasalainen ja Markku Åkerblom Tampereen teknillinen ylipisto, Matematiikan laitos
LisätiedotS-114.2500 Basics for Biosystems of the Cell Harjoitustyö. Proteiinirakenteen mallintaminen. Niina Sandholm 62938M Antti Niinikoski 60348E
S-114.2500 Basics for Biosystems of the Cell Harjoitustyö Proteiinirakenteen mallintaminen Niina Sandholm 62938M Antti Niinikoski 60348E Sisällysluettelo Johdanto... 3 Luonnontieteellinen perusta... 3
Lisätiedot&()'#*#+)##'% +'##$,),#%'
"$ %"&'$ &()'*+)'% +'$,),%' )-.*0&1.& " $$ % &$' ((" ")"$ (( "$" *(+)) &$'$ & -.010212 +""$" 3 $,$ +"4$ + +( ")"" (( ()""$05"$$"" ")"" ) 0 5$ ( ($ ")" $67($"""*67+$++67""* ") """ 0 5"$ + $* ($0 + " " +""
LisätiedotViikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi
Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 5.-7.11.2008. 1 Tällä viikolla Sisältösuunnitelma: Ennustamisstrategioista Koneoppimismenetelmiä: k-nn (luokittelu
Lisätiedot