Primjena distribuiranih sustava u računalnoj biologiji Maša Roller Milošević Grupa za bioinformatiku PMF
Sadržaj predavanja Računalna biologija Primjer primjene distribuiranih sustava u računalnoj biologiji
Stanica: osnovna jedinica života Izvor: On-Line Biology Book Jezgra = knjižnica Kromosomi = police Geni = knjige Knjiga predstavljaju svu informaciju (DNA) koju svaka stanica u tijelu treba za rast i ispunjene raznih funkcija.
Veličina knjižnica Zločin i kazna Fjodor Dostojevski Organizam 1,040,570 Slova (~ 1 x 10 6 ) Broj slova Klamidija 1 x 10 6 E. coli 4.6 x 10 6 Kvasac 1.3 x 10 7 Čovjek 3.3 x 10 9
Sekvence Geni Sekvence/1000 Strukture Rast bioloških informacija 2000 1800 1600 1400 1200 1000 800 600 400 200 0 NUKLEOTIDNE SEKVENCE GenBank 1965 1970 1975 1980 1985 1990 1995 8000 7000 6000 5000 4000 3000 2000 1000 0 PDB 3D STRUKTURE 1965 1970 1975 1980 1985 1990 1995 80000 70000 60000 50000 40000 30000 20000 10000 0 PROTEINSKE SEKVENCE SWISS-PROT PKRRSARLSA 1965 1970 1975 1980 1985 1990 1995 MAPIRANI LJUDSKI GENI 35000 30000 25000 20000 15000 10000 5000 0 1965 1970 1975 1980 1985 1990 1995 Izvor: NCBI
KRAJNJI KORISNIK Računalna biologija Podrška Procesuiranje sirovih podataka Održavanje baza Upravljanje podatcima Istraživanje Analiza podataka Interpretacija podataka Bioračunarstvo, biomatematika, biostatistika
Sadržaj predavanja Računalna biologija Primjer primjene distribuiranih sustava u računalnoj biologiji: Mikrobna metagenomika
Mikrobne zajednice Morske Probavilo miševa Ljudsko probavilo Postrojenje za uklanjanje fosfora Strvina kita Zemlja Kiseli sekret iz rudnika
Poteškoće u istraživanju ~ 1% mikroba se može uzgajati u kulturi mikrobnih zajednica Mikrobi žive u zajednicama copyright 2006 art-in-science.com http://www.nearingzero.net
Odgovor: metagenomika Uzorak iz okoliša Izolirana DNA Sekvenciranje i slaganje fragmenata
Slaganje fragmenata AACCTGACATAGGTTAACTA GGTTAACTATACCTGCCAATGA GATAAATCTGTGT CAATGATTGAGCGATA Arachne genome assembler Memorijski zahtjev = ~ 50 Gb Diskovni prostor = ~ 500 Gb
Anotacija metagenoma ~5 GB ATAGAATGATTTTTAAAAGGAATAATTTCGTTAGTTATATTTCCAGGTTTTAAAAAAGACATAGGTAAAT CAAAGAAATCTATTAAGCCCCTAAGAATTGATTCAAATGGTAAAAATTCCCCAAATGGAACAAGATTAA CCTTTTTATACCCAGATAATTTTTCACTAGACAAGATTGTCAAAGTATTAAAATAATTAATTGATGTAGGA GCTGATTCAGATTGGTAGATACCGGAAATTACATTCAAATTATTCTCTTCAAGCCTCTTCACAAGGTTGTT TCCATATAAGCTCTTTAGAGTGTATGGAAAAGGAGATTCTGGCCAAACAATTAGATCTAATCCTTCTTTC TCTAAACTCAAGCTAATTAATCTATCTTCAATTGATTTCCCATAATCACTTTCAAATTTTTGACGTGGCCCA AATGATGGCTGAACTATTCCAAATTTTAAATGCTCATCGCTTGAATTATGAATGTCTAATTTTGTGGTTAA GGAAGGTATTGCAAATGCAATTATTAATAAAATACTTAAGCCATACTTATATGCTTTTTTTGAACTAAGA GCTGCTGCTGAGACTATTAAATAAAATAATAGCGAGCATCCGATCACACCAATTATTGGTATCAAGAAA TCAAGTATCGTATCAAGGAAAATTACTCCTGGTTGCAGCCATGGAAATCCTCCTAAAATAAAAAATCTT GCTGATTCAAGCAATATTAATATTGAAGATAGGATTAGAGCATTTGTAAAGTTAGATATTCTTTTAATGT ATACAAATAGCATAATCGGGAGCACAAATATACTTGAAAGTAACAATCCTAGAAAAATTAATGCAGTG ACTGATAATGCTATGTTTACATTTCCATGATAGTGAATACTCACTATTAGCCAAAAAGTTCCAGCAAACC AAAGTCCAAATCCCCAAAAGAGAATATGCAACCATTTGTTTTCAGTTGAAGAACTAGTTAGTATCGAGA CCAAATATAAATAGGATAATACTAGGATCCACTTTTGATCATAAGGTGCAAAAGCAAGAAACGATAAT ATTCCAACTAATGCGGTTGTGAGATATCTAATCAGACGTTGGTTTATTAATTGTGATGCCAATCTTTTTAA CTTTCCTTTTATCAGCAGCTGTGACAGCTAAAGTCATATTGTTAACTTCAATCCTATCACCAACTTTTGGCA GCAAACCTAATTTATGAATAAATAATCCACCGACAGTTTCTGCGTCAAGATCATCAAACTTTAAGTCAAA TTTTTTCTCGAATACATTAATATCTAATCTAGCGTCAGCAATATATTCAGTAGGACTAACTTGAATTAATTC ATCAACGTCGCCGGTATCATGTTCATCTTCAATTTCTCCAACTAATTCCTCAAGAACATCCTCGATGGTTAT CAAGCCTGATACTGATCCATACTCATCTATAACCACTGCCATATGAGATCTGTCGTTTTTAAATTCTTCAA GCATAGTGTCGGCTTTCTTATTCTCAGGAACTACTTTTATATTTCTTGTTACTTTTTCTAGAGAAATAGGG GTTTTAGAATGCAAAGCGGGTAATATATCTTTAGCCAAAAGCAGGCCCTTAACCTCATTCTTATTTTCGC CCATAACAGGGTACCTTGAGTGCCCAGATTCGATAATTCTATTTATAAATACATCTTGGCTTTCATTTACG TCAACTGTGACCATTTCAACCTTTGGAATCATTATTTCCTTCAAAGTTGTATCTCCAAGCCGTATAGCCTTC TCAGCTATTAATTGGGCTTCTTTATCAATAATATTTGTATTAAGCGCATGCTGTAAGACCTCTGAGACCTC ATTTAGAGATTTAGGTTTAAAAGATATTAGATTTTTTAGCTTTTTAAATGCTGTCGACGGAGGTTTTTCTT ~4.5 GB Database BLAST t running (1 core opteron 1.8 GHz CPU) = 24 months t running (8 cores opteron 1.8 GHz CPU) = 3 months
Funkcije ovisne o okolišu Proizvodnja i pretvorba energije Transport i metabolizam ugljikohidrata
Grupa za bioinformatiku Voditelj: Kristian Vlahoviček Doktorandi: Rosa Karlić Vedran Lucić Tina Kokan Sofia Pinto Maša Roller Milošević Studenti: Vedran Franke Petar Glažar Saša Popić Jelena Tica Sistem administrator: Petar Jager Financiranje:
Naš moto