S-114.500 Solubiosysteemien perusteet Harjoitustyö RÖNTGENKRISTALLOGRAFIAN KÄYTTÖ PROTEIINIEN KOLMIULOTTEISEN RAKENTEEN SELVITTÄMISESSÄ



Samankaltaiset tiedostot
Laskuharjoitus 9, tehtävä 6

Proteiinin rakenteen selvittämisestä ja visualisoinnista

Veden ja glukoosin mallinnus

Joomla pikaopas. Yksinkertainen opas, jossa neuvotaan esimerkkisivuston teko Joomla julkaisujärjestelmällä vaihe vaiheelta.

Työn tavoitteita. 1 Teoriaa

ISIS Draw (Windows versio 2.5)

Moottorin kierrosnopeus Tämän harjoituksen jälkeen:

ATK tähtitieteessä. Osa 5 - IDL datan sovitusta ja muita ominaisuuksia. 25. syyskuuta 2014

ATK tähtitieteessä. Osa 5 - IDL datan sovitusta ja muita ominaisuuksia. 25. syyskuuta 2014

IDL - datan sovitus. ATK tähtitieteessä. IDL - esimerkiksi linfit. IDL - esimerkiksi linfit

Asiakirjojen vertailu-kurssi

1. Polyakrylaatti koostuu usein akryylihaposta, tai sen johdannaisista. Aluksi voidaan tarkastella akryylihapon rakennetta mallintamalla se.

HSC-ohje laskuharjoituksen 1 tehtävälle 2

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

a. Tavallisesti

KUVANKÄSITTELY THE GIMP FOR WINDOWS OHJELMASSA

Proteiinien kontaktiresidyjen ennustaminen. Tuomo Hartonen Teoreettisen fysiikan syventävien opintojen seminaari

Matterport vai GeoSLAM? Juliane Jokinen ja Sakari Mäenpää

EeNet materiaalit ohje

Kaakkois-Suomen Ammattikorkeakoulu Oy Mikkelin Ammattikorkeakoulu Oy Kymenlaakson Ammattikorkeakoulu Oy

Nspire CAS - koulutus Ohjelmiston käytön alkeet Pekka Vienonen

Uutiskirjesovelluksen käyttöohje

JÄTEHUOLLON ERIKOISTYÖ

AUTOCAD-TULOSTUSOHJE. Tällä ohjeella selitetään Autocadin mittakaavatulostuksen perusasiat (mallin mittayksikkönä millimetrit)

StatCrunch -laskentasovellus

Maastotietokannan torrent-jakelun shapefile-tiedostojen purkaminen zip-arkistoista Windows-komentojonoilla

MixW ja Dx-vihjeet (ohje) oh3htu

FOTONETTI BOOK CREATOR

Luku 3: Virheetön kide

S Laskennallinen Neurotiede

LAS- ja ilmakuva-aineistojen käsittely ArcGIS:ssä

Excel-taulukkoon X- ja Y-sarakkeisiin tallennettujen koordinaattien muuntaminen paikkatietokohteiksi

Tilastolliset ohjelmistot A. Pinja Pikkuhookana

HARJOITUSTYÖ: Mikropunnitus kvartsikideanturilla

Joonas Ruotsalainen GIT PIKAOPAS. Tutkielma 2011

SQLite selvitysraportti. Juha Veijonen, Ari Laukkanen, Matti Eronen. Maaliskuu 2010

Sähköposti ja uutisryhmät

OptimePortal ja OptimeEvent versioiden yhteenveto joulukuu

Ohjelmoinnin perusteet Y Python

MAB3 - Harjoitustehtävien ratkaisut:

ENY-C2001 Termodynamiikka ja lämmönsiirto TERVETULOA!

GeoGebra-harjoituksia malu-opettajille

Muita kuvankäsittelyohjelmia on mm. Paint Shop Pro, Photoshop Elements, Microsoft Office Picture Manager

Oppilaan pikaopas. Project 2013 käyttöliittymä ja näkymät

ASPIRIININ MÄÄRÄN MITTAUS VALOKUVAAMALLA

MAIDON PROTEIININ MÄÄRÄN SELVITTÄMINEN (OSA 1)

Enigmail-opas. Asennus. Avainten hallinta. Avainparin luominen

FYSIIKAN LABORATORIOTYÖT 2 HILA JA PRISMA

Written by Administrator Monday, 05 September :14 - Last Updated Thursday, 23 February :36

LUSAS tiedosto-opas. Matti Lähteenmäki

Action Request System

ENTSYYMIKATA- LYYSIN PERUSTEET (dos. Tuomas Haltia)

monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.

Tämä on PicoLog Windows ohjelman suomenkielinen pikaohje.

LAS-TIEDOSTON SISÄLTÖ LIITE 2/1

KESKUSTANUORTEN NETTISIVUT- OHJEITA PIIRIYLLÄPITÄJÄLLE 1. KIRJAUTUMINEN

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

BlueJ ohjelman pitäisi löytyä Development valikon alta mikroluokkien koneista. Muissa koneissa BlueJ voi löytyä esim. omana ikonina työpöydältä

782630S Pintakemia I, 3 op

Ohjelmoinnin perusteet Y Python

Mitä on konvoluutio? Tutustu kuvankäsittelyyn

CISS Base Excel raporttien määritys Käyttäjän käsikirja. CISS Base Käyttäjän Käsikirja Econocap Engineering Oy 1

Microsoft Security Essentials (MSE) asennuspaketin lataaminen verkosta

KÄYTTÖOHJE. Servia. S solutions

4 / 2013 TI-NSPIRE CAS TEKNOLOGIA LUKIOSSA. T3-kouluttajat: Olli Karkkulainen ja Markku Parkkonen

Sonera Viestintäpalvelu VIP VIP Laajennettu raportointi Ohje

Ohjeita. Datan lukeminen

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

SEM1, työpaja 2 ( )

Käyttöliittymän muokkaus

UpdateIT 2010: Editorin käyttöohje

Miten voin selvittää säästömahdollisuuteni ja pääsen hyötymään niistä?

Harjoituksen aiheena on tietokantapalvelimen asentaminen ja testaaminen. Asennetaan MySQL-tietokanta. Hieman linkkejä:

HP ProBook 430 G5 kannettavien käyttöönotto

Collector for ArcGIS. Ohje /

FYSP101/K1 KINEMATIIKAN KUVAAJAT

Avaa ohjelma ja tarvittaessa Tiedosto -> Uusi kilpailutiedosto

Purot.net Wiki. Tutkielma. Paavo Räisänen. Centria Ammattikorkeakoulu

Luku 7 Uusien Mallien Tiedostot

P6SLite ohjaus- ja zoom komennot

HAKUKONEMARKKINOINTI KOTISIVUJEN PÄIVITYSOHJE

Ajankohtaista peltolohkorekisterissä

Selainsähköposti Zimbran käyttöohje

S09 04 Kohteiden tunnistaminen 3D datasta

Automaattitilausten hallinta. Automaattitilauksien uudistettu käsittely

MAB3 - Harjoitustehtävien ratkaisut:

Maiju Mykkänen Susanna Sällinen

ACD/ChemSketch (Windows versio 8.0)

d sinα Fysiikan laboratoriotyöohje Tietotekniikan koulutusohjelma OAMK Tekniikan yksikkö TYÖ 8: SPEKTROMETRITYÖ I Optinen hila

Integrointialgoritmit molekyylidynamiikassa

Valitse aineisto otsikoineen maalaamalla se hiirella ja kopioimalla (Esim. ctrl-c). Vaihtoehtoisesti, Lataa CSV-tiedosto

Kieliversiointityökalu Java-ohjelmistoon. Ohje

Automaattinen regressiotestaus ilman testitapauksia. Pekka Aho, VTT Matias Suarez, F-Secure

KEMI-TORNIONLAAKSON KOULUTUSKUNTAYHTYMÄ LAPPIA LANGATON VIERAILIJAVERKKO 2(7) VERKKOYHTEYDEN MÄÄRITTELY WINDOWS XP:LLE (WINDOWS XP SP3)

Tärkeitä tasapainopisteitä

PHYS-C0240 Materiaalifysiikka kevät 2017

1/6 TEKNIIKKA JA LIIKENNE FYSIIKAN LABORATORIO V

Jakotaso 1. Teoriatausta. Työvaiheet. CAD työkalut harjoituksessa parting_1_1.catpart. CAE DS Muotinsuunnitteluharjoitukset


Transkriptio:

S-114.500 Solubiosysteemien perusteet Harjoitustyö RÖNTGENKRISTALLOGRAFIAN KÄYTTÖ PROTEIINIEN KOLMIULOTTEISEN RAKENTEEN SELVITTÄMISESSÄ 12.11.2003 Raisa Jokiaho Johanna Karimäki

SISÄLLYSLUETTELO JOHDANTO 1 RÖNTGENKRISTALLOGRAFIA 2 Proteiinien kiteytys 2 Röntgenkristallografialaitteisto 3 Rakennetekijöiden laskenta 4 Electron Density Maps 6 Crystallographic Information File 7 OHJELMAT 8 XtalView 8 Muita ohjelmia 12 ESIMERKKI: Trikliinisen lysotsyymin mallin tarkennus (refinement) 1.1 Å tarkkuudella 16 YHTEENVETO 22 VIITTEET 23

JOHDANTO Proteiinin kolmiulotteisen rakenteen tunteminen on tarpeellista, kun halutaan tutkia tarkemmin esimerkiksi entsyymin toimintaa ja varsinkin toiminnan mekanismeja. Rakenteista tehtyjä molekyylimalleja käytetään hyväksi muun muassa lääkkeiden suunnittelussa, bioteknologiassa, halutunlaisten proteiinien suunnittelussa (protein engineering) ja esimerkiksi tiettyihin tauteihin johtavien (geeni-)virheiden tarkastelussa (Kilpeläinen, 2003) Proteiinit ovat pitkiä, aminohapoista koostuvia peptidiketjuja, joilla on tärkeä tehtävä solun toiminnoissa. Proteiinin foldautumiseen, eli sen kolmiulotteiseen rakenteeseen vaikuttaa proteiinin aminohappojärjestys (vetysillat, rikkisillat) sekä proteiinin kemiallinen ja fysikaalinen ympäristö, esimerkiksi ympäristön ph. Proteiinin kolmiulotteinen rakenne saattaa myös muuttua sen eri tehtävissä, esimerkiksi vapaan entsyymin rakenne on kuin substraattiin sitoutuneen entsyymin konformaatio (Anon, 2003c). Pelkän aminohappojärjestyksen selvittäminen ei yleensä riitä määrittämään ainakaan uuden, tuntemattoman proteiinin kolmiulotteista rakennetta. Ennustusohjelmia esimerkiksi on kyllä käytössä, ja niiden ennustukset perustuvat esimerkiksi vapaan energian minimoimiseen tai vertailuun saman proteiiniperheen proteiineihin, mutta nämä ennustukset eivät ole täysin varmoja (Anon, 2003a). Yleensä proteiinin aminohapposekvenssin tarvitaan joko NMR:llä (nuclear magnetic resonance), kristallografisin menetelmin, molekyylimallinnuksen avulla tai elektronimikroskopialla hankittua dataa, jotta voidaan selvittää proteiinin kolmiulotteinen rakenne (Anon, 2003c, Kilpeläinen, 2003). NMR perustuu radiotaajuisten pulssien aiheuttamiin resonansseihin atomeissa. Vertaamalla annettuja pulsseja eri atomien emittoimiin pulsseihin voidaan päätellä atomien keskinäiset sijainnit. NMR tekniikan haittana on se, ettei sillä voida tutkia kovin suuria molekyylejä. Vastakohtana NMR tekniikalle, röntgenkristallografia ei aseta mitään rajoja tutkittavan molekyylin tai kompleksin koolle. Röntgenkristallografian haittana taas on se, että tutkittava molekyyli on ensin kiteytettävä, mikä ei aina ole kovinkaan helppo homma. Lisäksi kiteisen proteiinin konformaatio saattaa erota liukoisen proteiinin konformaatiosta (Anon, 2003c; Rupp, 2003). Uuden proteiinin rakenteen selvittäminen röntgenkristallografialla käsittää seuraavat vaiheet: i) proteiinin puhdistaminen ja kiteyttäminen ii) alkuperäisen proteiinin diffraktiodatan mittaaminen iii) raskasmetallijohdannaisten muodostaminen iv) raskasmetallijohdannaisten diffraktiodatan mittaaminen v) faasien laskenta vi) elektronitihentymäkartat ja mallin rakentaminen vii) mallin tarkentaminen (Evans, 1994). Proteiini voidaan myös kiteyttää jonkin toisen molekyylin kanssa. Esimerkiksi entsyymin toimintaan vaikuttava inhibiittori, aktivaattori tai entsyymin substraatti voi olla tällainen molekyyli. Kun sitoutumispaikka nähdään 3D-mallista, voidaan kyseisen reaktion mekanismi mahdollisesti selvittää (Kilpeläinen, 2003). 1

RÖNTGENKRISTALLOGRAFIA Proteiinien kiteytys Proteiinien kiteytyksen on sanottu olevan enemmän taidetta kuin tiedettä (Visuri ja Leisola, 1990), sillä useimpien proteiinien kiteyttäminen on hyvin hankalaa, eikä välttämättä onnistu lainkaan. Tämä on ymmärrettävää, kun ajatellaan, että proteiinit saattavat koostua useista sadoista aminohapoista ja että ketju laskostuu hyvin monimutkaiseksi sykkyräksi. Tästä johtuen proteiinit ovat hyvin epäsäännöllisen muotoisia eivätkä siten ole ihanteellisia kappaleita jäykkään kiderakenteeseen. Proteiinikiteet ovat hyvin hauraita ja pehmeitä ja herkkiä kaikenlaisille ympäristömuutoksille. Proteiinikiteet sisältävät suuria kanavia ja reikiä jotka ovat täyttyneet liuotinmolekyyleillä. Tästä johtuen kiteiden tiheys ei ole yhtä suuri kuin pienten tai suolamolekyylien tiheys. Verrattuna mineraalikiteitä koossapitäviin kovalentti- tai ionisidoksiin, proteiinikiteitä koossa pitävät voimat ovat huomattavasti heikompia: suolasillat, vetysidokset ja hydrofobiset sidokset (Johns, 1998; Ladish, 2001; Rupp, 2003). Proteiinien kiteytys aloitetaan konsentroidusta liuoksesta (proteiinikonsentraatio 2-50 mg/ml), johon lisätään reagenttejä, jotta saavutetaan ylikylläinen liuos ja proteiinien liukoisuus laskee saostumista ja lopulta spontaania ytimenmuodostumista varten. Ylikyllästetyssä tilassa kiteiden (crystals or solid phase) kemiallinen potentiaali on pienempi kuin liuoksen, joten aineelle on energeettisesti kannattavampaa olla kiinteänä kuin liuenneena (Ladish, 2001). Tavallisesti joudutaan kokeilemaan monia eri olosuhteita kiteiden saamiseksi. Olosuhteita, joissa kiteitä on mahdollista saada, joudutaan vielä yleensä optimoimaan, jotta saavutetaan diffraktio-kokeisiin soveltuvia kiteitä (halkaisija 0,1 0,3 mm) (Anon, 2003c; Rupp, 2003). Kiteytymisprosessissa tarvitaan sekä spontaania ytimien muodostumista että kiteiden kasvamista. Ylikyllästymisaste määrää mikä prosessi kulloinkin on vallalla (Anon, 2003c, Johns, 1998): Kyllästämätön: Kiteitä ei muodostu eivätkä ne kasva Matala ylikylläisyysaste: Jo muodostuneet kiteet kasvavat, mutta uusia ei muodostu Korkea ylikylläisyysaste: Kiteitä muodostuu ja muodostuneet kiteet kasvavat. Proteiinikiteen perusyksikkö (unit cell) koostuu yhdestä tai useammasta proteiinimolekyylistä. Kuvassa 1 on esitetty proteiinikiteen muodostuminen soluista. Tässä tapauksessa solu koostuu kahdesta motiivista (proteiinimolekyylejä). Kuva 1. Proteiinikiteen muodostuminen yksikkösoluista sekä yksikkösolujen muodostuminen proteiineista (Rupp, 2003). 2

Termistöä Anisotropia Kiteen anisotropialla tarkoitetaan sitä, että kiteytyneellä aineella on erilaiset fysikaaliset ominaisuudet eri suunnissa (x,y,z). Anisotropia kuvaa siis kiteytyksen aikaansaamaa epäjärjestytä. Anisotropiaparametreihin kuuluu lukuisia eri parametreja: termisiä, sidoslujuustekijöitä yms.. Eräs esimerkki anisotropiasta on kvartsin sähkönjohtokyky, joka on kiteen toisessa suunnassa 1000 kertaa parempi kuin toisessa suunnassa (Lind, 2003). B-faktori B-faktori kuvaa sidosten dynamiikkaa (sidosluonne), sidoksen lujuutta, termistä käyttäytymistä (Lind, 2003). Röntgenkristallografialaitteisto Röntgenkristallografiassa kiteytetyn proteiinin läpi johdetaan röntgensädediffraktometrillä voimakas röntgensäde. Koska proteiinimolekyylit ovat järjestäytyneet symmetrisesti kiteessä, heijastuvat kiteen läpi kulkevat röntgensäteet (aallonpituus noin 10 8 cm) kiteen eri osista eri tavalla muodostaen tietynlaisen kuvion (Kilpeläinen, 2003; Rupp, 2003). Kuviosta voidaan poimia diffraktoituneiden säteiden intensiteetit sekä säteiden koordinaatit. Kuvassa 2 on esitetty röntgendiffraktiolaitteisto. Kide diffraktoi röntgensäteitä tietyllä kulmalla (θ). Mitä pidemmälle röntgensäteet siroavat, sitä suurempi on data setin resoluutio. Resoluutiosta taas riippuu miten tarkkoja yksityiskohtia data kertoo kiteestä. Allonpituudesta ja diffraktiokulmasta voidaan suoraan laskea resoluutio (d) Braggin kaavalla (Rupp, 2003). Kuva 2. Röntgendiffraktiolaitteisto (Rupp, 2003) 3

Rakennetekijöiden laskenta Röntgenkristallografiassa funktio F(h,k,l) (kaava 1) eli rakennetekijä on minkä tahansa röntgensäteen heijastuma ja se ilmaisee sekä heijastuksen amplitudin että sen faasin (Rupp, 2003). (Kaava 1) Kaavassa f j on säteen komponentin amplitudi kuvan 3 mukaan (Wallwork, 2003): Kuva 3. Vektoriesitys komponenttiaaltojen (amplitudit f 1 ja f 2 ) yhdistelmästä sekä faaseista Φ 1 ja Φ 2, jolloin saadaan summa-aalto, jonka amplitudi on F ja faasi α. Se miten eri hajaantuneet tai heijastuneet säteet voidaan yhdistää elektronitiheyskartan luomiseksi, riippuu kolmesta tekijästä, jotka kaikki liittyvät jokaiseen säteeseen: suunta, amplitudi ja faasi. Heijastussäteen suunnasta voidaan määrittää heijastuksen indeksit (Miller index triple, hkl) ja mitatusta säteen intensiteetistä voidaan selvittää sen amplitudi. Säteen amplitudi F(h,k,l) on verrannollinen rakennetekijään F(h,k,l). Joten kaksi kolmesta tarvittavasta tekijästä saadaan tietoon mittauksella, mutta kolmas tekijä eli faasi tulee ratkaista matemaattisin menetelmin. Tämä on ns. röntgenkristallografian faasiongelma. Kaavassa 2 on esitetty kaavan 1 Fourier muunnos, jossa faasitermi a(h,k,l) on selvästi näkyvissä (Kilpeläinen, 2003; Rupp, 2003). (Kaava 2) Rakennetekijän kaavasta (kaava 1) voidaan erottaa atomin tyyppi (f(j)) atomin rakennetekijästä, eli se sijainnista (eksponenttitermi). Atomien sijainnit voidaan selvittää erilaisilla faasitekniikoilla. Röntgenkristallografian faasiongelma Evansin (1994) mukaan faasi-informaatio voidaan hankkia muutamalla eri tekniikalla, joista isomorfinen korvaaminen (isomorphous replacement) ja molekyylien korvaaminen (molecular replacement, MR) ovat käytetyimmät. 4

Isomorphous replacement Isomorfisessa korvaamisessa proteiinikiteen sisältämä liuotin korvataan raskasmetalleja sisältävällä liuoksella ja mitataan tämän raskasmetallijohdannaisen diffraktiodata. Kuvassa 4 on esitetty kaaviomainen kuva proteiinikiteestä, johon on lisätty (tässä yksi) raskasmetalliatomi sekä tavallinen proteiinikide. Kuva 4. Kaaviokuvat natiivista proteiinikiteestä (keskellä) sekä raskasmetallijohdannaisesta (vasemmalla) sekä näiden erotuksesta (Rupp, 2003). Vertaamalla näiden kahden kiteen diffraktiodataa, saadaan selville raskasmetallin aiheuttama diffraktio (kuva 5). Kuva 5. Raskasmetallijohdannaisen (vasemmalla) ja natiivin proteiinin diffraktiodatan vertailu (Rupp, 2003). Raskasmetalliatomin sijainti voidaan selvittää Pattersonin karttojen avulla ja kun raskasmetallien sijainnit tiedetään, eri faasien datat voidaan laskea faasiyhtälöillä. Laskentametodeja ovat esimerkiksi Multiple Isomorphous Replacement (MIR) tai Multiple wavelength Anomalous Diffraction (MAD) (Evans, 1994; Rupp, 2003). Pattersonin kartat Pattersonin yhtälö ei tarvitse faasidataa, vaan laskee rakennetekijät suoraan niiden amplitudeista. Kaavassa 3 Pattersonin yhtälö on esitetty 1-dimensionaalisena (vain h- dimensio) (Rupp, 2003): (kaava 3) Ratkaistu Pattersonin kartta antaa tiedot (peaks) atomien keskinäisistä etäisyyksistä rakenteessa (distance vectors). Useilla raskasmetalleilla laskenta tulee hyvin raskaaksi, joten MAD:n lisäksi käytetään Pattersonin korrelaatiometodia. Pattersonin korrelaatiometodi Menetelmässä kahta Pattersonin elektronitiheyskarttaa rotatoidaan toisiinsa nähden ja asetetaan päällekkäin (superimpose). Pattersonin kartta voidaan laskea suoraan mittausdatasta (difraktiointensiteetit) Fourier transformaatiotekniikalla. Pattersonin kartalla havaittavat piikit vastaavat kiderakenteen atomien välisiä vektoreja, jotka voivat olla joko molekyylin sisäisiä tai kahden molekyylin välisiä (Grosse-Kunstleve ja Adams, 2001). 5

Molecular replacement (MR) Käytettäessä MR tekniikkaa täytyy käytettävissä olla saman perheen jo rakenteeltaan selvitetty proteiini. Tunnetun proteiinin diffraktiodataa verrataan tutkittavan proteiinin dataan ja päätellään vertailun perusteella tutkittavan proteiinin rakenne. Tätä menetelmää tultaneen käyttämään yhä enemmän kun yhä useamman proteiinin kolmiulotteinen rakenne on selvitetty (Evans, 1994; Rupp, 2003). Electron Density Maps Yhdistämällä alkuperäinen diffraktiodata ja faasitekniikoilla saatufaasi-informaatio voidaan rakentaa molekyylin elektronitihentymä-malli (kuvat 6 ja 7) Kuva 6. Elektronitihentymäkartta (electron density map) Kuva 7. Oletettu leusiinin elektronitihentymäkartta resoluutiolla 1,8 Å (sinisellä verkolla merkitty) on tarkistettu rakentamalla kuvaan aminohapon atomimalli (keltaiset hiiliatomeja, punaiset happiatomeja ja siniset typpiatomeja) (Kleywegt, 2003). Saatu elektronitihentymäkartta ei aina ole suoraan oikea proteiinimalli, vaan mallia joudutaan yleensä tarkentamaan muilla tekniikoilla. Esimerkiksi real space mallinnus ottaa huomioon yksittäisten aminohappojen todellisuudessa vaatiman tilan ja vertaa tätä saatuun elektronitihentymäkarttaan. Tunnettuja sekundäärirakenteita (tiettyjen aminohappojen muodostamia alfa-heliksiä ja beta-tasoja) käytetään myös hyväksi todellisen kolmiulotteisen mallin rakentamisessa. 6

Uppsalan yliopiston Electron Density Server (Anon, 2003b) tarjoaa mahdollisuuden oletettujen proteiinirakenteiden tarkistamiseen. Palvelin vertailee oletettua rakennetta ja annettuja rakennetekijöitä palvelimelle tallennettuihin, varmistettuihin rakenteisiin. Palvelin tarjoaa myös useita graafisia vertailuja (esimerkiksi Real-space R-value: vertailee mallia molekyylien todellisiin rakenteisiin) useille proteiineille. SIGMA-A Sigma-A:lla kuvataan erilaisista tekijöistä saatua elektronitiheyskarttaa. Sigma on ko. kartan perusyksikkö. Seuraavassa on esitetty neljä erilaista karttaa (Anon, 2003d): 1) 2) 3) muista tekijöistä yhdistetty kartta 4) Crystallographic Information File Kansainvälinen kiteytys yhdistys (The International Union of Crystallography, IUCr) sponsoroi CIF-tiedostojen (Crystallographic Information File) standardisointia. CIF-tiedostoihin tallennetaan proteiinin kristallografiakokeista saatu informaatio sekä ehdotettu kolmiulotteinen rakenne ja aminohapposekvenssi tietyssä määrätyssä muodossa. IUCr tarjoaa erilaisia sanastoja, miten esimerkiksi kiteen symmetria tulee käsitellä tiedostossa. CIF-tiedostojen rakentamiseen, validoimiseen ja graafiseen esittämiseen on jo olemassa useita ohjelmistotyökaluja ja palveluja. Esimerkiksi encifer (CCDC, 2003a) on helppokäyttöinen ja ilmainen graafinen ohjelma CIF-tiedostojen tarkistamiseen ja kirjoittamiseen. 7

OHJELMAT XtalView Ominaispiirteitä osoita ja klikkaa käyttöperiaate FFT elektronitiheyskarttojen laskentaan rakennetekijöiden (Structure factor) laskenta Shake (jiggle) anti-bias valinnat monipuoliset mallin muokkausmahdollisuudet automatisoitu vesimolekyylien lisäys refining mode :ssa voi manuaalisesti sovittaa tähteen 3D näkymät kuvissa Tyypillinen manuaalinen sovitus käyttäen Xfit:iä Käytännössä työ tehdään PDB -tiedostosta, joka on muokattu XtalViewin Xfit:iin yhteensopivaksi. Tämä onnistuu WPDB 2 komennolla SHELXL-ohjelmalla. Xfit laskee nopeasti sigma-a tekijät, skaalaa anisotrooppisesti datan ja siinä on myös bulkkiliuoksen korjausominaisuus (a bulk solvent correction). Kun Xfit aukeaa, siihen on syötettävä kiteen unit cell dimensiot sekä ladattava oikeassa muodossa oleva PDB-tiedosto. Tiedostosta saa nopeasti haluamansa tiheyskartan Load Model toiminnoilla. Kuvassa 8 on esitetty tyypillinen Xfit:n valikkonäkymä. PDB tiedostoista ladattavat kartat ovat fcf-tiedostoja. Kuva 8. Xfit toimintaikkuna Tiheyskartta Kartan luomisessa voi myös hyödyntää Xfitin FFT toimintoja, jolloin karttaa voi helposti muokata seuraavasti: resoluutiota voidaan säätää kartan asetusparametreja (coefficients) voidaan muuttaa 8

voidaan tehdä karttoja, joista osa datasta on poistettu (omit maps) mallin muutoksen jälkeen faasin voi päivittää Kuvassa 9 on esitetty Xfit:llä saatu tiheyskarttamalli. Mallia voi muokata manuaalisesti myös suoraan tiheyskartalta, mikä onnistuu mm. Canvas Menun Toolbar valikkoa hyödyntäen. Kuvassa 10 on esitetty ko. valikko. Xfit voi myös opastaa käyttäjää asettamaan väärässä konformaatiossa olevan tähteen oikeaan konformaatioon fitting mode :ssa (Kuva 11). Tällöin ohjelma osoittaa väärään konformaation punaisella värillä. Väri muuttuu vihreäksi, kun käyttäjä on muuttanut tähteen sijainnin elektronitiheyskarttaan sopivaksi. Kuva 9. Tiheyskartta Kuva 10. Työkaluvalikko 9

Kuva 11. Oikean konformaation löytäminen fitting mode toiminnolla. Xfit ohjelmalla voidaan piirtää myös termisistä parametreista, kuten isotrooppisesta B:stä, todennäköisyyspintoja esittäviä kuvaajia halutuilta alueilta. Mallitusikkunoita Mallitusikkunoissa on useita vaihtoehtoja mallin käsittelyyn. Näitä ovat esimerkiksi Model ikkunassa Split residue eli tähteen jakaminen kahdeksi osaksi, jonkin tähteen poistaminen, jonkin tähteen lisääminen yms SfCalc ikkunassa voidaan laskea mallin rakennetekijöitä, kuten esim. Fc ja phi alle 1,5 resoluutiolla. Myös isotrooppiselle B mallille voidaan laskea rakennetekijöitä SfCalc ikkunassa. Kun mallin rakennetekijät on laskettu, niistä voi ladata FFT laskennalla kartan. Kuvassa 12 on esitetty esimerkkinä näkymä SfCalc ikkunasta. Editing Waters ikkunassa voidaan lisätä/poistaa vesimolekyylejä. Kuva 12. SfCalc ikkuna 10

Edellä esitettyjen manuaalisten toimintojen lisäksi Xfit:ssä toimii myös puoliautomatisoitu mallinnustoiminto (semi-automated fitting) Tällöin mallitus on hyvin nopeaa, mutta tämä toiminto vaatii sen, että käyttäjä on asettanut ns. dictionary tiedoston ohjelmaan. Dictionaryja on saatavilla useilla eri asetuksilla, jotka vaihtelevat mm. vetyatomien käsittelyjen suhteen. MAD faasin mallitus XtalView:lla on mahdollista mallittaa myös MAD mittausdataa. MAD kokeissa kerätään mittausdataa vähintään kolmella eri aaltopituudella ja kokeista saatava data identifioidaan seuraavasti (kuva 13): PI säteen vaihtumispiste reunalla, f':n minimi PK absorptiopiikki energiareunan yläpuolella, f'':n maksimi, intermediaatti f RH kaukainen reuna energiareunan yläpuolella, f':n maksimi RL - kaukainen reuna energiareunan alapuolella, f':n maksimi Neljäs aallonpituus, RL, mitataan toisinaan. Sen osuus faasin mallituksessa (phasing) on kuitenkin minimaalinen. Kuva 13. MAD kokeesta saatava data Mittausdatasta luodaan fin tiedosto XtalView:n xprepfin ikkunassa. Jokaisesta aallonpituudesta tulisi olla oma fin tiedostonsa. Mittausdatasta saadaan laskettua tiheyskartat Pattersonin menetelmällä. Kun Patterson kartat ovat valmiit, faasin mallituksen voi aloittaa xheavy ikkunassa. Valmista mallia voi ohjelmalla muokata ja parannella, mm. liuottimen rakennetta voidaan optimoida. 11

Muita ohjelmia ARP/wARP ARP/wARP on ohjelmistopaketti kristallografisten elektronitiheyskarttojen tulkitsemiseen ja niiden parantamiseen. Sitä voidaan käyttää myös makromolekyylimallien, kuten proteiinimallien tekemiseen sekä rakenteen hienomäärityksiin (refinement). Rakenteiden määritys perustuu mm. hybridimalliin, jossa proteiini ja vapaat atomit esiintyvät yhdessä. Tässä sovelluksessa ohjelma tekee useita syklejä, joissa syntyy aina uusi elektronitiheyskartta, joka on seuraavan syklin pohjana. Lähtöasetelmana olla voi olla eksperimentaaliset mittaustulokset (M(S)AD ja MIR(AS)), osittain rakennettu malli tai vapaaatomimalli. ARP/wARP ohjelmistolla voidaan myös optimoida liuottimen rakenne. Ohjelmisto toimii CCP4 ohjelman yhteydessä ja se on ilmainen akateemisille käyttäjille. CCP4 CCP4 on kokoelma erillisiä ohjelmistoja, jotka kattavat suurimman osan makromolekyylien röntgenkristallografiadatan mallinnuksesta. Ohjelmat jaetaan lähde-muodossa, joten käyttäjät voivat modifioida ja korjata niitä itse. Tähän tarvitaan Fortran ja C käännösohjelmat. Ohjelmistot toimivat sekä VMS-, Linux että Unix-ympäristöissä. Eri ohjelmistot kommunikoivat keskenään standarditiedostojen välityksellä, toisin kuin perinteisissä mallinnusohjelmistoissa, joissa kaikki operaatiot on integroitu yhteen massiiviseen ohjelmaan. Usein toisen ohjelman output-tiedosto toimii toisen ohjelman input-tiedostona. Standarditiedostot määritellään kristallografiasta saatavan perusdatan mukaan, joihin kuuluvat (reflection) heijastusdata, tiheyskartat ja atomi-koordinaatit. CCP4 on akateemisille käyttäjille ilmainen. CCP4 systeemiin kuuluu myös graafisia ohjelmistoja, kuten CCP4i ja kehitteillä oleva molgraphlib. CCP4 ohjelmistopaketin kanssa toimii myös ulkopuolisia ohjelmia, kuten ARP/wARP, CHART ja O. Mercury Mercury on CCDC:n (CCDC, 2003b) kehittämä kiteytystiedostojen (CIF, PDB, etc.) kolmiulotteinen visualisointiohjelma, joka toimii sekä Windows, Linux Intel, Solaris ja SG IRIX alustoilla. Mercury-ohjelmasta on ladattavissa ilmaiseksi 14 päivän demo-versio CCDC:n kotisivuilta (CCDC, 2003b). SHELX SHELX on kokoelma ohjelmistoja, joilla voidaan määrittää kristallirakenteita röntgendifraktiodatasta. Se on saatavilla sekä Unix että Windows 95/98/NT/2000 koneille ja on akateemisille käyttäjille ilmainen. Rakenteiden tarkasteluun sopiva graafinen XtalView toimii SHELX-ohjelmien kanssa. Ohessa on lyhyesti kuvailtuna SHELX-ohjelmistot: SHELXS: rakennemääritysohjelma, joka perustuu Pattersonin menetelmiin. SHELXD: rakennemääritysohjelma hankalien ongelmien ratkaisuun ja raskaiden atomipaikkojen paikallistamiseen (location of heavy atom sites). SHELXE: Faaseja SHELXD:n raskas-atomipaikoista sekä elektronitiheyksien modifikaatio. SHELXL: rakennemäärityksen hienosäätö (refinement), versio SHELXH soveltuu suurille rakenteille. CIFTAB: taulukoiden julkaisuväylä (CIF formaatilla). SHELXA: post-absorptio korjauksia (vain hätätapauksiin). SHELXPRO: proteiineille soveltuva SHELX-versio. Voidaan muuttaa ohjelmia mm. pdb-formaatista SHELX-formaattiin. 12

SHELXWAT: vesiatomien mallittamista makromolekyyleihin. SnB SnB perustuu ns. Shake-and-Bake menetelmään. Ohjelmalla on mahdollista rutiininomaisesti ratkaista monimutkaisia rakenteita, joissa on jopa 1000 yksittäistä ei-vety-atomia. Ohjelmalla voidaan ratkaista myös selenometionyyli-substituoitujen proteiinien rakenteet, jotka sisältävät jopa 160 Se paikkaa. Perinteisesti mallitusohjelmistoihin syötettävän mittausdatan tarkkuuden on täytynyt olla noin 1,1 Å, mutta SnB-ohjelma ratkoo helposti rakenteita, joissa mittaustarkkuus on noin 3 Å. Uusimmassa versiossa, SnB v2.2, on mukana myös graafinen ohjelma, jolla voi laskea rakennetekijöiden magnituudeja ja se sisältää myös Shake-and-Bake algoritmin. Visuaalisessa ohjelmassa voi myös editoida kidemallia. SnBohjelmaa voi ajaa useassa mikroprosessorissa rinnakkain, jolloin saadaan nopeasti tuloksia. Se on saatavilla useille Unix pohjaisille järjestelmille sekä PC.lle, joka toimii Linux - käyttöjärjestelmällä. Akateemiset käyttäjät voivat ladata ohjelman ilmaiseksi internetistä. SOLVE Solve on ohjelma, joka pystyy suorittamaan kaikki makromolekyylien rakenteen selvittämiseen tarvittavat stepit automaattisesti datan skaalauksesta elektronitiheyskartan laskemiseen. SOLVE ratkaisee automaattisesti myös MIR ja MAD rakenteet mittausdatasta. Ohjelma toimii mm. laskemalla Patterson funktioita. Solve antaa nopeasti mallitustuloksen: malli rakentuu nopeudella 1 tähde per 2-3 sekuntia. Pieni proteiini voidaan mallittaa muutamassa tunnissa. Solve on kaupallinen ohjelma, jonka lataaminen maksaa eiamerikkalaisille ja ei-kaupallisille tahoille 600 $. TNT TNT on ohjelmistopaketti, jota käytetään makromolekyylimallien tarkentamiseen (refine). Se on ilmainen ei-kaupallisille tutkimusorganisaatioille. Ohjelmistot toimivat sekä VMS, Unix, SGI, Linux ja Solaris systeemeissä. Yleensä TNT-ohjelmistoja käytetään röntgenkristallografiadifraktiodatan avulla saatavan mallin optimointiin. Ohjelma käyttää pienimmän neliösumman funktion minimointitekniikkaa, jolloin mallissa säilyy oikea stereokemia. TNT-ohjelmiston etuna on sen joustavuus: sen käyttämät metodit soveltuvat miltei minkä tahansa tilanteen ratkaisemiseen. Tämän joustavuuden vuoksi TNT on ideaalinen sellaisten rakenteiden mallittamiseen, jotka sisältävät kofaktoreita tai inhibiittorin. Ohjelmistopaketti koostuu erillisistä ohjelmista, jotka kukin suorittavat jotain tiettyä tehtävää. Ohjelma käyttää mm. Fast Fourier-transformaatioita nopeuttaakseen minimoimiseen kuluvaa laskenta-aikaa. Yleensä TNT toimii noin 20 kertaa nopeammin kuin ohjelmistot, jotka eivät hyödynnä Fourier-muunnostekniikkaa, kuten esimerkiksi SHELX. RAVE Rave on ohjelmistopaketti, joka toimii sekä yksittäisten kiteiden että monista yksiköistä koostuvien alueiden elektronitiheyksien mallittamiseen. Se sisältää myös työkalut sekundäärirakenteen selvittämiseen makromolekyylien elektronitiheyskartoista. RAVE on saatavilla SGI ja DEC ALPHA tietokoneille. Internetistä voi ladata sekä Linux että OSX version. RAVE ei toimi itsekseen, vaan sen lisäksi on oltava useita CCP4 ohjelmia (SFALL, RSTATS, FFT) sekä myös O, jolla voi esittää elektronitiheyskarttoja, kiteen avaruusryhmityksiä ja muita operaattoreita. 13

SHARP SHARP on makromolekyylien kristallografian tulkintaan soveltuva ohjelma. Se toimii mittausdatasta muokatuilla tiedoilla. SIR(AS), MIR(AS) ja SAD, MAD kokeilla saatua mittausdataa täytyy pelkistää, liittää yhteen ja skaalata, ennen kuin data on sopivassa muodossa ohjelmaa varten. SHARP ohjelmalla voidaan tarkentaa (refine) raskasatomimalleja. Sillä voidaan detektoida esim. sekasortoisia alueita (disordered sites), jolloin ohjelma käyttää apunaan samankaltaisuuksiin perustuvia jäännöskarttoja. Ohjelmalla voidaan laskea myös faasien todennäköisyysjakaumia. Ohjelman käyttämät matemaattiset menetelmät perustuvat perinteisiin isomorfisiin faasitekniikoihin sekä Bayesilaiseen statistiikkaan. SHARPIN laskemilla elektronitiheyskartoilla voidaan lisäksi detektoida raskaiden atomien anisotrooppisia lämpötilatekijöitä, detektoida jakautuneita paikkoja (split sites), detektoida koko datan anisotropia. SHARP ohjelman tiheyden modifikaatiotoimintoihin kuuluu mm. optimaalisen liuotinrakenteen selvittäminen ja ei-kristallografisen symmetrian detektointi. SHARP ohjelmat voivat toimia myös suoraan CCP4, ARP/wARP, RAVE, O, XtalView, Moloc ja Quanta -ohjelmien yhteydessä. Ohjelma on vapaasti ladattavana internetissä ja se toimii Unix-pohjaisissa koneissa. CNX CNX on Accelrys firman tuottama, maksullinen ohjelma. Ohjelma integroi röntgenkristallografiamittausdataa ja NMR dataa molekyylidynamiikkaan ja mekaniikkaan, energian minimointiin ja ratkaisee näiden avulla molekyylien kolmiulotteisia rakenteita. Ohjelma perustuu laajasti käytettyihin ohjelmiin X-PLOR ja CNS ja se on saatavilla IBM, SGI ja Linux versioina. CNX:n kapasiteetti ylittää X-PLORin ja CNS:n kapasiteetin ja sillä on näitä huomattavasti suurempi laskunopeus. CNX tukee useiden voimakenttien käyttöä, mm. Engh-Huber ja CHARMm voimakenttiä. CNS CNS (Crystallography & NMR System) on ohjelmistopaketti, jolla voidaan selvittää rakenteita röntgenkristallografia- tai NMR-datasta. Se on ilmainen akateemisille ja ei-kaupallisille käyttäjille ja toimii Unix, Linux sekä Windows NT ympäristöissä. CNS ohjelma on peräisin Yalen yliopistosta ja se on kansainvälisten tutkijaryhmien yhteistyön tulos. Ohjelma sisältää joustavan, monitasoisen ja hierarkisen rakenteen, jossa on suurin osa yleisesti käytetyistä algoritmeista makromolekyylien rakennemäärityksissä. Ohjelmassa on myös HTML-kielellä toimiva liittymä sekä oma erityinen CNS käyttäjäkieli. Noviisi käyttäjä voi käyttää HTMLkielellä toimivaa liittymää, kun taas edistyneempi käyttäjä voi hyödyntää edistyksellisempiä toimintoja CNS kielellä. Käyttäjä voi myös ladata lähdekoodin, joten lähdekoodin modifioiminen on mahdollista. CNS kieli on sekä vahva että fleksiibeli, joten moni uusi algoritmi voidaan helposti sisällyttää CNS kieleen ilman että lähdekoodia tarvitsee muuttaa. HKL HKL on ohjelmistopaketti, joka soveltuu yksittäisistä kiteistä saatavan röntgenkristallografiadifraktiodatan analysointiin. Se muodostuu kolmesta osasta: XdisplayF difraktiokuvion visualisointiin, Denzo datan määrän vähentämiseen ja integrointiin sekä Scalepack Denzolla saatujen intensiteettien yhteenliittämiseen. Ohjelma on maksuton vain Yhdysvaltalaisille tutkijoille vuosittain uudistettavalla lisenssillä. MAIN MAIN on interaktiivisesti toimiva ohjelma, joka käsittelee laskennallisia osuuksia makromolekyylien kristallografiassa. Sen toimintoja ovat mm. molekyylirakenteiden interaktiivinen ja visuaalinen mallitus, tiheyksien modifikaatiot, liuottimen mallittaminen, 14

pintojen (envelope) manipulointi, rakenteen hienosäätö (refinement) ja rakenneanalyysi. Ohjelma on ilmainen akateemisille käyttäjille ja toimii Unix ja Linux ympäristöissä. PROTEIN PROTEIN ohjelma soveltuu difraktiodatan analyysiin, MIR faasin määrittämiseen ja molekyylien korvaus (molecular replacement) laskelmiin ja se toimii Unix-ympäristössä. 15

ESIMERKKI: TRIKLIINISEN LYSOTSYYMIN MALLIN TARKENNUS (REFINEMENT) 1.1 Å TARKKUUDELLA Lyhennelmä menettelystä, tarkat tiedostot sekä komentorivit löytyvät osoitteesta: (http://shelx.uni-ac.gwdg.de/shelx/p1lys/p1lys.html#molrepprep1). Ohjelmat: SHELXPRO, SHELXL, SHELXWAT, EPMR, CCP4, XtalView Tässä demomallituksessa on ollut lähtökohtana kokeellisesti saatua atomiresoluutiodataa lysotsyymin avaruusryhmästä P1 ja lisäksi käytettävissä on ollut 2 Å malli toisesta avaruusryhmästä: PDB-tietopankista saatu 2lym.pdb eli lysotsyymin avaruusryhmän P4 3 2 1 2 PDB malli. Tuloksena tässä esimerkissä haluttiin atomimalli lysotsyymin avaruusryhmälle P1 1.1 Å tarkkuudella, jonka R-faktori olisi alle 10% ja vapaa R alle 13%. Mittausdata oli saatu 120 K lämpötilassa säteellä X11 EMBL c/o DESY systeemillä 0.92 Å resoluutiolla. 2LYM PDB mallia käytettiin molekyylin korvauksessa (molecular replacement). Molecular Replacement Model mallin valmistaminen Alkuperäinen PDB-tiedosto täytyi ensin muuttaa mallitusohjelmien kanssa yhteensopivaksi: esimerkiksi vedet, vetyatomit, ja heteroyhdisteet täytyi poistaa ja B-faktorit asettaa uudelleen. Tämän kaiken voi tehdä ohjelmalla SHELXPRO, joka käynnistetään SHELXissä kirjoittamalla komento shelxpro. Ohjelma tarjoaa käyttäjälle listan vaihtoehtoja, jotka on esitetty taulukossa 1: Taulukko 1. SHELXPRO komentokäskyt [F] New output filename [A] Anisotropic scaling (Hope & Parkin) [P] Progress of LS refinement diagram [T] Thermal displacement analysis [U] Update.res (and.pdb) to.ins file [R] Ramachandran Phi-Psi plot [M] Map file for O from.fcf [H].hkl file from other data formats [D] Convert DENZO/SCALEPACK.sca to.hkl [X] Write XtalView map coefficients [S] Reflection statistics from.fcf [J] Generate restraints from model [G] Generate PDB file from.res or.pdb [V] R(free) files [I].ins from PDB file [L] Luzzati plot [E] Esd analysis [N] NCS analysis [K] Kleywegt NCS plot [O] PDB file for O [Y] X-PLOR/CNS.fob to.hkl [C] Color plots (now on) [W] Write Turbo-Frodo map [Z] Least-squares fit [B] PDB deposition [Q] Quit Esimerkissä valittiin vaihtoehto G. Saatua tiedostoa voidaan käyttää monessa röntgenkristallografia-mallitusohjelmassa input-tiedostona. SHELXPRO esittää käyttäjälle listan kysymyksiä, joiden perusteella käyttäjä määrittää haluamansa PDB-tiedoston: Read PDB (P) or SHELX.ins or.res (S) file [S]: P Name of file to read [shelxpro.pdb]: 2lym.pdb Replace B-values with standard values (Y or N)? [N]: y Remove hydrogen atoms (Y or N)? [Y]: y Reset PART 1 occ. to 1, delete other disorder components (Y or N)? [Y]: y Remove all residues except standard amino-acids (Y or N)? [N]: y Uusi tiedosto nimettiin lopuksi 2lym_mod.pdb. 16

Heijastustiedoston (reflection file) valmistelu ja rakenteen selvittäminen EPMR ohjelmalla Molecular replacement ohjelma EPMR tarvitsee input-tiedostona rakennetekijöitä, ei intensiteettejä (eli mittauksilla saatua dataa). Tämä onnistuu ohjelmalla CCP4, jolloin saadaan hkl-tiedosto, tässä tapaksessa p1lys.hkl3. Tässä tiedostossa on muuttujina h, k, l, F ja sig(f). Ohjelmalla saadaan selville myös Wilson B factor, joka esimerkin datalle oli 5,3 A2. EPMR on hyvin helppokäyttöinen molecular replacement -ohjelma. Rakenteen selvittämiseksi täytyy syöttää unit cell tiedot sekä avaruusryhmän numero tiedostoon p1lys.cell. Kun ohjelma käynnistetään, se antaa noin minuutin kuluttua tuloksena PDB tiedoston epmr.1.best.pdb. Tässä ratkaisussa on korrelaatiokertoimena (correlation coefficient) ja datan R-arvona lukema väliltä 4,0 ja 15,0 Å sekä 45,6% ja 44,5%. EPMR ohjelmalla saatu malli on lähtömalli mallitukselle. Seuraavaksi saatu PDB tiedosto oli muutettava käyttökelpoiseksi SHELXL ohjelmalle. Myös heijastukset (reflections) täytyi muuttaa SCALEPACK formaatista SHELX formaattiin Ensimmäisen SHELXL ins tiedoston luominen EMPR-ohjelman epmr.1.best.pdb tiedosto on normaali PDB tiedosto. Se muutetaan SHELXPRO ohjelmalla SHELXL ins tiedostoksi, joka sisältää sekä ohjeet että koordinaatit mallin tarkennukseen. Tällä kertaa SHELXPRO-valikosta (Taulukko 1) valittiin vaihtoehto I. Ohjelma esitti kysymyksiä puuttuvista solu- (cell) ja symmetriatiedoista. Ins tiedostoon sisältyvät mm. Engh ja Huber jännitteet (restraints) standarditähteille. Rikkisilloille sekä C- terminaalisille karboksyyliryhmille oli lisätty ylimääräistä jännitettä. Tällä tavoin luotu tiedosto p1lys_mr.ins toimii input-rakenteena SHELXL-ohjelmassa. Heijastus (reflection) tiedoston valmistus mallin tarkentamiseen Jälleen käytettiin ohjelmaa SHELXPRO ja valikosta (Taulukko 1) valittiin vaihtoehto D: Convert DENZO/SCALEPACK.sca to.hkl. Tällöin luotiin hkl input-tiedosto SHELXL ja SHELXS ohjelmille. Tiedosto ei kuitenkaan ollut vielä valmis, vaan saatu p1lys.hkl tiedoston täytyi vielä muuttaa ns. R-vapaaksi tiedostoksi V (Taulukko 1) komennolla. Lopulta saatiin haluttu tiedosto p1lys_rf.hkl SHELXL formaatissa. Tästä tiedostosta tehtiin backup-tiedosto ja lisäksi tiedosto muutettiin sellaiseksi, että siihen ei voinut kirjoittaa muutoksia. Ensimmäinen mallin tarkennuskierros: rigid body Kun datan tarkkuus on yli 4 Å, rigid body refinement on hyvä mallituskeino. Ensimmäiseen SHELXL ins tiedostoon täytyi tehdä joitakin rakenteen jäykistäviä muutoksia. Tällöin SHELXL myös varoitti käyttäjää siitä, että jotakin on mahdollisesti vialla. Tämä johtui siitä, että rakenteen jäykistyessä sellaiset tähteet, jotka eivät ole keskenään vuorovaikutuksessa, ovatkin nyt lähellä toisiaan. SHELXL-ohjelma tällöin kuvittelee, että näiden atomien välillä tulisi olla sidos ja antaa käyttäjälle varoituksen. Myös symmetrian häviäminen saattaa häiritä minimointia, joten jäykistymisen kautta syntyneet symmetriavirheet täytyi korjata. Suurin osa ongelmia aiheuttavista tähteistä tässä lysotsyymiesimerkissä olivat Arg sivuketjuja, joita modifioitiin. Ohjelman lopetettua mallinnuksen saatiin Rwork-arvoksi 46,4% ja Rfree-arvoksi of 47,4%. Tulostiedosto oli muotoa p1lys_0a.res. 17

Toinen mallin tarkennuskierros: koordinaatit ja isotrooppiset B-faktorit Edellä saatu res tiedosto kopioitiin uudeksi ins tiedostoksi ja tiedostoon tehtiin jälleen joitakin muutoksia: mm, jäykkyystekijät poistettiin ja resoluutiota nostettiin. Tällä kierroksella saatavan mallin tarkkuus oli jo 1,5 Å. Ensimmäinen rakennemalli ja sitä seuraava mallin tarkennus Tässä vaiheessa vasta korjattiin suurimpia ongelman lähteitä ja mallin tekemisessä käytettiin edelleen koko dataa. Vielä tässä vaiheessa ei kannattanut tuhlata aikaa epäjärjestyksessä oleviin sivuketjuihin. Ongelmakohdissa esimerkiksi B-arvot ylittävät lukeman 0,15. Tällaiset paikat tulee rakentaa uudelleen. Lysotsyymiesimerkissä löytyi ohjelman SIMU-toiminnon avulla seuraavat paikat, jotka täyttivät ko. ongelmakriteerin: Lys1, Lys13, Arg14, Arg21, Asn44, Arg45, Asn46, Thr47, Arg61, Thr62, Thr69, Pro70, Leu75, Ser85, Lys97, Lys116. Muutosten ja modifikaatioiden jälkeen (osa tähteistä jopa poistettiin kokonaan) käytettiin SHELXPRO:n komentoa I (Taulukko 1), jolla luotiin uusi ins tiedosto. Tähän tiedostoon tehtiin lisäksi kaksi muutosta: tiedostoon lisättiin Rfree activation flag ja resoluutiolle asetettiin tietyt rajat. Tämän vaiheen ja kymmenen minimointikierroksen jälkeen mallin tarkennustulos oli: (Rwork, Rfree) = (26,2; 31,4)%. Automaattinen vesirakenteen ensimallitus Nyt oli aika rakentaa ensimmäinen faasia parantava vesirakennemalli. Jotkut vesimolekyylit todennäköisesti asettuivat niille alueille, joista edellisessä vaiheessa poistettiin tähteitä. Mutta faasin parantamisen kannalta on parempi laittaa molekyyli tyhjään paikkaan. Silloin on helpompi tulkita elektronitiheyskarttoja. Liuottimen jakautuminen määritetään ohjelmassa SHELXWAT, jota varten edellä saatua res tiedostoa muutettiin hieman. Siihen täytyi lisätä yksi vesimolekyyli, jotta SHELXWATohjelmalla olisi lähtöpiste laskennalle. Laskusyklien määrä vähennettiin 5:teen, koska vesimolekyylien tullessa mukaan laskenta-aika pitenee huomattavasti. Käyttäen komentoa P SHELXPRO:ssa, voi mallituksen etenemisestä piirtää kuvan (kuva 14). Kaiken kaikkiaan malliin lisättiin 90 vesimolekyyliä, jotka alensivat Rwork ja Rfree arvot 20,2 ja 24,6%:iin. Tämän jälkeen mallin luomista jatkettiin vesimolekyylien kanssa. Kuva 14. Vesirakenteen mallitus 18

Mallin parannus 1.5 Å:iin Jälleen katsottiin SIMU toiminnolla ongelmakohtia, jonka jälkeen rakennettiin uudelleen seuraavat tähteet: Glu7, Asn19, Thr47, Ile78, Ser86 ja Lys116. Seuraavat tähteet olivat todennäköisesti epäjärjestyksessä: Lys13, Arg21, Leu25, Arg112 ja Ile124. Koska tässä vaiheessa aivan kaikki data ei ollut käytössä, nämä kyseiset tähteet saatettiin vain jättää huomioimatta. Seuraavat tähteet puuttuivat ja ne piti siten rakentaa malliin: Asp48, Val99, Asn103, Gly102. Näin saatu malli tallennettiin XtalView-ohjelmaan tiedostona p1lys_3_mod.pdb ja tämän jälkeen käytettiin SHELXPRO:n U komentoa seuraavan ins tiedoston luomiseen. Tähän tiedostoon modifioitiin vesiatomien sijaintia jälleen SHELXWATohjelmalla. Tässä vaiheessa oli hyvä vilkaista mallia p1lys_4a.pdb sekä siitä saatuja elektronitiheyskarttoja XtalView:lla. Kartoista huomattiin, että Arg21 oli väärässä rotameerissa, Ser100 ja Asp101 puuttuivat. Thr43 oli epäjärjestyksessä. Näistä puutteista ei nyt kuitenkaan tarvinnut välittää, vaan kaiken datan saattoi huoletta ottaa mukaan mallin tarkentamiseen. Muutettiin p1lys_4a.res tiedosto p1lys_5.ins tiedostoksi. Tämän jälkeen käytettiin 20 perättäistä sykliä gradientin minimointiin lähtien resoluutiosta 1,5 Å ja päätyen lopulta lähelle resoluution alarajaa. Anisotropia Tähän mennessä malli oli mukautettu kaikkeen mittausdataan. Seuraavaksi otettiin käyttöön anisotrooppiset B-faktorit, jotta faaseja voitaisiin parantaa. Tällöin pitäisi saada parhaat mahdolliset tiheyskartat, minkä jälkeen olisi helpompi alkaa miettiä monimutkaista epäjärjestystä. Jotta anisotropiaparametrit (anisotropic displacement parameters) voisi sisällyttää malliin, oli edelleen tehtävä joitakin muutoksia tiedostoon p1lys_6.ins, joka oli kopio p1lys_5.res tiedostosta. Saatavaan PDB tiedostoon otettiin mm. suurin osa Fo-Fc tiheyspiikeistä pseudoatomeina mukaan (ne ovat hyödyllisiä opastimia paikallistamaan mielenkiintoisia alueita seuraavassa graafisessa katsannossa). Anisotropiaparametrien sisällyttäminen mallin tarkennukseen yli kaksinkertaisti mallin parametrien lukumäärän (4204:stä 9453:een). Ensimmäinen rakennemalli ja sen tarkennus (refinement) 1.1 Å resoluutiolla Mallin tarkennus hyvällä resoluutiolla poikkeaa selvästi alhaisen resoluution mallin luomisesta: siihen yleensä kuuluu lähinnä epäjärjestyksessä olevien alueiden identifiointia ja mallitusta. Jotta saadaan selville, mistä mallia täytyy parantaa, täytyy (1) listata epämiellyttävät jännitteet (disagreeable restraints), (2) etsiä korkeimmat piikit 1Fo-1Fc tiheyseroissa, (3) etsiä tähteet, joista puuttuu atomeja. 1. Epämiellyttävät jännitteet (disagreeable restraints) Epämiellyttävien jännitteiden listaan kuuluvat jännitteet, joissa malli poikkeaa yli 3 sigmayksikköä ko. tähteiden aiheuttamasta todellisesta jännitteestä. Tämä lista printtautuu jokaisen mallin tarkennussyklin jälkeen ja se on erittäin hyvä keino monitoroida mallitusprosessia ja siten havaita rakenteen ongelmakohdat. Ongelmakohtia on hyvä tarkastella myös visuaalisesti XtalView:in elektronitiheyskartasta. Kuvassa 15 on esitetty tällainen eräs ko. esimerkin ongelmakohdista. Ongelmakohtien rakenteita voidaan korjata esim. suoraan XtalView:llä poistamalla tiheyspiikkejä tai vesimolekyylejä, rotatoimalla tähteitä yms.. Hankalissa tapauksissa ongelmat voidaan korjata SHELXL-ohjelmalla. 19

Kuva 15. Esimerkki ongelmatapauksesta: Arg21-tähde. Kuvassa on SIGMA-A-painoitettu 2mFo-DFc tiheyskartta 1,0sigma:lla (sinisellä) yhdessä 1Fo-1Fc tiheyserokartta +/- 2.5 sigma:lla (vihreällä ja punaisella). Tässä tapauksessa ongelma korjattiin poistamalla tiheyspiikit ja vedet sekä pyörittämällä (rotate) sivuketju vihreään tiheysalueeseen. 2. Piikkejä Fo-Fc tiheyserokartalla On olemassa lukuisia keinoja käydä läpi tiheyseropiikkien listaa. Yksi näistä on käydä läpi osa lst-tiedostosta, jossa on täydellinen lista positiivisista piikeistä sekä piikkiä lähinnä olevasta atomista. Lysotsyymiesimerkissä löytyi mm. kohta, jossa todennäköisesti piikkien perusteella oli asetaatti- tai nitraatti-ioni kiteytysliuottimesta, mutta joka oli mallitettu vesimolekyyliksi. Tässä vaiheessa oli vaikea päättää oliko kyseessä nitraatti vai asetoni, joten kohtaan sovitettiin ensin nitraatti. Tarkoitus oli myöhemmin päättää sidospituuksien ja atomien suhteellisten B- arvojen perusteella, mikä atomi oli kyseessä. Nitraatti napattiin jostakin pdb tiedostosta ja ladattiin XtalView:in dictionaryyn. Sitten kyseinen vesiatomi muutettiin mutaatiokomennolla nitraatiksi ja rotatoitiin oikeaan tiheyteen. 3. Puuttuvia tähteitä Kun mallia oli jo jonkin verran korjailtu, osan edellä poistetuista tähteistä (lähinnä Argtähteita) sai istutettua takaisin: niille oli syntynyt paikka, jonne puuttuvat tähteet sopivat kokonsa ja elektronitiheyksien puolesta. Seuraavaksi oli käsiteltävä edelleen epäjärjestyksessä olevat alueet, joissa kuuluisi olla jokin edellä poistetuista tähteistä. XtalView:lla saadusta mallista tehtiin pdb tiedosto p1lys_6_mod.pdb. Komennolla U SHELXPRO:ssa päivitettiin p1lys_6.res-tiedosto käyttäen apuna p1lys_6_mod.pdb-tiedostoa, jolloin saatiin p1lys_7.ins-tiedosto. Joitakin muutoksia täytyi jälleen tehdä tiedostoon. Uudet atomit määritettiin anisotrooppisiksi, nitraattimolekyyliin lisättiin jännitystä yms Vesimolekyylit mallitettiin uudelleen SHELXWAT-ohjelmalla. Tämän kierroksen jälkeen R-arvoiksi saatiin of 15,8% (free) and 13,5%(work). 20

Toinen rakennemalli ja sen tarkennus (refinement) täydellä resoluutiolla Jälleen katsottiin epämiellyttävien jännitteiden listaa ja tarkasteltiin siinä olevia tähteitä XtalView:lla sekä muokattiin havaittavia puutteita. Myös tiheyseropiikit tarkastettiin uudelleen, jolloin löytyi uusia nitraattimolekyylejä ja puuttuvien tähteiden paikat tarkastettiin. Mallin tarkennusta jatkettiin kierros kierrokselta, kunnes päädyttiin tiedostoon p1lys_13. Tämä osuus mallin rakentamisesta sisälsi paljon pientä näperrystä. Perusstrategia oli kuitenkin aivan sama kuin edellä. Vetyatomien lisääminen Kun mallin tarkennus oli saatu valmiiksi, siihen lisättiin vetyatomit. SHELXL-ohjelmalla tämä kävi helposti: REM väittämät poistettiin HFIX väittämien edeltä. Kuitenkaan kaikille tähteille ei aktivoitu automaattista vetyjen lisäystä. Histidiinit täytyi tapauskohtaisesti katsastaa: elektronitiheyksien perusteella täytyi varmistaa oliko histidiini protonoitunut vai ei. Myöskään hydroksyyliryhmien vetyjen (Thr, Ser ja Tyr -tähteissä) automaattista vetyjen sijoittamista ei kytketty päälle. Lopullinen mallitustulostiedosto oli p1lys_14.ins, jolle saatiin R-arvoiksi R(work,free) = (9,74; 12,81). Vetyatomien lisääminen muutti mallia, jolloin saatiin taas pitkä lista epämiellyttävistä jännitteistä. Mallitustarkennusta tulisi vielä jatkaa kuten edellä, mutta malliesimerkki loppui tähän. 21

YHTEENVETO Röntgenkristallografia on proteiinien kolmiulotteisen rakenteen tutkimusmenetelmä. Menetelmällä on selvitetty yli 20 000 proteiinin rakenne. Menetelmän haittana on se, että proteiinit tulee ensin saada kiteiseen muotoon ja esimerkiksi glykolysoitujen proteiinien ja kalvoproteiinien kiteyttäminen on hyvin hankalaa. Proteiinien rakenteiden vertailu ja sitä kautta elektronitihentymämallin ehdottaman rakenteen tarkentaminen on tulossa yhä tärkeämmäksi työkaluksi kun proteiinien rakenteita tiedetään yhä enemmän. Proteiinien kristallografiadata pyritään muokkaamaan standardisoituun muotoon, ja jakaa tässä CIF-tiedostomuodossa, jotta kaikki tutkijat pystyisivät käyttämään jo tutkittua dataa hyväkseen. Proteiinien kristallografiadatan käsittelyyn on kehitetty useita ohjelmia, joista useimmat akateemiset ilmaisohjelmat toimivat vain Linux tai Unix alustalla. Kaupallisia ohjelmia löytyy myös Windows-alustalle. 22

VIITTEET Anonymous, The PSA Protein Structure Prediction Server, http://bmerc-www.bu.edu/psa/, 6.11.2003a. Anonymous, Electron Density Server at Uppsala University, http://fsrv1.bmc.uu.se/eds/, 10.11.2003b. Anonymous, X-Ray Crystallography, http://www.stolaf.edu/people/hansonr/mo/x-ray.html, 30.10.2003c. Anonymous, Model-phased maps, bias and likelihood, http://speedy.st-and.ac.uk/~naismith/workshop/html3/rjr3.html, 24.11.2003d. CCDC (The Cambridge Crystallographic Data Centre ), encifer, http://www.ccdc.cam.ac.uk/prods/encifer/, 10.11.2003a. CCDC (The Cambridge Crystallographic Data Centre ), Mercury, http://www.ccdc.cam.ac.uk/prods/mercury/index.html, 10.11.2003b. Evans, G., The method of Multiple wavelength Anomalous Diffraction using Synchrotron Radiation at optimal X-ray energies: Application to Protein Crystallography, Ph. D Thesis, University of Warwick, Department of Physics, Hamburg 1994. Grosse-Kunstleve, R., W., ja Adams, P., D., Patterson correlation methods, Acta Cryst. (2001). D57, 1390-1396. Johns, M. R., Crystallization, Proteins, Kinetics, in The Encyclopedia of Bioprocess Technology: Fermentation, Biocatalysis & Bioseparation (M. Flickinger and S. Drews, eds) John Wiley & Sons, New York 1998, 755 765. Kilpeläinen, S., Lyhyt johdatus molekyylimalleihin, http://www.biochem.oulu.fi/~skilpela/kurssi/kurssi.html, 30.10.2003. Kleywegt, G., Practical Model Validation, http://xray.bmc.uu.se/embo2001/modval/, 10.11.2003. Ladish, M. R., Bioseparations Engineering, 1 st edition, John Wiley & Sons, New York 2001, 735s. Lind, T., Crystals, http://www.tedlind.net/crystals.htm, 24.11.2003. Rupp, B., Crystallography 101, http://www-structure.llnl.gov/xray/101index.html, 30.10.2003. Visuri, K. and Leisola, M., Proteiinien kiteyttäminen, Kemia-Kemi 3 (1990), 208-212. Wallwork, S. C., Introduction to the Calculation of Structure Factors, http://journals.iucr.org/iucr-top/comm/cteach/pamphlets/3/3.html, 24.11.2003. 23