STOKASTISISTA PROSESSEISTA JA SIMULAATIOMENETELMISTÄ

Samankaltaiset tiedostot
3. Simulaatioiden statistiikka ja data-analyysi

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

6. Yhteenvetoa kurssista

FYSA241/K1. Juha Merikoski ja Sami Kähkönen (1999,2005) Janne Juntunen (2006) ja Vesa Apaja (2006-)

LASKENNALLISEN TIETEEN OHJELMATYÖ: Diffuusion Monte Carlo -simulointi yksiulotteisessa systeemissä

Esimerkki: Tietoliikennekytkin

Suurkanoninen joukko

Mikrotila Makrotila Statistinen paino Ω(n) 3 Ω(3) = 4 2 Ω(2) = 6 4 Ω(4) = 1

The Metropolis-Hastings Algorithm

Markov-ketjut pitkällä aikavälillä

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Markov-kustannusmallit ja kulkuajat

FYSA242 Statistinen fysiikka, Harjoitustentti

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

STOKASTISET PROSESSIT Peruskäsitteitä

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Satunnaislukujen generointi

8. Klassinen ideaalikaasu

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Laboratoriotyö 1 FYSA240 (FYS242) Juha Merikoski (työohjeet) ja Sami Kähkönen (tietokoneohjelma) 1999,2005

Erilaisia Markov-ketjuja

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Oletetaan ensin, että tangenttitaso on olemassa. Nyt pinnalla S on koordinaattiesitys ψ, jolle pätee että kaikilla x V U

MS-A0004/A0006 Matriisilaskenta

Numeeriset menetelmät TIEA381. Luento 6. Kirsi Valjus. Jyväskylän yliopisto. Luento 6 () Numeeriset menetelmät / 33

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2017 Harjoitus 1 Ratkaisuehdotuksia

TILASTOLLISEN KVANTTIMEKANIIKAN PERUSTEITA (AH ) Mikrotilat (kertausta Kvanttimekaniikan kurssilta)

Aikariippuva Schrödingerin yhtälö

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Martingaalit ja informaatioprosessit

VEKTORIANALYYSIN HARJOITUKSET: VIIKKO 4

PHYS-C0220 Termodynamiikka ja statistinen fysiikka Kevät 2016

S Fysiikka III (EST) Tentti ja välikoeuusinta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Suurkanoninen joukko

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Statistinen fysiikka, osa A (FYSA241)

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Inversio-ongelmien laskennallinen peruskurssi Luento 7

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

1 Lineaariavaruus eli Vektoriavaruus

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

3. Statistista mekaniikkaa

802320A LINEAARIALGEBRA OSA I

S Laskennallisen tieteen erikoiskurssi. Antti Kuronen Teknillinen korkeakoulu Laskennallisen tekniikan laboratorio PL TKK

9. Tila-avaruusmallit

PHYS-C0220 TERMODYNAMIIKKA JA STATISTINEN FYSIIKKA

Ch7 Kvanttimekaniikan alkeita. Tässä luvussa esitellään NMR:n kannalta keskeiset kvanttimekaniikan tulokset.

Moniulotteisia todennäköisyysjakaumia

Markov-ketjut pitkällä aikavälillä

Kanta ja Kannan-vaihto

Viikon aiheet. Funktion lineaarinen approksimointi

(1.1) Ae j = a k,j e k.

3. Statistista mekaniikkaa

2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio

Statistinen fysiikka, osa A (FYSA241)

Luento 9: Yhtälörajoitukset optimoinnissa

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Osittaisdifferentiaaliyhtälöt

T Rinnakkaiset ja hajautetut digitaaliset järjestelmät Stokastinen analyysi

Avaruuden R n aliavaruus

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Kuva 3.1: Näyte Gaussisesta valkoisest kohinasta ε t N(0, 1) Aika t

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

1. Johdanto. FYSA241, kevät Tuomas Lappi kl Huone: FL249. Ei kiinteitä vastaanottoaikoja.

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

PHYS-C0220 TERMODYNAMIIKKA JA STATISTINEN FYSIIKKA

KLASSISET TASAPAINOJOUKOT (AH 4.3, , 7.2) Yleisesti joukoista

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Kvanttimekaniikan tulkinta

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Insinöörimatematiikka D

T Rinnakkaiset ja hajautetut digitaaliset järjestelmät Stokastinen analyysi

Matematiikan tukikurssi

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

TASAPAINOJAKAUMAT KVANTTIMEKAANISISSA SYSTEEMEISSÄ (AH 5.4, 6.1, 6.4, 6.5) Mikrokanoninen joukko

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

Valintahetket ja pysäytetyt martingaalit

6. Differentiaaliyhtälösysteemien laadullista teoriaa.

3.6 Su-estimaattorien asymptotiikka

6 Vektoriavaruus R n. 6.1 Lineaarikombinaatio

min x x2 2 x 1 + x 2 1 = 0 (1) 2x1 1, h = f = 4x 2 2x1 + v = 0 4x 2 + v = 0 min x x3 2 x1 = ± v/3 = ±a x 2 = ± v/3 = ±a, a > 0 0 6x 2

Sovellettu todennäköisyyslaskenta B

k S P[ X µ kσ] 1 k 2.

Harjoitus Tarkastellaan luentojen Esimerkin mukaista työttömyysmallinnusta. Merkitään. p(t) = hintaindeksi, π(t) = odotettu inflaatio,

TASAPAINOJAKAUMAT KVANTTIMEKAANISISSA SYSTEEMEISSÄ (AH 5.4, 6.1, 6.4, 6.5) Mikrokanoninen joukko

PHYS-C0220 TERMODYNAMIIKKA JA STATISTINEN FYSIIKKA

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

w + x + y + z =4, wx + wy + wz + xy + xz + yz =2, wxy + wxz + wyz + xyz = 4, wxyz = 1.

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Luku 4. Derivoituvien funktioiden ominaisuuksia.

infoa tavoitteet E = p2 2m kr2 Klassisesti värähtelyn amplitudi määrää kokonaisenergian Klassisesti E = 1 2 mω2 A 2 E = 1 2 ka2 = 1 2 mω2 A 2

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

KKT: log p i v 1 + v 2 x i = 0, i = 1,...,n.

Transkriptio:

STOKASTISISTA PROSESSEISTA JA SIMULAATIOMENETELMISTÄ Simulaatiokurssi 2004 muokattu 25.5.2006 (J.Merikoski) Stokastisten simulaatiomenetelmien yleisiä lähtökohtia. Satunnaismuuttujat, stokastiset prosessit ja Markovin ketjut. Statistista fysiikkaa. Otanta. 1. Stokastisista prosesseista Olkoon x(t) ajasta t jollain tavalla riippuva satunnaismuuttuja (ei yleensä skalaari). Stokastiseksi prosessiksi (SP) sanomme funktiota f = f(x, t), merkitään usein Esim. Y X (t) = f(x, t). x(t) itse on SP. Satunnaiskävely x(t) on SP. Sen neliöpoikkeama [ x(t) x(0)] 2 on SP. Aluksi keskitymme satunnaismuuttujiin, joille x(t) on diskreetti ja ajan fuktiona paloittain vakio siten, että jotakin tapahtuu (tai joskus on tapahtumatta) tasavälein eli ajan hetkillä t = t 1, t 2,..., t M ja x k = x(t k t < t k+1 ), missä t k = kδt. Ellei toisin sanota, olkoon t 0 = 0. Kurssikirja Binder&Heermannissa (BH) merkitään τ s = N t samaistaen δt = τ s. Kyseisissä malleissa yksi atomi/spin liikahtaa/flippaa (keskimäärin) kerran t:ssa. 1

2 Tältä pohjalta: Markovin ketju (MC) = jono yrityksiä, joissa yrityksen tulos riippuu vain välittömästi edellisen (ei sitä edeltävien) yrityksen tuloksesta. Määritellään siirtymämatriisi w = (w ij ) seuraavasti: w ij (k) = P(x(k) = j x(k 1) = i). Jatkossa on (ellei toisin mainita) x ij (k) = w ij eli w ij :t eivät riipu ajasta, jolloin sanomme, ett MC on homogeeninen. Edelleen, simuloidut MC:t ovat äärellisiä eli yritysten mahdollisten tulosten joukko on äärellinen (jos ei muuta niin äärellisen laskentatarkkuuden vuoksi). Näitä mahdollisia tuloksia kutsumme jatkossa usein järjestelmän mahdollisiksi (mikro)tiloiksi. Kirjavien merkintöjen (tämä ja muut luentomateriaalit ja kirjat) ei pidä antaa hämätä: monesti e.g. w ij w i j W(i j) q ij jne. Todennäköisyysjakaumille ja etenkin siirtymätodennäköisyyksille käytetyt merkinnät eivät ole vakiintuneet, etenkään sovellusaloilla.

3 Vektori b on stokastinen, jos sen komponenteille on b i 0 i Matriisi w taas on stokastinen, jos ja b i = 1. i w ij 0 i, j ja rivisummat w ij = 1 i. j Siirrymme algoritmitasoa kohti: Olkoon g ij generointitodennäköisyys eli todennäköisyys, jolla generoimme tilasta i tilan j ja olkoon a ij sen hyväksymistodennäköisyys. Tällöin w ij = g ij a ij, kun i j j i w ij = 1 w ij, kun i = j j Jatkossa g ij = χ Si (j)/ S i, missä S i on niiden tilojen joukko, johon tilasta i voidaan siirtyä. Selvästi (w ij ) ja (g ij ) ovat stokastisia matriiseja (a ij ) ei ole stokastinen matriisi Huomaa, että puhuttaessa (diskreetin ajan) algoritmeista on tavallista puhua siirtymätodennäköisyyksistä (aika-askelta kohti) sen sijaan että puhuttaisiin siirtymätaajuuksista (fysikaalinen tulkinta).

4 Stationaarinen jakauma äärelliselle MC:lle p i := lim P(x(k) = i x(0) = j) j k Tätä merkitään fysiikassa usein symbolilla p eq i. Oletetaanpa, että p i on olemassa. Olkoon b i (k) tuloksen i todennäköisyys yrityskerralla (askeleella) k eli Tällöin b i (k) = m b m(k 1)w mi (k) ja = m b i (k) = P(x(k) = i). lim b(k) = lim P(x(k) = i x(0) = m)p(x(0) = m) k k m [ lim k P(x(k) = i x(0) = m)]p(x(0) = m) = p i P(x(0) = m) = p i, koska viimeinen summa on yli mahdollisten alkutilojen todennäköisyyksien. Vektorilla p on myös seuraava ominaisuus: m p = lim k b(0) wk = lim k b(0) wk 1 w = lim l b(0) w l w = p w eli se on w:n vasen ominasivektori ominaisarvolla 1.

5 Markovin ketju on redusoitumaton, jos i, j n Z + siten, että (w n ) ij > 0. Huom. Matriisissa g ij on usein paljon nollia. Olkoon D i = {n n > 0 ja(w n ) ij > 0}. Markovin ketju on jaksoton, jos i on gcd(d i ) = 1. Tähän riittää esimerkiksi, että w ii > 0 jollekin i. Lause: Äärelliselle homogeeniselle redusoitumattomalle jaksottomalle Markovin ketjulle stokastinen vektori p, jonka komponentit määräytyvät yksikäsitteisesti ehdosta (global balance) p ij w ji = p i i ja joka siis määrää stationaarisen jakauman. Todistus: Uskotaan. j Jos on voimassa detailed balance -ehto (mikroskooppinen reversiibeliys) p i w ij = p j w ji (DB) niin summaamalla yli j:n ja w:n stokastisuuden perusteella p i w ij = j j p j w ji p i = j p j w ji eli DB on riittävä ehto stationaariselle jakaumalle p.

6 2. STATISTISTA FYSIIKKAA Taustaksi sekä stokastisille (MC) että deterministisille (MD) menetelmille. Lähtökohta: termodynaaminen tasapainotila (kts. fysiikan peruskurssit ja fysa240). Perusidea: Kuvataan fysikaalisen järjestelmän, jonka mikrotiloja (kvanttitiloja) indeksoimme x:llä (kvanttiluvut), kontaktia ympäristönsä kanssa muutamalla termodynaamisella (makroskooppisella) muuttujalla, esim. T, V, N, P, B,... Kytkentä ympäristöön: mikroskopia usein tarkemmin määrittelemätön! 2.1. Klassinen statistinen mekaniikka Järjestelmän (hiukkasjoukon) mikrotila: ( q, p). Tilojen jatkumo, 6N-ulotteinen faasiavaruus. 3N yleistettyä koordinaattia ja 3N yleistettyä liikemäärää. Deterministiset liikeyhtälöt F = ma eli: q k = H/ p i ja ṗ k = H/ q i Lisää yksityiskohtia: kurssi fys211 ja kurssikirja Allen-Tildesley (AT). Mikrokanoninen joukko Todennäköisyystiheys ρ( q, p; E) = C norm δ(h( q, p) E). Vrt. toisella luennolla esitelty vakioenergia-md.

7 Kanoninen joukko eli ensemble Todennäköisyystiheys: ρ( q, p; T, V, N) exp{ H( q, p)/kt } ρ(e) g(e)exp( E/kT) Kiinteillä V, N järjestelmän kontaktia ympäristöön parametrisoi siis lämpötila T. Kun kontaktin mikroskooppiset yksityiskohdat eivät (usein) ole oleellisia, niitä mallinnetaan stokastisella prosessilla (Monte Carlo -menetelmässä algoritmi). Kanonisessa ensemblessa teemmekin kohta MC-simulaatioita. Myos deterministiseen MD-simulaatioon voidaan liittää stokastinen kytkentä lämpökylpyyn ( termostaatti ) peukaloimalla liikeyhtälöitä. Suurkanoninen ensemble Todennäköisyystiheys : ρ( q, p; T, V, µ) exp{ [H( q, p) µn]/kt } Paljon käytetty MC-simulaatioissa, joissa järjestelmän tila muutenkin muuttuu hyvin epäjatkuvasti hiukkasen lisääminen tai poistaminen ( N=±1) luontevaa. Vakiopaine-ensemble Todennäköisyystiheys: ρ( q, p; T, P, N) exp{ [H( q, p) + PV ]/kt } Vakiopaine-ensemblea, jossa simulaatiokopin koko ja muoto elää simulaation kuluessa, käytetään paljon MD-simulaatioissa (kts. kurssin MD-osa).

8 Partitiofunktio Jotta ρ olisi todennäköisyystiheys, se on normitettava. Kutsumme normitustekijää partitiofunktioksi em. jakaumien tapauksessa se on muotoa Z = dx exp{ [H( q, p) +...]/kt } dx = vakio d 3N qd 3N p ja klassisessa fysiikassa todennäköisyysmitta (faasiavaruuden tilavuuselementti) kiinnittyy vakiota vaille. Normitettu todennäköisyystiheys on ρ( q, p) = 1 exp{ [H( q, p) +...]/kt } Z Aika- ja ensembleeskiarvot Käytännössä simulaatioista ei yleensä lasketa Z:aa vaan termodynaamisten (TD) suureiden keskiarvoja. Nämä voivat olla luonteeltaan puhtaita aikakeskiarvoja (vrt. deterministinen MD) tai ensemblekeskiarvoja (MC) tai jotain siltä väliltä (MD stokastisella termostaatilla). TD suureen A aikakeskiarvo on A t = 1 t t 0 dta( q(t), p(t)) 1 N s A( q(t i ), p(t i )), t i [0, t]. N s Edellytyksin, jotka meidän tarpeisiimme ovat riittävän usein voimassa (ergodisuus ja sekoittuminen), on tämä pitkän ajan rajalla sama kuin ensemblekeskiarvo eli lim A t = A dxρ( q, p)a( q, p). t i=1

9 2.2. Diskreetti statistinen mekaniikka Oletetaan nyt diskreetit mikrotilat/kvanttitilat {x} ja konkreettisuuden vuoksi kanoninen ensemble. Tällöin yo. saa muodon A = x p(x)a(x) p(x) = 1 Z e E(x)/kT Z = x e E(x)/kT. Kvanttimekaniikan näkökulmasta, olettaen x :t Ĥ:n ominaistiloiksi ja lisäksi [Ĥ, Â]=0, tämä on sama kuin  = Tr ˆρ ˆρ = 1 Z e Ĥ/kT Z = Tre Ĥ/kT E(x) = x Ĥ x A(x) = x  x. Seuraavien muutaman luentokerran ajan oletamme, että luvut E(x) ja A(x) tunnetaan, ja keskitymme laskemaan keskiarvoa A. Jos nyt muutamme indeksointia/merkintää siten, että p(x) p i ja E(x) E i, havaitsemme DB-ehdossa sivulla 5 partitiofunktion Z supistuvan yhtälön kummaltakin puolelta pois. Siten partitiofunktiota ei tarvitse tuntea stationaariseen jakaumaan p i exp( E i /kt) konvergoivan stokastisen prosessin (siirtymämatriisin w ij ) konstruoimiseksi!

10 3. MONTE CARLO -MENETELMÄ: DISKREETTI TAPAUS Käytëtään havainnollisuuden vuoksi esimerkkinä kanonista ensemblea. Aloitetaan yksinkertaisimmasta/ilmeisestä ratkaisusta: 3.1. Satunnaisotanta (simple sampling) Valitaan kaikkien tilojen joukosta {x} täysin satunnaisesti M kpl tiloja eli tilat {x 1, x 2,..., x M }, jolloin approksimatiivisesti A M l=1 A(x l)exp[ E(x l )/kt] M l=1 exp[ E(x l)/kt]. Jono x 1, x 2,..., x M voidaan nähdä myös stokastisena prosessina, jossa millä tahansa askeleella on siirrytty yhtä suurella todennäköisyydellä mihin tahansa tiloista x, mutta se ei toteuta jakauman p(x) exp[ E(x)/kT] määräämää DB-ehtoa, joten joudumme yllä laskemaan sillä painotetun keskiarvon. Käytännössä tiloja x on suuri määrä ja yleensä on olemassa luonnollinen tapa (H:n näkökulmasta) sijoittaa ne johonkin korkeadimensioiseen konfiguraatioavaruuteen. Moniulotteisesta integroinnista tiedämme, että esim. valitsemalla pisteet, joissa integroitavaa funktiota arvioidaan, tasavälein (grid) virhearvio on luokkaa M a/d, missä a on pienehkö luku (vaikkapa kaksi). Satunnaisotannalle taas keskeinen raja-arvolause (KRAL) antaa virhearvion M 1/2, mikä ei riipu dimensiosta, ja on siksi hyvin korkeissa dimensioissa usein parempi vaihtoehto. Harjoitustehtävä (joka voi tuottaa huviakin): Laske π:n luku/likiarvo MC-menetelmällä. Yksi tapa: Arvo (x, y)-tason pisteitä tasanjakaumasta yksikköneliöön [0, 1] [0, 1], jolloin π/4 on niiden pisteiden osuus, joille x 2 + y 2 < 1. Jos jaksat, kokeile vastaavaa useampidimensioiselle pallolle ja arvioi suhteellista virhettä dimension funktiona.

11 3.2. Painotusotanta (biased sampling) Monissa kiinnostavissa ongelmissa vain hyvin pieni osa tiloista x eli konfiguraatioavaruudesta on merkitsevä termodynaamisen keskiarvon A laskemisessa. Voisimme koettaa tuottaa tilat {x 1, x 2,..., x M } jollakin sopivasti valitulla todennäköisyydellä p(x), jolloin A M l=1 A(x l)p(x l )/ p(x l ) M l=1 p(x l)/ p(x l ). Käytännössä tämä auttaa vain, jos p(x) vähintäänkin karkeasti noudattelee halutun jakauman p(x) piirteitä. Joskus tällainen approksimatiivinen jakauma on numeerisesti helpompi, mutta useimmiten luonnollinen valinta on jakauma p(x) itse. Joskus taas voi käytössämme olla jossakin lämpötilassa tuotettuja tiloja (jakauma p), jolloin voimme käyttää niitä myös A :n laskemiseen jossain lähellä olevassa lämpötilassa (jakauma p). Esimerkki (tekemällä tehty) Olkoon ongelmana laskea E systeemille, jonka mahdolliset sijainnit (tilat) olkoot x =..., 2, 1, 0, +1, +2,... ja E(x)/kT = x 2. Tuotetaan tätä varten tiloja biasoidulla satunnaiskävelyllä, jolle siirtymätodennäköisyys on x :n kasvaessa µ ja x :n pienenetessä 1 µ. Jos valitaan µ = 1/2, tulee simulaatiosta kanonisen jakauman kannalta hyvin tehoton, koska tuloksena on tavallinen satunnaiskävely. Jos µ < 1/2, tämäkin prosessi viihtyy origon x = 0 ympäristössä. Esimerkki (SAW) Konstruoidaan prosessi, jossa valmiiksi N step segmentin pituinen polymeeri luikertelee hilassa dynamiikalla, joka tuottaa polymeerin konfiguraatioita jollain statistiikalla siten, että jokaisessa hilan pisteessä voi kerrallaan olla korkeintaan yksi polymeerin segmentti, jolloin kukin tuotettu konfiguraatio on myös SAW. Tuloksena on konfiguraatioavaruudessa kävely, joka voi olla Markovin prosessi, vaikka SAW sinänsä hiukkasen liikkeeksi paikka-avaruudessa tulkittuna ei sitä ole.

12 3.3. MCMC-otanta (importance sampling) Markovin ketju Monte Carlo -menetelmässä (MCMC) tuotamme järjestelmän tilat eli näytteet {x 1, x 2,..., x M } jo valmiiksi halutulla jakaumalla, jolloin suureen A termodynaaminen keskiarvo on aritmeettinen keskiarvo A 1 M M A(x l ). l=1 Tiedämme jo, mitä tehdä: Tuotetaan Markovin ketju eli jono x 1, x 2,..., x M, jolle stationaarinen jakauma eli todennäköisyysjakauma rajalla M on suoraan kanonisen joukon todennäköisyysjakauma (termodynaamisessa tasapainossa) p(x l ) = 1 Z e E(x l)/kt, mikä onnistuu helpoiten (ei kuitenkaan ainoa mahdollisuus) DB-ehdon kautta. Ensimmäisen tällaisen prosessin esittivät ja sitä numeerisesti käyttivät Nicolas Metropolis kumppaneineen vuonna 1953 (JCP 21, s.1087). Metropolis-algoritmiksi kutsutaan siirtymätodennäköisyyksien muotoa w(x x ) = 1 τ s min{1, e δe/kt }, (Metropolis-dynamiikka) missä δe = E(x ) E(x). Jatkossa valitsemme simulaation tehostamiseksi ajan yksikön siten, että τ s = 1, jolloin mahdollisimman vähän siirtymiä hylätään. Välittömästi näemme, että Metropolis-muoto toteuttaa DB-ehdon, joka kirjoitettuna tavanomaisin Monte Carlo -ihmisten merkinnöin kanoniselle joukolle on: p(x)w(x x ) = p(x )w(x x) e E(x)/kT w(x x ) = e E(x )/kt w(x x), joten Metropolis-algoritmi todellakin vie kohti tasapainojakaumaa p(x). Käytännön simulaatioissa generointitodennäköisyys (g ij ) on usein harva ja symmetrinen matriisi ja hyväksymistodennäköisyys (a ij ) Metropolis-muotoa DB ok.

13 Metropolis ja kumppanit perustelivat (BH: plausibility argument ) algoritminsa käyttäen statistisen fysiikan ensemble-ajattelua ( gedanken experiment ), jossa tarkastellaan suurta määrää järjestelmän kopioita ja erityisesti kahden tilan x ja x välisiä siirtymiä. Tässä voidaan valita E(x) < E(x ). Jos nyt N x ja N x ovat jollain aika-askeleella ko. tiloissa olevien kopioiden lukumäärät sekä N x x ja N x x siirtymien lukumäärät, niin nettomääräksi transitioita suuntaan x x saadaan N x x N x x =... = N x τ s [ e E(x )/kt Nx e E(x)/kT N x Stationaarisessa tilassa tämän täytyy olla nolla, joten stationaarisessa tilassa (jonka olemassaoloa alkuperäinen perustelu ei takaa) on N x /N x =e E(x)/kT /e E(x )/kt. Käytännössäkin simulaatioissa tuotetaan yleensä monta toisistaan rippumatonta Markovin ketjua, usein eri alkutiloista, konvergenssin varmistamiseksi. Toinen paljon käytetty DB-ehdon toteuttava siirtymätodennäköisyyksien muoto on w(x x ) = 1 τ s 1 1 + e δe/kt, jossa Metropolis-algoritmista poiketen w on jatkuvasti derivoituva δe:n funktio ja hyväksymistodennäköisyys mentäessä energiassa alaspäin ei ole vakio. Käytännössä tuloksena on kuitenkin hyvin samankaltainen dynamiikka. Valittuamme esimerkiksi Metropolis-muotoisen siirtymätodennäköisyyden on edelleenkin monta tapaa rakentaa itse algoritmi. Useinkaan ei ole tehokasta yrittää siirtymää mihin tahansa toiseen tilaan vaan rajoitutaan siirtymiin (jollakin tavalla) lähekkäisten tilojen välillä. Tätä ajatellen kirjoitamme seuraavaksi w(x x ) = g(x x )a(x x ), ja oletetaan, että tilojen generointitodennäköisyys g(x x ) on symmetrinen eli g(x x ) = g(x x) ja että hyväksymistodennäköisyys a(x x ) on Metropolismuotoa. Selvästi DB toteutuu. Käytännön simulaatoissa g(x x ) on nolla useimmille siirtymille x x. ].

14 4. MALLEISTA JA ALGORITMEISTA 4.1. Ising-malli: Glauber-dynamiikka Olkoon kuhunkin hilapisteeseen r on määritelty klassinen spin-muuttuja S r. Lähinaapuri-Ising-magneetin energia (mikro)tilassa x on E(x) = J r,s S r (x)s s (x) B N S r (x), missä N on nyt spinien lukumäärä ja S r (x) = ±1 on spinin r suunta (ylös tai alas) ko. tilassa. Merkintä r, s tarkoittaa summaamista yli kaikkien lähinaapuriparien siten, että jokainen pari lasketaan kerran (2d neliöhilassa kullakin spinillä on neljä naapurispiniä). Jälkimmäinen summa taas käy yli kaikkien spinien. Vuorovaikutusparametrin J ollessa positiivinen eli ferromagneetin tapauksessa systeemi voittaa energiaa spinien kääntyessä samansuuntaisiksi ja myös niiden kääntyessä magneettikentän B suuntaan. Keskeisiä laskettavia suureita ovat magneettinen momentti spiniä kohti ja sen itseisarvo, M = 1 N S r M = 1 N S r, N N r=1 joista jälkimmäinen on varsinainen järjestyksen mittari eli ns. järjestysparametri tapauksessa J > 0. Keskimääräinen energia spiniä kohti on tietenkin E N = 1 J N S r S s B S r N r,s ja M:n ja E:n fluktuaatioille käytetään merkintöjä r=1 r=1 r=1 ( M) 2 = (M M ) 2 ( E) 2 = (E E ) 2.

15 Perus-MC-algoritmi Ising-mallin ratkaisemiseksi on seuraava: 0. Tuotetaan alkutila. 1. Valitaan satunnaisesti yksi spin, jonka tilaa koetetaan muuttaa. 2. Lasketaan δe. 3. Lasketaan ehdotetulle muutokselle hyväksymistodennäköisyys a. 4. Tuotetaan satunnaisluku ξ [0, 1]. 5. Toteutetaan muutos, jos a > ξ. 6. Palataan kohtaan 1, kunnes tiloja on tuotettu tarpeeksi. Huomautuksia yo. algoritmin käytännön toteutuksesta: 0. Mahdollinen riippuvuus alkutilasta testattava. 1. Joskus hilaa käydään läpi järjestyksessä (kts. BH). 2. Muutos on lokaali, joten δe voidaan laskea lokaalisti. 3. Hyväksymistodennäköisyydet voidaan taulukoida etukäteen. 4. Yleensä kannattaa tuottaa useampia satunnaislukuja kerralla. 5. Vaikka a ξ, lasketaan vanha uudeksi konfiguraatioksi. 6. Jokaista konfiguraatiota ei kannata ottaa keskiarvoihin, koska peräkkäiset konfiguraatiot eivät ole toisistaan riippumattomia. Ellei olla kiinnostuneita reunailmiöistä, hilaan määritellään yleensä periodiset reunaehdot (PBC). Kaksiulotteisessa neliöhilassa hilapisteen r=(x, y), missä x, y=1, 2,..., L, naapurit ovat (x, y ±1), (x±1, y) ja hilan reunoilla asetetaan 0 L ja L + 1 1. Kuten jatkossa käy ilmeiseksi, tällainen hila ei ole ääretön vaikka se onkin reunaton. Periodiset reunaehdot voidaan toteuttaa usealla eri tavalla: Testataan aina vaiheessa 2 ollaanko reunalla ja toimitaan sen mukaan. Luodaan reunaehtotaulukot, joista y ± 1 ja x ± 1 haetaan. Luodaan naapurilistat, joista naapureiden indeksit haetaan. Pidetään yllä järjestelmän kopioita sen kullakin reunalla. Eri ratkaisuilla on omat käyttötilanteensa, osalla koodin analyysiosassa laskettaessa tuotetuista konfiguraatioista termodynaamisia suureita. Esim. pitkän kantaman korrelaatioiden laskemista varten reunaehdot kannattaa usein toteuttaa eri tavalla kuin lyhyen kantaman vuorovaikutusten määräämässä dynamiikkaosassa.

16 4.2. Ising-malli: Kawasaki-dynamiikka Edellä simulaatio toteutettiin Glauber-dynamiikalla, jossa magnetoituma ei säily, eli ns. (T, B)-ensemblessa. Toisinaan käytetään myös Kawasaki-dynamiikkaa, jossa magnetoituma on säilyvä suure, ja puhumme (T, M)-ensemblesta. Tällöin simulaation alkukonfiguraatioilla on oltava haluttu kokonaismagnetoituma M ja simulaatio etenee vaihtamalla erimerkkisten naapurispinien suunnat keskenään hyväksymistodennäköisyyksien mukaan. Mallin kokonaisenergian lausekkeessa kenttätermillä B r S r(x) ei tällöin ole merkitystä dynamiikan kannalta. Termodynaamisella rajalla L nämä kaksi ensemblea johtavat samoihin keskiarvoihin staattisille suureille kuten E, mutta dynamiikat ovat hyvin erilaiset. Kawasakidynamiikan voi arvata olevan hitaampi tapa liikkua konfiguraatioavaruudessa, kun säilymislaki rajoittaa mahdollisia siirtymiä. 4.3. Hilakaasumalli (lattice-gas model) Tekemällä Ising-mallissa muuttujien vaihto s r = 2n r 1, jolloin siis n r = 0, 1, päädymme ns. hilakaasumalliin, jonka energia on tapana kirjoittaa muodossa E(x) µn(x) = ǫ r,s n r (x)n s (x) µ r=1 n r (x) (+vakio). Yllä n r tulkitaan hilapisteen r miehitysluvuksi, ǫ on atomien (pisteissä joissa n r =1) välisen lähinaapurivuorovaikutuksen energia ja µ on kemiallinen potentiaali, joka säätää hiukkastiheyttä. Lähtökohtaisesti olemme siis suurkanonisessa ensemblessa, jolloin käytämme Glauber-dynamiikkaa, jossa yksittäisille siirtymille N = ±1. Tässä sovelluksessa N ei ole hilapisteiden lukumäärä vaan muuttuva hiukkasluku. Tutkittaessa kuitenkin esim. atomien diffuusiota (vrt. erillinen harjoitustyö rajapinnaksikin kuvautuvalle asep-mallille) on luonnollista valita kanoninen ensemble ja käyttää Kawasaki-dynamiikkaa, jossa N=vakio. 4.4. Harjoistustyö Ising-mallista Rakenna Monte Carlo -simulaatio kaksiulotteisessa neliöhilassa määritellylle ferromagnetismin lähinaapuri-ising-mallille. Tutki magnetoituman M ja sen itseisarvon M odotusarvojen käyttäytymistä lämpötilan T ja magneettikentän B funktiona. Määritä karkeasti mallin kriittinen lämpötila T C, jonka yläpuolella spontaani magnetoituma M nollakentässä (B=0) häviää. Tutki tarkemmin magnetoituman ja sen fluktuaatioiden käyttäytymistä kriittisen pisteen (T=T C,B=0) lähellä systeemin koon L (nyt N=L 2 ) funktiona; kts. erillinen ohje ja BH.