Jatko-opintoseminaari 21-211 Kevyttä johdattelua kvanttimekaniikkaan: Tila-avaruus Petteri Laakkonen 23.9.21
Tämä teksti on tiivistelmä kirjan [1] luvun 2 tekstistä. Pyrkimyksenä on esittää perustellusti kvanttimekaniikan perusteita matemaattisesta näkökulmasta ja esitellä siihen liittyvää terminologiaa. 1
Luku 1 Perusosaset kvarkit leptonit <2.2 ev ν Fermionit (aine) I II III 2.4 MeV 2/3 uup 4.8 MeV -1/3 d down e electron neutrino e electron.511 MeV -1 1.27 GeV 2/3 c charm s strange 14 MeV -1/3 <.17 MeV 15.7 MeV -1 ν µ muon neutrino µ muon 171.2 GeV 2/3 ttop 4.2 GeV -1/3 b bottom <15.5 MeV ν τ tau neutrino 1.777 GeV -1 τtau Bosonit (voima) γ 1 fotoni 1 91.2 GeV 1 z 8.4 GeV ±1 1 w g gluoni weak force ± weak force 2
Luku 2 Kvanttimekaanisen systeemin perusteita Tässä luvussa esittelemme matemaattiset käsitteet, joita tarvitaan fysikaalisen systeemin esittämiseen kvanttimekaniikan mielessä. Käytämme havainnollistavana esimerkkinä koko luvun ajan elektronidiffraktiota. Huomaamme, että kvanttimekaniikka ja todennäköisyyslaskenta ovat vahvasti yhteydessä toisiinsa. 2.1 Tila-avaruus Tarkastellaan elektronidiffraktio, joka syntyy kun elektroni kulkee hilan (esimerkiksi rako tai kide) läpi ja osuu sen jälkeen tasaiseen pintaan (kalvoon) muodostaen diffraktiokuvion (samanlainen kuin valolla havaittu). Kukin elektroni aiheuttaa tasolle vain pienen pisteen, joten kuvio, joka syntyy useista elektroneista, on oikeastaan tilastollisen todennäköisyyden aikaansaama. Siis voidaan ajatella, että löytyy tiheysfunktio p(r), joka kertoo (karkeasti kuvattuna) että elektroni on avaruuden pisteen r sellaisessa (pienen) pienessä ympäristössä, jonka tilavuus on dv, todennäköisyydellä p(r)dv. Siis todennäköisyys sille, että elektroni löytyy alueesta V on P = V p(r)dv (2.1) Koska elektroneilla havaittu diffraktiokuvio on samanlainen kuin valolla, voimme ajatella elektroneilla olevan aaltoluonteen. Kun aallon poikkeamaa tas- 3
apainoasemasta paikassa r ajanhetkellä t merkataan f(r, t), niin voidaan kirjoittaa missä f(r, t) = A(r) cos(ωt + φ(r)) = Re ( ψ(r)e iωt), ψ(r) = A(r)e iφ(r). (2.2) Funktiota ψ kutsumme elektronin aaltofunktioksi. Koska diffraktio kuvio on elektronien todennäiköisyysjakauman mukaisesta käyttäytymisestä ja toisaalta aaltoluonteen mukaisesti elektronin käyttäytyminen taas riippuu amplitudista ja vaihekulmasta, niin voimme päätellä todennäköisyysfunktion itseasiassa olevan amplitudin ja vaihekulman funktio, eli voidaan kirjoittaa p(r) = k ψ(r) 2. (2.3) Yllä k = 1/ ψ(r) 2 dv, sillä todennäköisyys sille, että elektronin löytyy jostain on oltava 1. Edellä esitetyssä esimerkissä määriteltiin elektronille aaltofunktio (2.2), jonka voidaan yhtälön (2.3) perusteella ajatella edustavan tilaa, jossa elektroni kulloinkin on, ja kertovan mistä se (todennäköisesti) löytyy. Jotta yhtälössä (2.3) olisi järkeä täytyy integraalin ψ(r) 2 dv olla äärellinen. Lisäksi haluamme jatkossa käyttää operaattoreita, jotka määritellään polynomilla kertomalla ja derivaatan avulla, joten aaltofunktiolle ψ esitetaan seuraavat postulaatit: Postulaatti 1. W1 ψ on neliöllisesti integroituva W2 Funktiolla ψ on kaikkien kertalukujen osittaisderivaatat ja ne ovat tasaisesti jatkuvia ja toteuttavat postulaatin W1 W3 Jos f(r) on polynomi, niin fψ toteuttaa myös postulaatin W1 On helppo havaita, että funktiojoukko, joka toteuttaa postulaatit W1-W3 muodostaa lineaarisen vektoriavaruuden, johon määritellään sisätulo asettamalla ψ φ = ψ(r)φ(r)dv. Yleisessä tapauksess merkitsemme kvanttisysteemin tilavektoria ψ ja postuloimme tilojen joukon seuraavasti: 4
Postulaatti 2 (The principle of superpositioning). Kvanttisysteemin tilavektorit muodostavat kompleksisen lineaarisen sisätuloavaruuden. Jokainen nollasta eroava vektori ψ edustaa jotain systeemin tilaa. Jos c on nollasta eroava skalaari, niin c ψ edustaa samaa tilaa kuin ψ. Jokaista systeemin tilaa edustaa joku nollasta eroava tilavektori ja sen skalaarimonikerrat, mutta ei mikään muu tilavektori. Kahden tilavektorin summalle voidaan antaa seuraava fysikaalinen tulkinta: Jos ψ 1 ja ψ 2 ovat tilavektoreita, niin c 1 ψ 1 + c 2 ψ 2 on sellainen tila, jossa systeemi voi käyttäytyä kuin jos se olisi tilassa ψ 1 tai tilassa ψ 2 ja todennäköisyys sille käyttäytyykö systeemi tilan ψ 1 vai ψ 2 mukaisella tavalla riippuu vakioiden c 1 ja c 2 suuruudesta. 2.2 Tila-avaruuden ja fysikaalisen kokeen välinen yhteys Fysikaaliset kokeet voidaan jakaa kahteen luokkaan, ensimmäisen ja toisen tyypin kokeisiin. Ensimmäisen tyypin koe ei vaikuta mitattavaan ominaisuuteen. Siis toistettaessa ensimmäisen tyypin koe se antaa täsmälleen saman tuloksen. Toisen tyypin kokeessa mitattava ominaisuus muuttuu ja toistettaessa koe heti ensimmäisen jälkeen saamme yleensä eri tuloksen. Kvanttisysteemin ominaistila on sellainen systeemin tila, jossa kokeen tulos voidaan tietää varmasti ennen koetta. Jos kyseinen tila on ainoa, jossa saadaan kyseinen tulos, niin tuloksen ja tilan sanotaan olevan ei-degeneroituneita. Oletetaan, että kokeen E tulos α on degeneroitunut, eli löytyy ainakin kaksi ominaistilaa ψ 1 ja ψ 2, jotka vastaavat kyseistä tulosta. Vektorisumman fysikaalisen tulkinnan mukaan systeemi käyttäytyy tilassa c 1 ψ 1 + c 2 ψ 2 jomman kumman ominaistilan mukaisesti. Koska molempiin ominaistiloihin liittyy käyttäytyminen α, niin voimme päätellä, että myös c 1 ψ 1 + c 2 ψ 2 on tulokseen α liittyvä ominaistila. Siis ominaistilat virittävät aliavaruuden, jota kutsumme tulokseen α liittyväksi ominaisavaruudeksi ja merkitsemmme Ψ α. Ortogonaaliprojektoria, joka avaruuteen Ψ α merkitsemme P α. Nyt antaa seuraavat postulaatit Postulaatti 3. Jos kokeessa E tulosta α vastaavat ominaisvektorit ovat ψ i ja ominaisavaruuden ortogonaaliprojektori on P α, niin todennäköisyys sille, että 5
tilassa ψ oleva systeemi antaa kokeessa E tuloksen α on p E (α ψ) = ψ P α ψ ψ ψ = i ψ i ψ 2. ψ ψ Postulaatti 4. Jos ensimmäistä tyyppiä olevan kokeen E tulos on α, niin heti kokeen jälkeen systeemi on tilassa P α ψ. 2.3 Observaabelit :) Observaabeli on fysikaalinen suure, joka voidaan mitata kokeessa ja joka saa arvokseen reaaliluvun. Mitattua tulosta sanotaan ominaisarvoksi ja niistä kukin liittyy johonkin ominaistilaan. Ominaisarvojen avulla voimme rakentaa observaabelille A vastaavan lineaarisen operaattorin Â. Tarkastellaan ensiksi äärellisulotteista tapausta. Oletetaan nyt, että observaabelin A ominaistilat ( ψ i ) muodostavat kannan ja joukko (α i ) on niihin liittyvät ominaisarvot. Operaattori  määritellään asettamalla Jos ψ = i c i ψ i, niin Âψ = i c i α i ψ i. Siis ominaistilat α i ovat operaattorin  ominaisarvoja normaalissa (matemaattisessa) mielessä. Määritelmästä ja ominaisarvojen positiivisuudesta seuraa, että yllä määritelty operaattori on aina hermiittinen. Edellä on oletettu, että löytyy täysi määrä ominaisvektoreita. On kuitenkin varsin tavallista, että observaabelilla A ei toteuta tätä vaatimusta. Ääretönulotteisen tila-avaruuden kohdalla löytyy helposti fysikaalisesti merkittäviä operaattoreita, joilla ei ole kyseistä ominaisuutta. Tarkastellaan ehdot W1-W3 täyttävien funktioiden joukkoa, joiden määrittelyjoukko on yksiulotteinen. Siis erityisesti funktiojoukko on suljettu derivoinnin ja polynomilla kertomisen suhteen, eli voimme määritellä operaattorit ˆX ja ˆK asettamalla ( ˆXψ)(x) = xψ(x) ja ˆKψ = i dψ dx. Nämä ovat paikka- ja liikemääräoperaattorit. Nimet selvinnevät myöhemmin. 6
Selvästi molemmat operaattorit ovat hermiittisiä, mutta niillä ei ole yhtään ominaisvektoria. Voimme kuitenkin yleistää ominaisvektorien käsitettä esittelemällä bravektorit, eli käsiteltävän avaruuden lineaariset funktionaalit, ja ominaisbravektorit. (Jos  on lineaarinen kuvaus, niin ominaisbravektori on sellainen lineaarinen funktionaali H, että H ψ = λh ψ ja λ on tällöin yleistetty ominaisarvo). Merkitään ɛ k (x) = e ikx, missä k R. Nyt voimme esitellä ominaisbravektorit (lineaariset funktionaalit) ɛ k ja δ a asettamalla ja ɛ k ψ = ɛ k (x)ψ(x) dx δ a ψ = ψ(a). Kyseisiin ominaisbravektoreihin liittyvät yleistetyt ominaisarvot ovat k ja a, sillä ɛ k ˆK = k ɛ k. ja δ a ˆX = a δ a. Nyt voimme esittää jokaisen bravektorin ψ ( ψ kuvaa vektorin φ alkiolle ψ φ ) esiteltyjen operaattoreiden integraalina kuten alla esitetään ja siksi voimme ajatella, että kyseiset ominaisbravektorit muodostavat täydellisen joukon. (Kaikkia bravektoreita ei kuitenkaan voida esittää niiden avulla, mutta pääasia on että kaikki systeemin tiloihin liittyvät pystytään). Yksinkertainen laskutoimitus osoittaa, että voimme kirjoittaa jokaista fuktiota (tilaa) ψ kohti formaalisti ψ ( ) = c a δ a ( ) da, missä c a = ψ(a). Vastaavasti, kun asetetaan c k = 1 2π ψ(k), missä ψ on funktion ψ Fourrier-muunnos ψ(k) = 1 2π ψ(x)e ikx dx, niin Fourrierin käänteismuunnoskaava antaa ψ(x) = c ke ikx dk. Edelleen ψ φ = = c k ɛ k φ dk, 7 e ikx φ(x) dx dk
eli ψ = c k ɛ k dk. Yleisesti ottaen hermiittisellä operaattorilla voi olla normaaleja ominaisarvoja ja niihin liittyviä ominaisvektoreita, sekä yleistettyjä ominaisarvoja ja niihin liittyviä ominaisbravektoreita. Normaaleja ominaisarvoja kutsutaan diskreeteiksi ja yleistettyjä ominaisarvoja jatkuviksi. Yhdessä ne muodostavat operaattorin spektrin. Tarkastellaan operaattoria Â. Olkoot ψ i erillisiin diskreetteihin ominaisarvoihin α i liittyvät ominaisvektorit ja ψ α jatkuvaan ominaisarvoon α liittyvä ominaisbravektori. Saadaan esitys ψ = ψ i + c α ψ α dα, i missä c i = ψ i ψ ja c α = ψ α ψ. Tässä tapauksessa sanotaan, että ominaisarvot on normeerattu operaattorin  suhteen. Postulaatteja 3 ja 4 voidaan nyt täydentää seuraavilla postulaateilla. Postulaatti 5. Jos α on ei-degeneroitunut observaabelin A jatkuva minaisarvo ja ψ α siihen liittyvä ominaisbravektori, joka on normeerattu operaattorin  suhteen, niin todennäköisyys sille, että A antaa tuloksen, joka on välillä [α, α + dα] on p A (α ψ)dα, missä p A (α ψ) = ψ α ψ 2. (2.4) ψ ψ Postulaatti 6. Jos mittaus antaa tuloksen, joka on välillä [α 1, α 2 ], niin heti mittauksen jälkeen systeemi on tilassa, joka on tilan ψ ortogonaaliprojektio aliavaruuteen, joka on ortogonaalinen kaikkia niitä vektoreita ψ vastaan, jotka toteuttavat ehdon α2 ψ α ψ dα =. α 1 Annetaan operaattoreille ˆX ja ˆK ja niiden edustamille observaabeleille vielä fysikaalinen merkitys. Ajatellaan, että X ja K ovat observaaneleita, jotka liittyvät jollain tapaa kappaleen liikeeseen annetulla suoralla. Vaikka esitelty ɛ k ei kuulukkaan tilavektoreiden joukkoon, niin voidaan sen ajatella olevan idealisoitu aaltofunktio joka edustaa kappaletta, joka löytyy kaikista paikoista samalla todennäköisyydellä, sillä Todennäköisyys, että a 1 < X < a 2 Todennäköisyys, että a 3 < X < a 4 = 8 a2 a 1 a4 ɛ k 2 dx a 3 ɛ k 2 dx.
Funktio ɛ k edustaa jaksollista aaltofunktiota, joka aallon pituus on λ = 2π/k ja de Broglien relaation mukaan p = h λ = k. Koska k on operaattorin ˆK itseisarvo, niin havaitsemme, että observaabeli K on suoraan verrannollinen liikemäärään. Vastaava aaltofunktio idealisointi voidaan tehdä myös observaabelin X kohdalla. Jos ψ on normeerattu, niin yhtälö (2.4) antaa tiheysfunktion p(a) = ψ(a) 2. Jos vertaamme tätä tulosta elektronidiffraktio esimerkkiin, niin huomataan että X on kappaleen paikka. Jos merkataan, että δ a = δ(x a), missä δ on Diracin δ-funktio, jolla on ominaisuudet b a δ(x) =, jos x δ(x) dx = 1, jos a < < b f(x)δ(x) dx = f(), millä tahansa funktiolla f. Fysikaalisesti δ a siis edustaa sellaisen kappaleen aaltofunktiota, joka löytyy varmasti paikasta a. Sekä ɛ k ja δ a ovat fyysisesti mahdottomuuksia, mutta ne voidaan käsittää raja-arvona mittauksista, jotka tehdään kasvavalla tarkkuudella. Kuten me kaikki huomasimme ei elektrodiffraktioesimerkin mukainen ehdot W1-W3 täyttävien funktioiden avaruus ole Hilbert-avaruus, koska se ei ole täydellinen. Tämä on ongelma matemaattisen teorian kehityksen kannalta ja voisimme täydentää avaruuden L 2 avaruudeksi. Täydentämisestä puolestaan seuraa ongelmia, sillä haluamme määritellä operaattoreita, joiden määrittelyjoukko ei olisi koko L 2 ( ˆK, ˆX). Formaalisti ongelman saa kierrettyä käyttämällä varustettua Hilbertin avaruutta (rigged Hilbert space), joka on kolmikko Φ H Φ, missä H on Hilbert-avaruus, Φ sen tiheä osajoukko ja Φ on kaikkien lineaariavaruuden Φ lineaaristen funktionaalien joukko. Siis erityisesti kuvaukset, jotka ovat muotoa ψ ψ φ, missä φ H kuuluvat joukkoon Φ ja siten H = H (Rieszin esityslause) on osajoukko avaruudessa Φ. 9
2.4 Systeemien yhdistäminen Olkoon S ja T kaksi erillistä systeemiä, joiden tila-avaruudet ovat S ja T. Niistä saadaan yhdistetty systeemi ST, jonka tila-avaruutena toimii tensoritulo S T. Aaltofunktioiden tapauksessa tensoritulo saadaan muodostettua tavallisen kertolaskun avulla. Mikäli yhdistetyn systeemin osat ovat samoja (esim. kaksi samanlaista partikkelia), niin voidaan määrittää vaihto-operaatio X asettamalla X( ψ φ ) = φ ψ. Fyysisesti emme pysty tekemään eroa kahden tilan ψ φ ja φ ψ välille (superpositioperiaate), joten niiden on oltava samoja. Täten X( ψ φ ) = ɛ φ ψ. Koska X 2 on identiteettikuvaus, niin ɛ = ±1. Tiloja joilla ɛ = 1 sanotaan symmetrisiksi ja tiloja joilla ɛ = 1 antisymmetrisiksi. Se ovatko kahden partikkelin muodostamat tilat symmetrisiä vai antisymmetrisiä riippuu partikkeleista: Kahden fermionin tilat ovat aina antisymmetrisiä ja kahden bosonin tilat ovat aina symmetrisiä. Edelleen useampien systeemien muodostamia systeemejä saadaan luonnollisesti ottamalla tensoritulo yli useamman tila-avaruuden. Jos Ψ on n:n systeemin muodostaman systeemin tila ja X ij vaihto-operaattori, joka vaihtaa i. ja j. tilan paikat, niin mikäli X ij Ψ = Ψ kaikilla i, j, niin vektoria Ψ sanotaan totaalisesti symmetriseksi. Mikäli X ij Ψ = Ψ kaikilla i, j, niin vektoria Ψ sanotaan totaalisesti antisymmetriseksi. Postulaatti 7. Kahden systeemin S ja T muodostaman yhdistetyn systeemin ST tila-avaruus on osasysteemien S ja T tensoritulo. Jokainen elementaarinen partikkeli on joko fermioni tai bosoni. Usean samanlaisen partikkelin muodostaman systeemin tila on totaalisesti antisymmetrinen mikäli partikkelit ovat fermioneja ja totaalisesti symmetrinen mikäli partikkelit ovat bosoneita. Jos kaksi kaksi partikkelia olisi mahdollista erottaa toisistaan (klassinen tulkinta), niin tällöin kahden tilan ortogonaalisia tiloja olisi neljä kappaletta φ φ, ψ ψ, φ ψ, ψ φ. Jos partikkelit ovat bosoneita, niin löytyy kolme ortogonaalista tilaa φ φ, ψ ψ, φ ψ + ψ φ. 1
Mikäli partikkelit ovat fermioneja, löytyy vain yksi tila φ ψ ψ φ Tämä on Paulin eksluusioperiaate: Kaksi identtistä fermionia ei voi olla samassa tilassa. Voidaan myös sanoa, että systeemi, jossa on m bosonia ja n fermionia on bosoni mikäli n on parillinen ja fermioni jos n on pariton. 11
Kirjallisuutta [1] Sudbery, Anthony: Quantum mechanics and the particles of nature: An outline for mathematicians. Cambridge university press, 1986. 12