Luentoaiheet: 1. Satunnaissignaalien käsittely 2. Tehospektrin estimointi 2/144
Satunnaissignaalien käsittely Johdanto Diskreettiaikaiset satunnaisprosessit Diskreettiaikaisen satunnaisprosessin matemaattinen kuvaus Keskiarvot Aikakeskiarvot Satunnaissignaalien taajuustason tarkastelu Lineaaristen järjestelmien vaste satunnaisherätteelle 3/144
Satunnaissignaalien käsittely: johdanto Tausta Aiemmin olemme käsitelleet deterministisiä signaaleja Mitä tarkoittaa deterministinen? Signaali voidaan yksikäsitteisesti kuvata eksplisiittisellä matemaattisella lausekkeella, taulukolla tai muulla määrätyllä säännöllä. Useissa käytännön sovelluksissa signaalien kuvaaminen matemaattisesti on mahdotonta tai kuvaus on liian monimutkainen käytettäväksi Tällaisten signaalien käyttäytymistä ei voi ennustaa luotettavalla tavalla Signaalit ovat satunnaisia Mihin tarvitaan numeerinen epätarkkuus: katkaisu ja pyöristys aiheuttavat virhettä, jota voidaan mallittaa satunnaishäiriönä 4/144
kertaluonteiset häiriöt, esim. mekaniikasta johtuva ääni ja värähtely lämpöhäiriö (thermal noise) puhe- ja muut äänisignaalit tehospektrin estimointi optimaaliset suodattimet Tarkempi luokittelu Deterministiset signaalit: energiasignaalit äärellinen energia äärellinen kesto z-muunnos, Fourier-muunnos tehosignaalit: jaksolliset signaalit ääreton kesto äärellinen keskimääräinen teho, ääretön energia 5/144
yksi jakso: äärellinen energia Fourier-sarja Ei-deterministiset signaalit: ääretön kesto, ääretön energia, ei jaksollinen ei z-muunnosta, ei Fourier-sarjaa tai -muunnosta esitetään keskiarvoina, sekä autokorrelaatio- ja autokovarianssisekvensseinä jälkimmäiset usein energialtaan äärellisiä, joten z-muunnos tai Fouriermuunnos on olemassa 6/144
Diskreettiaikaiset satunnaisprosessit Esimerkki: kolikon heittäminen (ns. Bernoulli-prosessi) Luodaan sekvenssi numeroita heittämällä kruunaa ja klaavaa. Jos ajanhetekllä n saadaan kruuna, merkitään x(n) = +1, jos saadaan klaava merkitään x(n) = 1. Jatketaan tätä ikuisesti, < n <. x(n) 1.0 1.0 1.0 1.0 1.0 1.0-4 -3-2 0 3-5 -1 1 2 4 5 n -1.0-1.0-1.0-1.0-1.0 saadaan kestoltaan ääretön sekvenssi energia ääretön (Miksi?) Sekvenssin kuvaaminen deterministisesti mahdotonta. Miksi? Eikö voitaisi taulukoida arvoja ja kutsua tätä kolikonheiton deterministiseksi kuvaukseksi? 7/144
kesto ääretön: vaikka taulukkoon otettaisiin kuinka pitkä äärellinen pätkä tahansa, ei sen avulla voida ennustaa sekvenssin jatkoa kuvattava todennäköisyyksien ja keskiarvojen avulla Olkoon kruunan todennäköisyys p Klaavan todennäköisyys on 1 p x(n):n n.s arvo tulkitaan silloin satunnaismuuttujan x n arvoksi eli tässä tapauksessa funktioksi kolikon heiton tuloksesta jokainen arvo on kolikon heiton tulos siten, että tapahtuman tuli kruuna arvoksi annetaan +1 ja tapahtuman tuli klaava arvoksi annetaan 1 kolikon heiton tulos koostuu näistä toisensa poissulkevista tuloksista, tuli kruuna ja tuli klaava satunnaismuuttuja x n voi saada arvokseen vain +1 tai 1 Jokaiseen tapahtumaan liitetään tapahtuman todennäköisyys 8/144
kolikon heitossa x n = +1:n todennäköisyys on p, x n = 1:n todennäköisyys on 1 p Satunnaisprosessi koostuu joukosta satunnaismuuttujia {x n }, < n < sekä niihin liittyvistä todennäköisyyksistä Tietty joukko arvoja {x(n)}, < n < on satunnaisprosessin toteutus, jota kutsutaan näytesekvenssiksi Erilaisia näytesekvenssejä voidaan generoida esimerkkimme tapauksessa ääretön määrä kokoelmaa, joka sisältää kaikki mahdolliset näytesekvenssit, kutsutaan näytesekvenssien kokonaisuudeksi (eng. ensemble) Sovellettaessa satunnaisprosessien mallia käytännön signaalinkäsittelysovelluksiin, ajatellaan, että tietty sekvenssi {x(n)} on yksi kokonaisuuteen kuuluvista näytesekvensseistä yleisesti ottaen todellinen satunnaisprosessi ei ole tunnettu tunnettaessa {x(n)} 9/144
voi olla mahdollista, että voidaan tehdä järkeenkäypiä oletuksia prosessista tarkastelemalla riittävän pitkää näytesekvenssiä x(n)={...,+1,+1,-1,+1,-1,-1,+1,... } {xn}: xn = k 1 : p 1. xn = k N : p N x(n)={...,-1,+1,+1,-1,-1,+1,+1,... } Kokonaisuus Satunnaisprosessi. x(n)={...,-1,-1,+1,-1,+1,+1,+1,... } Näytesekvenssejä 10/144
Diskreettiaikaisen satunnaisprosessin matemaattinen kuvaus Satunnaisprosessi on indeksoitu joukko satunnaismuuttujia {x n } Satunnaisprosessi voidaan kuvata joukolla kertymäfunktioita (probability distribution function), jotka yleisessä tapauksessa voivat olla indeksin n (vastaa tavallisesti aikaa) funktioita Tietty satunnaismuuttuja x n kuvataan kertymäfunktiolla P xn (x n, n) = Todennäköisyys [x n x n ] missä x n tarkoittaa satunnaismuuttujaa ja x n tiettyä arvoa (ei siis vektoria tai matriisia!) x n voidaan määritellä myös todennäköisyystiheysfunktiolla (probability density function), joka määritellään p xn (x n, n) = P x n (x n, n) x n 11/144
Kolikonheittoesimerkissä satunnaismuuttujat olivat kvantisoituja, ts. ne saivat vain äärellisen määrän arvoja esimerkin tapauksessa kertymäfunktio on P xn (x n, n) = 1, x n 1 1 p, 1 x n < 1 0, x n < 1 Tällöin derivaattaa ei ole olemassa, ellei sallita impulsseja Toinen vaihtoehto on määritellä todennäköisyysmassafunktio kvantisoidulle satunnaismuuttujalle p xn (x n, n) = Todennäköisyys [x n = x n ] Kvantisoidun satunnaismuuttujan kertymäfunktio on silloin P xn (x n, n) = Todennäköisyys [x n x n ] = x x n p xn (x, n) 12/144
Pxn (x n, n) 1 p 1 p 1 1 xn pxn (x n, n) 1 p 1 p 1 1 xn Kahden satunnaismuuttujan riippuvuus toisistaan voidaan kuvat yhteiskertymäfunktiolla P xn,x m (x n, n, x m, m) = Todennäköisyys [x n x n ja x m x m ] 13/144
Jatkuvien satunnaismuuttujien tapauksessa yhteistiheysfunktio on p xn,x m (x n, n, x m, m) = 2 P xn,x m (x n, n, x m, m) x n x m Kvantisoitujen satunnaismuuttujien yhteistodennäköisyysmassafunktio määritellään seuraavasti: p xn,x m (x n, n, x m, m) = Todennäköisyys [x n = x n ja x m = x m ] Kolikoitten heitossa oletettiin, että tietyllä heitolla kruunan todennäköisyys ei riipu minkään muun heiton tuloksesta: tässä tapauksessa satunnaismuuttujat ovat tilastollisesti riippumattomia ja silloin P xn,x m (x n, n, x m, m) = P xn (x n, n) P xm (x m, m) Koko satunnaisprosessin määrittely vaatii kaikkien mahdollisten yhteiskertymäfunktioiden määrittelyä 14/144
Lisäksi kertymäfunktiot voivat riippua indeksistä n Jos todennäköisyysfunktiot ovat riippumattomia aikaorigon paikasta, satunnaisprosessin sanotaan olevan stationaarinen Tällöin esimerkiksi P xn,x m (x n, n + k, x m, m + k) = P xn,x m (x n, n, x m, m) Onko kolikonheittoesimerkki stationaarinen? On, koska kruunan todennäköisyys on aina p ja jokaisen satunnaismuuttujan oletettiin olevan riippumaton muista Monissa sovelluksissa satunnaisprosessi toimii signaalien mallina siten, että tietyn signaalin voidaan ajatella olevan näytesekvenssi jostain satunnaisprosessista 15/144
Keskiarvot Määritelmät Satunnaisprosessin keskiarvo määritellään yhtälöllä m xn = E [x n ] = xp xn (x, n)dx E tarkoittaa matemaattista odotusarvoa Jos x n on satunnaismuuttuja, on myös g(x n ) satunnaismuuttuja. Silloin E [g(x n )] = g(x)p xn (x, n)dx Jos satunnaismuuttujat ovat kvantisoituja, muuttuvat integraalit summiksi: E [g(x n )] = x g(x)p xn (x, n) 16/144
Jos ollaan kiinnostuneita kahden satunnaismuuttujan yhteisvaikutuksesta E [g(x n, y m )] = g(x, y)p xn,y m (x, n, y, m)dx dy missä p xn,y m (x, n, y, m) on satunnaismuuttujien x n ja y m yhteistiheysfunktio Keskiarvoilla on seuraavia ominaisuuksia 1. E [x n + y m ] = E [x n ] + E [y m ], eli summan keskiarvo on keskiarvojen summa 2. E [ax n ] = ae [x n ] eli vakio kertaa x n :n keskiarvo on yhtäsuuri kuin vakio kertaa x n :n keskiarvo Yleisesti kahden satunnaismuuttujan tulon keskiarvo ei ole yhtäsuuri kuin keskiarvojen tulo Jos näin, on, ts. jos E [x n y m ] = E [x n ] E [y m ] satunnaismuuttujien sanotaan olevan lineaarisesti riippumattomia tai korreloimattomia 17/144
Helposti nähdään, että riittävä ehto lineaariselle riippumattomuudelle on P xn,y m (x n, n, y m, m) = P xn (x n, n) P ym (y m, m) Tämä on kuitenkin vahvempi riippumattomuuden ehto, kun edellä ollut keskiarvojen tuloehto jälkimmäisen ehdon täyttävät satunnaismuuttujat ovat lisäksi tilastollisesti riippumattomia kaikki tilastollisesti riippumattomat satunnaismuuttujat ovat lineaarisesti riippumattomia, mutta kaikki lineaarisesti riippumattomat satunnaismuuttujat eivät välttämättä ole tilastollisesti riippumattomia Edellä olleista yhtälöistä nähdään, että yleisesti ottaen keskiarvot riippuvat ajasta (siis indeksistä n) Jos satunnaisprosessi on stationaarinen, näin ei ole: voidaan siis merkitä esim. m xn :n sijasta m x 18/144
Satunnaismuuttujan x n keskineliöarvo (mean square) on x 2 n:n keskiarvo: E [ x 2 ] n = x 2 p xn (x, n)dx Keskineliöarvoa nimitetään usein keskimääräiseksi tehoksi x n :n varianssi on [x n m xn ]:n keskineliöarvo: varianssi = E [ (x n m xn ) 2] = σ 2 x n Helposti voidaan osoittaa, että varianssi = E [ x 2 n] m 2 xn Keskiarvo, keskineliöarvo ja varianssi ovat hyvin yksinkertaisia satunnaismuuttujaa kuvaavia suureita 19/144
Käyttökelpoisempi suure on autokorrelaatio (autokorrelaatiosekvenssi), joka määritellään seuraavasti: γ xx (n, m) = E [x n x m] = missä { } tarkoittaa kompleksikonjugaattia x n x mp xn,x m (x n, n, x m, m)dx n dx m Satunnaisprosessin autokovarianssisekvenssi määritellään c xx (n, m) = E [(x n m xn )(x m m xm ) ] Toisaalta tämä voidaan kirjoittaa myös muotoon c xx (n, m) = γ xx (n, m) m xn m xm Huomaa, että sekä autokorrelaatio, että autokovarianssi ovat yleisessä tapauksessa kaksiulotteisia 20/144
Autokorrelaatio on satunnaisprosessin arvojen välisen riippuvuuden mitta Ristikorrelaatio kuvaa kahden satunnaismuuttujan välistä riippuvuutta Satunnaisprosessien {x n } ja {y m } ristikorrelaatio määritellään yhtälöllä γ xy (n, m) = E [x n y m] = xy p xn,y m (x, n, x, m)dx dy Ristikovarianssifunktio määritellään seuraavasti c xy (n, m) = E [(x n m xn )(y m m ym ) ] = γ xy (n, m) m xn m ym Edellä on jo havaittu, että satunnaisprosessin tilastolliset ominaisuudet voivat muuttua ajan funktiona 21/144
Stationaarinen satunnaisprosessi on kuitenkin tasapainotilassa, jossa tilastolliset ominaisuudet eivät riipu ajasta kertymäfunktio, autokorrelaatio ja ristikorrelaatio ovat ajasta riippumattomia (korrelaatiot riippuvat vain aikaerosta n m) Stationaariselle prosessille siis: m x = E [x n ] σx 2 = E [(x n m x ) 2] γ xx (n, n + m) = γ xx (m) = E [ x n x ] n+m Monet satunnaisprosessit eivät ole vahvasti stationaarisia (stationary in the strict sense), mikä tarkoittaa, että niiden kertymäfunktiot eivät ole aikainvariantteja, vaikka keskiarvo ja autokorrelaatio toteuttavat yo. yhtälöt Tällaisia prosesseja nimitetään laajassa mielessä stationaarisiksi (stationary in the wide sense) 22/144
Esimerkki satunnaisprosessin kuvaamisesta keskiarvoilla Esimerkki 1. Tarkastellaan edellä ollutta rahanheittoesimerkkiä (Bernoulli-prosessi). Määritä prosessin keskiarvo (odotusarvo), keskineliöarvo, varianssi ja autokorrelaatiosekvenssi. 23/144
Ratkaisu 1. m x = x xp x (x) Keskiarvo = (+1) Todennäköisyys [x n = +1] + ( 1) Todennäköisyys [x n = 1] = +1 p + ( 1) (1 p) = 2p 1 Keskineliöarvo E [ x 2] = (+1) 2 Todennäköisyys [x n = +1] + ( 1) 2 Todennäköisyys [x n = 1] = (+1) 2 p + ( 1) 2 (1 p) = 1 Siten varianssi on σ 2 x = E [ x 2] m 2 x = 1 (2p 1) 2 = 4p(1 p) 24/144
Koska prosessi oletettiin stationaariseksi, on autokorrelaatio γ xx (m) = E [ x n x ] {E [ x 2 n+m = n] = 1, m = 0 E [ x n xn+m] = E [xn ] E [ xn+m] = m 2 x, m 0 Jos p = 1/2: m x = 0 γ xx (m) = δ(m) 25/144
Aikakeskiarvot Edellä käsiteltiin satunnaisprosessin ominaisuuksia Ominaisuudet ovat tärkeitä monien teoreettisten asioiden tarkastelussa Käytännössä kuitenkin satunnaisprosessista ei ole käytetävissä kaikkia näytesekvenssejä, tavallisesti vain yksi Haluamme ehkä päätellä satunnaisprosessin satunnaislain tai määrittää joitakin satunnaisprosessin keskiarvosuureita käyttämällä vain tätä yhtä näytesekvenssiä Rahanheittoesimerkissä usean rahanheiton +1:n osuus pitäisi olla lähellä p:tä ja -1:n osuus lähellä 1 p:tä Määritellään satunnaisprosessin aikakeskiarvo x n = lim N 1 2N + 1 N n= N x n 26/144
Aika-autokorrelaatiosekvenssi määritellään seuraavasti x n x n+m = lim N 1 2N + 1 N n= N x n x n+m Nämä yhtälöt on määritelty äärettömälle määrälle satunnaismuuttujia, joten siten ne oikeastaan kuvaavat satunnaismuuttujaa eivätkä näytesekvenssiä Tiettyjen ehtojen ollessa voimassa (ns. ergodisuus) aikakeskiarvot ovat vakioita siten, että melkein kaikkien mahdollisten näytesekvenssien aikakeskiarvot ovat yhtäsuuria kuin tämä vakio Lisäksi kaikki aikakeskiarvot ovat yhtäsuuria kuin vastaavan kokonaisuuden keskiarvo Siis: x(n) = lim N 1 2N + 1 N n= N x(n) = E [x n ] = m x 27/144
ja x(n)x(n + m) = lim N 1 2N + 1 N n= N = E [ x n x n+m] = γxx (m) x(n)x(n + m) Aikakeskiarvo-operaattorilla on samat ominaisuudet kuin odotusarvo-operattorilla E [ ] Siten usein ei tehdä eroa satunnaismuuttujan x n ja sen arvon näytesekvenssissä x(n) välillä, ts. voidaan tulkita E [x(n)] = E [x n ] = x(n) prosessi, jolle tämä pätee on ergodinen prosessi Käytännössä usein tehdään oletus, että tietty sekvenssi on näytesekvenssi ergodisesta prosessista Silloin keskiarvot voidaan laskea yhdestä energialtaan äärellisestä sekvenssistä 28/144
Raja-arvoja (N ) ei tietenkään todellisuudessa voida laskea; sen sijaan lasketaan estimaatit x n N = x n x n+m N = 1 2N + 1 1 2N + 1 N n= N N n= N x n x n x n+m 29/144
aisuus 1: Satunnaissignaalien taajuustason tarkastelu Korrelaatio- ja kovariassisekvenssien ominaisuuksia Tarkastellaan kahta reaalista satunnaisprosessia {x n } ja {y n }, joiden autokorrealaatio, autokovarianssi, ristikorrelaatio ja ristikovarianssi ovat γ xx (m) = E [x n x n+m ] c xx (m) = E [(x n m x )(x n+m m x )] γ xy (m) = E [x n y n+m ] c xy (m) = E [(x n m x )(y n+m m y )] missä m x ja m y ovat prosessien keskiarvot Seuraavat ominaisuudet on helppo löytää c xx (m) = γ xx (m) m 2 x c xy (m) = γ xy (m) m x m y 30/144
aisuus 2: γ xx (0) = E [ x 2 n] = keskineliöarvo c xx (0) = σ 2 x = varianssi aisuus 3: γ xx (m) = γ xx ( m) c xx (m) = c xx ( m) γ xy (m) = γ yx ( m) c xy (m) = c yx ( m) aisuus 4: γ xy (m) c xy (m) γ xx (0)γ yy (0) c xx (0)c yy (0) 31/144
Erikoistapaus γ xx (m) γ xx (0) c xx (m) c xx (0) aisuus 5: Jos y n = x n n0, niin γ yy (m) = γ xx (m) c yy (m) = c xx (m) z-muunnos Olkoon Γ xx (z), C xx (z), Γ xy (z) ja C xy (z) sekvenssien γ xx (m), c xx (m), γ xy (m) ja c xy (m) z-muunnokset Sekvenssien γ xx (m) ja γ xy (m) z-muunnosten olemassaolon ehtona on, että m x = 0, jolloin on lisäksi Γ xx (z) = C xx (z) Γ xy (z) = C xy (z) 32/144
z-muunnoksiin liittyy seuraavia ominaisuuksia aisuus 1: aisuus 2: σ 2 x = 1 2πj C C xx (z)z 1 dz C xx (z) = C xx (1/z) C xy (z) = C yx(1/z ) Tehospektri Edellä ollut z-muunnoksen ominaisuus 1 on itse asiassa C xx (z):n z- käänteismuunnos m:n arvolla m = 0 Yleisesti siis c xx (m) = 1 2πj C C xx (z)z m 1 dz 33/144
Voidaan toisaalta määritellä c xx (n):n diskreettiaikainen Fourier-muunnos C xx (ω) = k= c xx (k)e jωk Tämän käänteismuunnos (IDTFT) pitäisi toisaalta olla autokovarianssisekvenssi c xx (m): c xx (m) = 1 π C xx (ω)e jωm dω 2π Lasketaan nyt c xx (0): π c xx (0) = 1 2π π π C xx (ω)dω Siten siis σ 2 x = 1 2π π π C xx (ω)dω 34/144
Kun m x = 0, varianssi on yhtä suuri kuin keskineliöarvo eli keskimääräinen teho Siten integraalissa oleva C xx (ω) kuvaa signaalin energian jakautumista eri taajuuksille ja siksi sitä nimitetään signaalin tehospektriksi tai pelkästään spektriksi Tällöin merkitään usein tehospektriä symbolilla S xx (ω): σ 2 x = 1 2π π π S xx (ω)dω Huom! On yleistä määritellä tehospektri myös autokorrelaation Fourier-muunnoksena, ts. S xx (ω) = Γ xx (ω) = γ xx (k)e jωk k= Tämän määrittelyn ongelma on, että Fourier-muunnosta ei ole, jos m x 0 On kuitenkin huomattava, että c xx (m) = γ xx (m), kun m x = 0 ja siksi myös niiden Fourier-muunnokset ovat yhtä suuria 35/144
Lineaaristen järjestelmien vaste satunnaisherätteelle Tarkastellaan lineaarista aikainvarianttia järjestelmää, jonka vaste y(n) herätteellä x(n) voidaan tunnetusti laskea konvoluutiosummalla y(n) = k= h(n k)x(k) = k= h(k)x(n k) Tiedetään, että jos järjestelmä on stabiili, y(n) on äärellinen, jos x(n) on äärellinen Olkoon sisäänmeno x(n) näytesekvenssi laajassa mielessä stationaarisesta satunnaisprosessista Sisäänmenoa voidaan kuvata keskiarvolla m x, autokorrelaatiolla γ xx (m) tai muilla toisen kertaluvun tilastollisilla ominaisuuksilla Ulostuloa voidaan kuvata samojen suureiden avulla 36/144
Ulostulon keskiarvoksi saadaan m y = E [y(n)] = k= = m x h(k)e [x(n k)] k= h(k) missä on käytetty keskiarvon ominaisuuksia E [x n + y m ] = E [x n ] + E [y m ] ja E [ax n ] = ae [x n ]. Koska järjestelmän taajuusvaste on H(ω) = k= h(k)e jωk voidaan ulostulon keskiarvolle kirjoittaa myös m y = H(0)m x 37/144
On selvää, että jos sisäänmeno on stationaarinen, myös ulostulo on stationaarinen Oletetaan hetkellisesti, että ulostulo ei ole stationaarinen Silloin ulostulon autokorrelaatiolle voidaan kirjoittaa γ yy (n, n + m) = E [y(n)y(n + m)] = E h(k)h(r)x(n k)x(n + m r) k= r= = h(k) h(r)e [x(n k)x(n + m r)] k= r= Palataan jälleen oletukseen, että x(n) ja siten myös y(n) ovat stationaarisia Silloin γ yy (n, n + m) = h(k) h(r)γ xx (m + k r) = γ yy (m) k= r= 38/144
Tehdään vielä muuttujanvaihto l = r k: γ yy (m) = = γ xx (m l) h(k)h(l + k) l= k= k= γ xx (m l)v(l) missä on määritelty v(l) = k= h(k)h(l + k) = h(l) h( l) Nyt havaitaan, että γ yy (m):n z-muunnos on Γ yy (z) = V (z)γ xx (z) = H(z)H(z 1 )Γ xx (z) 39/144
Sijoituksella z = e jω saadaan tehospektri Γ yy (ω) = H(ω) 2 Γ xx (ω) Tarkastellaan vielä sisäänmenon ja LTI-järjestelmän ulostulon ristikorrelaatiota γ xy (m) = E [x(n)y(n + m)] = E x(n) h(k)x(n + m k) k= = h(k)γ xx (m k) k= Jos oletetaan, että m x = 0, yo. lausekkeella on z-muunnos Γ xy (z) = H(z)Γ xx (z) 40/144
tai Fourier-muunnos (eli tulkitaan tehospektrinä) S xy (ω) = H(ω)S xx (ω) Tätä yhtälöä voidaan soveltaa järjestelmän siirtofunktion estimointiin ratkaistaan H(ω): H(ω) = S xy(ω) S xx (ω) 41/144
Kertauskysymyksiä 1. Miksi ei-determinististen signaalien käsittelyyn ei käytetä suoraan z-muunnosta tai Fourier-muunnosta (tai -sarjaa)? 2. Miten toimitaan em. työkalujen sijasta? 3. Miten määritellään Bernoulli-prosessi? 4. Osoita, että kolikonheittoesimerkin tuloksen energia on ääretön. 5. Mitä eroa on satunnaisprosessilla ja satunnaisprosessin toteutuksella? 6. Minkälainen on stationaarinen satunnaisprosessi? 7. Valkoisen kohinan peräkkäiset arvot eivät korreloi keskenään. Osoita, että nollakeskiarvoisen valkoisen kohinasekvenssin autokorrelaatiolle pätee γ xx (m) = σ 2 xδ(m) 42/144
8. Osoita, että valkoisen kohinasekvenssin tehospektri on vakio taajuuden suhteen. 9. Olkoon e(n) valkoinen kohinasekvenssi ja s(n) sekvenssi joka on lineaarisesti riippumaton e(n):stä. Osoita, että sekvenssi on myös valkoista kohinaa, ts. missä A on vakio. 10. Osoita, että varianssille σ 2 x n pätee y(n) = s(n)e(n) E [y(n)y(n + m)] = Aδ(m) E [ (x n m xn ) 2] = E [ x 2 n] m 2 xn 43/144
Johdanto Tehospektrin estimointi Tehospektrin estimointi äärellisen pituisesta näytesekvenssistä Energiatiheysspektrin laskenta Autokorrelaation ja tehospektrin estimointi: periodogrammi Tehospektrin estimointi DFT:n avulla Tehospektrin epäparametrinen estimointi Bartlettin menetelmä Welchin menetelmä Blackmanin-Tukeyn menetelmä Minimivarianssimenetelmä Tehospektrin parametrinen estimointi Yule-Walker-menetelmä Burgin menetelmä Kovarianssimenetelmät AR-mallin kertaluvun valinta 44/144
Tehospektrin estimointi: johdanto Tarkastellaan satunnaisprosesseina kuvattavien signaalien taajuusominaisuuksia Satunnaisuudesta johtuen taajuusominaisuuksia on tarkasteltava tilastollisesti Tarkoittaa sitä, että signaaleita kuvataan niiden keskiarvojen avulla Erityisesti autokorrelaatio on hyvä aikatason kuvaus satunnaissignaalista Fourier-muunnoksella saadaan tehospektri 45/144
Tehospektrin estimointi äärellisen pituisesta näytesekvenssistä Spektrin estimoinnin perusongelma on, että käytettävissä on vain äärellisen pituinen näytesekvenssi tilastollisesti stationaarisesta satunnaisprosessista (=äärettomän pitkä sekvenssi) Spektriestimaatista saadaan sitä parempi mitä pitempi näytesekvenssi Toisaalta jos satunnaisprosessi ei ole stationaarinen, ei voida ottaa hyvin pitkää näytesekvenssiä Tällöin on pyrittävä ottamaan mahdollisimman lyhyt näytesekvenssi, joka vielä kuvaa prosessia riittävästi Tarkastellaan seuraavassa yo. ongelmaa ensin deterministisillä signaaleilla 46/144
Energiatiheysspektrin laskenta Tarkastellaan deterministisen signaalin spektrin määrittämistä äärellisen pituisesta sekvenssistä Sekvenssi x(n) saadaan analogisesta signaalista x a (t) näytteistämällä näytteenottotaajuudella F s Jos x a (t) on energialtaan äärellinen, sillä on Fourier-muunnos X a (F ) = x a (t)e j2πf t dt Parsevalin teoreeman perusteella E = x a (t) 2 dt = X a (F ) 2 df 47/144
Suure X a (F ) 2 kuvaa signaalin energian jakautumista taajuuden funktiona, ja sitä kutsutaan siten signaalin energiatiheysspektriksi (tai tehospektri), siis S xx (F ) = X a (F ) 2 Edellä on lisäksi havaittu, että energiatiheysspektri on autokorrelaation R xx (τ) = x a(t)x a (t + τ)dτ Fourier-muunnos (edellyttäen, että m x = 0): S xx (F ) = R xx (τ)e j2πf τ dτ Jatketaan tarkastelua diskreettiaikaisena 48/144
x(n):n Fourier-muunnos on X(ω) = X(f) = x(n)e jωn n= n= x(n)e j2πfn X(f) voidaan ilmaista analogisen signaalin x a (t) spektrin avulla seuraavasti ( ) F X = F s F s missä F/F s = f k= X a (F kf s ) Jos x a (t) on kaistaltaan rajoitettu siten, että ei tapahdu laskostumista ( ) F X = F s X a (F ) F s 49/144
Näytteistetyn signaalin spektri on silloin ekvivalenttinen jatkuva-aikaisen kanssa Näytteistetyn signaalin energiatiheysspektri on siten ( ) S xx (f) = F 2 X = Fs 2 X a (F ) 2 F s Energiatiheysspektri on myös autokorrelaatiosekvenssin r xx (k) = n= x (n)x(n + k) Fourier-muunnos (tutulla ehdolla) S xx (f) = k= r xx (k)e j2πkf On siis olemassa kaksi tapaa laskea energiatiheysspektri: 50/144
1. Suora tapa: lasketaan x(n):n Fourier-muunnos S xx (f) = X(f) 2 = 2 x(n)e j2πfn n= 2. Epäsuora tapa: lasketaan autokorrelaatiosekvenssi r xx (m) ja sen Fouriermuunnos S xx (f) = r xx (k)e j2πkf k= Käytännössä x(n):stä on käytettävissä vain äärellisen pituinen näytesekvenssi, ei äärettömän pitkää sekvenssiä Tämä vastaa sitä, että todellinen x(n) kerrotaan suorakaideikkunalla w(n) x(n) = x(n)w(n) = { x(n), 0 n N 1 0, muuten 51/144
Fourier-muunnoksen ikkunointiteoreeman mukaan kahden sekvenssin tulon Fourier-muunnos saadaan konvoluutiointegraalilla X(f) = 1/2 1/2 X(α)W (f α)dα Ikkunointi aiheuttaa tehon vuotamista sellaisille taajuuksille, joilla sitä todellisuudessa ei ole Siten ikkunoidun sekvenssin spektri on vääristynyt todellisesta S exex (f) = X(f) 2 = N 1 n=0 x(n)e j2πfn 2 52/144
Satunnaissignaalien autokorrelaation ja tehospektrin estimointi: periodogrammi Satunnaissignaalien käsittelyn yhteydessä on opittu, että stationaarisilla satunnaisprosesseilla on ääretön kesto ja siten ääretön energia Fourier-muunnosta ei ole olemassa Spektri määritellään siksi autokorrelaatiofunktion Fourier-muunnoksena γ xx (τ) = E [x (t)x(t + τ)] Γ xx (F ) = γ xx (τ)e j2πf τ dτ Käytännössä satunnaisprosessista on käytettävissä vain yksi toteutus (näytesekvenssi) eikä todellista autokorrelaatiota siten voida määrittää 53/144
Voidaan kuitenkin laskea estimaatti autokorrelaatiolle (aikakeskiarvoautokorrelaatio) R xx (τ) = 1 2T 0 missä 2T 0 on havainnointiaika T0 T 0 x (t)x(t + τ)dτ Jos stationaarinen satunnaisprosessi on ergodinen, havainnointiajan lähestyessä ääretöntä, lähestyy estimaatti todellista autokoreelaatiota γ xx (τ) = lim R xx(τ) T 0 = lim T 0 1 2T 0 T0 T 0 x (t)x(t + τ)dτ Siten aikakeskiarvoautokorrelaatiota R xx (τ) voidaan käyttää satunnaisprosessin autokorrelaation estimaattina 54/144
R xx (τ):n Fourier-muunnosta voidaan lisäksi käyttää tehospektrin estimaattina T0 P xx (F ) = R xx (τ)e j2πf τ dτ T 0 = 1 [ T0 ] T0 x (t)x(t + τ)dt e j2πf τ dτ 2T 0 T 0 T 0 = 1 2 T0 x(t)e j2πf t dt 2T 0 T 0 Todellinen tehospektri on estimaatin P xx (F ) odotusarvo T 0 :n lähestyessä ääretöntä Γ xx (F ) = lim E [P xx(f )] T 0 = lim E 1 T0 2 x(t)e j2πf t dt T 0 2T 0 T 0 55/144
Edeltä havaitaan taas, että tehospektrin laskentaan on kaksi mahdollisuutta 1. Suora tapa: x:n Fourier-muunnoksen laskenta 2. Epäsuora tapa: autokoreelaation laskenta välituloksena Tarkastellaan seuraavassa tehospektrin estimointia yhdestä satunnaisprosessin näytesekvenssistä oletetaan, että analogisesta signaalista x a (t) otetaan näytteitä näytteenottotaajuudella F s > 2B, missä B on suurin signaalissa esiintyvä taajuus näytteistämällä saadaan sekvenssi x(n), 0 n N 1 Näytteistä voidaan laske aikakeskiarvoautokorrelaatio eli autokorrelaation estimaatti r xx(m) = r xx(m) = 1 N m 1 N m N m 1 n=0 N 1 n= m x (n)x(n + m), m = 0, 1,..., N 1 x (n)x(n + m), m = 1, 2,..., 1 N 56/144
Tämän Fourier-muunnos antaa estimaatin tehospektrille P xx(f) = N 1 m= N +1 r xx(m)e j2πfm Autokorrelaation estimaatin laskennassa käytettävä normalisointikerroin N m johtaa siihen, että estimaatin odotusarvo on satunnaisprosessin todellinen autokorrelaatio, ts. E [r xx(m)] = 1 N m N m 1 n=0 E [x (n)x(n + m)] = γ xx (m) Estimaattia r xx(m) sanotaan siksi biasoimattomaksi eli harhattomaksi estimaatiksi Koska odotusarvo on yhtäsuuri kuin todellinen autokorrelaatio ja lisäksi koska voidaan osoittaa, että estimaatin varianssi lähestyy nollaa, kun N, sanotaan, että r xx (m) on autokorrelaation konsistentti estimaatti 57/144
Harhaton estimaatti ei anna luotettavaa tulosta varsinkaan suurilla viiveen m arvoilla kun m lähestyy N:ää, summaan tulee vain vähän keskiarvottavia termejä Tuloksen parantamiseksi voidaan käyttää biasoitua eli harhallista estimaattia: r xx (m) = 1 N r xx (m) = 1 N N m 1 n=0 N 1 n= m x (n)x(n + m), m = 0, 1,..., N 1 x (n)x(n + m), m = 1, 2,..., 1 N Harhallisella estimaatilla r xx (m) on harha (bias) m γ xx (m)/n, koska sen keskiarvo on E [r xx (m)] = 1 N N m 1 n=0 E [x (n)x(n + m)] = ( 1 m ) γ xx (m) N 58/144
Harhallisella estimaatilla on kuitenkin pienempi varianssi kuin harhattomalla estimaatilla Se on lisäksi asymptoottisesti biasoimaton, koska lim E [r xx(m)] = γ xx (m) N Lisäksi estimaatin varianssi lähestyy nollaa, kun N, joten myös r xx (m) on autokorrelaation konsistentti estimaatti Biasoimattoman ja biasoidun autokorrelaatioestimaatin vertailuesimerkki Käytetään harhallista estimaattia tehospektrin estimointiin P xx (f) = N 1 m= (N 1) r xx (m)e j2πfm 59/144
Toisaalta, jos sijoitetaan autokorrelaation harhallisen estimaatin lauseke r xx (m):n paikalle, saadaan P xx (f) = 1 N N 1 2 x(n)e j2πfn n=0 = 1 N X(f) 2 missä X(f) on näytesekvenssin x(n) Fourier-muunnos Laatikossa olevaa muotoa nimitetään periodogrammiksi Tehospektrin estimaatin keskiarvoksi saadaan E [P xx (f)] = E = N 1 m= (N 1) N 1 m= (N 1) r xx (m)e j2πfm = ( 1 m ) N γ xx (m)e j2πfm N 1 m= (N 1) E [r xx (m)] e j2πfm 60/144
Saatu lauseke voidaa tulkita siten, että tehospektrin estimaatin keskiarvo on ikkunoidun autokorrelaatiofunktion ( γ xx (m) = 1 m ) γ xx (m) N Fourier-muunnos Ikkunafunktiota nimitetään Bartlett-ikkunaksi w(n) = ( 1 m ) N Fourier-muunnoksen ikkunointiteoreeman mukaan estimoidun spektrin keskiarvo on E [P xx (f)] = N 1 m= (N 1) γ xx (m)e j2πfm = 1/2 1/2 = Γ xx (f) W B (f) = 1 2π Γ xx(ω) W B (ω) Γ xx (α)w B (f α)dα 61/144
missä W B (f) on Bartlett-ikkuna spektri Konvoluution vaikutusta voidaan demonstroida helposti tarkastelemalla signaalia x(n) = M 1 k=0 A k e jω kn, < n < Signaalin spektri on X(ω) = M 1 n=0 M 1 k=0 A k e jω kn e jωn = M M 1 k=0 A k δ(ω ω k ) Kun spektri lasketaan katkaistusta sekvenssistä, saadaan periodogrammi P xx (ω) = 1 2π = M 2π π π M 1 k=0 [ M M 1 k=0 A k δ(ω ω k ) A k W B (ω ω k ) ] W B (ω α)dα 62/144
todellisen spektrin impulssit ovat korvautuneet samassa kohdassa olevilla ikkunafunktion spektreillä Autokorrelaation estimaatista laskettu tehospektri kärsii siten samoista ongelmista, jotka aiheutuvat aikatason sekvenssin katkaisusta Estimoidun spektrin havaitaan olevan asymptoottisesti biasoimaton, ts. lim N N 1 m= (N 1) r xx (m)e j2πfm = m= γ xx (m)e j2πfm = Γ xx (f) Voidaan osoittaa, että periodogrammi ei ole todellisen tehospektrin konsistentti estimaatti, ts. periodogrammi ei konvergoidu todelliseksi tehospektriksi, nimittäin varianssin voidaan osoittaa olevan var [P xx (f)] = Γ 2 xx(f) [ 1 + ( )] sin 2πfN N sin 2πf 63/144
N:n lähestyessä ääretöntä lim var [P xx(f)] = Γ 2 xx(f) N (konsistentin estimaatin tapauksessa pitäisi lähestyä nollaa) 64/144
Periodogrammi: yhteenveto Autokorrelaation estimaatit r xx(m) ja r xx (m) ovat todellisen autokorrelaation γ xx (m) konsistentteja estimaatteja (eli yhtyvät todelliseen, kun N ) Harhallisella estimaatilla r xx (m) on kuitenkin bias Harhallisen estimaatin r xx (m) Fourier-muunnos P xx (f) (eli periodogrammi) ei ole todellisen tehospektrin Γ xx (f) konsistentti estimaatti Periodogrammi on kuitenkin asymptoottisesti biasoimaton estimaatti todellisesta tehospektristä Äärellisen pituisen sekvenssin tehospektrin estimaatilla on kuitenkin bias Tarvitaan parempia menetelmiä, joiden varianssi on pienempi Ohita autokorrelaatioesimerkki 65/144
Esimerkki: biasoimaton vs. biasoitu autokorrelaatioestimaatti Esimerkki 2. Eräästä signaalista on käytettävissä kolme näytettä x(n) = 0.5, 0, 0.5 Laske estimaatti signaalin autokorrelaatiosta biasoimattomalla ja biasoidulla autokorrelaatioestimaatilla. Kumman arvelet olevan lähempänä todellista ja miksi? 66/144
Ratkaisu 2. Biasoimaton autokorrelaatioestimaatti r xx = 0.1667, 0, 0.25 Biasoitu autokorrelaatioestimaatti r xx = 0.1667, 0, 0.08 Autokorrelaation suurin arvo tulisi olla viivellä 0. Biasoimattomassa tapauksessa näin ei ole. Oletetaan siksi, että biasoitu on totuudenmukaisempi. 67/144
Periodogrammin laskenta DFT:llä Jatkuva periodogrammi P xx (f) voidaan laskea DFT:n avulla Jos näytepisteitä on N kappaletta, on laskettava vähintään N-pisteinen DFT P xx ( k N ) = 1 N N 1 2 x(n)e j2πnk/n, k = 0, 1,..., N 1 n=0 jolloin saadaan näytteitä jatkuvasta spektristä taajuuksilla f k = k/n Käytännössä näin harva näytteistys ei anna kovin hyvää kuvaa jatkuvasta spektristä P xx (f) Lasketaan P xx (f) useammassa pisteessä Lisätään nollia sekvenssin perään (zero padding) siten, että datapisteitä on yhteensä L 68/144
L-pisteinen DFT on silloin P xx ( k L ) = 1 N N 1 2 x(n)e j2πnk/l, k = 0, 1,..., L 1 n=0 On huomattava, että nollien lisääminen ja DFT:n laskenta L > N pisteessä EI paranna DFT:n resoluutiota Nollien lisäyksellä spektriin vain interpoloidaan lisää pisteitä N-pisteisen DFT:n pisteiden väliin ts. nollien lisäyksellä ei saada paremmin näkyviin lähekkäisiä taajuuksia Resoluution määrää sekvenssin alkuperäinen pituus Erityistä hyötyä nollien lisäämisestä on, kun DFT:n pituus kasvatetaan lähimpään 2:n potenssiin voidaan käyttää FFT:tä laskentaan 69/144
Tehospektrin epäparametrinen estimointi Parametrinen vs. epäparametrinen Epäparametrisessa estimoinnissa ei tehdä mitään oletusta siitä, minkälaisesta prosessista data on peräisin Epäparametrisia menetelmiä ovat Bartlettin menetelmä Welchin menetelmä Blackmanin-Tukeyn menetelmä 70/144
Bartlettin menetelmä (keskiarvotettu periodogrammi) Menetelmässä keskiarvotetaan useassa osassa laskettua periodogrammia Menetelmä koostuu kolmesta osasta 1. N-pisteinen sekvenssi jaetaan K:hon osaan siten, että jokaisen pituus on M (K = N/M: osat eivät mene päällekäin) x i (n) = x(n + im), i = 0, 1,..., K 1 2. Jokaiselle osalle lasketaan periodogrammi P (i) xx (f) = 1 M M 1 n=0 x(n)e j2πfn 2 n = 0, 1,..., M 1 3. Lasketaan laskettujen K:n periodogrammin keskiarvo, i = 0, 1,..., K 1 P B xx(f) = 1 K K 1 i=0 P (i) xx (f) 71/144
Menetelmän ominaisuudet spektrin keskiarvo on E [ P B xx(f) ] = 1 K K 1 i=0 E [ ] P xx (i) (f) = E [ ] P xx (i) (f) Yksittäisen periodogrammin keskiarvoksi saadaan E [ ] P xx (i) (f) = M 1 m= (M 1) = Γ xx (f) W B (f) ( 1 m ) γ xx (m)e j2πfm M Havaitaan, että konvoluutiolauseke on sama kuin periodogrammin tapauksessa, mutta erona on, että Bartlett-ikkunan pituus on lyhentynyt (N M) Vaikutus on resoluution pieneneminen (heikkeneminen) K:een osaan 72/144
Resoluution pienenemisen vastapainoksi varianssi pienenee K:een osaan var [ P B xx(f) ] = 1 K 1 K 2 i=0 var [ ] P xx (i) (f) = 1 [ ] K var P xx (i) (f) Valkoiselle kohinalle var [ P B xx(f) ] = 1 K Γ2 xx(f) [ 1 + ( )] sin 2πfM M sin 2πf 73/144
Welchin menetelmä: muokattujen periodogrammien keskiarvotus Welchin menetelmässä on kaksi eroa Bartlettin menetelmään verrattuna: 1. Dataosat saavat mennä päällekkäin 2. Osia ikkunoidaan ennen periodogrammin laskentaa 74/144
Welchin menetelmä on siten: 1. N-pisteinen sekvenssi jaetaan L:ään osaan siten, että jokaisen pituus on M x i (n) = x(n + id), i = 0, 1,..., L 1 n = 0, 1,..., M 1 missä M D on päällekkäin menevien näytteiden lukumäärä 2. Jokaiselle osalle lasketaan ikkunoitu periodogrammi P (i) xx (f) = 1 MU M 1 n=0 2 x(n)w(n)e j2πfn, i = 0, 1,..., L 1 missä U on normalisointikerroin, joka ottaa ikkunafunktion tehon huomioon U = 1 M M 1 n=0 w 2 (n) 75/144
3. Lasketaan laskettujen L:n periodogrammin keskiarvo P W xx(f) = 1 L L 1 i=0 P (i) xx (f) Keskiarvo ja varianssi Welchin estimaatin keskiarvo on E [P w xx(f)] = 1 L L 1 i=0 E [ ] P (i) xx (f) = E [ ] P (i) xx (f) Ikkunoidun periodogrammin keskiarvolle voidaan jälleen johtaa E [ ] P (i) xx (f) = Γ xx (f) W (f) 76/144
missä W (f) on ikkunafunktion spektri W (f) = 1 MU M 1 n=0 w(n)e j2πfn 2 normalisoituna kertoimella U Normalisoinnista seuraaa, että 1/2 1/2 W (f)df = 1 Welchin menetelmän varianssi on hankalampi laskea kuin aiemmin, jos dataosat menevät päällekkäin V.o.e., jos L = K (ei päällekkäisyyttä) var [ Pxx(f) W ] = 1 [ ] L var P (i) xx (f) 1 L Γ2 xx(f) 77/144
V.o.e., jos päällekkäisyys on 50 %:sta (L = 2K) ja käytetään Bartlett-ikkunaa: Verrataan Bartlettin menetelmään: var [ P W xx(f) ] 9 8L Γ2 xx(f) var [ P W xx(f) ] = 9 16 var [ P B xx(f) ] 78/144
Blackmanin-Tukeyn menetelmä Bartlettin ja Welchin menetelmät vähensivät spektriestimaatin varianssia periodogrammiin verrattuna keskiarvottamalla periodogrammia Toinen tapa vähentää periodogrammin tilastollista vaihtelevuutta on tasoittamalla periodogrammia Muistetaan, että periodogrammi lasketaan autokorrelaatiosekvenssin estimaatin Fourier-muunnoksena Äärellisen pituisella näytesekvenssillä autokorrelaatioestimaatin varianssi on kuitenkin suuri, koska suurilla viiveillä m autokorrelaatiosekvenssin estimaatti keskiarvottuu vain vähän Esim. autokorrelaation harhallinen estimaatti viiveellä m = N 1: r xx (N 1) = 1 x(0)x(n 1) N vaikka N olisikin suuri, ovat r xx (m):n arvot m N epäluotettavia 79/144
Periodogrammin varianssin vähentämiseksi voidaan siis joko 1. vähentää autokorrelaatioestimaatin varianssia, tai 2. vähentää epäluotettavien autokorrelaation estimaatin arvojen vaikutusta periodogrammiin Blackmanin-Tukeyn menetelmässä tehospektrin laskennassa autokorrelaatioestimaattia ikkunoidaan Blackmanin-Tukeyn tehospektriestimaatti on siten P BT xx (f) = M 1 m= (M 1) r xx (m)w(m)e j2πfm missä r xx (m) on autokorrelaation harhallinen estimaatti Huomaa, että ikkunafunktiolla (viiveikkuna vs. dataikkuna) on oltava seuraavat ominaisuudet 1. 0 w(m) w(0) = 1 80/144
2. w( m) = w(m) 3. w(m) = 0, m > M 1 Mikäli ehdot eivät täyty saattaa tehospektriestimaatissa olla negatiivisia arvoja joillakin taajuuksilla Keskiarvo ja varianssi Blackman-Tukey-spektriestimaatin keskiarvo on E [ P BT xx (f) ] = missä aiemmasta jo tiedetään 1/2 1/2 E [P xx (α)] W (f α)dα E [P xx (α)] = 1/2 1/2 Γ xx (θ)w B (α θ)dθ W B (f) on Bartlett-ikkunan Fourier-muunnos ja W (f) Blackman-Tukeyn tehospektriestimaatin laskennassa käytettävän ikkuna Fourier-muunnos 81/144
Spektriestimaatin keskiarvo on siten E [ P BT xx (f) ] = 1/2 1/2 1/2 1/2 Γ xx (θ)w B (α θ)w (f α)dαdθ Keskiarvolle voidaan esittää lauseke myös aikatason suureiden avulla: E [ P BT xx (f) ] = M 1 m= (M 1) E [r xx (m)] w(m)e j2πfm = M 1 m= (M 1) γ xx (m)w B (m)w(m)e j2πfm missä Bartlett-ikkuna on w B = { 1 m N, m < N 0 muuten 82/144
Blackman-Tukeyn tehospektriestimaatin laskennassa käytettävän ikkunan w(n) pituuden M tulisi selvästi olla M << N, jotta saataisiin tavoiteltua periodogrammin tasoittumista Jos tämä ehto täyttyy, on spektriestimaatin keskiarvo E [ P BT xx (f) ] 1/2 1/2 Γ xx (θ)w (f θ)dθ = Γ xx (f) W (f) missä W (f) on viiveikkunan Fourier-muunnos Varianssin laskenta on työläämpi ja vaatii joidenkin oletusten tekoa Lähtökohtana varianssin yleinen lauseke: var [ P BT xx (f) ] = E { [P BT xx (f) ] 2 } { E [ P BT xx (f) ]} 2 Tuloksen laskemisessa tehdään seuraavat oletukset: 83/144
satunnaisprosessi on valkoista kohinaa N >> M >> 1 Ikkunafunktion spektri kapea prosessin todelliseen tehospektriin verrattuna Lopputulokseksi saadaan var [ P BT xx (f) ] Γ 2 xx(f) [ 1 N Γ 2 xx(f) 1 N 1/2 1/2 M 1 W 2 (θ)dθ m= (M 1) ] w 2 (m) missä w(n) on ikkunafunktion aikatason sekvenssi Havaitaan, että varianssin minimoimiseksi ikkunan leveyden M tulisi olla mahdollisimman pieni, jotta summaan tulisi mahdollisimman vähän termejä Toisaalta pieni M huonontaa spektriestimaatin resoluutiota (ikkunafunktion resoluutio kääntäen verrannollinen pituuteen) 84/144
Suositellaan, että M:n maksimiarvo olisi M = N/5 85/144
Resoluutio Epäparametristen menetelmien vertailu Resoluutiolla tarkoitetaan spektriestimaatin kykyä erottaa lähekkäiset taajuudet toisistaan Resoluutio voidaan määritellä usealla tapaa Yksi tapa on määritellä ikkunafunktion puolen tehon eli 6 db:n kaistanleveys Tällaisella määrittelyllä periodogrammin resoluutio riippuu Bartlettin ikkunan kaistanleveydestä ω = 0.89 2π/N Res [P xx (f)] = 0.89 2π N Tällä perusteella voidaan likimain ratkaista tarvittava näytteiden lukumäärä N, kun halutaan erottaa taajuudet, jotka ovat toisistaan ω:n päässä N = 0.89 2π ω 86/144
Muokatussa (ikkunoidussa) periodogrammissa käytetty ikkunafunktio muuttaa resoluutiota Taulukko 1: Muokatun periodogrammin resoluutio Ikkuna Resoluutio Suorakaide 0.89 (2π/N) Bartlett 1.28 (2π/N) Hanning 1.44 (2π/N) Hamming 1.30 (2π/N) Blackman 1.68 (2π/N) Bartlettin menetelmässä resoluutio määräytyy M:n pituisen Bartlett-ikkunan kaistanleveyden perusteella ja on siten Res [ P B xx(f) ] = 0.89 2π M = 0.89K 2π N = K Res [P xx(f)] Welchin menetelmän resoluutio määräytyy samoin M:n pituisen Bartlett-ikkunan sekä käytetyn dataikkunan kaistanleveyden perusteella 87/144
verrattuna periodogrammiin korvataan siis N M:llä resoluution lausekkeessa Muuttuvuus Edellä on havaittu, että estimointimenetelmää valitessaan joutuu tekemään kompromissin resoluution ja varianssin välillä Käytetään kahta suuretta arvioimaan kompromissin onnistumista Määritellään muuttuvuus (eng. variability) ν = var [P xx(ω)] {E [P xx (ω)]} 2 joka on toisaalta normalisoitu varianssi Toinen käytettävä suure on arvoluku (eng. figure of merit) M = ν ω missä ω on estimointimenetelmän resoluutio 88/144
Mitä pienempi M on, sitä parempi estimointimenetelmä on resoluution ja varianssin välisen kompromissin suhteen Tarvittavat arvot eri menetelmille on laskettu jo aiemmin tulokset on koottu taulukkoon (menetelmissä, jotka riippuvat parametreista ja ikkunoista on käytetty samoja ikkunoita kuin edellä) 89/144
Taulukko 2: Epäparametristen menetelmien ominaisuuksia Menetelmä Muuttuvuus ν Resoluutio ω Arvoluku M Periodogrammi 1 0.89 2π N Bartlett 1 0.89K 2π K N Welch 9 1 1.28 2π 8K M Blackman-Tukey 9M 0.64 2π 8 N M 0.89 2π N 0.89 2π N 0.72 2π N 0.43 2π N 90/144
Minimivarianssimenetelmä Edellä esiteltiin epäparametrisia menetelmiä, joita nimitetään usein myös klassisiksi menetelmiksi Minimivarianssimenetelmää (MV) ei usein lasketa kuuluvaksi klassisiin menetelmiin, vaikka menetelmää ei toisaalta lueta parametrisiinkään menetelmiin menetelmää kutsutaan myös ensimmäisen esittäjän mukaan Caponin menetelmäksi MV-menetelmässä spektri estimoidaan suodattamalla prosessi kapeakaistaisista suodattimista koostuvalla suodatinpankilla Menetelmän periaatteen selvittämiseksi tulkitaan ensin periodogrammia suodatinpankkina Olkoon h i (n) N:n pituinen FIR-suodatin h i (n) = 1 N ejnω i w R (n) = { 1 N ejnω i, 0 n N 1 0, muuten 91/144
Suodattimen taajuusvaste on H i (ω) = N 1 n=0 h i (n)e jnω = e j(ω ω i)(n 1)/2 sin [N(ω ω i)/2] N sin [(ω ω i )/2] Suodatin on kaistanpäästösuodatin, jonka keskitaajuus on ω i, ja jonka kaistanleveys on noin ω = 2π/N Suodatetaan WSS-prosessia x(n) tällä suodattimella, saadaan ulostulo y i (n) = x(n) h i (n) = n k=n N +1 x(k)h i (n k) = 1 N n k=n N +1 x(k)e j(n k)ω i H i (ω i ) = 1, joten sisäänmenon ja ulostulon tehot ovat yhtäsuuria taajuudella ω i : P xx (ω i ) = P yy (ω i ) Jos suodatin on riittävän kapeakaistainen, voidaan x(n):n tehospektrin olettaa olevan vakio suodattimen päästökaistalla 92/144
Silloin ulostulon keskimääräinen teho on E [ y i (n) 2] = 1 2π π π ja siten x(n):n teho kulmataajuudella ω i : P xx (ω) H i (ω) 2 dω ω 2π P xx(ω i ) = 1 N P xx(ω i ) P xx (ω i ) NE [ y i (n) 2] Siten siis: jos y i (n):n teho pystytään estimoimaan, voidaan x(n):n tehospektri kulmataajuudella ω i estimoida yo. yhtälöllä Yksinkertainen, mutta raaka tapa tehon estimointiin on ottaa vain yksi näyte signaalista: Ê [ y i (n) 2] = y i (N 1) 2 Toisaalta edeltä saadaan yhtälön oikealle puolelle: y i (N 1) 2 = 1 N 2 N 1 x(k)e jkω i k=0 2 93/144
Siten x(n):n estimoitu teho taajuudella ω i on P xx (ω i ) = N y i (N 1) 2 = 1 N N 1 x(k)e jkω i k=0 2 Yhtälö vastaa periodogrammin yhtälöä taajuudella ω i Tehospektriestimaatti saadaan useilla taajuuksilla, kun suodattimia h i (n) kytketään rinnakkain muodostetaan suodatinpankki Periodogrammissa suodatinpankki on sisäänrakennettuna, joten sitä ei tarvitse oikeasti toteuttaa Edellä siis saatiin tulos, että jos x(n):n tehospektri on likimain vakio kapeakaistaisen suodattimen päästökaistalla, on suodattimen ulostulon teho likimain E [ y i (n) 2] P xx (ω i ) ω 2π 94/144
Signaalin x(n) teho kulmataajuudella ω i voidaan estimoida siten yhtälöllä P xx (ω i ) = E [ y i (n) 2] /(2π) Periodogrammin tapauksessa ongelmana on, että suodatinpankissa käytettävät suodattimet ovat samanlaisia (poikkeavat vain keskikulmataajuudeltaan): suodattimet ovat datasta riippumattomia kun signaali sisältää merkittävästi energiaa suodattimen sivukeilojen taajuusalueella, tehospektriestimaatti on virheellinen Parempi ratkaisumalli olisi käyttää datasta riippuvia suodattimia näiden suodattimien tulisi olla optimaalisia siinä mielessä, että ne suodattaisivat mahdollisimman paljon päästökaistan ulkopuolelta Suunnitellaan nyt tällainen suodatin: Olkoon suodatin FIR-tyyppinen, jonka kertoimet saavat olla kompleksisia 95/144
Impulssivaste on g i (n) ja taajuusvaste G i (ω) Asetetaan ensin suodattimen vahvistus 1:ksi päästökaistalla G i (ω i ) = p g i (n)e jnω i = 1 n=0 Merkitään suodattimen kertoimia vektorilla g i : g i = [g i (0), g i (1),..., g i (p)] T Olkoon e i vektori, joka koostuu termeistä e jkω i, k = 0, 1,..., p: e i = [ 1, e jω i, e j2ω i,..., e jpω i ] T Näillä merkinnöilla ehto G i (ω) = 1 voidaan kirjoittaa muotoon g H i e i = e H i g i = 1 96/144
Suodatetaan nyt satunnaisprosessi tällä suodattimella. Ulostulo on y i (n) = p g i (n)x(n k) = x T (n)g i k=0 missä x = [x(n), x(n 1),..., x(n p)] T Suodattimen ulostulon varianssi on σ 2 y i = E [ y i (n) 2] = E [ g H i x (n)x T (n)g i ] = g H i Γ xx g i missä Γ xx on x(n) autokorrelaatiomatriisi Suodattimen suunnitteluongelma: varianssin minimointi rajoitteella G i (ω i ) = 1 Tulokseksi voidaan osoittaa saatavan g i = Γ 1 xx e i e H i Γ 1 xx e i 97/144
Varianssin minimiarvo on silloin min g i E [ y i (n) 2] = 1 e H i Γ 1 xx e i Huomaa, että autokorrelaatiomatriisia lukuunottamatta kaikki termit ovat taajuuden funktioita Saatua varianssin minimiarvoa käytetään usein minimivarianssimenetelmän tehospektriestimaattina: P MV xx (f) = 1 e H i (f)γ 1 xx e i (f) Täsmälleen ottaen spektri pitäisi vielä skaalata suodattimien (normalisoidulla) kaistanleveydellä /(2π) Suodatin riippuu datasta, joten kaistanleveys on määritettävä datan perusteella 98/144
Valkoisella kohinalla kaistanleveyden voidaan osoittaa olevan 2π = 1 p + 1 Minimivarianssimenetelmän tehospektriestimaattina voidaan siten käyttää muotoa Pxx MV p + 1 (f) = e H i (f)γ 1 xx e i (f) Usein spektrin absoluuttiarvo ei ole tärkeää, jolloin ensimmäinen estimaatti riittää 99/144
Autokorrelaatiomatriisi Määritellään vektori x, joka sisältää satunnaisprosessin x(n) arvot n = 0,..., p: x = [x(0), x(1),..., x(p)] T Lasketaan sitten tulo xx H : x(0)x (0) x(0)x (1)... x(0)x (p) xx H = x(1)x (0) x(1)x (1)... x(1)x (p)... x(p)x (0) x(p)x (1)... x(p)x (p) Jos x(n) on WSS, tulon odotusarvo on r xx (0) rxx(1) rxx(2)... rxx(p) R xx = E [ xx H] r xx (1) r xx (0) rxx(1)... rxx(p 1) = r xx (2) r xx (1) r xx (0)... rxx(p 2).... r xx (p) r xx (p 1) r xx (p 2)... r xx (0) 100/144
R xx :ää nimitetään autokorrelaatiomatriisiksi 101/144
Tehospektrin parametrinen estimointi Edellä esitellyissä epäparametrisissä menetelmissä oletetaan, että autokorrelaatio on nolla lasketun viivealueen ulkopuolella Aiheuttaa mm. spektripiikkien madaltumista ja niiden tehon hajoamista pääkeilaan ja sivukeiloihin Parametrisissä menetelmissä oletetaan esim. autokorrelaatiofunktion käyttäytyvän jonkin mallin mukaisesti Tehospektri estimoidaan ko. mallin Fourier-muunnoksella Spektripiikit voidaan saada paremmin vastaamaan todellista Toisaalta huonolla mallin rakenteen valinnalla voidaan tehdä suuria virheitä Parametrisia menetelmiä ovat Yule-Walker-menetelmä Burgin menetelmä Kovarianssimenetelmät 102/144
Tehospektrin parametrinen estimointi tausta Tehospektrin parametrisen estimoinnin taustana on, että analysoitavaa dataa x(n) pyritään ennustamaan LTI-järjestelmällä, jonka lähtosignaali on x(n) ja tulosignaali w(n) p x(n) = a k x(n k) + k=1 q b k w(n k) k=0 jonka siirtofunktio on H(z) w(n) on ennustusvirhe ja ideaalisesti sen ajatellaan olevan valkoista kohinaa Tämän järjestelmän käänteisjärjestelmän 1/H(z) ulostulo herätteellä x(n) on valkoista kohinaa w(n) Käytettäessä ennustavaa LTI-järjestelmää tehospektrin estimoinnissa, ei tulosignaali w(n) ole käytettävissä 103/144
Lähtösignaalia (eli analysoitavaa dataa x(n)) mallinnetaan siksi stationaarisena satunnaisprosessina Tulosignaali w(n) voidaan silloin myös olettaa stationaariseksi satunnaisprosessiksi Silloin datan tehospektri on Γ xx (f) = H(f) 2 Γ ww (f) missä Γ ww (f) on tulosignaalin w(n) tehospektri ja H(f) on mallin taajuusvaste Jos w(n) ajatellaan valkoiseksi kohinaksi, sen autokorrelaatiolle pätee γ ww (m) = σ 2 wδ(m) missä σ 2 w on w(n):n varianssi 104/144
Silloin analysoitavan datan x(n) tehospektri on Γ xx (f) = σw 2 B(f) 2 A(f) 2 105/144
Malli-LTI-järjestelmästä erotetaan usein kolme eri tapausta: Autoregressiivinen (AR) prosessi Autoregressiivinen (AR) prosessi saadaan, kun kertoimet {b k } = 0, k > 0 ja b 0 = 1. Differenssiyhtälö on silloin x(n) = p a k x(n k) + w(n) k=1 Liukuvan keskiarvon (moving average, MA) prosessi Liukuvan keskiarvon prosessi saadaan, kun kertoimet {a k } = 0, k > 0. Aikatason kuvaus on silloin q x(n) = b k w(n k) k=0 Autoregressiivinen, liukuvan keskiarvon (ARMA) prosessi Tämä on molemmat edelliset sisältävä prosessi: p x(n) = a k x(n k) + k=1 q b k w(n k) k=0 106/144
Mallin parametrien määrittäminen Yleisesti ARMA-järjestelmille voidaan johtaa seuraava yhteys γ xx (m) = p k=1 a kγ xx (m k), m > q p k=1 a kγ xx (m k) + σw 2 q m k=0 h(k)b k+m, 0 m q γxx( m), m < 0 Erityisesti AR-järjestelmälle yhtälö voidaan esittää matriisimuodossa γ xx (0) γ xx ( 1) γ xx ( 2)... γ xx ( p + 1) γ xx (1) γ xx (0) γ xx ( 1)... γ xx ( p + 2).... γ xx (p 1) γ xx (p 2) γ xx (p 3)... γ xx (0) a 1 a 2. a p γ xx (1) = γ xx (2). γ xx (p) ja σ 2 w = γ xx (0) + p a k γ xx ( k) k=1 107/144
Yhtälöitä nimitetään Yule-Walker-yhtälöiksi Kerroinmatriisi on ns. Toeplitz-matriisi ja se voidaan kääntää tehokkaasti Levinson-Durbin-algoritmilla 108/144
Yule-Walker-menetelmä (autokorrelaatiomenetelmä) Yule-Walker-menetelmässä autokorrelaatio estimoidaan suoraan datasta käyttämällä tavallisesti autokorrelaationa γ xx (m) biasoitua estimaattia autokorrelaatiolle r xx (m) = 1 N N m 1 n=0 x (n)x(n + m), m 0 Biasoidun estimaatin käyttö takaa, että autokorrelaatiomatriisi on positiividefiniitti ja siten sillä on aina käänteismatriisi Yule-Walker-menetelmän tehospektri saadaan seuraavasti: P YW xx (f) = σ 2 wp p 2 1 + â p (k)e j2πfk k=1 109/144
missä â p (k) ovat Yule-Walker-yhtälöstä saatavat AR-mallin parametriestimaatit ja p σ wp 2 = Êf p = r xx (0) + â p (k)rxx(k) k=1 on estimoitu p:n asteen ennustajan minimikeskineliöarvo Keskineliöarvolle voidaan kirjoittaa myös muoto p σ wp 2 = Êf p = r xx (0) (1 â k (k) 2) k=1 Yule-Walker-menetelmälle on ominaista: koska prosessin autokorrelaation γ xx (m) paikalla joudutaan käyttämään estimaattia r xx (m), dataan käytetään suorakaideikkunaa resoluutio ei yhtä hyvä kuin menetelmissä, jotka eivät ikkunoi (Burg, kovarianssimenetelmät) ei hyvä menetelmä lyhyille näytesekvensseille (pitkillä näytteillä toimii yhtä hyvin kuin muut) 110/144
spektriviivojen jakautuminen (spectral line splitting): mallin kertaluku p liian suuri (vrt. funktion mallittaminen polynomilla) Malli aina stabiili (spektrin estimoinnissa ei välttämätön ominaisuus) Autokorrelaatiomenetelmässä voidaan käyttää myös harhatonta autokorrelaation estimaattia ongelmana on, että autokorrelaatiomatriisi ei ole välttämättä positiividefiniitti (käänteismatriisin olemassaolo ei taattua) spektriestimaatin varianssi voi olla suuri 111/144
Burgin menetelmä Burgin menetelmän perustana on eteenpäin ja taaksepäin ennustavien ennustajien ennustusvirheen minimointi Oletetaan, että meillä on data x(n), n = 0, 1,..., N 1 Eteenpäin ja taaksepäin ennustavien ennustajien yhtälöt ovat m x(n) = a m (k)x(n k) k=1 m x(n m) = a m(k)x(n + k m) k=1 Ennustajien ennustusvirheet ovat ê f m(n) = x(n) x(n) ja ê b m(n) = x(n m) x(n m): 112/144
m ê f m(n) = x(n) + a m (k)x(n k) k=1 ê b m(n) = x(n m) + m a m(k)x(n + k m) k=1 Ennustusvirheen keskineliöarvo on ε m = N 1 n=m ( êf m (n) 2 + êb m (n) 2) Tämä virhe minimoidaan siten, että kertoimet a m (k)(1 m p) täyttävät Levinson-Durbin-rekursioyhtälöt a m (k) = { a m 1 (k) + K m a m 1(m k), 1 k m 1 k m, k = m 113/144
missä K m = a m (m) on ennustajan ristikkototeutuksen m.s kerroin K m :lle voidaan eo. minimoinnilla johtaa tulos K m = N 1 n=m 2 N 1 n=m ê f m 1 (n)[êb m 1(n 1)] ( ê f m 1 (n) 2 + êb m 1 (n 1) ), m = 1, 2,..., p ( ) 2 Tämän yhtälön nimittäjässä on pienimmän neliösumman estimaatit eteenpäin ja taaksepäin ennustusvirheelle, Êf m 1, Êb m 1 Siten K m voidaan ilmaista muodossa K m = 2 N 1 n=m ê f m 1 (n)[êb m 1(n 1)] Ê m 1, m = 1, 2,..., p 114/144