Digitaalinen kuvankäsittely Tik (3 ov) L. Syksy 1999

Digitaalinen kuvankäsittely Tik-61.247 (3 ov) L Syksy 1999 Luennot: Laskuharjoitukset: Jorma Laaksonen Patrik Hoyer

1. Luento 14.9.1999 4 1. Yleistä kurssista............................................. 6 2. Johdanto................................................. 10 3. Ihmissilmän rakenne........................................... 14 4. Digitaalisen kuvan esitysmuoto..................................... 18 2. Luento 21.9.1999 23 1. Kuva-alkioiden yhteyksiä......................................... 24 2. Fourier-muunnokset........................................... 30 3. Luento 28.9.1999 43 1. Fourier-muunnokset, jatkoa....................................... 44 2. Muita kuvamuunnoksia......................................... 48 4. Luento 5.10.1999 56 1. Muita kuvamuunnoksia, jatkoa..................................... 57 2. Kuvien ehostaminen........................................... 62 5. Luento 12.10.1999 70 1. Kuvien ehostaminen harmaataso-operaatioin, jatkoa.......................... 71 2. Spatiaalisuodatus ehostusmenetelmänä................................. 76 6. Luento 19.10.1999 83 1. Kuvien ehostaminen taajuustason operaatioin.............................. 84 2. Värien käyttö kuvankäsittelyssä..................................... 93 2

7. Luento 26.10.1999 98 1. Värien käyttö kuvankäsittelyssä, jatkoa................................. 99 2. Kuvien entistäminen........................................... 103 8. Luento 2.11.1999 106 1. Kuvien entistäminen, jatkuu....................................... 107 9. Luento 16.11.1999 118 1. Kuvien entistäminen, jatkuu....................................... 119 2. Kuvien tiivistäminen........................................... 123 10.Luento 23.11.1999 131 1. Kuvien tiivistäminen, jatkuu....................................... 132 11.Luento 30.11.1999 152 1. Kuvien tiivistäminen, jatkuu vielä.................................... 153 2. Kuvien segmentointi........................................... 161 12.Luento 7.12.1999 167 1. Kuvien segmentointi, jatkuu....................................... 168 2. Tenttivaatimukset............................................ 180 3

1. Luento 14.9.1999 Sisältö 1. Yleistä kurssista......................................... 6 1.1 Kurssin suorittaminen...................................... 6 1.2 Ilmoittautuminen........................................ 6 1.3 Tiedotukset........................................... 6 1.4 Luennot............................................. 6 1.5 Laskuharjoitukset........................................ 8 1.6 Kirja............................................... 8 1.7 Luentomonisteet......................................... 8 1.8 Kurssitoimittaja......................................... 8 1.9 Harjoitustehtävä......................................... 9 1.10 Tentti.............................................. 9 1.11 Suhde vanhaan Tik-61.147-kurssiin............................... 9 2. Johdanto............................................. 10 2.1 Päämäärät ja osa-alueet.................................... 10 2.2 Historiaa............................................. 12 4

2.3 Yhteydet muihin aloihin..................................... 12 2.4 Sovelluksia............................................ 13 3. Ihmissilmän rakenne....................................... 14 3.1 Kuvanmuodostus........................................ 15 3.2 Kirkkauden erottelu....................................... 16 3.3 Adaptoituminen valaistukseen.................................. 17 3.4 Machin nauhat......................................... 17 4. Digitaalisen kuvan esitysmuoto................................. 18 4.1 Koordinaatit........................................... 18 4.2 Kuvamalli............................................ 19 4.3 Näytteenotto ja kvantisointi.................................. 20 4.4 Kuvan subjektiivinen laatu................................... 22 5

1. Yleistä kurssista 1.1 Kurssin suorittaminen Kurssin suorittaminen sisältää pakollisen harjoitustehtävän ja tentin suorittamisen. 1.2 Ilmoittautuminen Kursille voi ilmoittautua http://wwwtopi.hut.fi/imp/course.htx?tik-61.247, jos se sattuu toimimaan. 1.3 Tiedotukset Kurssiin liittyvistä asioista tiedotetaan osoitteessa http://www.cis.hut.fi/opinnot/tik-61.247, ryhmässä news://nntp.tky.hut.fi/opinnot.tik.informaatiotekniikka sekä Informaatiotekniikan laboratorion ilmoitustaululla kolmannen kerroksen aulassa B-käytävän suulla. 1.4 Luennot Luennot pidetään tiistaisin kello 12 14 salissa T3. Luennoitsija erikoisopettaja TkT Jorma Laaksonen (mailto:jorma.laaksonen@hut.fi). 6

Luentokalvot ovat luennon jälkeen nähtävillä http://www.cis.hut.fi/opinnot/tik-61.247/dkk-kalvot.pdf. Luennoitsijan vastaanotto luennon jälkeen tiistaisin kello 14 15 huoneessa B304. 7

1.5 Laskuharjoitukset Laskuharjoitukset keskiviikkoisin kello 14 16 salissa T3 alkaen 22.9.1999. Harjoitukset pitää DI Patrik Hoyer (mailto:patrik.hoyer@hut.fi). Harjoitustehtävät ovat jo ennakkoon nähtävillä http://www.cis.hut.fi/opinnot/tik-61.247/laskarit99.html. 1.6 Kirja Rafael C. Gonzales & Richard E. Woods, Digital Image Processing, Addison-Wesley, 1992, 3rd edition. Kirjasta luetaan kappaleet 1 7. Tutustumiskappale nähtävillä Informaatiotekniikan laboratorion sihteerin Tarja Pihamaan huoneessa B326 olevassa harmaassa peltisessä vetolaatikostossa. 1.7 Luentomonisteet Laskuharjoitukset ratkaisuineen sekä luentokalvot ilmestyvät Otatiedon kautta. 1.8 Kurssitoimittaja Jonne Sundell (mailto:jonne.sundell@hut.fi) F N. 8

1.9 Harjoitustehtävä Kurssin suoritukseen kuuluu pakollinen harjoitustehtävä, joka arvostellaan hyväksytty/hylätty-periaatteella. Harjoitustyö on saatava hyväksytysti läpi tammikuun tenttiä edeltävään päivään mennessä. Seuraava aikaraja on vuoden kuluttua. Harjoitustehtävä tulee lokakuun aikana esille osoitteeseen http://www.cis.hut.fi/opinnot/tik-61.247/harkkatyo.html. 1.10 Tentti Tenttejä järjestetään neljä: ensimmäinen 14. joulukuuta, toinen tammikuun tenttikaudella, kolmas kevään luentokaudella ja viimeinen syksyn 2000 luentokaudella. Tentissä neljä tehtävää à 6 pistettä eli maksimi 24 pistettä. 9 pisteellä pääsee läpi. 1.11 Suhde vanhaan Tik-61.147-kurssiin Kurssi korvaa vanhan samannimisen kurssin Tik-61.147, jonka laajuus oli 2,5 ov ja joka ei sisältänyt pakollista harjoitustyötä, sekä vanhan Tik-61.174 Digitaalisen kuvankäsittelyn ohjelmatyö -kurssin (1ov). Sisällöltään ja tentiltään kurssit ovat ainakin vielä syksyn 1999 vaatimusten mukaan samat. Vanhoista kursseista voi edelleen suorittaa toisen, mikäli toinen on jo suoritettu. Tällöin puolestaan ei voi suorittaa uutta kuvankäsittelyn kurssia. 9

2. Johdanto Vanha klisee: Yksi kuva kertoo enemmän kuin tuhat sanaa. Arvioilta 75% ihmisen saamasta informaatiosta perustuu näköhavaintoihin. Kuvainformaation käsittelyn tarve suuri. Digitaalisen kuvankäsittelyn yleistymistä on perinteisesti hidastanut käytettävien datamäärien suurudesta johtunut tarvittavien laitteiden kalleus ja käsittelyn hitaus. Tästä perinteestä on nyt päästy eroon ja yhä useammat sovellukset ovat tulleet käytännössä toteuttamiskelpoisiksi. 2.1 Päämäärät ja osa-alueet Päämääriltään digitaalinen kuvankäsittely jakautuu päähaaroihin: Kuvainformaation parantaminen ihmisen tulkintaa varten. kuvankäsittely: kuva kuva pisteoperaatiot suodatus entistäminen geometrian korjaus viivojen ja reunojen vahvistus kuvien kohdistus muutosanalyysi 10

Kuvainformaation käsittely koneellista tulkintaa varten. kuva-analyysi / konenäkö: kuva jotain muuta kohteentunnistus kuvasta kuvan selittäminen kuva-analyysi robottinäkö Kuvien tiivistäminen Rekonstruktio projektioista Käytettävät menetelmät riippuvat paljon sovelluksesta. 11

2.2 Historiaa Sanomalehtikuvien siirto merikaapelia pitkin Lontoosta New Yorkin 1920-luvulla. Avaruusluotainten lähettämien kuvien parantelu 1960-luvulla Yhdysvalloissa. Satelliittikuvien käsittely 1970-luvun alussa. 2.3 Yhteydet muihin aloihin Hahmontunnistus Signaalinkäsittely Tekoäly Digitaalinen kuvankäsittely Optiikka Havaintopsykologia Graafinen tekniikka 12

2.4 Sovelluksia Sotilassovellukset Graafinen ala Kaukokartoitus Lääketiede Teollinen laaduntarkastus Robottinäkö Kuvansiirto ja -arkistointi Arkeologia, fysiikka, tähtitiede, biologia, rikostutkinta,... 13

3. Ihmissilmän rakenne linssi verkkokalvo tarkan näön alue fovea iiris optinen akseli näköhermo sokea täplä Verkkokalvon reseptorit Tapit (cones) kirkasnäkö (photopic vision) 6 7 miljoonaa keskellä verkkokalvoa (5 ) herkkiä väreille yksityiskohtien näkeminen oma hermo jokaisella 14

Sauvat (rods) hämäränäkö (scotopic vision) 75 150 miljoonaa jakautuneena verkkokalvolle (160 ) ei värinäköä yleiskuvan muodostaminen useita samassa hermossa 3.1 Kuvanmuodostus 15 m 2.55 mm 100 m 17 mm Erona optisiin linsseihin on silmän mukautumiskyky ja joustavuus. 15

3.2 Kirkkauden erottelu I + I I I taustan intensiteetti I intensiteetin muutos keskellä I c muutos havaittavissa 50% kokeista I c /I Weberin suhde I c /I pieni: pienet suhteelliset intensiteettimuutokset havaitaan eli hyvä erottelukyky I c /I suuri: vain suuret suhteelliset intensiteettimuutokset havaitaan eli huono erottelukyky Kirkkaassa valaistuksessa Weberin suhde on pienempi ja siten silmän suhteellinen erottelukyky parempi kuin hämärässä. 16

3.3 Adaptoituminen valaistukseen Silmän adaptaatiokyky valtava: 10 10 tasoa hämäräkynnykseltä häikäisyrajalle. Samanaikaisesti silmä voi kuitenkin adaptoitua vain tietylle kirkkausalueelle. Silmä ei siten voi adaptoitua kirkkaudeltaan erilaisiin yksityiskohtiin vaan ainoastaan keskimääräiseen kirkkauteen. Mielivaltaisen kuvapisteen ympäristössä voidaan havaita 10 20 intensiteettitasoa. Kuvan eri osissa adaptaatio muuttuu ja havaitaan eri intensiteettejä ja siten suurempi kokonaiserottelualue. Tasaisissa kuvissa vaaditaan yleensä yli 100 intensiteettitasoa. 3.4 Machin nauhat Vakiointensiteetti näyttää viereisen muutoksen vuoksi vaihtelevalta. Kynnykset korostuvat entisestään. 17

4. Digitaalisen kuvan esitysmuoto 4.1 Koordinaatit Digitaalinen kuva esitetään yleensä x- ja y-koordinaattien funktiona. Koordinaattijärjestelmän asettaminen vaihtelee. x y y y x x matemaattinen perinteinen Gonzalez&Woods 18

4.2 Kuvamalli f(x, y) vastaa valoenergiaa 0 < f(x, y) < Havaittu kuva jaetaan valaistuskomponenttiin i(x, y) ja heijastuskomponenttiin r(x, y): f(x, y) = i(x, y) r(x, y) joille pätee: 0 < i(x, y) < 0 < r(x, y) < 1 Digitoidun monokromaattisen kuvan harmaataso l on käytännössä kokonaisluku, l [0, L] l = 0 vastaa mustaa l = L vastaa valkoista 19

4.3 Näytteenotto ja kvantisointi Digitointi xy-koordinaattien suhteen vastaa kaksiulotteista näytteenottoa, kutsutaan spatiaaliseksi kvantisoinniksi. Valaistusamplitudin digitointia kutsutaan harmaataso- eli intensiteettikvantisoinniksi. Digitaalinen kuva esitetään N N matriisina: f(0, 0) f(0, 1) f(0, N 1) f(1, 0) f(1, 1) f(1, N 1) f(x, y)... f(n 1, 0) f(n 1, 1) f(n 1, N 1) Määrättävä spatiaaliresoluutio N ja harmaatasoresoluutio G. Yleensä kahden potensseja: Jolloin kuvan tallettamiseen tarvitaan bittejä: N = 2 n, G = 2 m b = N N m Televisiokuvan tasoon päästään, kun N = 512 ja m = 7. 20

N M = 384 256 N M = 192 128 N M = 96 64 N M = 48 32 G = 256 b = 786432 b = 196608 b = 49152 b = 12288 G = 64 b = 589824 b = 147456 b = 36864 b = 9216 G = 16 b = 393216 b = 98304 b = 24576 b = 6144 G = 4 b = 196608 b = 49152 b = 12288 b = 3072 21

4.4 Kuvan subjektiivinen laatu Resoluutioluvut ja bittimäärät eivät suoraan vastaa ihmisen kokemusta kuvan laadusta. Subjektiivisia arvioita voidaan tutkia isopreferenssikäyrillä, kuten kirjan sivuilla 38 39 esitetään. 22

2. Luento 21.9.1999 Sisältö 1. Kuva-alkioiden yhteyksiä.................................... 24 1.1 Naapuruus............................................ 24 1.2 Liitännäisyys........................................... 25 1.3 Polut............................................... 26 1.4 Etäisyysmitat.......................................... 27 1.5 Aritmeettiset, joukko-opilliset ja loogiset operaatiot...................... 28 1.6 Ympäristöoperaatiot....................................... 28 2. Fourier-muunnokset....................................... 30 2.1 Fourier-muunnospari jatkuvassa tapauksessa.......................... 30 2.2 Kaksiulotteinen Fourier-muunnospari jatkuvassa tapauksessa................. 32 2.3 Diskreetti Fourier-muunnospari................................. 33 2.4 Esimerkki: yksiulottteinen diskreetti Fourier-muunnos..................... 35 2.5 Kaksidimensioisen Fourier-muunnoksen ominaisuuksia..................... 36 23

1. Kuva-alkioiden yhteyksiä 1.1 Naapuruus Kuva-alkiolla eli pikselillä p, jolla on koordinaatit (x, y), on neljä naapuria vaaka- ja pystysuunnissa pisteissä (x + 1, y), (x 1, y), (x, y + 1) ja (x, y 1). Niitä kutsutaan p:n 4-naapureiksi ja merkitään N 4 (p). p:n neljä diagonaalinaapuria ovat (x + 1, y + 1), (x 1, y + 1), (x + 1, y 1) ja (x 1, y 1) ja niitä merkitään N D (p). p:n 8-naapurusto muodostuu N 4 (p):n ja N D (p):n yhdisteenä: N 8 (p) = N 4 (p) N D (p). Kuvan reunoilla naapurustot ovat vajaita. (x-1,y-1) (x,y-1) (x+1,y-1) (x-1,y) p (x,y) (x+1,y) (x-1,y+1) (x,y+1) (x+1,y+1) 24

1.2 Liitännäisyys Pikseleiden liitännäisyys eli yhtenevyys eli konnektiivisuus (connectivity) on tärkeä käsite kuvan kohteiden reunaviivojen määrittelyssä ja alueiden määräämisessä. Kaksi kuva-alkiota ovat liitännäisiä, jos ne ovat jossakin mielessä naapureita ja lisäksi harmaatasoarvoiltaan riittävän samankaltaisia. Harmaatasojen samankaltaisuus voidaan määritellä joukolla V. Esimerkiksi, jos vain kuva-alkiot, joiden intensiteetit ovat 59, 60 tai 61, ovat kiinnostavia, niin määritellään V = {59, 60, 61}. Määritellään pikseleille p ja q kolme eri liitännäisyystyyppiä: 4-liitännäisyys: p V q V q N 4 (p) 8-liitännäisyys: p V q V q N 8 (p) m-liitännäisyys eli sekaliitännäisyys: p V q V (q N 4 (p) q N D (p) N 4 (p) N 4 (q) = ) Sekaliitännäisyys eliminoi 8-liitännäisyydestä usein seuraavat monikäsitteiset polut. 0 1 1 0 1 1 0 1 1 0 1 0 0 1 0 0 1 0 0 0 1 0 0 1 0 0 1 4 8 m Kaksi kuva-aluetta S 1 ja S 2 ovat vierekkäisiä (adjacent), joss p, q : p S 1 q S 2 p ja q liitännäisiä 25

1.3 Polut Polku kuva-alkiosta p, jonka koordinaatit ovat (x, y), kuva-alkioon q, jonka koordinaatit ovat (s, t) on pikselijono: (x, y) = (x 0, y 0 ), (x 1, y 1 ),, (x n, y n ) = (s, t) Jonossa jokainen (x i+1, y i+1 ), i = 1,..., n, on liitännäinen (x i, y i ):n kanssa. n on polun pituus. Jono voidaan määritellä 4-, 8- ja m-liitännäisyyden mukaan. Kuvan osajoukkoon S kuuluvat alkiot p ja q ovat S:ssä liitännäisiä, joss on olemassa p:stä q:hun polku, jonka kaikki kuva-alkiot kuuluvat S:ään. Jos p on S:n kuva-alkio, p:n kanssa liitännäiset S:n alkiot muodostavat S:n yhtenäisen komponentin (connected component). Kaikki yhtenäisen komponentin pikselit ovat toisiinsa nähden liitännäisiä. Erilliset yhtenäiset komponentit ovat toisiinsa nähden pistevieraita, so. niillä ei ole yhteisiä jäseniä, so. niiden leikkaus on tyhjä. 26

1.4 Etäisyysmitat Olkoon p, q, ja z kuva-alkioita, joiden koordinaatit ovat vastaavasti (x, y), (s, t) ja (u, v). Etäisyysfunktio (metriikka) D toteuttaa seuraavat ehdot: D(p, q) 0 ja D(p, q) = 0 p = q D(p, q) = D(q, p) D(p, z) D(p, q) + D(q, z) Yleisesti käytettyjä etäisyysmäärittelyjä: D e (p, q) = (x s) 2 + (y t) 2 D 4 (p, q) = x s + y t D 8 (p, q) = max( x s, y t ) Euklidinen etäisyys D 4 -etäisyys eli city-block-etäisyys eli Manhattan-etäisyys D 8 -etäisyys eli šakkilautaetäisyys e 8 4 27

Kahden pisteen välinen D 4 -etäisyys on lyhimmän niiden välisen 4-polun pituus. Vastaavasti D 8 -etäisyys ja 8-polku. Pisteestä etäisyydellä D 4 = 1 olevat kuva-alkiot ovat kyseisen pisteen 4-naapurit. Vastaavasti D 8 = 1 ja 8-naapurit. m-liitännäisyyttä vastaava etäisyys on polun pituus ja riippuu polun varrella olevien kuva-alkioiden arvoista ja niiden naapureista. Etäisyyttä kahden pikselin välillä voidaan tarkastella myös riippumatta niiden liitännäisyydestä. 1.5 Aritmeettiset, joukko-opilliset ja loogiset operaatiot Kuvien välillä voidaan määritellä tavanomaiset aritmeettiset (+,,*,/), joukko-opilliset (,, \) ja loogiset (,, ) operaatiot. Kuvien täytyy tällöin useimmiten olla keskenään saman kokoisia. Jotkut määrittelyt ovat mielekkäitä vain binaarisille kuville. 1.6 Ympäristöoperaatiot Suuri osa digitaalisen kuvankäsittelyn menetelmistä perustuu aritmeettisten (tai loogisten) operaatioiden suorittamiseen kunkin kuva-alkion määrätyssä ympäristössä. Operaatioita kutsutaan eri nimillä: maskioperaatiot, templaattioperaatiot, ikkunaoperaatiot, suodatusoperaatiot,... Aritmeettiset ympäristöoperaatiot voidaan lausua pikseleiden harmaa-arvojen z i ja maskin kertoimien w i avulla. 28

z 1 z 2 z 3 w 1 w 2 w 3 z 4 z 5 z 6 w 4 w 5 w 6 z 7 z 8 z 9 w 7 w 8 w 9 Esimerkiksi 3 3-kokoinen maski, jolla lasketaan ympäristön keskiarvo: 9 z = 1 9 (z 1 + z 2 + + z 9 ) = 1 9 i=1 z i Yleisemmässä tapauksessa voidaan maskin avulla laskea painotettu summa: z = 9 w i z i i=1 Operaatio vastaa vektorimuotoista sisä- eli pistetuloa: z = w T z, missä w ja z ovat painokertoimista ja kuva-alkion ympäristöstä muodostetut vektorit. 29

2. Fourier-muunnokset Fourier-muunnokset digitaalisen kuvankäsittelyn kannalta tärkein 2-dimensioisten kuvamuunnosten laji. Muita esim. kosini-, Walsh-, Hadamard-, Haar-, Slant- ja Hotelling- eli Karhunen-Loève-muunnokset. Kuvamuunnoksia tarvitaan: ehostuksessa entistämisessä koodauksessa sisällön kuvailussa 2.1 Fourier-muunnospari jatkuvassa tapauksessa F{f(x)} = F (u) = F 1 {F (u)} = f(x) = f(x)e j2πux dx F (u)e j2πux du F (u) on kompleksinen: F (u) = R(u) + ji(u) = F (u) e jφ(u) 30

F (u) = R 2 (u) + I 2 (u) φ(u) = arctan I(u) R(u) P (u) = F (u) 2 = R 2 (u) + I 2 (u) Fourier-spektri vaihekulma tehospektri f(x) F (u) A AX 0 0 X x -3/X -2/X -1/X 0 1/X 2/X 3/X u F (u) = X 0 Ae j2πux dx = A j2πu (e j2πux 1) = A sin(πux) e jπux πu F (u) = AX sin(πux) πux 31

2.2 Kaksiulotteinen Fourier-muunnospari jatkuvassa tapauksessa F{f(x, y)} = F (u, v) = F 1 {F (u, v)} = f(x, y) = f(x, y)e j2π(ux+vy) dx dy F (u, v)e j2π(ux+vy) du dv F (u, v) on kompleksinen: F (u, v) = R(u, v) + ji(u, v) = F (u, v) e jφ(u,v) F (u, v) = R 2 (u, v) + I 2 (u, v) φ(u, v) = arctan I(u,v) R(u,v) P (u, v) = F (u, v) 2 = R 2 (u, v) + I 2 (u, v) Fourier-spektri vaihekulma tehospektri 32

2.3 Diskreetti Fourier-muunnospari Jatkuva-argumenttinen funktio f(x) voidaan diskretoida tasaväliseksi sekvenssiksi: {f(x 0 ), f(x 0 + x), f(x 0 + 2 x),..., f(x 0 + (N 1) x)} Merkinnät saadaan yksinkertaisemmiksi sopimalla, että diskreettiä funktiota voidaan merkitä kuten aiemmin merkittiin jatkuvaa: f(x) = f(x 0 + x x), x = 0, 1,..., N 1 Määritellään nyt diskreetti Fourier-muunnos- ja -käänteismuunnospari: F (u) = 1 N N 1 x=0 f(x)e j2πux/n, u = 0, 1,..., N 1 N 1 f(x) = F (u)e j2πux/n, x = 0, 1,..., N 1 u=0 Diskretointiväleille pätee: u = 1 N x 33

Kaksiulotteisessa tapauksessa: F (u, v) = 1 MN f(x, y) = M 1 x=0 M 1 N 1 u=0 v=0 N 1 y=0 f(x, y)e j2π(ux/m+vy/n), u = 0, 1,..., M 1, v = 0, 1,..., N 1 F (u, v)e j2π(ux/m+vy/n), x = 0, 1,..., M 1. y = 0, 1,..., N 1 Huomattava, että muunnospari on vakiokertoimien osalta epäsymmetrinen. Joskus muunnospari esitetään myös symmetrisenä, jolloin molemmissa on kerroin 1/MN. Toisaalta, jos kyseessä on neliömuotoinen kuva, so. M = N, voidaan kaavat kirjoittaa symmetrisiksi kertoimilla 1/N. 34

2.4 Esimerkki: yksiulottteinen diskreetti Fourier-muunnos f(x) f(x) = f(x 0 + x x) 4 3 2 1 f(x 0 + x) f(x 0 ) f(x 0 + 2 x) f(x 0 + 3 x) 4 3 2 1 0 0 0 0.25 0.50 0.75 1.00 1.25 x 0 1 2 3 x 0 x 1 x 2 x 4 x F (0) = 1 4 F (1) = 1 4 F (2) = 1 4 F (3) = 1 4 3 x=0 3 x=0 f(x)e 0 = 1 (f(0) + f(1) + f(2) + f(3)) = 3.25 4 (keskiarvo) f(x)e j2πx/4 = 1 4 (2 1 + 3 j + 4 1 + 4 j) = 1 ( 2 + j) 4 3 f(x)e j4πx/4 = 1 4 (2 1 + 3 1 + 4 1 + 4 1) = 1 4 x=0 3 x=0 f(x)e j6πx/4 = 1 4 (2 1 + 3 j + 4 1 + 4 j) = 1 (2 + j) 4 F (0) = 3.25 F (1) = 1 4 1 5 0.56 F (2) = 4 = 0.25 F (3) = 1 5 0.56 4 35

2.5 Kaksidimensioisen Fourier-muunnoksen ominaisuuksia Dynamiikan kompressointi Jos 2D-Fourier-muunnosta käytetään tehospektrin visualisoimiseen, dynamiikkaa täytyy kompressoida, koska kuvissa yleensä on energiaa taajuustason origon läheisyydessä huomattavasti enemmän kuin reunoilla. Separoituvuus Muunnos voidaan kirjoittaa M = N-tapauksessa: F (u, v) = 1 N = 1 N = 1 N D(u, v) = c log(1 + F (u, v) ) N 1 N 1 x=0 N 1 x=0 N 1 x=0 y=0 f(x, y)e j2π(ux+vy)/n ( N 1 e j2πux/n y=0 e j2πux/n NF y {f(x, y)} = NF x {F y {f(x, y)}} f(x, y)e j2πvy/n ) 2D-muunnos voidaan siis hajottaa kahdeksi peräkkäiseksi 1D-muunnokseksi. Tarvittavien laskuoperaatioiden määrän muutos on tällöin luokkaa O(N 4 ) O(2N 3 ). 36

Siirto eli translaatio f(x, y)e j2π(u 0x+v 0 y)/n F (u u 0, v v 0 ) f(x x 0, y y 0 ) F (u, v)e j2π(ux 0+vy 0 )/N Siirto toisessa tasossa vastaa vaihekulman muutosta toisessa tasossa ja päinvastoin. Translaatio ei vaikuta Fourier- eikä tehospektriin, koska eksponenttitermin itseisarvo on aina yksi. Visualisointitarkoituksessa usein siirretään Fourier-tason origo alueen kulmasta keskelle: u 0 = v 0 = N/2, e j2π(u 0x+v 0 y)/n = e jπ(x+y) = ( 1) (x+y) f(x, y)( 1) (x+y) F (u N/2, v N/2) Kuva ( 1) (x+y) itse asiassa vastaa kaksiulotteista Nyquist-taajuutta. 37

Jaksollisuus eli periodisuus F (u, v) = F (u + N, v) = F (u, v + N) = F (u + N, v + N) Muunnos on siis molempiin suuntiin jaksollinen periodilla N. Konjugaattisymmetria F (u, v) = F ( u, v) F (u, v) = F ( u, v) Kierto eli rotaatio Napakoordinaatistoesityksessä x = r cos θ, y = r sin θ, u = ω cos φ, x = ω sin φ voidaan osoittaa, että kaksidimensioinen Fourier-muunnos toteuttaa: f(r, θ + θ 0 ) F (ω, φ + θ 0 ) 38

Lineaarisuus Fourier-muunnosoperaattori F{ } on lineaarinen, mikä on seurausta siitä, että se on sekä distributiivinen F{f 1 (x, y) + f 2 (x, y)} = F{f 1 (x, y)} + F{f 2 (x, y)} että skaalausinvariantti joten F{af(x, y)} = af{f(x, y)} F{af 1 (x, y) + bf 2 (x, y)} = af{f 1 (x, y)} + bf{f 2 (x, y)} Kokoskaalaus Kokoskaalaukselle pätee f(ax, by) 1 F (u/a, v/b) ab Keskiarvo Kuvan keskiarvo f(x, y) voidaan lausua havaitsemalla: f(x, y) = 1 N 2 N 1 x=0 N 1 y=0 f(x, y) = 1 F (0, 0) N 39

Laplace-operaatio Reunanetsinnässä usein käytettävä Laplace-operaattori voidaan lausua kaksidimensioisen Fourier-muunnoksen avulla: 2 f(x, y) = 2 f x 2 + 2 f y 2 F{ 2 f(x, y)} = 4π 2 (u 2 + v 2 )F (u, v) Kyseessä on siis ilmeinen ylipäästösuodin, jonka vaste origossa on nolla. Konvoluutio Lineaariset suodatusoperaatiot voidaan tulkita konvoluutioina. Konvoluution määritelmät: f(x) g(x) = f(a)g(x a) da yksiulotteinen jatkuva tapaus f(x, y) g(x, y) = f(a, b)g(x a, y b) da db kaksiulotteinen jatkuva tapaus M 1 f(x) g(x) = 1 M m=0 f e(m)g e (x m) yksiulotteinen diskreetti tapaus f(x, y) g(x, y) = 1 M 1 N 1 MN m=0 n=0 f e(m, n)g e (x m, y n) kaksiulotteinen diskreetti tapaus Laajennetut sekvenssit f e (x, y) ja g e (x, y) muodostetaan laskostumisen estämiseksi jatkamalla alkuperäisiä A B:n 40

ja C D:n pituisia sekvenssejä f(x, y) ja g(x, y) nollilla siten, että M A + C 1 N B + D 1 Konvoluutioteoreema Konvoluutioiden tärkeys piilee konvoluutioteoreemassa, jonka mukaan tuloa kuva- eli spatiaalitasossa vastaa konvoluutio taajuustasossa ja päinvastoin. f(x, y) g(x, y) F (u, v) G(u, v) f(x, y) g(x, y) F (u, v) G(u, v) Siten kuvan konvoloiminen eli suodattaminen lineaarisella maskilla voidaan toteuttaa pisteittäisenä kertolaskuna taajuustasossa. Tarvittavien operaatioiden lukumäärän suuruusluokka vähenee tällöin O(N 2 W 2 ) O(N 2 ), missä N on kuvan ja W maskin koko. Fourier-muunnoksen ja -käänteismuunnoksen toteuttaminen vie luonnollsesti oman aikansa, mutta tarvitsee tehdä vain kerran, mikäli suoritetaan useita peräkkäisiä taajuustason operaatioita. 41

Korrelaatio f(x) g(x) = f (a)g(x + a) da yksiulotteinen jatkuva tapaus f(x, y) g(x, y) = f (a, b)g(x + a, y + b) da db kaksiulotteinen jatkuva tapaus M 1 f(x) g(x) = 1 M m=0 f e (m)g e (x + m) yksiulotteinen diskreetti tapaus f(x, y) g(x, y) = 1 M 1 N 1 MN m=0 n=0 f e (m, n)g e (x + m, y + n) kaksiulotteinen diskreetti tapaus f (x, y) g(x, y) F (u, v) G(u, v) f(x, y) g(x, y) F (u, v) G(u, v) Korrelaatio on kuten konvoluutio, mutta: toista sekvenssiä ei käännetä, toinen termeistä kompleksikonjungoidaan, ei ole symmetrinen, so. f(x) g(x) g(x) f(x) Käytännössä usein kuitenkin suodatusmaski on symmetrinen ja reaalinen, joten konvoluutio ja korrelaatio yhtyvät. 42

3. Luento 28.9.1999 Sisältö 1. Fourier-muunnokset, jatkoa................................... 44 1.1 Whittaker-Shannonin näytteenottoteoria............................ 44 1.2 Diracin deltafunktio....................................... 44 1.3 Nopea Fourier-muunnos, FFT................................. 47 2. Muita kuvamuunnoksia..................................... 48 2.1 Walsh-muunnos......................................... 51 2.2 Hadamard-muunnos....................................... 53 43

1. Fourier-muunnokset, jatkoa 1.1 Whittaker-Shannonin näytteenottoteoria Jatkuva kaistarajoitettu funktio voidaan esittää näytteidensä avulla täydellisesti, mikäli näytteenottotaajuus on vähintään kaksinkertainen funktion sisältämään suurimpaan taajuuskomponenttiin nähden. Mikäli kaistarajoitusehto ei ole voimassa, tapahtuu laskostuminen eli vierastuminen (aliasing). Näytteenottotaajuuden puolikasta suuremmat taajuudet ovat systeemin kannalta vieraita. Äärellinen näytteiden määrä aiheuttaa käytännössä säröä. Diskreetti Fourier-muunnos lasketaan aina äärelliselle sekvenssille, joten spektri säröytyy. Mitä pidempi näytesekvenssi (eli mitä suurempi kuva), sitä korkeampi rajataajuus ja sitä vähemmän säröä. Jos kuvat olisivat jaksollisia, säröä ei esintyisi. Luonnolliset kuvat eivät valitettavasti koskaan ole jaksollisia. Toisaalta luonnolliset kuvat ovat usein itsessään varsin kaistarajoittuneita, so. eivät sisällä merkittävästi suuria taajuuksia. 1.2 Diracin deltafunktio Diracin deltafunktio δ(x, y) = 0 kaikkialla muulla paitsi origon infinitesimaalisessa ympäristössä. δ(x, y) dx dy = 1 44

δ(x, y) voidaan määritellä käyttäen sekvenssiä δ n (x, y) = n 2 rect(nx, ny), n = 1, 2,... y 1 rect(x, y) -1 1 x rect(x, y) = { 1, x 1 2, y 1 2, 0, muulloin -1 δ n (x, y) on nolla origokeskisen 1 n 1 n -neliön ulkopuolella ja vakio n2 ko. neliön sisällä. Tällöin ja δ n (x, y) dx dy = 1 ; n = 1, 2,... lim δ n(x, y) = δ(x, y) n Konvoluutio g(x, y) δ n (x, y) dx dy on g(x, y):n keskiarvo origokeskisessä 1 1 -neliössä, raja-arvona, kun n, saadaan g(0, 0). n n 45

Näytteenotto kuvasta pisteessä (x 0, y 0 ) saadaan konvoluutiona: f(x, y) δ(x x 0, y y 0 ) dx dy = f(x 0, y 0 ) Muodostetaan kaksidimensioinen impulssijono (tai -kenttä) s(x, y), jossa on piikkejä x:n välein x-suunnassa ja y:n välein y-suunnassa: y y y y s(x, y) y y x y x x x x x x Diskreetit näytteet jatkuvasta funktiosta f(x, y) saadaan s(x, y):llä kertomalla: s(x, y)f(x, y) S(u, v) F (u, v) 1 1 Taajuusalueessa S(u, v) on impulssijono, jossa piikit ovat :n välein u-suunnassa ja :n välein v-suunnassa. x y Laskostumista ei tapahdu, jos F (u, v) on siten kaistarajoitettu, että F (u, v):t eivät konvoluutiossa mene päällekkäin. Päädytään samanlaisiin tarkasteluihin kuin yksidimensioisessa tapauksessa. 46

1.3 Nopea Fourier-muunnos, FFT Diskreetti Fourier-muunnos voidaan yksidimensioisessa tapauksessa järjestää niin, että laskennan määrä vähenee N 2 :sta 1 2 N log 2 N:ään. Laskenta jaetaan rekursiivisesti osiin ja osia jälleen yhdistettäessä huomioidaan, että samaa laskentaa ei tarvitse suorittaa kahdesti. Havainnollistamiseen käytetään usein perhoskaaviota : F m (p) F m+1 (p) F m (q) w r N -1 F m+1 (q) FFT-muunnoksen jälkeen tulosarvot ovat väärässä, bittikäänteisessä järjestyksessä: 000 001 010 011 100 101 110 111 000 100 010 110 001 101 011 111 Kaksidimensioinen FFT tehdään kahtena peräkkäisenä yksidimensioisena FFT:nä, ensin riveittäin ja sitten sarakkeittain tai päinvastoin. 47

2. Muita kuvamuunnoksia Kuvamuunnoksen T (u, v) yleinen muoto N N-kokoiselle kuvalle f(x, y) on T (u, v) = f(u, v) = N 1 N 1 x=0 y=0 N 1 N 1 u=0 v=0 f(x, y) g(x, y, u, v) T (x, y) h(x, y, u, v) g(x, y, u, v) on muunnoksen ydin ja h(x, y, u, v) on käänteismuunnoksen ydin. Ydin määrää muunnoksen luonteen. Esim. DFT:ssä g(x, y, u, v) = 1 N e j2π(xu+yv)/n ja h(x, y, u, v) = 1 N ej2π(xu+yv)/n. Muunnosydin on separoituva, joss g(x, y, u, v) = g 1 (x, u) g 2 (y, v) Esim. DFT on separoituva: g(x, y, u, v) = e j2πxu/n e j2πyv/n. Muunnosydin on symmetrinen, joss g on separoituva ja g 1 on funktionaalisesti sama kuin g 2 : g(x, y, u, v) = g 1 (x, u) g 1 (y, v) Esim. DFT on symmetrinen samoin kuin sen käänteismuunnos. 48

Separoituva muunnos voidaan laskea kahdessa vaiheessa (kuten aiemmin DFT): 1) Lasketan yksidimensioinen muunnos f(x, y):n rivien suhteen T (x, v) = N 1 y=0 f(x, y) g 2 (y, v) x, v = 0, 1,..., N 1 2) Lasketan yksidimensioinen muunnos T (x, v):n sarakkeiden suhteen T (u, v) = N 1 x=0 T (x, v) g 1 (x, u) u, v = 0, 1,..., N 1 Yhtä hyvin voidaan myös laskea ensin sarakkeiden ja sitten rivien suhteen. Separoituvan muunnoksen käänteismuunnos voidaan vastaavasti laskea kahdessa vaiheessa. Joss ydin g(x, y, u, v) on symmetrinen, voidaan muunnos kirjoittaa matrisimuotoon T = AFA, missä F on N N kuvamatriisi, A on N N symmetrinen muunnosmatriisi, a ij = g 1 (i, j), T on N N muunnos, u, v = 0, 1,..., N 1 49

Käänteismuunnos saadaan vastaavasti käänteismuunnosmatriisilla B: BTB = BAFAB Joss B = A 1, saadaan: F = BTB Tällöin digitaalinen kuva F voidaan muodostaa täysin muunnoksestaan T. Jos B A 1, saadaan: F = BATAB Useat kuvamuunnokset, esim. Walsh-, Hadamard- ja diskreetti kosinimuunnos ovat diskreetin Fourier-muunnoksen lisäksi esitettävissä em. muodossa. 50

2.1 Walsh-muunnos Kun N = 2 n, saadaan Walsh-muunnoksen muunnosparit f(x) W (u) ja f(x, y) W (u, v) ytimellä n 1 1 g 1 (x, u) = ( 1) b i(x)b n 1 i (u) N b k (z) on z:n binaariesitysmuodon k:s bitti oikealta laskien. Esim. n = 3, z = 6 = 110 2 b 0 (z) = 0, b 1 (z) = 1 ja b 2 (z) = 1. Kun N = 8 eli n = 3, saadaan g(x, u):n arvot eli matriisin A alkiot skaalausta x 0 1 2 3 4 5 6 7 0 + + + + + + + + 1 + + + 2 + + + + 3 + + + + u 4 + + + + 5 + + + + 6 + + + + 7 + + + + i=0 1 vaille: N Voidaan havaita, että Walsh-muunnoksen ydin on symmetrinen matriisi, jonka rivit ja sarakkeet ovat ortogonaaliset. Käänteismuunnosydin sama kuin muunnosydin, kun kerroin on otettu mukaan molempiin. Koska muunnoksessa käytetään vain kertoimia 1 ja 1, ei tarvita kertolaskuja vaan ainoastaan yhteen- ja vähennyslaskuja. 51 1 N

Kaksidimensioinen Walsh-muunnos Kaksidimensioisen Walsh-muunnoksen symmetrisyydestä lähtien voidaan kirjoittaa kaksidimensioiset muunnosytimet: g(x, y, u, v) = h(x, y, u, v) = g 1 (x, u) g 1 (y, v) = 1 N n 1 ( 1) (b i(x)b n 1 i (u)+b i (y)b n 1 i (v)) i=0 Muunnospari voidaan siis kirjoittaa täydellisenä: W (u, v) = 1 N f(x, y) = 1 N N 1 x=0 N 1 u=0 N 1 y=0 N 1 v=0 n 1 f(x, y) i=0 n 1 W (u, v) i=0 ( 1) (b i(x)b n 1 i (u)+b i (y)b n 1 i (v)) ( 1) (b i(x)b n 1 i (u)+b i (y)b n 1 i (v)) Walsh-muunnoksen tämän kaltaisesa muodotuksessa on lähdetty siitä, että muunnos on separoituva ja symmetrinen. Tällainen lähestymistapa lienee perusteltu, koska ei ole sattuma, että Walsh-muunnos on symmetrinen, vaan se on alunperinkin sellaiseksi tarkoitettu. Walsh-muunnos voidaan laskea FFT:n kaltaisella nopealla algoritmilla. 52

2.2 Hadamard-muunnos Hadamard-muunnos Walsh-muunnos, joss N = 2 n. Muunnosmatriisin rivit ovat eri paikoissa. Kuvankäsittelyssä puhutaan usein Walsh-Hadamard-muunnoksesta spesifioimatta kumpaa nimenomaan tarkoitetaan. Kun N = 2 n, saadaan Hadamard-muunnoksen muunnosparit f(x) H(u) ja f(x, y) H(u, v) ytimellä 1 g 1 (x, u) = i=0 b i(x)b i (u) N Walsh-muunnoksesta poiketen bittejä siis verrataan samaan suuntaan. Myös Hadamard-muunnoksen ydinmatriisi a ij = g 1 (x, u) on ortogonaalinen ja symmetrinen: x 0 1 2 3 4 5 6 7 0 + + + + + + + + 1 + + + + 2 + + + + 3 + + + + u 4 + + + + 5 + + + + 6 + + + + 7 + + + + Hadamard-muunnoksen ydinmatriisi voidaan muodostaa rekursiivisesti: H 1 = [1] [ ] HN H H 2N = N H N H N 53

Kaksidimensioinen Hadamard-muunnos Walsh-muunnoksen tavoin myös Hadamard-muunnos on symmetrinen. Kaksidimensioisen Hadamard-muunnoksen muunnosytimet voidaan kirjoittaa: g(x, y, u, v) = h(x, y, u, v) = g 1 (x, u) g 1 (y, v) = 1 N n 1 ( 1) (b i(x)b n 1 i (u)+b i (y)b n 1 i (v)) i=0 Muunnospari voidaan siis kirjoittaa täydellisenä: W (u, v) = 1 N f(x, y) = 1 N N 1 x=0 N 1 u=0 N 1 y=0 N 1 v=0 f(x, y)( 1) n 1 i=0 (b i(x)b i (u)+b i (y)b i (v)) W (u, v)( 1) n 1 i=0 (b i(x)b i (u)+b i (y)b i (v)) Hadamard-muunnosta ei voi laskea FFT:n kaltaisella nopealla algoritmilla. 54

Järjestetty Hadamard-muunnos Määritellään matriisin rivin (tai sarakkeen) sekvenssi lukuna, joka ilmoittaa, kuinka monta kertaa etumerkki vaihtuu ko. rivillä. Normaalin Hadamard-muunnoksen muunnosmatriisin rivit (ja sarakkeet) ovat siten sekaisin, että niiden sekvenssi ei ole kasvavassa järjestyksessä. Rivit (ja samalla sarakkeet) voidaan kuitenkin järjestää kasvan sekvenssin mukaisesti: x 0 1 2 3 4 5 6 7 0 + + + + + + + + 1 + + + + 2 + + + + 3 + + + + u 4 + + + + 5 + + + + 6 + + + + 7 + + + + Kirjan kuvat 3.25 ja 3.26 esittävät Walsh- ja järjestetyn Hadamard-muunnoksen kaksidimensioiset ytimet h(x, y, u, v), kun N = 4. 55

4. Luento 5.10.1999 Sisältö 1. Muita kuvamuunnoksia, jatkoa................................. 57 1.1 Diskreetti kosinimuunnos, DCT................................. 57 1.2 Haar- ja Slant-muunnokset................................... 58 1.3 Hotelling-muunnos....................................... 59 2. Kuvien ehostaminen....................................... 62 2.1 Spatiaalialuemenetelmät ehostuksessa............................. 63 2.2 Harmaataso-operaatiot..................................... 64 2.3 Harmaa-arvohistogrammioperaatiot............................... 67 56

1. Muita kuvamuunnoksia, jatkoa 1.1 Diskreetti kosinimuunnos, DCT Kaksiulotteinen diskreetti kosinimuunnos määritellään: C(u, v) = α(u)α(v) f(x, y) = N 1 N 1 u=0 v=0 N 1 N 1 x=0 y=0 f(x, y) cos α(u)α(v)c(u, v) cos 1 α(u) =, kun u = 0 N 2, kun u 0 N (2x + 1)uπ 2N (2x + 1)uπ 2N cos cos (2y + 1)vπ 2N (2y + 1)vπ 2N, u, v = 0, 1,..., N 1, x, y = 0, 1,..., N 1 Muunnos on separoituva ja symmetrinen. Toisin kuin diskreetissä Fourier-muunnoksessa, kosinimuunnoksen arvot ovat reaalisia. DCT:tä käytetään kuvien tiivistämisessä eli kuvakompressiossa, esim. JPEG-standardissa. 57

1.2 Haar- ja Slant-muunnokset Haar- ja Slant-muunnokset ovat vähemmän käytettyjä ja vähempimerkityksellisiä muunnoksia kuin aiemmin esitellyt. Niillä on kuitenkin aiemmin mainitut hyödylliset ominaisuudet: separoituvuus, symmetrisyys, muunnosmatriisin ortogonalisuus ja nopea toteutus. 58

1.3 Hotelling-muunnos Hotelling- eli ominaisvektori- eli pääkomponentti- eli Karhunen-Loève- (KL-) muunnos. Perustuu datavektorijoukon tilastollisiin ominaisuuksiin. Oletetaan n-dimensioinen satunnaismuuttuja x. Datajoukon keskiarvo ja kovarianssi voidaan laskea: m x = E{x} = 1 M M k=1 x k C x = E{(x m x )(x m x ) T } = 1 M M x k x T k m x m T x C x on reaalinen ja symmetrinen, sille voidaan aina määrätä n:n ortonormaalin ominaisvektorin joukko. Olkoot e i, i = 1, 2,..., n, C x :n ominaisvektorit ja λ i vastaavat ominaisarvot. Yleisyyden kärsimättä voidaan olettaa, että ominaisarvot ja vastaavat vektorit on järjestetty laskevaan suuruusjärjestykseen, λ j λ j+1, j = 1, 2,..., n 1. Kullekin ominaisarvo/-vektori-parille pätee ominaisarvoyhtälö: C x e i = λ i e i k=1 Määritellään Hotelling-muunnosmatriisi A: A = e T 1 e T 2. e T n 59

Vektorin x Hotelling-muunnos saadaan: y = A (x m x ) Muunnetun vektorijoukon kovarianssimatriisista voidaan osoittaa: λ 1 C y = AC x A T λ 2 =... λ n Voidaan tulkita, että muunnos on tehnyt datavektorin komponentit keskenään korreloimattomiksi ja järjestänyt ne pienenevän varianssin (energian) mukaiseen järjestykseen. Lisäksi koordinaatiston origo on siirtynyt datan painopisteeseen ja koordinaattiakselit ovat ominaisvektorien suuntaiset. Hotelling-muunnosta käytetään yleisesti kuvassa olevan kohteen suunnan normalisoimiseen ja/tai piirreirrotukseen. x 2 x 2 e 2 e 1 y 2 y 1 x 1 x 1 x-vektorit voidaan myös muodostaa monikanavakuvista, esim. satelliittikuvat, jolloin kultakin kanavalta tulee yksi x:n komponentti. Kanavien välistä korrelaatiota voidaan näin pienentää. 60

Rekonstruktio pääkomponenteista KL-muunnoksen käänteismuunnoksessa vektori x pyritään rekonstruoimaan y-vektorista. Koska A:n rivit ovat ortonormaaleja, A 1 = A T, x = A T y + m x Muunnosmatriisi A K muodostetaan käyttämällä k:ta (1 K n) suurinta ominaisarvoa vastaavat ominaisvektorit. Tälläin muodostuvat y-vektorit ovat k-dimensioisia. Kun k < n, rekonstruktio ei ole tarkka: x = A T Ky + m x Voidaan osoittaa, että neliöllinen virhe x:n ja x:n välillä on: n e ms = E{ x x 2 } = j=k+1 λ j Koska λ j :t pienenevät monotonisesti, rekonstruktiovirhe on jokaisella k:n arvolla minimissään. Hotelling-muunnos on kaikista lineaarisista muunnoksista optimaalinen pienimmän keskimääräisen neliöllisen virheen mielessä. 61

2. Kuvien ehostaminen Kuvan ehostamisen (enhancement) päämääränä on käsitellä kuvaa siten, että lopputulos on sopivampi kuin alkuperäinen kuva tietyssä mielessä tai sovelluksessa. Esimerkiksi voidaan kiinnittää huomiota kuvan visuaaliseen miellyttävyyteen, kuten terävyyteen tai kohinattomuuteen. Ehostamiskeinot ovat yleisesti sovelluskohtaisia. Esimerkiksi röntgenkuvien ehostamiseen käytettävät menetelmät eivät välttämättä sovellu avaruusluotaimen lähettämien kuvien parantamiseen. Tekniikat ovat myös hyvin heuristisia, koska on vaikea määritellä matemaattisesti, millainen olisi esim. ihmissilmin tarkastellen hyvä kuva. Ehostusmenetelmät voidaan jakaa kahteen pääluokkaan: spatiaalialuemenetelmät taajuusaluemenetelmät Käytännön sovelluksessa voidaan myös yhdistää molempien lajien menetelmiä. 62

2.1 Spatiaalialuemenetelmät ehostuksessa Spatiaalialueessa eli kuvatasossa toimivat ehostusmenetelmät voidaan jakaa edelleen: pisteoperaatiot maskioperaatiot Ensinmainitut voidaan tulkita myös viimemainittujen yhdeksi erikoistapaukseksi. Toisaalta pisteoperaatioina voidaan toteuttaa menetelmiä, joille ei löydy suoraa vastinetta maskioperaatioiden puolelta. Käsitellään pikseleitä kuvatasossa g(x, y) = T [f(x, y)] f(x, y) on alkuperäinen kuva g(x, y) on käsitelty kuva T [ ] on kuvaan f kohdistuva operaattori pisteen (x, y) ympäristössä T -operaattori voidaan kohdistaa myös joukkoon keskinäisesti riippuvia ja kohdistettuja syötekuvia pikseleittäin. Tällöin pitäisikin kirjoittaa f(x, y):n sijaan f(x, y). Jos T :n vaikutusalue on vain itse (x, y)-pikseli yksin, kyseessä on pisteoperaatio, muutoin maskioperaatio. 63

2.2 Harmaataso-operaatiot Harmaataso-operaatioiksi kutsutaan pisteoperaatioita, joissa lähdekuvasta f(x, y) muodostetaan tuloskuva g(x, y) käyttäen muunnosfunktiota s = T (r), missä r = f(x, y) on harmaa-arvo lähdekuvan tietyssä pisteessä ja s = g(x, y) vastaavassa tuloskuvan pikselissä. Harmaataso-operaatioita ovat esim. kontrastin muuttaminen s = T (r) s r r binarisointi s = T (r) t r 64

kuvan negatointi s = T (r) dynamiikan kompressointi s = T (r) r harmaatasoviipalointi r s = T (r) s = T (r) r r 65

bittitasoviipalointi s = T (r) s = T (r) s = T (r) s = T (r) r r r r harmaa-arvohistogrammin tasoitus harmaa-arvohistogrammin määräys 66

2.3 Harmaa-arvohistogrammioperaatiot Histogrammioperaatiot ovat merkittävä pisteoperaatioiden ryhmä. Kuvan histogrammi muodostetaan laskemalla, kuinka monta kerta kukin harmaataso esiintyy kuvassa: p(r x ) = n k n r k [0, L 1] on k:s diskreetti harmaataso n k on k:nnen harmatason lukumäärä kuvassa n on pikselien lukumäärä koko kuvassa p(r x ) on estimaatti harmaatason r k esiintymisen todennäköisyydelle kuvassa. Histogrammin muodosta voidaan päätellä kuvan ominaisuuksia ja mahdollisesti tarvittavia ehostustoimenpiteitä. p(r k ) p(r k ) p(r k ) p(r k ) tumma kuva r k vaalea kuva r k heikko kontrasti r k r k voimakas kontrasti Usein on helpointa ajatella r:n saavan reaalilukuarvoja välillä [0, 1], miisä 0 vastaa mustaa ja 1 valkoista. 67

Harmaa-arvohistogrammin muuntaminen Histogrammin muuntamisessa käytettävät harmaa-arvo-operaatiot ovat yleensä muotoa s = T (r), missä T (r) on yksikäsitteinen ja monotonisesti kasvava välillä 0 r 1, jolloin harmaa-arvojen järjestys säilyy 0 T (r) 1, kun 0 r 1, jolloin harmaa-arvot säilyvät sallituissa rajoissa Samat ominaisuudet on myös käänteismuunnoksella r = T 1 (s). Jatkuvassa tapauksessa voidaan tutkia differenssejä: p s (s) = [ p r (r) dr ] ds r=t 1 (s) Siten muunnetun kuvan harmaa-arvohistogrammi p s (s) voidaan saada halutuksi sopivalla T (r):n valinnalla. 68

Harmaa-arvohistogrammin tasoitus Tarkastellaan muunnosfunktiota: s = T (r) = r 0 p r (w) dw, 0 r 1 Yhtälön oikea puoli esittää r:n kumulatiivista jakautumafunktiota (CDF). CDF kasvaa kasvaa monotonisesti 0:sta 1:een. s:n derivaatta r:n suhteen: Sijoitetaan dr ds aiempaan lausekkeeseen: ds dr = p r(r) [ p s (s) = p r (r) dr ] ds r=t 1 (s) [ ] 1 = p r (r) p r (r) r=t 1 (s) = 1, 0 s 1 Joten muunnos s = T (r) tuottaa tasaisen histogrammin p s (s). 69

5. Luento 12.10.1999 Sisältö 1. Kuvien ehostaminen harmaataso-operaatioin, jatkoa..................... 71 1.1 Muita pistemuunnoksia..................................... 74 2. Spatiaalisuodatus ehostusmenetelmänä............................ 76 2.1 Epälineaariset spatiaalisuotimet................................. 77 2.2 Kuvan pehmentäminen alipäästösuodatuksella......................... 78 2.3 Kohinanpoisto mediaanisuodatuksella............................. 79 2.4 Kuvan terävöittäminen ylipäästösuodatuksella......................... 80 70

1. Kuvien ehostaminen harmaataso-operaatioin, jatkoa Harmaa-arvohistogrammin määräys Histogrammin määrääys (specification) tarkoittaa, että kuvan harmaa-arvojakauma muunnetaan halutunlaiseksi. Histogrammin määrääminen voidaan toteuttaa analogisesti histogrammin tasoituksen kanssa. Tasoitushan tehtiin käyttämällä alkuperäisen kuvan harmaa-arvojen kertymäfunktiota s = T (r) = r p 0 r(w)dw. Mielivaltaisesta harmaaarvojakaumasta p z (w) päästään samoin tasajakaumaan käyttäen muunnosta v = G(z) = z p 0 z(w)dw. Tämän muunnoksen käänteismuunnoksella z = G 1 (v) voidaan vastaavasti muuntaa tasajakauma halutuksi jakaumaksi p z (w). Histogrammi voidaan siis määrätä mieleiseksi muunnoksella: z = G 1 (s) = G 1 (T (r)) missä T (r) on alkuperäisen kuvan ja G(s) haluttu todennäisyystiheyden kertymäfunktio. Tähänastinen koskee jatkuvia todennäköisyysjakumia. Käytännössä kuitenkin toimitaan diskreeteillä jakaumilla. Se onkin itse asiassa helpompaa, koska jatkuvassa tapauksessa G 1 (s):n analyyttinen muodostaminen on useimmiten hankalaa. Diskreetissä tapauksessa sen sijaan voidaan taulukoida muunnosarvot kaikille harmaa-arvoille. 71

Paikallinen ehostaminen histogrammin tasoituksella Edellä esitellyt menetelmät ovat kohdistuneet koko kuva-alan harmaa-arvojakaumaan. Usein on kuitenkin tarpeen parannella yksityiskohtia kuvan pienehköissä osa-alueissa. Esimerkiksi kaksihuippuisen jakauman tapaus kirjan kuvassa 4.15. Koska jokaisen pienehkön kuva-alueen pikseleillä on vain pieni vaikutus kokonaisharmaatasojakaumaan, ei globaali muunnos välttämättä kykene huomioimaan paikallisia parannustarpeita. Sekä histogrammin tasoitus että histogrammin määräys voidan toteuttaa paikallisesti M N-ikkunassa, jossa keskipisteen uusi harmaa-arvo lasketaan käyttäen ympäröiviä pikseleitä harmaatasohistogrammin estimointiin. Paikallinen muunnos määritellään siis jokaiselle pikselille erikseen. Laskutyötä voidaan jonkin verran helpottaa huomioimalla, että kullakin uudella pikselillä yksi pikselisarake poistuu kuva-alasta ja toinen tulee tilalle. Jakauma voidaan siten päivittää. Jos käytetään ikkunoita, jotka eivät mene päällekkäin, voidaan yhdellä histogrammin muokkauksella ratkaista koko osakuvan pikselien uudety harmaa-arvot. Tällöin laskenta on huomattavasti paljon nopeampaa, mutta seuraksena todennäköisesti shakkilautamainen tuloskuva. 72

Muita paikallisen ehostuksen menetelmiä Paitsi histogrammeihin, paikalliset ehostusmenetelmät voivat perustua myös paikalliseen harmaatasojen keskiarvoon ja varianssiin perustuvia. Siten saadaan kuvassa kirkkaus ja kontrasti vakioitua paikallisesti. Tyypillisesti muunnos voi olla: g(x, y) = km ( ) f(x, y) m(x, y) + m(x, y), missä σ(x, y) g(x, y) = alkion (x, y) uusi harmaatasoarvo f(x, y) = alkion (x, y) vanha harmaatasoarvo m(x, y) = alkion (x, y) tietyn ympäristön paikallinen harmaatasokeskiarvo σ(x, y) = alkion (x, y) saman ympäristön paikallinen harmaatasovarianssi M = alkuperäisen kuvan f(x, y) kokonaisharmaatasokeskiarvo k = vakio, 0 < k < 1 Muunnos voimistaa paikallisia vaihteluita. Keskihajonta nimittäjässä saa aikaan, että alhaisen kontrastin eli pienen varianssin alueita kuvassa muutetaan eniten. 73

1.1 Muita pistemuunnoksia Erotuskuvat Kuvien f(x, y) ja h(x, y) erotus saadaan vähentämällä vastaavat kuvapisteiden harmaasävyt toisistaan: g(x, y) = f(x, y) h(x, y) Erotuskuvissa voidaan havaita muutokset tai liike. Sovellutuksia: 1) ehostus, 2) segmentointi Esimerkki: Liikennevirran havainnointi: vähennetään peräkkäiset kuvat toisistaan ja otetaan itseisarvo. Tällöin paikoillan pysyvä ja siksi arvoiltaan vakio tausta muuttuu mustaksi. Esimerkki: Varjoaineen etenemisen seuraaminen verenkierrossa: vähennetään varjoaineen ruiskuttamisen jälkeen otetut röntgen- tms. kuvat ennen varjoaineen antoa otetusta kuvasta. 74

Keskiarvo useista kuvista Jos on mahdollista ottaa useita identtisiä kuvia samasta kohteesta, voidaan kuvassa esiintyvää kohinaa ratkaisevasti vähentää. Oletetaan kohinamalli g(x, y) = f(x, y) + η(x, y) missä kohina η(x, y) on kaikissa pisteissä korreloimatonta ja nollakeskiarvoista. Laskemalla pisteittäinen keskiarvokuva M:stä kuvasta {g i (x, y) ; i = 1, 2,..., M} saadaan g(x, y) = 1 M M g i (x, y) i=1 Nyt ja E{g(x, y)} = f(x, y) σ 2 g(x,y) = 1 M σ2 η(x,y) M:n kasvaessa pikseliarvojen varianssi pienenee ja g(x, y) lähestyy f(x, y):tä. Käytännössä hyvin harvassa sovelluksessa saadaan peräkkäisiä identtisiä otoksia. Myös kuvien täsmällinen kohdistaminen päällekäin on vaikeaa, jos tapahtuu pientäkin liikettä kuvien välillä. Keskiarvoistusta sovelletaan kuitenkin paljon valo- ja elektronimikroskopiassa, kun näytteet ovat staattisia. 75

2. Spatiaalisuodatus ehostusmenetelmänä Jo aiemmin esitellyt menetelmät ovat olleet spatiaalisia, mutta niissä käsittely on kohdistunut kuvaan pikseli kerrallaan. Spatiaalimenetelmien yleisessä tapauksessa pikselin uusi harmaa-arvo määräytyy pikselin ja sen tietyn spatiaalisen ympäristön alkuperäisistä harmaa-arvoista. Spatiaalisuodatuksen tärkein alaluokka on lineaariset suotimet. siirtofunktio on impulssivasteen (pisteen leviämisfunktion) Fourier-muunnos alipäästösuodin vaimentaa korkeataajuisia komponentteja ja päästää lävitse matalat taajuudet ylipäästösuodin vaimentaa matalataajuisia komponentteja ja päästää lävitse korkeat taajuudet kaistanpäästösuodin vaimentaa sekä matala- että korkeataajuisia komponentteja ja päästää lävitse tietyllä kaistalla olevat taajuudet Yleensä lineaariset suotimet ovat ympyräsymmetrisiä sekä spatiaali- että taajuustasossa. Impulssivasteen poikkileikkausmuoto spatiaalitasossa antaa käsityksen suotimen taajuustaso-ominaisuuksista. 1 1 1 taajuustaso alipäästö ylipäästö kaistanpäästö spatiaalitaso 0 0 0 76

Lineaarinen suodatus voidaan spatiaalitasossa lausua maskin alla olevan kuvanosan ja maskin painokertoimien sisäeli pistetulona. z = w T z, missä w ja z ovat painokertoimista ja kuva-alkion ympäristöstä muodostetut vektorit. 2.1 Epälineaariset spatiaalisuotimet Epälineaariset suotimet toimivat kuten lineaariset, mutta maskin keskipisteen uusi harmaa-arvo ei ole lineaarikombinaatio maskin pikseliarvoista. Yleisimpiä epälineaarisia operaatioita: mediaani maksimi minimi 77

2.2 Kuvan pehmentäminen alipäästösuodatuksella Aiemmin todettiin, että kohinaa voitiin tehokkaasti poistaa kuvista, mikäli olemassa oli kuvasarja samasta kohteesta. Koska näin ei useimmiten ole, tarvitaan muita keinoja, jos kuvat sisältävät liikaa kohinaa. Kuvaa voidaan pehmentää spatiaalisella suotimella, joka keskiarvoistaa tietyn kokoisen maskin alalla. Kuvassa oleva korreloimaton additiivinen kohina vaimenee, kuten aiemmin todettiin kuvasarjojen osalta. Samalla (valitettavasti) kuvan yksityiskohdat hämärtyvät, tapahtuu alipäästösuodatus. Mitä suurempaa maskia käytetään, sitä voimakkaampaa on sumentuminen. Kirjan esimerkki kuva 4.22. Sumeutumista voidaan rajoittaa käyttämällä epälineaarista kynnystystä: { 1 M (m,n) S g(x, y) = f(m, n), f(, y) 1 M (m,n) S f(m, n) < T f(x, y), muulloin Pisteet, joiden poikkeama ympäristönsä keskiarvosta on positiivista kynnysarvoa T suurempi, jäävät muuttumatta. Voimaakkaat muutokset, esim. reunat ja nurkat, eivät muutu. Siten sumentumiselle herkät yksityiskohdat säilyvät paremmin kuin puhtaasti lineaarisella suodatuksella. 78

2.3 Kohinanpoisto mediaanisuodatuksella Naapurikeskiarvoistuksen huono puoli on reunojen ja muiden terävien yksityiskohtien sumeneminen. Mediaanisuodatuksella pyritään välttämään tätä ongelmaa. Myös mediaanisuodatus hävittää yksityiskohtia, mutta useinkaan ei niin paljon kuin vastaavankokoinen lineaarinen suodatus. Kirjan esimerkki kuva 4.23. Mediaanisuodatusta käytetään kohinan poistoon pitkälti samoin kuin alipäästösuodatustakin. Mendiaanisuodatus on optimaalinen menetelmä voimakkaan pisteittäisen impulssikohinan, ns. suola ja pippuri -kohinan, poistamiseksi. Mediaani tarkoittaa järjestetyn lukujoukon keskimmäistä arvoa. Siten esimerkiksi, jos 3 3-ikkuna sisältää pikselien arvot {17, 34, 30, 18, 37, 25, 28, 22, 20}, jotka järjestetään suuruusjärjestykseen {17, 18, 10, 22, 25, 28, 30, 34, 37}, on mediaani 25. Saatu arvo sijoitetaan tuloskuvaan maskialan keskipisteeseen kuten lineaarisessa suodatuksessakin. Epälineaarisena menetelmänä mediaanisuodatuksella ei ole määriteltyä impulssivastetta eikä myöskään siirtofunktiota. Mediaanisuodatus on jokaiselle kuvalle omanlaisensa. 79

2.4 Kuvan terävöittäminen ylipäästösuodatuksella Kuvan terävöittämisellä pyritään korostamaan kuvan yksityiskohtia tai ehostamaan sumentuneita detaljeja. Terävöittämine voidaan tulkita myös keskiarvoistamisen käänteisoperaatioksi. Ylipäästösuotimens maski-ikkunan keskellä on suuria positiivisia kertoimia, joiden ympärillä maskin reunoilla on negatiiviset kertoimet. 0 1 9-1 -1-1 -1 8-1 -1-1 -1 Kirjan esimerkki kuva 4.25. Pienet yksityiskohdat hitaasti vaihtelevalla taustalla häipyvät, voimakkaat ääriviivat korostuvat. Negatiivisten kertoimien vuoksi tuloskuvan pikseliarvot on lopuksi rajoitettava tai skaalattava aluperäiselle välille. 80

Korkeiden taajuuksien korostus Aina ei haluta kokonaan hävittää alkuperäistä kuvaa vaan ainoastaan korostaa korkeita taajuuskomponentteja. Korkeiden taajuuksien korostus eli High-boost-suodatus voidaan tulkita kehitetyksi muodosta: Esimerkiksi 3 3-kokoinen alipäästö: ylipäästö = alkuperäinen alipäästö 1 9-1 -1-1 8-1 -1-1 -1-1 1 9 9 1 9 1 1 1 1 1 1 1 1 1 Yleisemmässä tapauksessa voidaan kirjoittaa: high-boost = A alkuperäinen alipäästö = (A 1) alkuperäinen + ylipäästö Sopivalla A:n arvolla voidaan saada aikaan haluttu korostus, kuten kirjan kuva 4.27 osoittaa. 81

Derivoivat suodatukset Ylipäästösuodatus voidaan tulkita myös kuvan derivoinniksi samoin kuin alipäästösuodatus integroinniksi. Kirjassa sivuilla 197 200 esitetään Robertsin gradientti jatkuva-arvoisen gradientin diskreettinä approksimaationa. Lisäksi esitellään Prewitt- ja Sobel-gradientit, joista viimemainittua käsitellään lisäksi kurssin loppupuolella kuvien segmentoinnin yhteydessä. 82

6. Luento 19.10.1999 Sisältö 1. Kuvien ehostaminen taajuustason operaatioin........................ 84 1.1 Alipäästösuodatus........................................ 85 1.2 Ylipäästösuodatus........................................ 89 1.3 Homomorfinen suodatus.................................... 91 1.4 Spatiaalimaskien muodostaminen taajuustason määrittelystä................. 92 2. Värien käyttö kuvankäsittelyssä................................ 93 2.1 Väriteorian perusteita...................................... 94 83

1. Kuvien ehostaminen taajuustason operaatioin Ehostus taajuusalueessa perustuu konvoluutioteoreemaan: kuvan ja maskin spatiaalialueen konvoluutiota vastaa taajuusaluessa vastaavien Fourier-muunnosten tulo. g(x, y) = h(x, y) f(x, y) G(u, v) = H(u, v) F (u, v) lasketaan kuvan f(x, y) Fourier-muunnos F (u, v) valitaan siirtofunktio H(u, v), jolla F (u, v) kerrotaan muodostetaan ehostettu kuva g(x, y) käänteisellä Fourier-muunnoksella Kohinan väheneminen, kuvan sumeneminen korkeiden taajuuksien redusointi. Yksityiskohtien korostaminen, kuvan terävöittäminen korkeiden taajuuksien korostaminen. Lineaarinen suodatus helposti ajateltavissa taajuusalueessa. Käytännössä suodatus tehdään yksinkertaisesti ja tehokkaasti käyttäen pieniä spatiaalitason maskeja, jos mahdollista. 84

1.1 Alipäästösuodatus Alipäästösuodatuksella vaimennetaan korkeita taajuuksia, mikä sumentaa kuvaa, koska korkeat taajuudet vastaavat harmaatasojen nopeita muutoksia kuten ääriviivoja ja kohinaa. Ideaalinen alipäästösuodin (ILPF) Ideaalisen alipäästösuotimen vaste on yksi D 0 -säteisen taajuustason ympyrän sisällä ja nolla sen ulkopuolella: { 1, D(u, v) D 0 H(u, v) = 0, D(u, v) > D 0 missä D 0 on rajataajuus. H(u, v) on ympyräsymmetrinen origon suhteen. D(u, v) = ( u 2 + v 2) 1 2 Esimerkki: Alipäästösuodatetaan kirjan kuvaa 4.31. Kasvatetaan rajataajuutta ja katsotaan kuinka suuri osuus kuvan sisältämästä kokonaissignaalitehosta kulloinkin säilyy suodatuksessa. Kokonaissignaaliteho voidaan laskea: P T = N 1 N 1 u=0 v=0 P (u, v) P (u, v) = R 2 (u, v) + I 2 (u, v) = F (u, v) 2 85

Huomataan, että pieni säde sisältää huomattavan määrän energiasta. Energian säilyminen ei kuitenkaan vastaa ihmissilmän havaintoa yksityiskohtien säilymisestä. Alipäästösuotimen aiheuttamaa sumentumaa voidaan tutkia tarkastelemalla suotimen siirtofunktion käänteis-fouriermuunnosta, so. suotimen impulssivastetta eli pisteenleviämisfunktiota. Ideaalisen alipäästösuotimen impulssivaste on muodoltaan: Voidaan havaita, kuinka jokainen alkuperäinen piste leviää ja sekoittuu ympäröivien pikseleiden kanssa. Lisäksi voidaan huomata ideaaliselle alipäästösuotimelle ominaiset renkaat, jotka aiheuttavat kuvassa rengastumista. Rengastumisen vuoksi voimakkaat pikselit saavat ympärilleen renkaita ja vastaavasti voimakkaat rajat kuvassa monistuvat tai toistuvat heikompina kaikuina. Esimerkki kirjan kuva 4.32. h(x, y):n samankeskisten renkaiden säteet ovat kääntäen verrannolliset rajataajuuteen D 0. Voimakas suodatus eli pieni D 0 aiheuttaa voimakkaan rengastumisen. 86

Butterworth-alipäästösuodin Erilaisista vaihtoehtoisista alipäästösuodatuksista tärkeimpiä on Butterworth-suodin: 1 H(u, v) = 1 + ( ) 2n D(u, v)/d 0 n = suotimen asteluku D 0 = rajataajuus D(u, v) = ( u 2 + v 2) 1 2 Rajatajuudella: H(u, v) = 0.5 (Suodin voidaan formuloida eri tavoin, kirjassa on esitelty toinenkin konventio. Yllä oleva murtolauseke voitaisiin kirjoittaa myös H(u, v) 2 :n arvoksi.) H(u, v) 1 0.5 1 2 3 D(u,v) D 0 Butterworth-suodin sumentaa kuvaa vähemmän kuin ideaalinen suodin, koska suuritaajuiset komponentit pääsevät vaimennettuina vaikuttamaan tulokseen. Lisäksi renkaita ei muodostu. Esimerkki kuvassa 4.35. 87

Alipäästösuodatuksen sovelluskohteita Esimerkki: Kirjan kuvat 4.36 (a) ja (b) osoittavat, kuinka Butterworth-alipäästösuodatuksella voidaan vähentää vääriä reunaviivoja (false contouring), joita esiintyy 16-harmaasävyisessä kuvassa. Esimerkki: Kirjan kuvat 4.36 (c) ja (d) näyttävät, kuinka kuvassa oleva (nollakeskiarvoinen ja korreloimaton) kohina vähenee Butterworth-alipäästösuodatuksella. Alipäästösuodatus on lähinnä kosmeettinen prosessi, jolla voidaan poistaa tai ainakin vähentää kohinaa tai joitakin muita kuvan vääristymiä kuvan terävyyden kustannuksella. 88

1.2 Ylipäästösuodatus Korkeiden taajuuksien korostaminen vahvistaa ääriviivoja. Ideaalinen ylipäästösuodin Ideaalinen ylipäästösuodin on ideaalisen alipäästösuotimen komplementti: { 0, D(u, v) D 0 H(u, v) = 1, D(u, v) > D 0 Butterworth-ylipäästösuodin Myös ylipäästösuodin voidaan toteuttaa Butterworth-rakenteella. Tällöin: H(u, v) = 1 1 + ( D 0 /D(u, v) ) 2n 89

Ylipäästösuodatuksen sovelluskohteita Puhdasta ylipäästösuodatusta tarvitaan kuva-aanyylisovelluksissa, joissa etsitään kuvista reunoja ja pyritään segmentoimaan kuvassa olevat kohteet kuvan taustasta. Ihmisen katsottavaksi tarkoitetuissa kuvissa käytetään enemmänkin korkeiden taajuuksien korostusta. Tällöin esim. Butterworth-ylipäästösuotimen ulostulo lisätään vakiolla kerrottuna alkuperäiseen kuvaan. Tämä vastaa aiemmin esiteltyä High-boost-suodatusta. Esimerkki: Kirjan kuvat 4.39 (a) (d). 90

1.3 Homomorfinen suodatus Homomorfiseksi suodatukseksi kutsutaan menetelmiä, joissa kuvanmuodstuksessa vaikuttavat epälineaariset tekijät ensin linearisoidaan, sitten käsitellään kuva lineaarisesti ja lopuksi palautetaan kuva alkuperäiseen epälineaariseen esitysmuotoon. Jo aiemmin esitettiin, kuinka kuva f(x, y) voidan ajatella muodostuneeksi valaistuskomponentista i(x, y) ja heijastuskomponentista r(x, y): f(x, y) = i(x, y) r(x, y) Kuvanmuodostus voidaan linearisoida ottamalla logaritmi yhtälön molemmista puolista: ln f(x, y) = ln i(x, y) + ln r(x, y) Kuvanmuodostuksessa on luontevaa ajatella, että valaistuksen i(x, y) vaihtelut ovat hitaita verrattuna heijastuksen r(x, y) vaihteluihin. Siten haitallisia valaistusvaihteluja voidaan vähentää ylipäästösuodattamalla linearisoitua kuvaa high-boost-suotimella. Linearisoitu kuva palautetaan tässä tapauksessa eksponentioimalla takaisin alkuperäiseen esitysmuotoon. Koko prosessointi voidaan esittää kaaviolla: f(x, y) ln FFT H(u, v) FFT 1 exp g(x, y) Esimerkki kirjan kuva 4.42. 91

1.4 Spatiaalimaskien muodostaminen taajuustason määrittelystä Ainakin pienten kuvatasossa määriteltyjen maskien soveltaminen kuviin on nopeampaa ja yksinkertaisempaa kuin prosessointi taajuusalueessa tarvittavine muunnoksineen ja käänteismuunnoksineen. Toisaalta kuitenkin esim. alipäästösuodatus on helpompi määritellä taajuustasossa. Periaatteessa tarvittaisiin koko kuvan kokoinen N N-maski h(x, y) jotta taajuustasossa määritelty suodatus H(u, v) voitaisiin toteuttaa spatiaalitasossa: h(x, y) = N 1 N 1 u=0 v=0 H(u, v) exp ( j2π(ux + vy)/n ), x, y = 0, 1,..., N 1 Käytännössä voidaan muodostaa pienempi n n-kokoinen maski ĥ(x, y), joka virheen pienimmän neliösumman mielessä approksimoi H(u, v):ta Ĥ(u, v):llä. ĥ(x, y) = N 1 N 1 u=0 v=0 Ĥ(u, v) exp ( j2π(ux + vy)/n ), x, y = 0, 1,..., n 1 n 1 n 1 Ĥ(u, v) = ĥ(x, y) exp ( j2π(ux + vy)/n ), u, v = 0, 1,..., N 1 x=0 y=0 Nyt siis jää tehtäväksi sovittaa H(u, v) ja Ĥ(u, v) toisiinsa neliövirheen mielessä optimaalisesti. Ratkaisu noudattelee yleistä neliöllistä minimointitehtävää ja voidaan ratkaista vektori-matriisi-laskennalla ja pseudoinverssillä. 92

2. Värien käyttö kuvankäsittelyssä Väri on ihmissilmälle erittäin tärkeä informaation lähde. Ihmissilmä voi erottaa tuhansia värisävyjä ja niiden intensiteettejä. Harmaasävyjä silmä kykene erottamaan vain joitakin kymmeniä tai noin sata. Automaattisessa kuva-analyysissä värit helpottavat havaittavuutta esim. esineiden identifioinnissa, näkymäanalyysissa ja -erottelussa. Värien käyttö kuvankäsittelyssä voidaan jakaa karkeasti kahteen päälajiin: täysvärikuvat, kuvat muodostettu värisensorilla, käsitellään todellisia värikuvia väärävärikuvat, muodostettu alunperin monokromaattisista kuvista värjäämällä tietyt harmaatasot Valon karakterisointi akromaattinen (achromatic), valoa karakterisoi vain sen intensiteetti eli määrä. Esim. musta-valko-tv. kromaattinen (chromatic), huomioi energian jakautumisen sähkömagneettisen säteilyn kaistalla 400 700 nm. radianssi (radiance) valolähteen kokonaisenergia, mittayksikkö watti (W). luminanssi (luminance) mittaa havainnoijan havaitsemaa energiamäärää, esimerkiksi infrapunalähteen luminanssi on lähes nolla, mittayksikkö lumen (lm). kirkkaus (brightness) subjektiivinen mitta. 93

2.1 Väriteorian perusteita Värispektri muodostuu puhtaista väreistä, so. vain yhdestä aallonpituudesta kutakin havaittua väriä kohden. Spektri jakautuu kuuteen leveään kaistaan violetti sininen vihreä keltainen oranssi punainen 380 450 nm 450 480 nm 480 570 nm 570 600 nm 600 670 nm 670 760 nm Ihmissilmä havaitsee spektrin värejä vastaavat värit myös eri aallonpituuksien sekoituksista. Esineen tuottama väriaistimus perustuu sen heijastaman valon aallonpituuksiin. Kaikkia aallonpituuksia yhtälaisesti heijastava pinta näyttää valkoiselta. Päävärit Tiettyjä aallonpituuksia punaista (R), vihreää (G) ja sinistä (B) pidetään valon pääväreinä, koska niiden yhdistelmänä voidaan tuottaa suurempi väriskaala kuin millään muulla kolmen värin kombinaatiolla. RGB-pääväreistä ei voida muodostaa kaikkia värejä. Päävärit on standardoitu: sininen 435.8 nm, vihreä 546.1 nm ja punainen 700 nm. Väritelevision toistokyky perustuu valon kolmen päävärin yhteenlaskuun. Kuvapinnalla on kolmenlaista loisteainet- 94

ta, joita aktivoidaan kutakin omalla elektronitykillä. Elektronisuihkun intensiteettiä moduloimalla muodostetaan eri värikombinaatiot. Värien erottaminen toisistaan perustuu kolmeen suureeseen: kirkkaus (brightness) hue edustaa väriä vastaavan spektri komponentin aallonpituutta, karakterisoi puhtaasti väriä saturaatio edustaa värin suhteellista puhtautta, so. paljonko valkoista tai mustaa on sekoittunut puhtaaseen väriin. Spektrin puhtaat värit ovat täysin kyllästyneitä, so. eivät sisällä valkoista. Värin kromaattisuudella tarkoitetaan hueta ja saturaatiota yhdessä. Sekundäärivärit Sekundääriväreillä tarkoitetaan pigmenttivärejä magenta (purppura), syaani (sinivihreä) ja keltainen. Kukin sekundääriväri muodostuu kahden päävärin summana: punainen + sininen = magenta vihreä + sininen = syaani punainen + vihreä = keltainen Sekundäärivärit määritellään niiden absorboiman päävärin mukaan. Kaikkien sekundäärivärien yhdistelmänä muodostuu musta. Painotekniikassa värit määritellään sekundäärivärien ja mustan avulla. 95

Tristimulusarvot Punaisen, vihreän ja sinisen määrät, jotka tarvitaan tietyn spektrin puhtaan värin tuottamiseen, muodostavat tristimulusarvot X, Y ja Z. Trikromaattisuuskertoimet Normalisoidut tristimulusarvot tuottavat trikromaattisuuskertoimet X x = X + Y + Z Y y = X + Y + Z Z z = X + Y + Z x + y + z = 1 Tuotettavan puhtaan värin aallonpituuden ja trikromaattisuuskertoimien vastaavuudet on ratkaistu kokeellisesti ja taulukoitu. 96

Kromaattisuusdiagrammi Trikromaattisuuskertoimilla on itse asiassa vain kaksi vapausastetta: kun x ja y on annettu, z voidaan ratkaista, z = 1 x y. Eri värit voidaan tällöin esittään punaisen x:n ja vihreän y:n funktiona kromaattisuusdiagrammina. Katso kirjan väritaulu IV. Spektrin puhtaat värit näkyvät kielenmuotoisen diagrammin reunoilla. Sekoittuneet värit sijaitsevat diagrammin sisäosissa. Kuvion keskellä on tasaenergiapiste, joka vastaa standardivalkoista. Värisävyjen saturaatio eli kyllästyneisyys on kromaattisussdiagrammin kehällä aina yksi. Lähestyttäessä tasaenergiapistettä saturaatio menee nollaan. Mitä tahansa kolmea väriä yhdistämällä voidaan tuottaa sävyt, jotka sijaitsevat diagrammissa kyseisten kolmen värin määräämän kolmion sisäpuolella. Diagrammin kuperuuden vuoksi kaikkia puhtaita spektrin värejä ei voida tuottaa millään värikolmikolla. 97