Videotekniikka Videosignaali Kamerasensorit Värioppi Väritelevisio Laitteisto Videosignaali Videokamera skannaa kuvaa rasterikuvion mukaisesti Skannaus alkaa vasemmasta yläreunasta ja etenee vaakasuorien juovien mukaisesti Petri Vuorimaa 1 Petri Vuorimaa 2 Kuvasuhde Kuvasuhteella tarkoitetaan vaakasuoran etäisyyden suhdetta pystysuoraan etäisyyteen Televisiossa kuvasuhde on 4:3 Laajakuva-televisiossa kuvasuhde on 16:9 Synkronointi Rasterikuvion synkronointi varmistetaan erillisillä synkronointipulsseilla Tahdistusta varten tarvitaan sekä vaaka- että pystysuorat synkronointipulssit Synkronointipulssit voidaan liittää videosignaaliin tai siirtää erillisenä Petri Vuorimaa 3 Petri Vuorimaa 4 Resoluutio Resoluutio (jatk.) Resoluutiolla tarkoitetaan television kykyä toistaa yksityiskohtia Vaakasuora resoluutio tarkoittaan yhden juovan toisistaan erottuvien pisteiden lukumäärää Pisteiden lukumäärä riippuu skannauspisteen koosta Resoluutio mitataan laskemalla vierekkäisten valkoisten ja mustien pystysuorien viivojen lukumäärä Petri Vuorimaa 5 Vierekkäisistä valkoisista ja mustista viivoista aiheutuu korkeataajuuksinen signaali Käytännössä 80 viivaa vastaa yhtä 1 MHz NTSC-standardissa kaistanleveys on 4,5 MHz, joten vaakasuora resoluutio on 360 viivaa Pystysuora resoluutio riippuu skannattavien juovien lukumäärästä USA:ssa juovia on 525 ja Euroopassa 625 n. 40 juovaa menee skannauspisteen siirtämiseen Petri Vuorimaa 6 1
Kuvataajuus Liikkuva kuva vaatii useita kuvia sekunnissa Yleinen kuvataajuus on 25 tai 30 kuvaa/sekunti Välkkymisen estäminen vaatii 50 kuvaa/sekunti Tämä ei ole mahdollistu, minkä takia käytetään kuvakenttien lomitusta Ensin lähetetään ja näytetään parittomat juovat ja sen jälkeen parilliset juovat Silmä ei erota pieni välkkyviä kohteita, joten välkkymistä ei näy Petri Vuorimaa 7 Kuvataajuus (jatk.) Lomittelusta aiheutuu kuitenkin myös häiriöitä Nopeasti liikkuvien kappaleiden reunassa näkyy sahanreunakuvio Vaakasuorissa terävissä reunoissa ja viivoissa näkyy välkkymistä Vaakasuoria reunoja näkyy erityisesti tietokonegrafiikassa Petri Vuorimaa 8 Kamerasensorit Kameraa ei yleensä toteuteta skannaavan kuvapisteen avulla Kontrasti on parempi, jos yksittäisten kuvapisteiden tilaa seurataan jatkuvasti (intergointi) Valo kasvattaa kaksiulotteisen valoherkän materiaalin pinnalla olevien pisteiden jännitettä Pisteiden jännitteet luetaan skannaus-periaatteella Käytössä on sekä tyhjiöputkiin että puolijohteisiin perustuvat kameroita Petri Vuorimaa 9 Värioppi Väritelevisio perustuu teoriaan, jonka mukaan mikä tahansa väri voi esittää kolmen perusvärin summana Vähennys: sinipuna, punavihreä ja keltainen Summaus: punainen, sininen ja vihreä Petri Vuorimaa 10 Summaus ja vähennys Väritelevisio punainen vihreä keltainen valkoinen sininen sininen (-punainen) keltainen (-sininen) punainen (-vihreä) musta vihreä punainen Väritelevisio perustuu summaavaan väriteoriaan Valo heijastetaan kolme eri sensorille linssi punainen vihreä sininen vahvistin vahvistin vahvistin RGB -monitori Petri Vuorimaa 11 Petri Vuorimaa 12 2
Yksi sensori Yhden sensorin rakenne on helpompi toteuttaa Valo jaetaan erivärisiin komponentteihin Eri värisignaalit erotetaan elektroniikan avulla Käytännössä resoluution on usein heikompi linssi sensori elektroniikka RGB -monitori Komposiittisignaali Kolmen eri värisignaalin siirto on hankalaa, joten usein käytetään komposiitti-formaattia Kehitetty lähettämistä varten, mutta käytetään paljon laajemmin Signaali jakaantuu luminanssi (monokromi) ja krominanssiosiin (väri) Signaalit muodostetaan matriisimuunnoksella Petri Vuorimaa 13 Petri Vuorimaa 14 Komposiittisignaali (jatk.) Luminanssi siirretään perustaajuudella ja krominannsisignaalit korkeammilla taajuuksilla Häiriöitä esiintyy vähän, koska + luminanssisignaali ei ole herkkä häiriöille varsinkin, jos krominanssisignaalin perustaajuus on pariton monikerta puolesta juovataajuudesta + silmä on paljon herkempi mustavalkoisille reunoille kuin värireunoille, joten krominannsisignaaleja varten varattu kaista voi olla 2-4 kertaa kapeampi NTSC Pohjois-Ameriikka, Japani, ym. National Television Systems Committee, 50-luku Yhteensopiva vanhojen mustavalkoisten televisioiden kanssa (luminanssisignaali) Luminanssi Y (4.5 MHz) sekä krominanssi I (1.5 MHz) ja Q (0.5 MHz) Kaksi-vaihe-amplitudi-modulaatio + I in-phase ja Q quadrature (90 asteen vaihe-ero) Petri Vuorimaa 15 Petri Vuorimaa 16 PAL & SECAM Phase Alternating Line (PAL): sama kaistanleveys molemmilla krominanssisignaaleilla (U ja V) Sequentel Couleur avec Memoire (SECAM): krominanssisignaalit vuorottelevat juovilla (FMmodulaatio) Eri järjestelmillä tuotettujen ohjelmien välillä tarvitaan konversiota Laitteisto Videolaitteiden markkinat ovat suuret, joten laitteita löytyy joka lähtöön Laitteet voidaan luokitella kolmeen laatutasoon + Studio: isot televisioyhtiöt ym. + Ammattilais: pienemmät yhtiöt, opetus, teollisuus ym. + Kuluttaja: kotikäyttäjät Petri Vuorimaa 17 Petri Vuorimaa 18 3
Värikamerat Studiotason kamerat käyttävät yleensä kolmen kamerasensorin ratkaisua Käytössä on useita linssejä (lähi, laaja, zoom ym.) Lisäksi pienempiä mukana kuljetettavia kameroita Myös ammattilaiskamerat käyttävät kolmea sensoria, mutta ovat yksinkertaisempia Kuluttajille suunnatuissa kameroissa on yksi sensori ja yleensä myös nauhuri Petri Vuorimaa 19 Filmikamerat Filmien näyttämistä varten on omat kameransa Filmeissä on yleensä 24 kuvaa/sekunti 25 Hz televisiojärjestelmissä filmiä näytetään nopeammin (nopeus kasvaa 4 %) 30 Hz televisiojärjestelmissä kuvia puolikuvina vuorotellen kolme ja kaksi kertaa + Suhteeksi tulee 2:2.5 = 24:30 + Tästä syntyy tiettyjä virheitä (esim. auton pyörät pyörivät taaksepäin) Petri Vuorimaa 20 Filmikamerat (jatk.) Nauhurit Toinen ongelma on värijärjestelmissä Televisio (summaava) ja Filmi (vähentävä) Televisiossa kirkkaat värit ovat parhaita Filmissä tummat värit ovat parhaita Tarvitaan gamma-korjausta, parempaa signaali/kohina-suhdetta ja värien käsittelyä Petri Vuorimaa 21 Magneettiset nauhat ovat epälineaarisia, joten yleensä käytetään FM-modulaatiota Yleensä kuvaukset tehdään yksittäisten otosten pätkissä ja nauhalle lisätään SMPTE-koodi Yksittäisistä otoksista editoidaan master-nauha, josta otetaan varsinaiset käytettävät kopiot Yleensä tallennetaan komposiittisignaalia, mutta komponentit voidaan tallettaa myös erikseen Digitaaliset tallennusmenetelmät parantavat laatua Petri Vuorimaa 22 Nauhurit (jatk.) C-tyyppi: 1 tuuman avokela (komposiitti; studio) + Euroopassa B-tyyppi Betacam ja MII-tyyppi: 1/2 tuuman kasetti (komponentti; studio) U-Matic: 3/4 tuuman kasetti (luminanssi ja krominanssi-signaalien järjestely; ammatt.) S-VHS ja Hi-8: kasetti (komponentti; ammatt.) VHS ja 8-mm: kasetti (kuten U-Matic; koti) Monitorit Kuva- ja signaalimonitorit Studiotason monitorit on sovitettu keskenään Ammattilaistason monitorit ovat hieman halvempia Kotona käytetään televisiota (viritin + monitori) SCART-liitin mahdollistaa myös komposiitti- ja RGB-signaalien käytön Petri Vuorimaa 23 Petri Vuorimaa 24 4
8. Videokompressio Kompressiosuhde Kompressiojärjestelmän ominaisuudet Videokompression perusteet Menetelmät Algoritmit + H.261 +MPEG-1 +MPEG-2 +MPEG-4 +MPEG-7 Käsittelemättömän datan suhde kompressoituun + 512 x 480 x 24 = 737 280 B + 737 280 B / 15 000 B = 49 Resoluutio ja väritarkkuus voivat muuttua + 256 x 240 x 24 = 184 320 B + 184 320 B / 15 000 B = 12,29 Bittien lukumäärä pikseliä kohden parempi mitta + (15 000 x 8) / (256 x 240) = 1,95 bits per pixel (bpp) Petri Vuorimaa 25 Petri Vuorimaa 26 Kuvanlaatu Hukkaamaton ja hukkaava kompressio Hukkaamattomassa koodauksessa käytetään tehokkaampia datan pakkausmenetelmiä Hukkaavassa kompressiossa kuva muuttuu Tuloksena saattaa syntyä häiriöitä Kuvanlaatu vaikea määrittää Kompressionopeus Yleensä pakkaus ja purku tehdään eri aikoina Usein kuva tai video pakataan kerran ja puretaan useasti Tällöin pakkaus voi kestää kauan, mutta purku pitää tapahtua nopeasti Videoneuvottelussa tilanne on toinen Petri Vuorimaa 27 Petri Vuorimaa 28 Laitteisto vai ohjelmisto Osa algoritmeista voidaan toteuttaa ohjelmistolla, mutta tietyt menetelmät vaativat laitteistoa Laitteisto voi olla yleiskäyttöinen tai yksinomaan tiettyä algoritmia varten suunniteltu Tietylle algoritmille suunniteltua laitteistoa ei voi muuttaa, mutta se on nopea Videokompression perusteet Kuvissa esiintyy paljon redundanssia + vierekkäisissä pikseleissä esiintyy usein sama väri + vaakasuorissa kappaleissa yksittäiset juovat ovat usein samanlaisia + paikallaan pysyvät tai hitaasti liikkuvat kappaleet toistuvat samanlaisina peräkkäisissä kuvissa Katsoja ei erota kaikki yksityiskohtia + silmä ei ole esim. kovin herkkä väreille Petri Vuorimaa 29 Petri Vuorimaa 30 5
Menetelmät Johdanto Yksinkertaiset menetelmät Interpolaatio Ennustus Muunnokset Tilastolliset menetelmät Liikkeenkorjaus Johdanto Videokompressio on tarkkaan tutkittu alue Osa menetelmistä vaatii liikaa laskentaa Tyypillinen kompressiomenetelmä koostuu useasta eri tekniikasta Simple: Truncation CLUT Run-Length Interpolative: Subsample Predictive: DPCM Motion compensation Transform: DCT Statistical: Huffman Petri Vuorimaa 31 Petri Vuorimaa 32 Yksinkertaiset menetelmät Tarkkuutta voidaan helposti tiputtaa 16 bpp Toinen vaihtoehto on käyttää väritaulua + Color Lookup Table (CLUT) + 8 bpp kohtuullinen laatu Lisäksi voidaan käyttää Run-Length -koodausta + toistuvat värit korvataan koodilla, jossa on väriarvo ja toistuvien pikselien lukumäärä + tietokonegrafiikassa, animaatiossa ja CLUTkoodatuissa kuvissa mahdollista päästä alle 1bpp Interpolaatio Osa pikseleistä koodataan ja loput interpoloidaan Tarkoittaa käytännössä pienenpää resoluutiota Toimii kuitenkin hyvin värikomponenttien koodauksessa (alinäytteitys) + YUV-komponenteista U ja V voidaan ottaa vain joka neljäs näyte sekä vaaka- että pystysuunnassa (1/16) + 8 bpp + (8 bpp + 8 bpp) / 16 = 9 bpp + ei toimi synteettisissä kuvissa Petri Vuorimaa 33 Petri Vuorimaa 34 Ennustus Voidaan käyttää seuraavan pikselin, juovan tai kuvan ennustamiseen DPCM: koodataan peräkkäisten näytteiden erotus + käytetään pienempää bittimäärää; ylivuodot ongelma ADPCM: askelkokoa voidaan kasvattaa + tarvitaan ylimääräisiä bittejä Ennustuksen ongelmana on virheiden toistuminen Harvoin käytetään pelkästään ennustusta Muunnokset Datajoukko muunnetaan toiseen muotoon Tarvitaan myös käänteismuunnos +X 0 (8 bit) & muut 4 bit: 8 b + 3 x 4 b = 20 b (5 bpp) A C B D X 0 X 1 X 2 X 3 Muunnos: X 0 =A X 1 =B-A X 2 =C-A X 3 =D-A Käänteismuunnos: A=X 0 B=X 1 +X 0 C=X 2 +X 0 D=X 3 +X 0 Petri Vuorimaa 35 Petri Vuorimaa 36 6
DCT-muunnos DCT-koodaus yleisin käytetty muunnos Pikseliryhmä muunnetaan perustaajuuksien kertoimiksi Ensimmäistä nollataajuutta kutsutaan DCkertoimeksi Suurin osa kertoimista on pieniä tai jopa nolla Kertoimet kvantisoidaan tiettyyn esitystarkkuuteen Tilastolliset menetelmät Yleensä sekä alkuperäisessä että koodatussa kuvassa esiintyy tilastollinen jakauma Yleisimmät lukuarvot koodataan lyhyemmillä merkeillä ja harvemmin esiintyvät pidemmillä Tarvitaan koodikirja, joka pitää lähettää vastaanottajalle Koodikirjan lähettämistaajuutta voidaan vaihdella Petri Vuorimaa 37 Petri Vuorimaa 38 Liikkeenkorjaus Videossa peräkkäisissä kuvissa on yleensä paljon redundanssia Ongelmana on löytää muuttuvat kohdat ja irrottaa ne kuvasta Ratkaisu on jakaa kuva lohkoihin ja koodata ainoastaan muuttuneet lohkot Lisäksi voidaan koodata lohkojen liikkuminen Petri Vuorimaa 39 Algoritmit Yleensä kompressointialgoritmi hyödyntää useampaa koodausmenetelmää Algoritmeista pyritään saamaan virallisia standardeja International Organisation for Standardization ISO International Electrotechnical Commission IEC + Joint Photographic Expert Group (JPEG) + Motion Picture Expert Group (MPEG) H.261 Alkuperäinen videokuva (625 tai 525 juovaa) muutetaan CIF-formaattiin Bittivirta sisältää kaiken tarpeellisen ja se voidaan yhdistää audion kanssa Bittivirta on 40 kbps - 2 Mbps Sekä yksi- että kaksisuuntainen kommunikaatio Virheenkoodaus Monipisteneuvottelu Petri Vuorimaa 41 Petri Vuorimaa 42 7
CIF-formaatti Luminanssi - Krominanssi (Y, CB, CR) 8 bittiä/näyte 30 kuvaa/sekuntti Luminanssi 352 x 288 resoluutio Krominanssi 172 x 144 resoluutio Quarter-CIF formaatti puolittaa resoluutiot Kaikki kooderit/dekooderit tukevat QCIFformaattia; QIF-formaatti valinnainen Petri Vuorimaa 43 Koodausalgoritmi H.261 käyttää kuvien välistä ennustusta ja DCTkoodausta INTRA-moodissa kuva koodataan yksin ja INTER-moodissa käytetään ennustusta Kuva jaetaan 16 x 16 makrolohkoihin, jotka koostuvat neljästä 8 x 8 luminanssilohkosta ja kahdesta 8 x 8 krominanssilohkosta Lisäksi käytössä on lohkoryhmät 0, 1, 2 tai 3 kuvaa mahdollista tiputtaa Petri Vuorimaa 44 MPEG Arkkitehtuuri Hyvä kuvanlaatu 1,0-1,5 Mbps Symmetrinen tai asymmetrinen koodaus/dekood. Toisto mistä tahansa kohtaa mahdollista Kelaus ja käänteinen toisto mahdollista Audio/video synkronointi Datavirheet eivät saa aiheuttaa ongelmia Kompressio/dekompressio -viiveen ohjaus Editointi mahdollista Eri formaatit (ikkunointi) Halpojen piirisarjojen kehittäminen mahdollista Neljä erilaista kuvatyyppiä: + I-kuvat muista riippumattomia + P-kuvat ennustettuja (liike) muista I- tai P-kuvista + B-kuvat interpoloituja sekä edellisistä että tulevista I- tai P-kuvista + D-kuvat ovat nopeaa etsimistä varten I-kuvat vievät eniten tilaa; P-kuvat 3:1; B-kuvat edelleen 2-5:1 B-kuvien dekoodaus aiheuttaa viivettä Petri Vuorimaa 45 Petri Vuorimaa 46 MPEG-kuvasarja Bittivirran syntaksi Bittivirta koostuu useista eri tasoista: + videosekvenssi (täydellinen sekvenssi) + ryhmä kuvia (kaikki parametrit; haku) + kuva (yksittäinen kuva) + osakuva (sisältää synkronointi ym. tiedot) + makrolohko (16 x 16; liikkeenkorjaus) + lohko (8 x 8) Petri Vuorimaa 47 Petri Vuorimaa 48 8
Tehokkuus Voidaan käyttää useita resoluutioita ja bittimääriä Esim. CD-ROM: 30 kuvaa/sekunti, 352 x 240 resoluutio (kuin VHS-nauhuri) Pakkaus ja purku voidaan tehdä ohjelmallisesti Reaaliaikainen pakkaus pitää kuitenkin tehdä laitteistolla MPEG-2 MPEG-2: bittinopeus 2-15 Mbps Mahdollistaa myös teräväpiirtotelevision Käytössä digitaalisessa televisiossa Viisi audiokanavaa, bassot ja seitsemän selostus/kieli-kanavaa Video-, audio- ja datavirrat kootaan lähetysvirraksi (transport stream) Petri Vuorimaa 49 Petri Vuorimaa 50 MPEG-4 Kompositio MPEG-4: matalat bittinopeudet Kuva ja ääni voidaan jakaa osiin (tekijöihin) Eri osia varten voidaan käyttää eri koodausmenetelmiä Uusien koodausmenetelmien käyttöönotto mahdollista Demultiplekseri Luonnollinen audio Luonnollinen video Synteettinen audio Synteettinen video Kompositio Petri Vuorimaa 51 Omistusoikeudet MPEG-7 Multimediasisältö MPEG-7 ei ole kompressiostandardi, vaan se on tarkoitettu sisällön kuvaamiseen + multimediasisällön kuvaus + joustavuus sisällönhallinnassa + eri datalähteiden sovittaminen Kyseessä on siis metadata-standardi Voidaan käyttää sisällön hakuun ja suodatukseen Kuvauksen generointi MPEG-7 kuvaus Sisällönkuvauskieli Kuvausmenetelmät Kuvaukset Hakukone Sovellus Suodatus agentti Petri Vuorimaa 53 Enkooderi MPEG-7 koodi Dekooderi 9