Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?



Samankaltaiset tiedostot
Ongelma(t): Miten digitaalista tietoa voidaan toisintaa ja visualisoida? Miten monimutkaista tietoa voidaan toisintaa ja visualisoida?

Ongelma(t): Mikä on Turingin kone? Miten Turingin kone liittyy funktioihin ja algoritmeihin? Miten Turingin kone liittyy tietokoneisiin?

Ongelma 1: Miten tieto kannattaa koodata, jos sen halutaan olevan hyvin vaikeasti luettavaa?

Kuvan pakkaus JPEG (Joint Photographic Experts Group)

Algoritmit 2. Luento 9 Ti Timo Männikkö

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

Numeropelissä 3x3-ruudukko sisältää luvut 1, 2,, 9. Tehtäväsi on järjestää ruudukko näin:

Matias Sumanen Mittaussignaalin häviötön pakkaaminen. Kandidaatintyö

Alla olevassa kuvassa on millisekunnin verran äänitaajuisen signaalin aaltomuotoa. Pystyakselilla on jännite voltteina.

Sinulle on annettu bittijono, ja tehtäväsi on muuttaa jonoa niin, että jokainen bitti on 0.

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Luku- ja merkkikoodit. Digitaalitekniikan matematiikka Luku 12 Sivu 1 (15)

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

Algoritmit 2. Luento 9 Ti Timo Männikkö

Algebralliset menetelmät virheenkorjauskoodin tunnistamisessa

LÄHTEENKOODAUS. Mikä on lähteenkoodauksen perusidea? A Tietoliikennetekniikka II Osa 20 Kari Kärkkäinen Syksy 2015

Algoritmit 2. Luento 10 To Timo Männikkö

811120P Diskreetit rakenteet


Palautteita. Tutoriaalit olivat vaikeat! Totta, tentti on onneksi helpompi

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Shannonin ensimmäinen lause

Matlab-tietokoneharjoitus

Tiedon esitysmuodot. Luento 6 (verkkoluento 6) Lukujärjestelmät Kokonaisluvut, liukuluvut Merkit, merkkijonot Äänet, kuvat, muu tieto

Digitaalitekniikan matematiikka Luku 13 Sivu 1 (10) Virheen havaitseminen ja korjaus

Ongelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan?

Harmaasävykuvien häviötön tiivistäminen

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Digitaalinen audio & video I

Matematiikka ja teknologia, kevät 2011

SISÄLLYS - DIGITAALITEKNIIKKA

puheen laatu kärsii koodauksesta mahdollisimman vähän. puhe pakkautuu mahdollisimman pieneen määrään bittejä.

LARI KUMPU ADPCM:N KÄYTTÖ ÄÄNEN HÄVIÖTTÖMÄSSÄ PAKKAUKSESSA

Signaalien datamuunnokset. Digitaalitekniikan edut

Signaalien datamuunnokset

Koodausteoria, Kesä 2014

ELEC-C7230 Tietoliikenteen siirtomenetelmät

Harmaasävykuvien häviöttömästä tiivistyksestä

Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja

ELEC-C5070 Elektroniikkapaja (5 op)

TAMPEREEN TEKNILLINEN YLIOPISTO

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

Digitaalinen audio & video, osa I. Johdanto. Digitaalisen audion sovellusalueet. Johdanto. Taajuusalue. Psykoakustiikka. Johdanto Digitaalinen audio

T Luonnollisten kielten tilastollinen käsittely

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

INFORMAATIOTEORIA & KOODAUS TÄRKEIMPIEN ASIOIDEN KERTAUS A Tietoliikennetekniikka II Osa 28 Kari Kärkkäinen Syksy 2015

Tietotyypit ja operaattorit

esimerkkejä erilaisista lohkokoodeista

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

Tietoliikenteen fyysinen kerros. Tietoliikenne kohtaa todellisuuden Kirja sivut 43-93

Algoritmit 2. Luento 13 Ti Timo Männikkö

TEHTÄVIEN RATKAISUT. Tehtäväsarja A. 2. a) a + b = = 1 b) (a + b) = ( 1) = 1 c) a + ( b) = 13 + ( 12) = = 1.

Tehtävä 2: Tietoliikenneprotokolla

TAMPEREEN TEKNILLINEN YLIOPISTO

Datatähti 2019 loppu

Digitaalinen signaalinkäsittely Kuvankäsittely

Tiedonsiirron perusteet ja fyysinen kerros. Tietoliikenne kohtaa todellisuuden OSI-mallin alimmainen kerros Kirja sivut 43-93

Tietorakenteet ja algoritmit syksy Laskuharjoitus 1

JPEG:n algoritmit ja niiden vaihtoehdot

Koodausteoria, Kesä 2014

Koodausteoria, Kesä 2014

Algoritmit 2. Luento 13 Ti Timo Männikkö

Tekijöihinjaon kvanttialgoritmi

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

Digitaalinen audio & video, osa I

ITKP102 Ohjelmointi 1 (6 op)

Tietorakenteet ja algoritmit - syksy

MS-A0402 Diskreetin matematiikan perusteet

Koodausteoria, Kesä 2014

Äärettömät sanat. Aleksi Saarela. Matematiikan ja tilastotieteen laitos ja FUNDIM-keskus, Turun yliopisto. A. Saarela (TY) Äärettömät sanat 1 / 28

ANSI/IEEE Std

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

Data ja informaatio. Tiedonsiirron perusteet ja fyysinen kerros. Ohjattu media. Tiedonsiirto. Ohjaamaton media

811120P Diskreetit rakenteet


Algoritmit lyhyiden sekvenssien rinnastamiseen referenssigenomia vasten. Krista Longi

JBIG2-tiivistysstandardi

jäsentäminen TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho 26. marraskuuta 2015 TIETOTEKNIIKAN LAITOS

Kuvankäsi*ely 1. Digitaaliset kuvat ja niiden peruskäsi3eet. Kimmo Koskinen

Digitaalitekniikan matematiikka Luku 1 Sivu 1 (19) Johdatus digitaalitekniikkaan

Häviötön tiedon pakkaaminen

OHJ-1010 Tietotekniikan perusteet 4 op Syksy 2012

Toisessa kyselyssä alueella on 1 ruudussa A ja 3 ruudussa B, joten suosituin ehdokas on B.

Digitaalinen Audio & Video I

Vapo: Turveauman laskenta 1. Asennusohje

Ongelma(t): Jotta tietokone olisi mahdollisimman yleiskäyttöinen ja suorituskykyinen, niin miten tietokoneen resurssit tulisi tarjota ohjelmoijalle,

Perinnöllinen informaatio ja geneettinen koodi.

811120P Diskreetit rakenteet

T DSP: GSM codec

7. Kuvantiivistys 7.1. Perusteet

Algoritmit 1. Demot Timo Männikkö

Ongelma(t): Miten mikro-ohjelmoitavaa tietokonetta voisi ohjelmoida kirjoittamatta binääristä (mikro)koodia? Voisiko samalla algoritmin esitystavalla

Kenguru 2017 Benjamin (6. ja 7. luokka)

Algoritmit 2. Demot Timo Männikkö

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 29. toukokuuta 2013

Syötteen ainoalla rivillä on yksi positiivinen kokonaisluku, joka on alle = Luvussa ei esiinny missään kohtaa numeroa 0.

Algoritmit 2. Luento 12 To Timo Männikkö

Laskuharjoitus 4 ( ): Tehtävien vastauksia

Kenguru Student (lukion 2. ja 3. vuosi) sivu 1 / 6

Toteutusdokumentti: Huffman-koodaus

Transkriptio:

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? 2012-2013 Lasse Lensu 2

Ongelma 2: Voidaanko dataa tai informaatiota tallettaa tiiviimpään tilaan koodaamalla se uudelleen? 2012-2013 Lasse Lensu 3

Ongelma 3: Mikä on tiivein esitysmuoto tai koodaustapa tietylle datalle? 2012-2013 Lasse Lensu 4

Digitaalisen datan ja informaation määrä kasvaa kiihtyvää tahtia digitalisoitumisen sekä kuva-, video- ja äänisovellusten takia. Datan esitysmuotoa on mahdollista muuttaa koodaamalla se uudelleen. 2012-2013 Lasse Lensu 5

Tietojenkäsittelyn perusteet 1 Tiedon tiivistäminen 2012-2013 Lasse Lensu 6

Aiheen sijoittuminen 2012-2013 Lasse Lensu 7

Tiedon tiivistäminen Brookshear, J.G. Computer Science - An overview, 7 th ed. Addison Wesley, 2003 Alaoutinen, S., 2008 Motivaatio tiivistämiseen Perusmenetelmiä 2012-2013 Lasse Lensu 8

Miksi säästellä bittejä Pakattu tieto vie vähemmän tilaa siirrossa ja talletuksessa nopeus/tehokkuus. Useimmissa tapauksissa tiedon esitystapaa voi tiivistää käsiteltävän tiedon kärsimättä. Entropia kertoo, kuinka monta bittiä/merkki keskimäärin vähintään tarvitaan (satunnaisen tiedon koodaamiseen). 2012-2013 Lasse Lensu 9

Tiivistäminen Jokaiselle koodattavalle merkkijonon merkille (jostakin aakkostosta) oma koodisana: N L log b K, missä N koodisanan pituus, L on koodattavan merkkijonon pituus, b koodiaakkoston koko ja K koodattavan aakkoston koko. Tiivistämissuhde: kuinka paljon uudelleen koodaaminen hyödyttää. Kiinteäpituinen/muuttuvapituinen koodi 2012-2013 Lasse Lensu 10

Perusmenetelmät Häviötön tiivistäminen: Alkuperäisestä tiedosta ei katoa tai muutu mitään Tiivistämisessä tulee raja vastaan Häviöllinen tiivistäminen: Alkuperäistä tietoa katoaa Parempi tiivistämissuhde 2012-2013 Lasse Lensu 11

Gray-koodi Binääriesitys, jossa kahden peräkkäisen symbolin binääriesitykset eroavat mahdollisimman vähän. Liittyy lähinnä tiedonsiirron säilyttämiseen virheettömänä. 7 1 0 0 6 1 0 1 5 1 1 1 4 1 1 0 3 0 1 0 2 0 1 1 1 0 0 1 0 0 0 0 2012-2013 Lasse Lensu 12

Jakson/jononpituuskoodaus Tiedon binääriesityksessä vuorottelevat ykkösten ja nollien jonot. Lähetetään tieto vain siitä, kunka monta kutakin bittiä on peräjälkeen (ykkönen aloittaa): 00011010100001111100010111001111 032111145311324 2012-2013 Lasse Lensu 13

Kiinteän pituuden koodaus Häviötön tiivistäminen Jokaiselle koodattavalle sanalle (tai merkille) on oma bittikuvio. Bittikuvion bittien määrä N L log b K Wenglish koostuu viisikirjaimisista merkistön a-z sanoista: Kuinka monta bittiä/sana tarvitaan, jotta jokainen sana saa oman bittikuvion? 2012-2013 Lasse Lensu 14

Lasketaan... N L log b K N 5 log 2 26 N 23. 5 eli wenglish vaatisi 24 bittiä sanaa kohti. Tietokoneessa se vaatisi 4 tavua, eli pitkän kokonaisluvun verran. 2012-2013 Lasse Lensu 15

Kiinteän pituuden koodaus Häviöllinen tiivistäminen: Yleisimmille koodattaville sanoille oma bittikuvio. Harvinaiset sanat eivät kaikki saa omaa koodia. Wenglish käyttää kuitenkin tavallisesti vain noin 32 000 sanaa, joten näille omat koodisanat; loput niputetaan 8 000 sanaan: Entä nyt, kuinka monta bittiä/sana? 2012-2013 Lasse Lensu 16

Lasketaan... N log 2 40000 N 15. 29 Edellisessä käsitellään siis sanoja, ei kirjaimia, joten tarvitaan siis 16 bittiä/sana. Tilantarve on tietokoneessa 2 tavua eli puolet aiemmasta. 2012-2013 Lasse Lensu 17

Muuttuvan pituuden koodaus Häviötön koodaus Huffman koodi: Useimmin esiintyville merkeille annetaan lyhin bittikuvio. LZW-koodi: Luo taulukkoa esiintyneistä sanoista. Q-koodi: Käyttää koodattavan merkin todennäköisyyden laskemiseen lähiympäristön merkkejä. 2012-2013 Lasse Lensu 18

Huffman-koodi Koodattavien symbolien esiintymistodennäköisyydet on tiedettävä. Menetelmä: Kahden vähiten todennäköisen symbolin todennäköisyydet lasketaan yhteen ja tulos sijoitetaan listaan niiden kahden tilalle. Toistetaan kunnes kaksi todennäköisyyttä on jäljellä: Toiselle koodisanaksi 0 ja toiselle 1. Yhdistetyn todennäköisyyden koodisanaan lisätään oikealle 0 ja 1. 2012-2013 Lasse Lensu 19

Huffman-koodi s i s 1 s 2 s 3 s 4 s 5 P(s i ) 0.40 0.20 0.15 0.15 0.10 0.40 0.25 0.20 0.15 0.40 0.35 0.25 0.60 0.40 s i s 1 1 s 1 2 000 1 0 01 s 00 3 001 1 000 s 010 01 4 001 s 5 011 2012-2013 Lasse Lensu 20

Häviöllinen koodaus Ennustava koodaus Esim. Differentiaalinen pulssikoodimodulaatio (DPCM): Jo lasketuista pisteistä (historia) seuraavan pisteen lähinaapurit määräävät uuden pisteen arvon. Muunnoskoodaus Esim. Diskreetti Fourier -muunnos (DFT): Taajuustasoon muunnettu kuva kertoo, mitä taajuuksia (minkä kokoluokan yksityiskohtia) kuvassa on. Alkuperäinen kuva on täysin palautettavissa taajuustiedon perusteella. 2012-2013 Lasse Lensu 21

DPCM 187 187 176 199 176 187 187 187 176 199 172 199 176 187 176 199 172 172 172 199 176 199 172 172 178 172 172 199 187 0 11-23 23-11 0 0 11-23 27-27 23-11 11-23 27 0 0-27 23-23 27 0-6 6 0-27 2012-2013 Lasse Lensu 22

Fourier-muunnos 2012-2013 Lasse Lensu 23

Yhteenveto Koodattua tietoa voidaan tiivistää (koodata uudelleen), kun tietoalkiot koodit sisältävät päällekkäistä tietoa. Tiivistäminen voi tapahtua häviöttömästi (kaikki alkuperäinen tieto on tallella) tai häviöllisesti. Entropia määrää minimirajan tietoalkioiden koodaamiseen käytettävälle bittimäärälle. 2012-2013 Lasse Lensu 24