T-61.246 DSP: GSM codec



Samankaltaiset tiedostot
Digitaalinen audio & video I

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

Digitaalinen audio & video, osa I. Johdanto. Digitaalisen audion sovellusalueet. Johdanto. Taajuusalue. Psykoakustiikka. Johdanto Digitaalinen audio

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

puheen laatu kärsii koodauksesta mahdollisimman vähän. puhe pakkautuu mahdollisimman pieneen määrään bittejä.

Digitaalinen Audio & Video I

Alla olevassa kuvassa on millisekunnin verran äänitaajuisen signaalin aaltomuotoa. Pystyakselilla on jännite voltteina.

Digitaalinen audio & video, osa I

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

Synteesi-analyysi koodaus

S Tietoliikennetekniikan perusteet. Jukka Manner Teknillinen korkeakoulu

Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka. Vfo135 ja Vfp124 Martti Vainio

5 Akustiikan peruskäsitteitä

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Laskuharjoitus 4 ( ): Tehtävien vastauksia

Juha Henriksson. Digitaalinen äänentallennus Dr. Juha Henriksson Finnish Jazz & Pop Archive

1. Perusteita Äänen fysiikkaa. Ääniaalto. Aallonpituus ja amplitudi. Taajuus (frequency) Äänen nopeus

Pianon äänten parametrinen synteesi

ELEC-C5070 Elektroniikkapaja (5 op)

Tiedonsiirron perusteet ja fyysinen kerros. Tietoliikenne kohtaa todellisuuden OSI-mallin alimmainen kerros Kirja sivut 43-93

Äänen laadun parantaminen puheensiirrossa keinotekoisella taajuuskaistan laajennuksella

ELEC-C Sovellettu digitaalinen signaalinkäsittely. Äänisignaalien näytteenotto ja kvantisointi Dither Oskillaattorit Digitaalinen suodatus

Tiedon koodaus signaaliin

1 Olkoon suodattimen vaatimusmäärittely seuraava:

SGN-4200 Digitaalinen audio

Historiaa musiikillisten äänten fysikaalisesta mallintamisesta

KAISTANLEVEYDEN JA TEHON KÄYTÖN KANNALTA OPTIMAALINEN MODULAATIO TRELLISKOODATTU MODULAATIO (TCM)

Mitä on multimedia? Multimedia. Jatkuva-aikainen media. Yleisimmät mediatyypit. Jatkuvan median käsittelyvaiheet. Interaktiivuus

Äänen eteneminen ja heijastuminen

Puhetie, PCM järjestelmä, johtokoodi

Tiedon koodaus signaaliin. Sinifunktio. Fourier-sarja. Esimerkki: b -kirjain. T = 8; f =1/T = 1/8 10/14/ Fysikaalinen tulkinta

Tiedon koodaus signaaliin

Puheen akustiikan perusteita

A! Modulaatioiden luokittelu. Luento 4: Digitaaliset modulaatiokonstellaatiot, symbolijonolähetteet. ELEC-C7230 Tietoliikenteen siirtomenetelmät

1 Määrittele seuraavat langattoman tiedonsiirron käsitteet.

Digitaalitekniikan matematiikka Luku 1 Sivu 1 (19) Johdatus digitaalitekniikkaan

Anturit ja Arduino. ELEC-A4010 Sähköpaja Tomi Pulli Signaalinkäsittelyn ja akustiikan laitos Mittaustekniikka

SISÄLLYS - DIGITAALITEKNIIKKA

Organization of (Simultaneous) Spectral Components

Tietoliikennesignaalit & spektri

LARI KUMPU ADPCM:N KÄYTTÖ ÄÄNEN HÄVIÖTTÖMÄSSÄ PAKKAUKSESSA

Radioamatöörikurssi 2015

Sanasto: englanti-suomi

KOHINA LÄMPÖKOHINA VIRTAKOHINA. N = Noise ( Kohina )

1 Diskreettiaikainen näytteistys. 1.1 Laskostuminen. Laskostuminen

Kuvan pakkaus JPEG (Joint Photographic Experts Group)

S Mobile Communication Systems and Services (2 credits) Exam

Signaalien taajuusalueet

LABORATORIOTYÖ 3 VAIHELUKITTU VAHVISTIN

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?

5 Lineaarinen ennustus

IIR-suodattimissa ongelmat korostuvat, koska takaisinkytkennästä seuraa virheiden kertautuminen ja joissakin tapauksissa myös vahvistuminen.

Tiedon esitys tietokoneessa. Jyry Suvilehto T Johdatus tietoliikenteeseen ja multimediatekniikkaan kevät 2014

esimerkkejä erilaisista lohkokoodeista

Signaalien datamuunnokset. Digitaalitekniikan edut

Signaalien datamuunnokset

Anturit ja Arduino. ELEC-A4010 Sähköpaja Tomi Pulli Signaalinkäsittelyn ja akustiikan laitos Mittaustekniikka

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

Mul$media. Jyry Suvilehto Alkuperäiset kalvot Petri Vuorimaa

Digitaalinen audio

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.

HITSAUKSEN TUOTTAVUUSRATKAISUT

Multimedia. Mitä on multimedia? Mediatyypit. Siirtoformaatit. + Teksti + Grafiikka + Audio + Kuva + Video. Petri Vuorimaa 1

Kanavointi ja PCM järjestelmä

Digitaalinen media. Petri Vuorimaa

Moniantennitekniikat langattoman tietoliikenteen kapasiteetin räjäyttäjinä

S Mobile Communication Systems and Services (2 credits) Exam

Helsinki University of Technology Laboratory of Telecommunications Technology

Mobile Sensing IX Prosodic Sensing. Spring 2015 Petteri Nurmi

Kurssin perustiedot. ELEC-C7110 Informaatioteknologian perusteet. Tämän viikon aiheet. Tiedonsiirron perusteita. Tiedonsiirron rakenneosat

Tuntematon järjestelmä. Adaptiivinen suodatin

Säätötekniikan ja signaalinkäsittelyn työkurssi

Data ja informaatio. Tiedonsiirron perusteet ja fyysinen kerros. Ohjattu media. Tiedonsiirto. Ohjaamaton media

Ryhmätyö. Kalle Palomäki Signaalinkäsi5elyn ja akus8ikan laitos

Reititys. Reititystaulukko. Virtuaalipiirin muunnostaulukko. Datasähkeverkko. virtuaalipiiriverkko. Eri verkkotekniikoita

TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen

Radioamatöörikurssi 2016

1. PUHEEN KOODAUS... 2

Helsinki University of Technology

Tiedonkeruu ja analysointi

Laskuharjoitus 2 ( ): Tehtävien vastauksia

Yleistä. Digitaalisen äänenkäsittelyn perusteet. Tentit. Kurssin hyväksytty suoritus = Harjoitustyö 2(2) Harjoitustyö 1(2)

Radiokurssi. Modulaatiot, arkkitehtuurit, modulaattorit, ilmaisimet ja muut

Referenssit ja näytteenotto VLBI -interferometriassa

Puheen akustiikan perusteita

T SKJ - TERMEJÄ

Virheen kasautumislaki

Laajaverkot (WAN) Puhelinverkko. runkolinjat digitaalisia, kuitua local loop analoginen, kierretty pari kanavointi

Kanavointi (multiplexing)

Kanavointi (multiplexing) Laajaverkot (WAN) T1 Carrier CCITT PCM. E1 (2.048 Mbps)

Uuden sukupolven HF-kommunikaatiotekniikka

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Puheen tuotto ja havaitseminen I Vokaalit. Puheentuoton lähde-suodin -malli. Glottaalinen äänilähde. Fonaatio

Puheen tuotto ja havaitseminen I

Helsinki University of Technology

Tiedonsiirron perusteet ja fyysinen kerros. Tietoliikenne kohtaa todellisuuden OSI-mallin alimmainen kerros "Miten siirretään yksi bitti"

AKKREDITOITU KALIBROINTILABORATORIO ACCREDITED CALIBRATION LABORATORY SGS FIMKO OY

SGN-4051 Puheenkoodaus

Transkriptio:

T-61.246 DSP: GSM codec

Agenda Johdanto Puheenmuodostus Erilaiset codecit GSM codec Kristo Lehtonen GSM codec 1

Johdanto Analogisen puheen muuttaminen digitaaliseksi Tiedon tiivistäminen pienemmäksi Vähentää siirrettävien bittien määrää (bit rate) Säilyttää riittävän äänen laadun Nykyhetken puhesovellukset vs. tulevaisuuden multimediasovellukset GSM standardi: 18 kbps Residual Pulse Excitation codec Kristo Lehtonen GSM codec 2

Äänentuotanto Nasal cavity GSM phone Pharyngeal cavity Mouth cavity Glottis Lungs Äänikanava äänihuulista suuhun Äänihuulet värähtelevät Perustaajuus (pitch) Kristo Lehtonen GSM codec 3

Äänentuotanto Quasi-periodinen Ennustettavuus tärkeää koodauksen kannalta Kristo Lehtonen GSM codec 4

Äänentuotanto Suurimmat komponentit formantteja Äänikanavan mallinnus suodattimena Muuttuu hitaasti Korrelaatioita Kristo Lehtonen GSM codec 5

Äänentuotanto Ihmiskorvan erottelukyky rajallinen taajuuksista 16 20 000 Hz puhelinverkoissa 300 3 400 Hz Resoluutiokyky myös rajallinen Herkempi matalilla taajuuksilla Kristo Lehtonen GSM codec 6

Epälineaarinen kvantisointi A-laki Voltage amplitude 128 96 64-4096 -3072-2048 -1024 32 1024 2048 3072 4096 Quantisising value -32-64 -96-128 Kristo Lehtonen GSM codec 7

Miten hyödyntää puheen ominaisuuksia koodauksessa? Effect of predictive coding and transform coding Relevant Description of channel signal after efficient coding Redundant Effect of amplitude quantisation Non-Redundant Irrelevant Lyhyen ja pitkän ajanjakson korrelaatiot Ennustus (signaalin sijaan koodataan ennustusvirhe) Osa informaatiosta hahmottamisen kannalta irrelevanttia Tehokas kvantisointi Mallinnus suodattimena Kristo Lehtonen GSM codec 8

Codecit voidaan luokitella 3 eri ryhmään Aaltomuotokoodaus Pyritään säilyttämään signaalin aaltomuoto Vokoodaus (source coding) Mallinnetaan lähdettä Hybridinen koodaus Aaltomuoto- ja vokoodauksen yhdistelmä Kristo Lehtonen GSM codec 9

Aaltomuotokoodaus PCM yksinkertaisin esimerkki Näytteenotto Lineaarinen kvantisointi (12 bit/näyte) vs. A-laki (8 bit/näyte) Ennustus - DPCM r(n) = s(n) s (n) Kvantisointi vaatii vähemmän bittejä σ SNR = 10log σ 2 s 2 r Kristo Lehtonen GSM codec 10

Vokoodaus Pitch Generation of impulses Voiced The parameters in the vocal tract Switch Vocal tract as a filter Filtered speech Generation of noise Unvoiced Äänikanavaa mallinnetaan filtterinä Hyvin pieni bit rate, mutta huono äänen laatu Käytössä puhtaassa muodossaan lähinnä armeijasovelluksissa Kristo Lehtonen GSM codec 11

Hybridinen koodaus Quality of service Hybrid codecs Excellent Waveform codecs Good Fair Source codecs Poor 16 22 44 84 16 32 64 Bit Rate kbits/s Aaltomuotokoodaus hyvä noin 16 kbit/s asti Vokoodaus hyvin pienillä bit rate:llä AbS, MPS, RPE Kristo Lehtonen GSM codec 12

Lyhyen aikavälin ennustus (LPC) Suodattimen herätteenä ei vain soinnillen-soinniton ääni Heräte ennustetaan edeltävien näytteiden lineaarikombinaationa Korrelaatioita alle 16 näytteen etäisyydeltä Minimoidaan virhesignaali kertoimien valinnalla 1 H ( z) = A( z) A( z) = 1+ p k= 1 a k z k Kristo Lehtonen GSM codec 13

Pitkän aikavälin ennustus (LTP) Korrelaatioita alle noin 20-120 näytteen etäisyydeltä Maksimoidaan x[n] ja x[n+n] korrelaatio P( z) =1+ bz N Kristo Lehtonen GSM codec 14

GSM-codec -Linear Predictive Coding with Regular Pulse Excitation (LPC-RPE) Error - + Linear prediction 36 bits Synthesis filter 20 ms speech bloc Long-term prediction 36 bits Excitation analysis 188 bits Bit rate 13 kbit/s Jaettu 20 ms lohkoihin ja edelleen 5 ms ala-lohkoihin Jokaisella 20 ms lohkolla oma synteesifiltteri Kristo Lehtonen GSM codec 15

GSM-codec -Linear Predictive Coding with Regular Pulse Excitation (LPC-RPE) Bits per 5 ms block Bits per 20 ms block LPC filter 8 parameters 36 LTP filter Delay parameter 7 28 Gain parameter 2 8 Excitation signal Subsampling phase 2 8 Maximum amplitude 6 24 13 samples 39 156 Total 260 bits Myös Half-rate codec olemassa GSM:lle bit rate 5.6 kbit/s Kristo Lehtonen GSM codec 16