SGN-4010 Puheenkäsittelyn menetelmät

Koko: px
Aloita esitys sivulta:

Download "SGN-4010 Puheenkäsittelyn menetelmät"

Transkriptio

1 SGN-41 Puheenkäsittelyn menetelmät Konsta Koppinen 18. joulukuuta 26

2 Sisältö 1 Signaalinkäsittelyn kertausta Spektri, DFT, DTFT Aika-taajuusresoluutio Jaksollisen signaalin spektri Nollilla jatketun signaalin spektri Ikkunointi Signaalin autokorrelaatio Autokorrelaation määritelmä Fonetiikkaa Puhe-elimet Puheentuotto Artikulatorista fonetiikkaa Vokaalit Konsonantit Suomen kielen äänteet Muita foneettisia piirteitä Akustista fonetiikkaa 38 4 Lineaarinen ennustus Lineaarisen ennustuksen taustaa Ääntöväylän mallinnus Autokorrelaatioyhtälöt Levinson-Durbin rekursio Lineaarisen ennustuksen sovelluksia Formanttien estimointi Tekijöihin jako Amplitudivasteen maksimien etsintä LP-kertoimien käyttö perustaajuuden estimoinnissa ii

3 SISÄLTÖ iii 6 Puhesynteesi Tekstianalyysi Puhesignaalin generointi Sääntöpohjainen synteesi Konkatenatiivinen synteesi Markovin piilomalleihin perustuva synteesi

4 iv SISÄLTÖ

5 Luku 1 Signaalinkäsittelyn kertausta Tässä luvussa kerrataan/käydään läpi seuraavat signaalinkäsittelyn tiedot joilla on erityistä merkitystä puhesignaalin käsittelyn kannalta: spektri, DFT, DTFT ja FFT aika-taajuusresoluutio signaalin jaksollisuuden ja spektrin harmonisuuden välinen yhteys ikkunointi Lukijan oletetaan osaavan signaalinkäsittelyn perusteet jotka voi hankkia esimerkiksi kursseilta SGN-12 Signaalinkäsittelyn menetelmät ja SGN-125 Signaalinkäsittelyn sovellukset. 1.1 Spektri, DFT, DTFT Napataan kiinni signaali Òµ ½ ½ ¾ ¾ ½ ja sen DFT Ë µ (eli discrete Fourier transform, diskreetti Fourier-muunnos) Ë µ Ò¼ Òµ ÜÔ Ò ¾µ ¼ ½ ½ ¾ ½ ¾¾ ½ ¾¾ ½ ¾ ½ ¼¾µ ¾½¾ ¼ ¾½¾ ¼ µ ¼¾ 1

6 2 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA jotka löytyvät kuviosta 1.1. Esim. arvot Ë µ ja Ë ½µ voidaan laskea samalla kaavalla, mutta lopputuloksena on se, että DFT on jaksollinen, tässä tapauksessa jaksonpituudella eli Ë ¼µ Ë µ Ë ½¼µ Ë ½µ Ë µ Ë ½½µ jne. Termi FFT eli fast Fourier transform viittaa nopeaan Fourier-muunnokseen joka on nopea algoritmi DFT:n laskemiseksi. Insinööriperinteiden mukaisesti kuitenkin usein käytämme nimitystä FFT myös itse DFT-muunnoksesta. Diskreetti Fourier-muunnos kertoo kuinka paljon tietyn taajuisia kompleksisia eksponenttisignaaleja alkuperäisessä signaalissa on. Jatkossa termi kompleksinen eksponenttisignaali saatetaan lyhentää muotoon kompleksinen sini tai jopa sini, sillä ÜÔ µ Ó µ Ò µ 2 signaali s(n) DFT:n amplitudi DFT:n vaihe, radiaaneina Kuvio 1.1: Signaali Òµ ja sen DFT:n amplitudi ja vaihe. Signaalin Òµ diskreetti Fourier-muunnos Ë µ sisältää siis saman informaation kuin Òµ mutta joskus signaalia analysoitaessa on käyttökelpoista käyttää redundantimpaa taajuusesitysmuotoa. Jos katsotaan esimerkiksi DFT:n tappia Ë ¾µ Ò¼ Òµ ÜÔ Ò¾ ¾µ

7 1.1. SPEKTRI, DFT, DTFT 3 se kertoo signaalin Òµ ja signaalin ÜÔ Ò¾ ¾µ sisätulon, toisin sanoen suurin piirtein sen, kuinka paljon signaalia ÜÔ Ò¾ ¾µ sisältyy signaaliin Òµ (matemaattisesti innokkaat voivat miettiä tätä tarkemmin muistelemalla vektorien sisätuloa Ò :ssa). Signaali ÜÔ Ò¾ ¾µ taas on kompleksinen eksponenttisignaali joten se voidaan yhtä hyvin kirjoittaa muodossa ÜÔ Òµ missä ¾ ¾. Ja kun tähän asti ollaan tultu, voidaan saman tien antaa taajuudelle muitakin reaaliarvoja kuin ¼ ¾ ¾ ¾ ¾ ja ¾. Esimerkiksi jos ¼½ ¾, niin summa Ò¼ Òµ ÜÔ kertoo suunnilleen kuinka paljon signaalia Òµ ÜÔ Òµ (kompleksinen eksponenttisignaali, jakso ½¼) sisältyy signaaliin Òµ. Jos sama homma tehdään isolle nipulle :n arvoja saadaan funktio Ë µ Ò¼ Òµ ÜÔ Òµ joka on signaalin Òµ DTFT (eli discrete-time Fourier transform, diskreettiaikainen Fourier-muunnos). Kuviossa 1.2 on esitelty signaalin Òµ DTFT. DTFT lasketaan siis vastaavasti kuin DFT mutta tiheämmällä jaolla, jonka takia saatamme ajoittain viitata siihen nimellä interpoloitu DFT. Havaitaan että DTFT on jaksollinen jaksolla ¾ (näppärä juttu koska tämä ei riipu signaalin pituudesta), ja sen näytteet arvoilla ¼ ¾ ¾ ¾ ¾ ¾ antavat täsmälleen DFT:n näytteet (jotka on osoitettu kuviossa 1.2 tähdillä). Tällä kurssilla käytetään signaalin DTFT:n amplitudista Ë µ nimitystä spektri, joskus myös itse DTFT:sta. Yleisesti spektrillä voidaan vieläpä tarkoittaa DTFT:n amplitudin neliötä tai jopa jotain muuta taajuusesitystä joten kannattaa olla varuillaan. Mitä iloa tästä spektristä sitten on? Esimerkiksi seuraava: otetaan 1 tappia sinisignaalia Òµ Ò Ò ¾ µ

8 4 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA 2 signaali s(n) DTFT:n amplitudi DTFT:n vaihe Kuvio 1.2: Signaalin Òµ DTFT ja DFT:n näytteet tähdillä. jonka jaksonpituus on. Tämä signaali ja sen DFT:n amplitudi löytyvät kuviosta 1.3. Koska Òµ on täysin jaksollinen signaali, voisimme odottaa että sen DFT:ssa olisi vain tätä taajuutta vastaava komponentti (sekä lisäksi negatiivisella taajuudella koska Òµ on reaalinen, mutta tällä ei ole tässä niin väliä), mutta DFT:ssa näyttääkin olevan iso kasa eri taajuuksia. Selitys on siinä, että sinin taajuutta ¾ ei esiinny DFT:ssa, jonka pituus on ½¼, vaan lähimmät taajuudet ovat ¾½¼ ja ¾½¼. Jos signaalin pituus sattuisi olemaan monikerta jaksonpituudesta, DFT:ssa olisi vain yksi nollasta eroava alkio. Jos kuitenkin DFT:n sijaan lasketaankin DTFT, käy kuten kuvio 1.4 kertoo: spektripiikki on levinnyt koko taajuusalueelle, kuitenkin siten että oikean taajuuden kohdalla on suurin piikki. DTFT antaa tässä oikeamman kuvan signaalista, sillä sen arvot eivät riipu niin paljon siitä miten signaalin (mahdollinen) jaksonpituus ja ikkunan pituus sopivat toisiinsa.

9 1.2. AIKA-TAAJUUSRESOLUUTIO 5 1 sinisignaali DFT:n amplitudi Kuvio 1.3: 1 tappia sinisignaalia jonka jaksonpituus on 3 ja DFT:n amplitudi. 1.2 Aika-taajuusresoluutio Sinisignaalin taajuuden estimointia pohtimalla tulee ilmi yleisempi aika-taajuusresoluution ns. Heisenbergin epätarkkuusperiaate: jos signaalin aikaresoluutio on hyvä, sen taajuusresoluutio ei voi olla kovin hyvä, ja päinvastoin. Signaalin aikaresoluutio tarkoittaa tässä ikkunan (=signaalin) pituutta ja taajuusresoluutio suurin piirtein sitä, kuinka keskittynyt sen DTFT on. Aikaresoluutio on sitä parempi mitä lyhyempi ikkuna ja taajuusresoluutio on sitä parempi mitä keskittyneempi DTFT. Ajatellaan että otetaan jostain pidemmästä signaalista 1 tapin mittainen ikkuna, jolloin tiedämme melko tarkkaan (1 näytteen tarkkuudella) missä päin signaalia tämä ikkuna on. Sen sijaan 1 tapin ikkunasta on vaikea tehdä kovin tarkkaa taajuusanalyysia: kyseessä voisi olla tietyntaajuinen sini ja hiukan kohinaa tai aikalaillaeritaajuinen sini ja hiukan enemmän kohinaa. Sen sijaan jos alkuperäisestä signaalista otetaan 124:n tapin mittainen ikkuna, voimme jo aika hyvin diskriminoida edellisten taajuusvaihtoehtojen välillä, mutta nyt aikaresoluutio on heikompi, koska käytetty ikkuna on pidempi. Otetaan tästä esimerkkinä 16kHz:lla näytteistetty signaali joka on summa kah-

10 6 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA 1 sinisignaali spektri Kuvio 1.4: 1 tappia sinisignaalia jonka jaksonpituus on 3 ja sen spektri, DFT:n näytteet merkitty tähdillä. desta sinistä joiden taajuudet ovat 44Hz ja 45Hz: Òµ Ò ¼½¼¼¼µ¾Òµ Ò ¼½¼¼¼µ¾Òµ josta otettu ½¼¼:n näytteen pala on kuviossa 1.5. Kun tästä piirretään 44Hz:n ympäristössä laskettu DTFT 4:n ja 4:n pituisille ikkunoille saadaan kuvio 1.6 (DTFT:t on vielä normalisoitu näytteen pituudella). Lyhyemmän ikkunan DTFT:ssa näkyy vain yksi piikki kun taas pidemmässä erottuvat yksittäiset sinit. Kuuntelemalla sinit lyhyempi kuulostaa (ainakin luennoitsijan korvin) lyhyeltä piippaukselta kun pidemmässä erottaa jo huojuntaa joka viittaa läheisiin sinitaajuuksiin. Edellinen periaate voidaan formuloida matemaattisesti huomattavasti tarkemminkin, mutta tämän kurssin kannalta järkevää lienee pitää mielessä vain periaate: mitä pidempi ikkuna, sen parempi taajuusresoluutio mutta sen huonompi aikaresoluutio.

11 1.2. AIKA-TAAJUUSRESOLUUTIO 7 2 kahden sinisignaalin summa Kuvio 1.5: Kahden taajuudeltaan lähekkäisen sinisignaalin summa.

12 8 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA 1 DTFT:n amplitudi, 4 näytettä taajuus, Hz 1 DTFT:n amplitudi, 4 näytettä taajuus, Hz Kuvio 1.6: Kahden sinisignaalin summasta laskettu DTFT eri signaalien pituuksilla.

13 1.3. JAKSOLLISEN SIGNAALIN SPEKTRI Jaksollisen signaalin spektri Joidenkin puheäänteiden (esim. vokaalien) aaltomuoto on usein lähes jaksollinen. Signaalin jaksollisuus taas näkyy Fourier-muunnoksessa niin, että sen DFT on harmoninen, eli siinä kaikki energia on perustaajuudella ¼ ja sen monikerroilla ¾ ¼ ¼ ¼. Tällä tiedolla on usein käyttöä puhe- ja audiosignaalien käsittelyssä. Mutta miksi spektri on harmoninen? Selitys 1 (hankala). Lasketaan kylmästi Ë ½ µ Æ ½ Ò¼ ½ Òµ ÜÔ Òµ missä ½ Òµ on Æ:n pituinen ei-jaksollinen signaali Ë ½ µ tämän DTFT. Jos nyt eli kaksi jaksoa signaalia ½ Òµ, niin ¾ Òµ ½ Òµ ½ Òµ Ë ¾ µ ¾Æ ½ Ò¼ Æ ½ Ò¼ ¾ Òµ ÜÔ Òµ ½ Òµ ÜÔ Òµ Æ ½ Ò¼ Ë ½ µ ÜÔ ÆµË ½ µ Ë ½ µ ½ ÜÔ Æµµ ½ Òµ ÜÔ Ò Æ µµ Vastaavalla meiningillä kun signaalista otetaan à kopiota voidaan todeta spektrin olevan Ë Ã µ Ë ½ µ ½ ÜÔ Æµ ÜÔ Ã ½µÆµ Eli herää kysymys miten à µ ½ ÜÔ Æµ ÜÔ Ã ½µÆµ käyttäytyy kun à kasvaa. Koska à µ on geometrinen sarja, saadaan (pikku muistelulla/taulukkokirjalla) à µ ½ ÜÔ Æõ ½ ÜÔ Æµ Tämän funktion nimittäjä on kun ¼ ¾Æ ¾ ¾Æ Æ ½µ ¾Æ. Tällöin myös osoittaja on, joten osamäärä voidaan tällaisella taajuudella laskea

14 1 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA l Hospitalin säännön avulla ÐÑ Ã µ ÐÑ Ã ½ ÜÔ Æõ ½ ÜÔ Æµ ½ ÜÔ Æõµ ½ ÜÔ Æµµ ÜÔ Æõ Æõ ÜÔ Æµ Æ µ sillä :n määritelmän mukaan ÜÔ Æõ ÜÔ Æµ ½. Lisäksi à µ ¼ silloin kun osoittaja on eli kun on ¾ Æõ:n monikerta jos se ei ole samalla ¾Æ:n monikerta. Näin käy jos ¾ Æõ ¾ ¾ Æõ à ½µ¾ Æõ à ½µ¾ Æõ Siis: kun signaalista ½ Òµ otetaan à jaksoa, sen DTFT on ÃË ½ µ kun on ¾Æ:n monikerta ja nolla kun on ¾ :n monikerta paitsi ¾Æ:n monikerrois- Æà sa. Kuva 1.7 havainnollistaa tilannetta. Tämä selitys ei välttämättä ole kaikkein havainnollisin joten katsotaan vielä toinen... Selitys 2 (helpompi mutta hiukan vähemmän tarkka). Otetaan taas à kopoita Æ:n pituisesta signaalista ½ Òµ signaaliin à ҵ ja olkoon signaalin à ҵ DFT Ë Ã µ. Tavoitteena on osoittaa että DFT:n tapit paitsi ¼ à ¾Ã Æ ½µÃ ovat nollia. Lähdetään liikkeelle käänteisestä DFT:sta eli Òµ ½ Æà ½ Ë Ã µ ÜÔ ¾Ò Æõµ Æà ¼ Tiedämme että Òµ on jaksollinen signaali jonka jaksonpituus on Æ ja se saadaan siis summaamalla signaaleja ÜÔ ¾Ò Æõµ eri :n arvoilla. Jos otamme mukaan summaan vain ne :n arvot joilla tämä signaali on jaksollinen jaksolla Æ niin summasignaali on taatusti myös jaksollinen jaksolla Æ. Nämä :n arvot saadaan yhtälöstä ÜÔ ¾Ò Æõµ ÜÔ ¾ Ò Æ µ Æõµ Kirjoittamalla oikea puoli auki tämä yhtälö saadaan muotoon ÜÔ ¾Ò Æõµ ÜÔ ¾Ò Æõµ ÜÔ ¾Æ Æõµ

15 1.4. NOLLILLA JATKETUN SIGNAALIN SPEKTRI 11 3 signaali 3 signaali x 2 3 signaali x FFT:n amplitudi 15 FFT:n amplitudi 2 FFT:n amplitudi Kuvio 1.7: Monistettuja signaaleja ja niiden spektrit. eli ½ ÜÔ ¾Æ Æõµ ÜÔ ¾Ãµ Tämä taas on voimassa vain silloin kuin à on kokonaisluku, eli juuri silloin kun ¼ à ¾Ã Æ ½µÃ. Selitys 3 (selityskyky olematon mutta menee muistisääntönä). Kun aikatason signaaliin lisätään à kopiota, sen spektriin interpoloituu à nollaa jokaisen tapin väliin. 1.4 Nollilla jatketun signaalin spektri Nollien lisääminen aikatason signaalin perään ennen DFT:n laskentaa on myös usein hyödyllinen operaatio. Tällä saadaan itse asiassa hyvä approksimaatio DTFT:sta ja mm. kaikki edellä olleet kuviot DTFT:sta on laskettu tällä tavalla. Oletetaan, että meillä on 256:n näytteen pituinen signaali ½ Òµ johon lisäämme loppuun nollia siten että signaalin pituus on 124, merkitään tätä signaalia

16 12 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA ¾ Òµ (jonka alussa majailee siis ½ Òµ ja lopussa 768 nollaa). Jos laskemme alkuperäisen ja toisaalta nollilla jatketun (engl. zero-padded) jonon DFT:n, käy kuten kuvio 1.8 kertoo: DFT interpoloituu. Miksi? Tämä selittyy helposti DFT:n laskennan avulla, nimittäin DFT:n laskeminen antaa DTFT:n Ë ½ µ näytteet taajuuksilla ¼ ¾¾ ¾ ¾¾ ¾ ¾¾. Nämä saadaan siis kaavasta Ë ½ µ ¾ Ò¼ ½ Ò ÜÔ Òµ kun ¼ ¾¾ ¾ ¾¾ ¾ ¾¾. Pidennetyn signaalin ¾ Òµ DTF:ssa taas on laskettuna taajuudet ¼ ¾½¼¾ ½¼¾ ¾½¼¾ (huomaa että nämä ovat tiuhemmassa kuin edellisessä) ja nämä saadaan kaavasta Ë ¾ µ ½¼¾ Ò¼ ¾ Ò ÜÔ Òµ Mutta hetkinen! Koska jonon ¾ Òµ ensimmäiset ¾ arvoa ovat samat kuin jonossa ½ Òµ ja loput ovat nollia, voidaan todeta että Ë ¾ µ ¾ Ò¼ ½ Ò ÜÔ Òµ joka on siis täsmälleen sama kuin Ë ½ µ. Siis: nollilla jatketun jonon spektri on täsmälleen sama kuin alkuperäisenkin, mutta sen DFT:ssa on tiuhempi näytteistys. Hyvä puoli nollilla jatketun jonon DFT:n laskemisessa on sen nopeus, koska se toteutetaan FFT:n avulla (DFT on siis se muunnnos, ja FFT taas algoritmi jolla DFT lasketaan). Matlabilla nollilla jatketun jonon DFT:n saa laskettua komennolla fft(x, n) missä n on haluttu pituus. 1.5 Ikkunointi Puhe ei ole stationaarinen signaali, vaan sen ominaisuudet muuttuvat tyypillisesti millisekuntien tai kymmenien millisekuntien aikana. Tämä on täysin luonnollinen ja hyvä asia, mutta tämä tekee sellaisten signaalinkäsittelyn menetelmien kuten DFT tai autokorrelaatio käyttämisen sellaisenaan epätarkoituksenmukaiseksi. Useilla äänteillä puhesignaalin omainaisuudet pysyvät lyhyen jakson ajan (n. 5-1 ms) enemmän tai vähemmän vakiona. Tämä tarkoittaa sitä että puhesignaalista otettuun lyhyeen ikkunaan voidaan soveltaa suhteellisen menestyksekkäästi perinteisiä signaalinkäsittelyn menetelmiä. Suuri osa puheenkäsittelystä tapahtuukin näin: otetaan signaalista lyhyitä ikkunoita (mahdollisesti osittain päällekkäisiä) ja

17 1.5. IKKUNOINTI 13 4 signaali 4 nollilla jatkettu signaali DFT:n amplitudi 4 DFT:n amplitudi Kuvio 1.8: Signaali, nollilla jatkettu signaali ja molempien DFT:t. Alkuperäisen signaalin DFT:n näytteet on merkitty tähdillä. käsittelemällä niitä. Tällaista lyhyttä puheesta (tai muusta signaalista) otettua ikkunaa kutsutaan kehykseksi (engl. frame) tai usein vain ikkunaksi.ikkunan pituus on tyypillisesti 1-3 ms ja peräkkäisten kehysten välinen etäisyys puolet tästä. Tämä ikkunointi vastaa toteutuksellisesti sitä mitä sillä ymmärretään esimerkiksi suodattimen suunnittelussa ikkunointimenetelmällä: otetaan pitkä signaali (esimerkiksi puhesignaali tai ideaalinen impulssivaste) ja kerrotaan se näytteittäin äärellisen pituisella ikkunafunktiolla, jolloin tuloksena saadaan äärellisen mittainen ja painotettu versio alkuperäisestä signaalista. Esimerkki löytyy kuviosta 1.9. Puheenkäsittelyssä ikkunafunktion täsmällinen muoto ei yleensä ole kovin kriittinen, mutta usein kannattaa käyttää jotain pehmeää ikkunaa (esimerkiksi hanning, Hamming, kolmio, puolisuunnikas) suorakulmaisen sijaan. Tämä johtuu pitkälti samasta syystä kuin suodattimen suunnittelussakin, ts. pehmeämmän ikkunan spektrin sivukeilat ovat huomattavasti pienemmät kuin suorakulmaisen ikkunan. Lisäksi esimerkiksi myöhemmin tarkasteltavassa LPC-analyysissä signaali oletetaan nollaksi ikkunan ulkopuolella, joten suorakulmaisen ikkunan tapauksessa kehyksen rajalla on äkillinen muutos signaalissa, mikä usein vääristää tuloksia.

18 14 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA 1 signaali ja ikkuna näytteen indeksi 1 kehys Kuvio 1.9: Signaalin ikkunointi. Kuitenkin täytyy pitää mielessä, että puheenkäsittelyssä (päinvastoin kuin esimerkiksi suodattimen suunnittelussa) menetelmät ovat harvoin täydellisesti matemaattisesti perusteltuja. Yleensä tavoitteena on toteuttaa järjestelmä, joka toimii mahdollisimman hyvin annetussa sovelluksessa. Nämä sovelluksen kriteerit taas saattavat olla hyvin vaikeasti analyyttisesti määriteltävissä, kuten esimerkiksi koodatun puheen laatu, syntetisoidun puheen ymmärrettävyys tai ehostetun puheen miellyttävyys. Tältä pohjalta kannattaa ikkunointiinkin suhtautua sen verran vapaasti, että on valmis käyttämään erilaista ikkunointia eri tilanteissa. Esimerkiksi: puheen koodauksessa pyritään usein esittämään näytteet täsmälleen sellaisina kuin ne ovat, jolloin tässä käytetään suorakulmaista ikkunointia. Sen sijaan kun puhekoodekissa lasketaan ns. LPC-kertoimet, näiden laskennassa käytetään pehmeää ikkunaa, joka on vieläpä epäsymmetrinen jotta koodekin viive saadaan minimoitua. Puheentunnistuksessa käytetään yleensä päällekkäisiä noin 1 ms pehmeitä (tyypillisesti hanning) ikkunoita, joista tehdään hypoteeseja mikä äänne voisi olla kyseessä, ja näitä hypoteeseja yhdistellään useamman kehyksen yli. Jos puhetta halutaan myös muokata (ei siis ainoastaan analysoida), kannattaa käyttää päällekkäisiä ikkunoita jotka summautuvat suurin piirtein 1:een. Esimerk-

19 1.5. IKKUNOINTI 15 ki: toteutetaan maailman yksinkertaisin koodaussysteemi, jossa lasketaan kustakin kehyksestä DFT, nollataan siitä kaikki paitsi muutama amplitudiltaan isoin tappi ja otetaan tästä käänteismuunnos. Todellisuudessa tämän toteutus vaatisi huomattavan paljon lisätyötä mm. kerrointen indeksien ja amplitudien koodauksessa. Siinä tulee kuitenkin hyvin esille erilaisia ikkunointiin, analysointiin ja syntetisointiin liittyviä juttuja. Matlab-koodi löytyy osoitteesta sekä alta. Koodin jälkeen on selitetty sen toimintaa. function syn = FFT_koodaus(ind, N, x, fs); % syn = FFT_koodaus(ind, N, x, fs); % % Ikkunointi-demo: käydään puhesignaali x läpi % pyöreäreunaisesti ikkunoiduissa 6 ms kehyksissä (jos ind == ), tai % suorakulmaisesti ikkunoiduissa 15 ms kehyksissä (jos ind == 1), % lasketaan kustakin FFT, nollataan kaikki paitsi N isointa tappia, ja % syntetisoidaan tämän perusteella puhe takaisin ulostulosignaaliin syn. % % % ind : jos, käytetään 6ms pehmeää ikkunaa, jos 1, 15 ms suorakulmaista. % N : kuinka monta tappia jätetään FFT:hen % x : puhesignaali, jos ei annettu otetaan tiedostosta yhdeksan.wav % fs : näytteenottotaajuus, oletus 8 Hz % % syn : koodattu signaali if ( nargin < 3), [x,fs] = wavread( yhdeksan.wav ); end x = x(:); % tehdään pystyvektoriksi if ( nargin < 4), fs = 8; % näytteenottotaajuus end if ( ind == ), awinlen = round( fs*.6) % analyysi-ikkunan pituus, 6 ms % tehdään hihasta analyysi-ikkuna, pyöreät reunat, tasainen keskeltä temp = hanning( fs*.1); % tässä ne pyöreät reunat awinfun = [temp(1:length(temp)/2); ones(awinlen-length(temp),1);... temp(length(temp)/2+1:end)]; swinlen = round(awinlen/2); % synteesi-ikkunan pituus %puolet analyysi-ikkunasta

20 16 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA swinfun = hanning( swinlen); % synteesi-ikkunafunktio nforward = swinlen/2; % kuinka monta tappia on kehysten välillä, 15 ms end if ( ind == 1), awinlen = round( fs*.15); % analyysi-ikkunan pituus, 15 ms awinfun = boxcar( awinlen); swinlen = awinlen; % synteesi-ikkunan pituus = analyysi-ikkunan pituus swinfun = boxcar( swinlen); % synteesi-ikkunafunktio nforward = swinlen; end if ( rem( awinlen, 2) == 1), error( sori, ainoastaan parilliset ikkunan pituudet käyvät. ); % käänteisen FFT:n takia end fftind = 2:floor(awinlen/2); % FFT:n puolikkaan indeksit ilman DC-tasoa ja % Nyquistin taajuutta n = 1+ceil(awinlen/2); % ensimmäisen kehyksen keskimmäinen näyte syn = zeros( size( x)); % ulostulosignaali tehdään tänne while ( n+ceil(awinlen/2) <= length(x)) awinind = n-ceil(awinlen/2)+(:awinlen-1); % nykyisen kehyksen % analyysi-ikkunan indeksit frame = x( awinind).*awinfun; % kehys Frame = fft(frame); % kehyksen FFT %etsitään N:nneksi suurin itseisarvo [val,sind] = sort( abs( Frame( fftind))); valn = val( end-n+1); % nollataan kaikki paitsi N suurinta ja tehdään käänteinen FFT FrameMod = zeros( length( Frame),1); % modifioitu kehys FrameMod(1) = Frame(1); % säilytetään DC FrameMod( fftind) = Frame( fftind).*(abs( Frame( fftind)) >= valn); % otetaan vain isoimmat tapit FrameMod( length(frame)+2-fftind) = conj( FrameMod(fftind)); % peilataan % FFT:n toinen puolikas iframe = ifft(framemod); % käänteinen FFT if ( max( abs( imag( iframe))) >.1) % tarkistus error( Käänteinen FFT ei ole reaalinen. ); end iframe = real( iframe); swinind = n - swinlen/2 + (:swinlen-1); % synteesi-ikkunan indeksit swin = iframe( 1+ awinlen/2 - swinlen/2 + (:swinlen-1)).*swinfun; % synteesikehys syn( swinind) = syn(swinind) + swin; % overlap-add

21 1.6. SIGNAALIN AUTOKORRELAATIO 17 end n = n + nforward; % liikutaan signaalissa eteenpäin Idea hommassa on seuraava: puheesta ikkunoidaan ensin kehys FFT-analyysia varten. Tämä tehdään joko pehmeäreunaisella 6 ms ikkunalla tai suorakaiteisella 15 ms ikkunalla. Analyysikehyksestä lasketaan FFT ja nollataan siitä kaikki paitsi itseisarvoltaan suurimmat tapit. Tälle osittain nollatulle spektrille lasketaan tämän jälkeen käänteinen FFT, jolloin saadaan vastaava aikatason signaali. Tässä on pientä säätöä sen kanssa että FFT:n täytyy olla konjugaattisymmetrinen. Tämä tarkoittaa sitä että jos ikkunan pituus on Æ ja sen FFT on ¼µ ½µ ¾µ Æ ½µ niin ennen käänteistä FFT:ta pitää huolehtia siitä että ½µ Æ ¾µ ¾µ Æ µ jne. Tälle muokatulle signaalille tehdään tämän jälkeen ns. synteesi-ikkunointi: sen keskeltä ikkunoidaan pala (tässä tapauksessa hanning-ikkunalla) joka summataan lopulliseen signaaliin, jolloin tuloksena saatavaan signaaliin ei tule äkillisiä muutoskohtia. Tätä menetelmää jossa lopullinen signaali saadaan summaamalla päällekkäisiä kehyksiä kutsutaan overlap-add-menetelmäksi ja sille on usein käyttöä puheenkäsittelyssä. Synteesi-ikkunointia havainnollistaa kuvio 1.1. Mm. hanning-ikkunan käytössä on vielä se hyvä puoli että parittoman pituiset puoliksi päällekkäiset ikkunat summatuvat 1:een. Jos käytetään 15 ms suorakaideikkunaa, peräkkäiset kehykset eivät osu ollenkaan päällekäin, vaan synteesi tapahtuu liimaamalla käänteisen FFT:n tuottamia aikatason signaaleja sellaisenaan peräkkäin. Kehysten rajoilla esiintyy täten epäjatkuvuuskohtia, jotka saavat ulostulopuheen kuulostamaan rosoiselta. Huomaa, että kummankin ikkunan tapauksessa puhe koodataan samalla määrällä parametreja (ottamatta kvantisointia huomioon): kummallakin menetelmällä ikkunaa liikutetaan eteenpäin 15 ms kehysten välillä. Merkille kannattaa panna myös se, että 6 ms ikkunalla koodattu puhe kuulostaa subjektiivisesti paremmalta kuin 15 ms suorakaideikkunalla vaikka edellisestä aiheutuvan kohinan teho on itse asiassa suurempi. 1.6 Signaalin autokorrelaatio Signaalin autokorrelaatio kertoo kuinka paljon signaali eri viiveillä korreloi itsensä kanssa (josta nimikin). Se on Fourier-muunnoksen ohella yksi käyttökelpoisimmista signaalien analysointimenetelmistä joten käydään se tässä läpi siltä varalta että se ei ole vielä lukijalle tuttu juttu. Puheenkäsittelyssä autokorrelaatiota käytetään erityisesti puheen perustaajuuden määrittämisessä.

22 18 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA analyysi ikkuna (ehyt viiva) ja synteesi ikkuna (katkoviiva) näytteet Kuvio 1.1: M-funktiossa käytetyt analyysi- ja synteesi-ikkunat Autokorrelaation määritelmä Meidän tarkoituksiimme riittää hyvin määritellä autokorrelaatio vain äärellisen pituisille signaaleille, jotka käytännössä ovat kehyksiä jostain pidemmästä signaalista. Kuviossa 1.11 on esimerkki tällaisesta signaalista. Signaalin indeksoinnin kannalta on usein kuitenkin näppärämpää esittää tämä äärettömän pitkänä signaalina, joka on muualla kuin tämän äärellisen ikkunan kohdalla. Kuvio 1.12 esittää tämän nollilla jatketun signaalin. Signaalin Òµ autokorrelaatio Ö µ määritellään kaavalla Ö µ ½ Ò ½ Òµ Ò µ (1.1) missä saa kaikki kokonaislukuarvot ¾ ½ ¼ ½ ¾. Huomaa että autokorrelaatio on siis viiveen funktio vastaavasti kuin esimerkiksi FFT on taajuuden funktio, jonka takia sitä nimitetään myös autokorrelaatiofunktioksi. Autokorrelaatio on itse asiassa korrelaatio signaalien Òµ ja Ò µ välillä: sen arvo on sitä suurempi mitä enemmän nämä signaalit korreloivat keskenään.

23 1.6. SIGNAALIN AUTOKORRELAATIO 19.1 puhekehys näyte Kuvio 1.11: Äärellisen pituinen kehys. Eräs ongelma autokorrelaation määrittelemisessä kaavalla (1.1) on se, että suuremmilla viiveillä summaan tulee mukaan vähemmän termejä ja tämän takia autokorrelaation arvo pienenee viiveen kasvaessa signaalista riippumatta. Esimerkiksi jos meillä on Æ:n näytteen pituinen ikkuna vakiosignaalia 1 (eli Òµ ½ kun ¼ Ò Æ ja Òµ ¼ muulloin), kun ¼ Æ autokorrelaatio on Ö µ Ò Æ ½ Ò Æ ½ Ò Òµ Ò µ Òµ Ò µ ½ Æ Kun Æ ¼, vastaavalla päättelyllä todetaan että autokorrelaatio on Ö µ Æ Kun Æ, toinen termi summassa (1.1) on aina, joten kaiken kaikkiaan tässä

24 2 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA.1 nollilla jatkettu puhekehys näyte Kuvio 1.12: Nollilla jatkettu äärellisen pituinen kehys. tapauksessa autokorrelaatioksi tulee Æ ÙÒ Æ Ö µ ¼ ÙÒ Æ Toisin sanoen tämä autokorrelaation määritelmä suosii pienempiä viiveitä. Tämän takia autokorrelaatiosta löytyy myös pari muunnelmaa joissa tämä ongelma pyritään kiertämään. Ensimmäinen muunnelma on määritellä autokorrelaatio kaavalla Ö ½ µ Æ ½ Ò Òµ Ò µ (1.2) jossa yksinkertaisesti otetaan keskiarvo kaikista nollasta eroavista tulon termeistä viiveellä. Tämä kyllä poistaa arvojen pienenemisen ongelman mutta tilalle tulee toinen: mitä suurempi viive on, sitä vähemmän termejä summaan tulee mukaan ja sitä epäluotettavampi tulos on. Esimerkiksi kohinaisella signaalilla autokorrelaatio voi saada suuriakin arvoja kun viive on suuri vaikka signaali ei näillä viiveillä oikeastaan korreloikaan, esimerkki tästä löytyy jäljempänä. Koko homma saataisiin perusteltua täsmällisemmin sillä että tämän autokorrelaatiofunktion estimaattorin varianssi kasvaa kun viive kasvaa (vaikka se onkin harhaton) mutta tämä vaatisi stokastisten prosessien teoriaa joten ei käydä tätä sen tarkemmin läpi.

25 1.6. SIGNAALIN AUTOKORRELAATIO 21 Vielä yksi muunnos autokorrelaatiosta saadaan kaavalla Ö ¾ µ Æ ½ Ò Æ ½ Òµ Ò µ kun Æ Æ ja summan laskemiseen käytetään Òµ:n arvoja kun Ò ¾Æ ¾ ¾Æ ¾. Tässä jippo on siinä, että kaikilla viiveillä otetaan summaan mukaan sama määrä termejä jolloin luotettavuus säilyy. Ongelmana on se että signaalista tarvitaan pidempi ikkuna kuin edellisillä menetelmillä ja eri viiveillä autokorrelaatio tulee laskettua eri näytteiden yli, jonka seurauksena osa seuraavan kappaleen ominaisuuksista eivät ole voimassa. Jatkossa käytämme autokorrelaatiota (1.1) mutta on hyvä pitää mielessä että myös vaihtoehtoja on olemassa. Matlabissa autokorrelaation saa laskettua komennolla xcorr. Autokorrelaatiofunktion ominaisuuksia Kaavan (1.1) autokorrelaatiolla on seuraavat ominaisuudet: Ö µ Ö µ, toisin sanoen autokorrelaation on symmetrinen funktio - viiveen suhteen. Jätetään tämä lukijan todettavaksi. Ö ¼µ = signaalin energia. Tämä seuraa suoraan siitä että Ö ¼µ Ò Òµ ¾ Ö ¼µ Ö µ kaikilla :n arvoilla. Otetaan lähtökohdaksi perusmatikan kursseilta tuttu Cauchy-Schwarz epäyhtälö Æ:n pituisille reaalivektoreille Ü ja Ý: Æ ¾ Æ Ü ÒµÝ Òµ Ò½ Ò½ Ü Òµ ¾ Æ Ò½ Ý Òµ ¾ Myös tässä voidaan summata kaikkien kokonaislukuindeksien Ò yli kunhan vain äärellinen määrä arvoista poikkeaa nollasta. Kun meillä on joku viive niin otetaan vektoriksi Ü signaali Òµ ja vektoriksi Ý viivästetty signaali Ò µ. Huomaa että koska Òµ:ssa vain äärellisen monta arvoa eroaa nollasta, sekä Òµ että Ò µ voidaan esittää äärellisen pituisina vektoreina. Konkreettinen esimerkki: jos Òµ ½ ¾ ja ¾ niin tehdään vektorit Ü ½ ¾ ¼ ¼

26 22 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA ja Ý ¼ ¼ ½ ¾ Nyt kun sovelletaan Cauchy-Schwarz-epäyhtälöä näihin vektoreihin saadaan Ò Òµ Ò µ ¾ Ò Ò Òµ ¾ Ò Òµ ¾ ¾ Ò µ ¾ koska È Ò Òµ ¾ È Ò Ò µ ¾. Tästä seuraa että Ö µ ¾ Ö ¼µ ¾ josta puolestaan seuraa että Ö ¼µ Ö µ. autokorrelaatiofunktion Fourier-muunnos = signaalin Fourier-muunnoksen amplitudin neliö (Wiener-Khinchin teoreema). Tarkalleen ottaen siis Ò Ö Òµ ÜÔ Òµ Ò Òµ ÜÔ Òµ Tämä on hitusen yllättävä tulos ja yksi tapa hahmottaa sitä on seuraava: autokorrelaatiofunktion Ö µ symmetrisyydestä seuraa helposti että sen Fouriermuunnos on reaalinen. Tämä teoreema sanoo että Fourier-muunnos on paitsi reaalinen myös ei-negatiivinen (koska edellisen yhtälön oikea puoli on aina ¼). Tällä kurssilla emme isommin käytä tätä tulosta mutta se on kuitenkin hyvä pitää mielen perukoilla. ¾ Esimerkkejä autokorrelaatiosta Katsotaan läpi muutamia signaaleja ja niiden autokorrelaatio jotta saadaan jokin käsitys siitä miten autokorrelaatio toimii. Olemme lähinnä kiinnostuneita siitä mikä autokorrelaatiofunktion muoto on, joten tätä tarkoitusta varten autokorrelaatio saadaan näppärästi normalisoitua jakamalla sen arvot Ö ¼µ:lla. Esimerkki 1: Òµ ½ eli vakiosignaali. Totesimme jo aiemmin että tämän signaalin autokorrelaatiofunktio on Ö µ Æ

27 1.6. SIGNAALIN AUTOKORRELAATIO 23 Tässä tapauksessa Ö ¼µ Æ, joten normalisoitu autokorrelaatio (siis autokorrelaatio jaettuna signaalin energialla) on Ö µ ½ Æ Tämä on esitetty kuviossa Tässä on oleellista huomata että vaikka Òµ:n näytteet eri viiveillä korreloivat täysin, niin signaalin ikkunointi aiheuttaa sen että autokorrelaatio kuitenkin pienenee lineaarisesti viiveen kasvaessa. 2 vakiosignaali normalisoitu autokorrelaatio viive Kuvio 1.13: Vakiosignaali ja autokorrelaatio. Esimerkki 2: Òµ = satunnaista kohinaa jonka keskiarvo ¼. Ajatellaan vaikka että signaali saadaan heittämällä -sivuista noppaa jonka arvot ovat ¼ ½ ja ¾. Kun ¼ niin Ö ¼µ on signaalin energia, kuten tavallista. Kun ¼, meillä on summa Ö µ Ò Òµ Ò µ

28 24 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA Nyt minkä tahansa kahden arvon Òµ ja Ò µ tulo saadaan taulukosta ¼ ½ ¾ ¼ ¼ ¼ ¼ ¼ ¼ ½ ¼ ½ ¾ ¾ ¼ ¾ Todetaan että taulukon alkioiden summa on ¼ ja jokainen niistä on yhtä todennäköinen, joten summasta Ò Òµ Ò µ tulee arvoksi keskimäärin. Tämä päättely saataisiin huomattavasti vakaammalle pohjalle käyttämällä todennäköisyyslaskennan teoriaa mutta tämä tarkkuus riittää meidän tarpeisiimme. Eli satunnaisen signaalin tapauksessa autokorrelaatio Ö µ on signaalin energia kun ¼ ja koko lailla kun ¼. Kuviossa 1.14 on esitetty yksi realisaatio tästä signaalista kun sen pituus on Æ ½¼¼ ja tämän normalisoitu autokorrelaatio. Todetaan että autokorrelaatio ei ole tarkalleen kun ¼ mutta kuitenkin aika liki. Kuviossa 1.15 on esitelty tilanne kun signaalin pituus Æ ½¼¼¼, josta huomataan että normalisoitu autokorrelaatio on huomattavasti pienempi kun ¼. Normalisoitu autokorrelaatio käyttäen kaavaa (1.2) on vielä laskettu kuviossa 1.16 josta välittömästi havaitaan että pitkillä viiveillä tämä menetelmä ei ole kovin luotettava. Tavallaan nämä kaksi esimerkkisignaalia kuvastavat autokorrelaation ääripäitä: täysin korreloivan signaalin normalisoitu autokorrelaatio on ½ ja täysin satunnaisen signaalin normalisoitu autokorrelaatio on impulssi (siis ½ kun ¼ ja muuten). Käytännön signaalit elävät jossain näiden ääripäiden välimaastossa jota varten katsotaan pari esimerkkiä autokorrelaatiosta eri puheäänteissä. Esimerkki 3: kuviossa 1.17 on esitetty kehys (suorakaideikkunalla ikkunoitu) [ä]-äänteestä ja sen autokorrelaatio. Havaitaan että autokorrelaatiossa on useita suuria piikkejä joten eri viiveet korreloivat vahvasti keskenään. Erityisesti viiveellä 15 autokorrelaatiossa on iso positiivinen piikki joka johtuu puheen perustaajuudesta tässä kehyksessä; yhdellä jaksonpituudella viivästetty puhe näyttää aika samalta kuin viivästämätön puhe. Tässä kehyksessä puheen perustaajuus on siis Æ ½¼¼¼ ÀÞ ½¼ ÀÞ. Itse asiassa autokorrelaation piikkien etsintä on hyvä tapa löytää puheen perustaajuus (tästä tarkemmin seuraavassa luvussa). ½¼ Esimerkki 4: kuviosta 1.17 löytyy kehys (taas suorakaideikkunalla ikkunoitu) [s]-äänteestä ja sen autokorrelaatio. Tässä tapauksessa autokorrelaatio on kohtuullisen impulssimainen mikä viittaa siihen että [s]-äänteen aaltomuoto on melko satunnainen.

29 1.6. SIGNAALIN AUTOKORRELAATIO 25 kohinasignaali normalisoitu autokorrelaatio viive Kuvio 1.14: Satunnaissignaalin autokorrelaatio. pidempi kohinasignaali normalisoitu autokorrelaatio viive Kuvio 1.15: Pidemmän satunnaissignaalin autokorrelaatio.

30 26 LUKU 1. SIGNAALINKÄSITTELYN KERTAUSTA pidempi kohinasignaali normalisoitu autokorrelaatio r 1 (k) viive Kuvio 1.16: Satunnaissignaalin autokorrelaatio kaavalla (1.2)..1 [ä] äänne normalisoitu autokorrelaatio viive Kuvio 1.17: [ä]-äänne ja autokorrelaatio.

31 1.6. SIGNAALIN AUTOKORRELAATIO 27.3 [s] äänne normalisoitu autokorrelaatio viive Kuvio 1.18: [s]-äänne ja autokorrelaatio.

32 Luku 2 Fonetiikkaa Puhe on kaiken kaikkiaan hyvin monitasoinen ja monimutkainen inhimillinen ja fysikaalinen ilmiö, sisältäen kysymyksiä liittyen mm. kognitioon, kieleen, fysiologiaan, kuuloon ja akustiikkaan. Fonetiikka tarkoittaa yleisesti puheen tutkimusta, joka sisältää piirteitä edellisistä tieteenaloista. Puheenkäsittelyn kannalta joudumme toistaiseksi keskittymään puheen alempiin tasoihin, joissa kysytään esimerkiksi: Millaisia erilaisia äänteitä on olemassa? Mikä on perustaajuus/puheen resonanssitaajuudet tietyllä hetkellä? Miten puhetta kannattaa koodata? Mitä foneemeja tietyssä puhejaksossa esiintyy? Näiden ja muiden kysymysten selvittämiseksi tarvitaan perustietoja siitä, millainen signaali puhe oikeastaan on. Suuri osa puheen akustisista ominaisuuksista juontaa juurensa ihmisen puheentuottojärjestelmän ominaisuuksiin. Siksi tämän järjestelmän toiminta katsotaan ensin läpi, ja sen jälkeen sitä pyritään mallintamaan. 2.1 Puhe-elimet Hyviä kuvioita liittyen oheiseen tekstiin löytyy osoitteesta Akustisesti puhe on ilmanpaineen vaihtelua, jonka voimanlähteenä on keuhkoissa oleva tiivistetty ilma. Sisäänhengityksessä pallea ja kylkivälilihakset jännittyvät, jolloin rintakehä laajenee ja keuhkoihin syntyy alipaine ja ilmaa virtaa niihin. Uloshengityksen aikana lihakset rentoutuvat, jolloin rintakehä supistuu, ja ilmaa virtaa ulos keuhkojen ylipaineesta johtuen. Puhetta esiintyy lähes yksinomaan uloshengityksen aikana. Kannattaa pitää mielessä, että puhe-elimet (keuhkot, kieli, äänihuulet, yms.) ovat alun perin kehittyneet mahdollistamaan ihmi- 28

33 2.1. PUHE-ELIMET 29 sen muita toimintoja, lähinnä hengityksen ja syömisen, ja ovat vasta myöhemmin adaptoituneet myös puheen tuottamiseen. Kurkunpää on kehittynyt elin, jonka päätarkoituksena on toimia läppänä jokaa erottaa ruokatorven henkitorvesta nielaisemisen ajaksi. Puheentuoton kannalta oleellisinta kurkunpäässä on että se muokkaa keuhkoista lähtevän äänettömän ilmavirran jollain tapaa kuuluvaksi. Kurkunpää muodostuu seuraavista osista: kilpirusto (aataminomena), äänihuulet ja kannurustot. Äänihuulten välissä olevaa rakoa nimitetään ääniraoksi eli glottikseksi ja se muodostuu huuliraosta (äänihuulten välissä) ja rustoraosta (kannurustojen välissä), ks. kuvio 2.1. Ihminen pystyy säätelemään monipuolisesti ääniraon muotoa kurkunpään lihaksien avulla. Kuvio 2.1: Kurkunpään poikkileikkaus äänihuulten kohdalta ylhäältä katsottuna, kuvion leikattu henkilö katsoo ylöspäin ( Ääntöväylällä tarkoitetaan yleensä puhe-elimiä kurkunpään jälkeen, ks. kuvio 2.2. Nämä jakautuvat seuraaviin alueisiin: nieluontelo, nenäontelo ja suuontelo. Tärkeimmät puhe-elimet ääntöväylässä ovat kieli, kitapurje, alaleuka ja huulet. Kieli on puheentuoton tärkein elin: sen eri asennot määräävät suurimman osan äänteistä. Kitapurje on lihas, jonka avulla voidaan erottaa nieluontelo nenäontelosta. Ohessa lyhyt suomi-englanti-termistö aiheesta:

34 3 LUKU 2. FONETIIKKAA alveolar ridge hammasvalli bronchus keuhkoputki cricoid cartilage rengasrusto epiglottis kurkunkansi glottis äänirako larynx kurkunpää nasal cavity nenäontelo thyroid cartilage kilpirusto trachea henkitorvi vocal tract ääntöväylä pharynx nielu velum, soft palate kitapurje arytenoid cartilage kannurusto cartilage rusto diaphragm pallea false vocal folds taskuhuulet hyoid bone kieliluu lungs keuhkot palate kitalaki tongue kieli vocal folds äänihuulet oral pharynx, pharyngeal cavity nieluontelo uvula kitakieleke Kuvio 2.2: Ääniväylän puhe-elimet (Thomas W. Parsons, Voice and Speech Processing, McGraw-Hill, Inc., s. 63).

35 2.2. PUHEENTUOTTO Puheentuotto Puhetta muodostuu, kun keuhkoista lähtevä ilmavirta kulkee ääniraon eli glottiksen läpi ja moduloituu ääntöväylässä. Ääniraosta lähtevä ääni voidaan ajatella herätteeksi, jonka ääntöväylä suodattaa. Ilmavirtaus sinänsä on äänetöntä, joten äänteet muodostetaan tavalla tai toisella aiheuttamalla muutoksia keuhkoista lähtevään ilmavirtaan. Alla on lueteltu glottiksen eri herätetyypit. soinnilliset äänteet Glottis aukenee ja sulkeutuu jaksollisesti, mikä aiheuttaa katkonaisen ilmavirran. Yhtä auki-kiinni jaksoa sanotaan värähdykseksi, ja sen kesto määrää äänen perustaajuuden jota säädetään esim. laulamisessa. Tyypillisesti taajuus on n. 5-5Hz (matalampi miehillä, korkeampi naisilla ja lapsilla). Äänteitä, joissa äänihuulet värähtelevät, sanotaan soinnillisiksi (esim. kaikki vokaalit). hengitys Glottis on auki. Ilmavirta on tasaista ja sen takia (lähes) äänetöntä. soinnittomat äänteet Glottis on jonkin verran auki mutta äänihuulet eivät värähtele. kuiskaus Glottis on kiinni mutta rustorako auki, jolloin muodostuu kuultavaa hankaushälyä (friction). Kuvio 2.3: Äänihuulten asento eri äännetyypeissä (Kalevi Wiik, Fonetiikan Peruskurssi, WSOY, 1981). Ääntöväylä suodattaa glottisherätteen puhe-elinten asennosta riippuvalla tavalla. Kunkin äänteen aikana ääntöväylällä on tyypillinen (äänteestä riippuva) muotonsa, jota voidaan mallintaa akustisena putkena. Tällä putkella on erityisesti tietyt resonanssitaajuudet, joiden johdosta äänteen spektrissä on havaittavissa vahvistuneita osavärähtelyalueita eli formantteja. Formantit ovat tärkein seuraus ääniväylän moduloinnista; niiden avulla voidaan luokitella kaikki vokaalit. Toinen tapa muodostaa äänteitä on aiheuttaa ääntöväylän johonkin osaan kapeikko jonka

36 32 LUKU 2. FONETIIKKAA läpi kulkiessaan ilmavirta muuttuu pyörteiseksi. Kolmas laaja äänteiden luokka saadaan sulkemalla hetkeksi ääntöväylä kokonaan joltain kohtaa ja avaamalla se, jolloin ilmavirta poksahtaa ulos. Seuraavassa luvussa on selitetty tämän kurssin jatkon kannalta oleellisimmat tiedot siitä, miten puhe-elimet tuottavat tietyn äänteen ja millaisia akustisia ominaisuuksia äänteellä tästä konfiguraatiosta johtuen on. Yleisesti artikulatorinen fonetiikka tutkii, millä tavalla puhe-elimet sijoittuvat tietyn äänteen aikaansaamiseksi kun taas akustisessa fonetiikassa tutkitaan akustisen aallon ja puhe-elinten asentojen yhteyttä (tästä lisää myöhemmin). 2.3 Artikulatorista fonetiikkaa Eräs tärkeä fonetiikan tavoite on luokitella eri kielissä esiintyvät äänteet. Tätä tarkoitusta varten kehitettiin vuonna 1888 International phonetic alphabet (IPA). IPA:n luokittelusta ollaan jokseenkin yksimielisiä, mutta lähinnä merkinnällisistä syistä (IPAssa käytetyttyjä symboleita ei löydy kirjoituskoneesta) käytetään muitakin foneettisia aakkostoja, mm. Arpabet. IPA-luokitus löytyy osoitteesta Äänteitä voidaan käsitellä foneettiselta kannalta, jolloin tarkastelu ei ole sidoksissa mihinkään tiettyyn kieleen, vaan äänteet pyritään kuvaamaan mahdollisimman täsmällisesti niiden artikuloinnin (puhe-elinten asennon) avulla. Toinen lähestymistapa on fonologinen, jossa tarkastellaan tietyssä kielessä esiintyviä eri äänteitä, erityisesti niiden äänteiden luokkaa jotka tulkitaan samaksi. Esimerkiksi [k] ja [p] ovat suomen kielessä eri äänteitä koska sanaa kala ei ymmärretä samaksi kuin sanaa pala. Sen sijaan äänteet [s] ja "suhu-[s]"(kuten esim. sanassa shekki) eivät muuta sanan merkitystä, joten ne tulkitaan suomen kielessä samaksi äänteeksi, kun taas esim. venäjän kielessä ne ovat eri äänteitä. Kaikkien maailman kielten äänteet jakautuvat vokaaleihin ja konsonantteihin (selitetty tarkemmin alla), joita edelleen jakaa tarkemmin eri ominaisuuksien perusteella (myös selitetty tarkemmin alla). Kannattaa koko ajan pitää mielessä että tämän kappaleen luokittelu on tullut pyrkimyksestä selittää miten ihmisten äänteet muodostuvat; puhuminen onnistuu varsin hyvin tietämättä tästä luokituksesta mitään (joskus jopa paremmin) Vokaalit Vokaalit (engl. vowel) ovat soinnillisia äänteitä, joissa ääniväylä on avoin. Eri kielissä saattaa kuitenkin esiintyä tarvetta edellisen määritelmän hienosäätöön, esim. suomen kielessä vokaalit määritellään äänteiksi joissa ääntä pääsee esteettä suun keskeltä ulos (näin päästään eroon nasaaleista [n] ja [m] sekä lateraalista [l]).

37 2.3. ARTIKULATORISTA FONETIIKKAA 33 Vokaalit taas voidaan luokitella seuraavien ominaisuuksien perusteella: kielen asento huulten pyöreys nasaalisuus Erityisesti kielen asennossa on oleellista ääniväylän kapeimman kohdan sijainti. Tämä voidaan esittää ns. vokaalidiagrammin avulla, jossa on kuvallisesti esitetty kielen keskiviivan korkein kohta suussa. [i] [y] [u] [e] [ö] [o] [ä] [a] Kuvio 2.4: Vokaalidiagrammi, jossa on esitettynä kielen korkein kohta suomen eri vokaaleissa. Kuvio esittää pelkistetysti vasemmalle katsovan henkilön suuonteloa. Huulten asennon perusteella äänteitä nimitetään labiaalisiksi (jos huulet ovat pyöristetyt) tai illabiaalisiksi (jos eivät). Esim. suomen [i] ja [y] eroavat lähinnä huulten pyöreyden perusteella. Nasaalisuus liittyy siihen, onko kitapurje alhaalla vai ylhäällä. Kun kitapurje on alhaalla eli auki, ilmavirta pääsee nenäonteloon ja syntyy nasaalinen äänne, ja vastaavasti kitapurjeen ollessa ylhäällä syntyy oraalinen äänne.

38 34 LUKU 2. FONETIIKKAA Konsonantit Konsonanteissa (engl. consonant) ilmavirta ei pääse vapaasti suun kautta ulos. Tarkemmin ottaen konsonantit voidaan luokitella seuraavien ominaisuuksien perusteella: ääntymäpaikka ääntymätapa sointi Ääntymäpaikka (engl. place of articulation) kertoo missä kohdassa ääntöväylää muodostuu tärkein kapeikko. Esimerkisi [p]-äänteessä kapeikko muodostuu huulten välissä ja [t]-äänteessä kielen ja ylähampaiden takana. Eri ääntymäpaikat ovat (ks. kuvio 2.5): bilabiaalinen huulten välissä labiodentaalinen alahuulen ja ylähampaiden välissä dentaalinen hampaiden välissä alveolaarinen hammasvallin ja kielen välissä palato-alveolaarinen kitalaen etuosan ja kielen välissä palataalinen kitalaen ja kielen välissä velaarinen kitapurjeen ja kielen välissä uvulaarinen kitapurjeen kärjen (uvula) ja kielen välissä faryngaalinen nielun takaosan ja kielen välissä Ääntymätavalla (engl. manner of articulation) tarkoitetaan sitä, kuinka vapaasti ilmavirta pääsee virtaamaan konsonanttia äännettäessä. Konsonantteja joissa ilmavirralla on vapaa ulospääsy sanotaan resonanteiksi ja niitä joissa ei sanotaan obstruenteiksi. Resonantit voidaan edelleen ryhmitellä tarkemmin: puolivokaalit (engl. approximant). Nämä muistuttavat vokaaleja, mutta kielellä tai huulilla muodostettava kapeikko on ahtaampi kuin vokaaleilla. Suomen puolivokaaleja ovat [j] ja [v].

39 2.3. ARTIKULATORISTA FONETIIKKAA 35 Kuvio 2.5: Konsonanttien ääntymäpaikat: 1: bilabiaalinen, 2: labiodentaalinen, 3: interdentaalinen, 4: dentaalinen, 5: alveoraalinen, 6: palataalinen, 7: velaarinen, 8: uvulaarinen, 9: faryngaalinen, 1: laryngaalinen, 11: apikaalinen, 12: koronaalinen, 13: laminaalinen, 14: dorsaalinen, 15: radikaalinen, 16: sublingvaalinen, 17: epiglottaalinen. nasaalit. Nasaaleissa ilmavirta kulkee ulos vain nenän kautta, suomessa [n], [m], [ng]. likvidat. Näissä ilmavirta tulee suusta eri tavalla kuin vokaaleissa. Likvidat jaotellaan edelleen lateraaleiksi joissa ilmavirta kulkee kielen laitojen yli (suomessa [l]) ja tremulanteiksi joissa ilmavirta on katkonainen (suomessa [r]). Samoin obstruenttien jakoa voidaan hienontaa: klusiilit (engl. plosive). Näissä obstruenteissa ilmavirta katkaistaan kokonaan (suomessa [p], [t], [k]). Myös [b], [d], [g] voidaan laskea suomen kielen foneemeiksi vaikka kaikki suomea puhuvat eivät käytä näitä puheessa; nämä ovat muuten samat kuin äänteet [p], [t] ja [k], mutta ovat soinnillisia. frikatiivit. Ilmavirta estetään osittain, suomessa [s], [h], sekä vieraampana [f].

40 36 LUKU 2. FONETIIKKAA Sointi ilmaisee onko konsonantti soinnillinen vai soinniton. Soinnillisia konsonantteja suomen kielessä ovat kaikki paitsi [p],[t],[k],[h] ja [s] (sekä [f]). Itse asiassa [h] voi esiintyä ns. henkäyssoinnillisena äänteenä (kuten sanassa paha), jolloin ääniraon huulirako värähtelee etuosaltaan ja rustorako on auki. Edellisten kolmen ominaisuuden (ääntymäpaikka, ääntymätapa ja sointi) perusteella voidaan luokitella kaikki konsonantit. Esimerkkejä: [m] on soinnillinen bilabiaalinen nasaali ja [k] on soinniton palataalinen klusiili. Kysymys: onko suomen kielessä soinnitonta dentaalista klusiilia? Entä soinnillista labiodentaalista resonanttia? 2.4 Suomen kielen äänteet Alla on suomen kielen äänteiden jaottelu ääntymätavan mukaan: vokaalit: [a],[e],[i],[o],[u],[y],[ä],[ö] konsonantit resonantit puolivokaalit: [j],[v] nasaalit: [n],[m],[ng] lateraali: [l] tremulantti: [r] obstruentit frikatiivit: [h],[s] (myös [f]) klusiilit: [p],[t],[k] (myös [b],[d],[g]) Lisäksi suomessa kaikki äänteet poislukien [d], [g], [f] voidaan kahdentaa, esimerkiksi muta, mutta, muuta, mutaa ja muuttaa ovat kaikki eri sanoja. "Äng-äänne"[ng] esiintyy tosin aina pitkänä (esim. kengät) ellei sitä seuraa konsonantti (kenkä), ja [v] ja [h] eivät yleensä esiinny pitkinä paitsi joskus loppukahdennuksen yhteydessä (homevvaurio). 2.5 Muita foneettisia piirteitä Yleistä äänneluokkaa kutsutaan foneemiksi, kun taas yksittäistä puhuttua realisaatiota kutsutaan fooniksi (kaikki foonit ovat siis periaatteessa erilaisia). Tietyssä

41 2.5. MUITA FONEETTISIA PIIRTEITÄ 37 kielessä samaan äänneluokkaan kuuluvia äänteitä, joilla on kuitenkin joku foneettinen ero, sanotaan allofoneiksi. Yleinen periaate jonkin kielen foneemien määrittämisessä on se voiko jonkin äänteen muuttaminen toiseksi muuttaa sanan merkitystä. Esimerkiksi suomen kielessä kaikki vokaalit voidaan ääntää joko nasaalisina tai ei-nasaalisina sanan merkityksen muuttumatta kun taas vaikkapa ranskan kielessä myös merkitys voi muuttua. Vaikka kielen äänteet kuullaan diskreetteinä foneemeina, itse äänteet eivät ole diskreettejä, äkillisesti toisiinsa muuttuvia aaltomuotoja, vaan äänteet sulautuvat toisiinsa. Tätä ilmiötä kutsutaan yhteisartikuloinniksi (engl. coarticulation). Yhteisartikulointi johtuu pitkäli siitä että puhe-elinten siirtyminen ei ole hetkellinen tapahtuma vaan vaatii aikaa, ja tämän siirtymisen aikana aaltomuoto muuttuu tasaisesti. Lisäksi, yleensä kun puhe-elimet ovat saaneet äänteen riittävän hyvin äännettyä (eli niin hyvin että kuulija sen ymmärtää), ne alkavat siirtyä seuraavan äänteen vaatimaan asentoon. Lisäksi äänteessä käytetty allofoni riippuu usein ympäröivistä äänteistä, erityisesti seuraavasta äänteestä. Prosodialla tarkoitetaan puheen pidempiaikaisia ominaisuuksia, joita ovat lähinnä kvantiteetti, paino ja intonaatio (määrittelyt alla). Prosodian pienin yksikkö foneemin sijasta on yleensä tavu. Tavun yleispätevää määritelmää ei ole olemassa, mutta kielikohtainen määritteleminen onnistuu. Suomen kielessä tavutuksen pääsääntö on se, että tavun raja kulkee jokaisen CV (konsonatti, vokaali) ryhmän edellä (esim. pu-heen-kä-sit-te-ly). Tavu on kielellisesti usein käyttökelpoisempi yksikkö kuin yksittäiset foneemit. Kvantiteetilla tarkoitetaan äänteiden pituutta. Joissakin kielissä (esim. espanja) kvantiteetin muutoksella ei saada sanan merkitystä muuttumaan. Sen sijaan suomen kielessä kvantiteetitti on erottava piirre (eli sillä voidaan muuttaa sanan merkitystä) sekä vokaaleissa (muta, muuta) että konsonanteissa (muta, mutta). Äänteen kvantiteetti riippuu monesta eri tekijästä, kuten äänteen luonnollisesta kestosta, viereisten äänteiden laadusta ja kestosta, äänteiden asemasta tavussa sekä äänteen painosta. Paino tarkoittaa jonkin äänteen painottamista, yleensä suuremmalla teholla tai muuttuneella äänenkorkeudella. Paino voi viitata joko tavupainoon (painotetaan tiettyä tavua sanassa) tai sanapainoon (painotetaan tiettyä sanaa virkkeessä). Suomen kielessä tavupaino on aina ensimmäisellä tavulla (jonka takia suomen kieli on ei-suomalaisen korviin melko monotonisen kuuloista). Intonaatio viittaa puheen äänenkorkeuden muutokseen pidemmän jakson, esim. virkkeen aikana. Äänenkorkeudella voidaan muuttaa joissain kielissä sanojen merkityksiä (esim. kiina) mutta sitä käytetään muissakin kielissä ilmaisemaan esim. välimerkkejä. Esimerkiksi englannin kielessä äänenkorkeus nousee kysymyslauseen lopussa, kun taas suomen kielessä koko kysymyslauseen sävelkorkeus on jonkin verran korkeampi kuin vastaavan väitelauseen.

42 Luku 3 Akustista fonetiikkaa Akustisessa fonetiikassa tutkitaan puheen akustisia ominaisuuksia ja sitä miten ne seuraavat puheentuottomekanismin toiminnasta. Aiheen tarkka käsitteleminen vaatisi oman kurssinsa, mutta seuraavassa käydään läpi aiheesta tämän kurssin kannalta oleellisimmat tiedot. Tärkein ääntöväylän akustinen ominaisuus ovat siinä esiintyvät resonanssit, jotka syntyvät samaan tapaan kuin esim. puhallinsoittimissa, eli värähtelevän ilmapatsaan seisovina aaltoina. Mikäli kyseessä on tasapaksu putki, jonka toinen pää on umpinainen ja toinen avoin, siinä muodostuu seisovia aaltoja siten, että paineenvaihtelu umpinaisessa päässä on pienimmillään ja avonaisessa suurimmillaan, kuten kuviosta 3.1 näkyy. Mikäli putken pituus on, seisovien aaltojen aallonpituudet () ovat Tyypillisesti aikuisen miehen ääntöväylän pituus on luokkaa ½ cm ja naisen n. ½ cm, ja äänen nopeudeksi ilmassa (merk. ) voidaan ottaa n. ¼ m/s. Putken resonanssitaajuudet () voidaan laskea aaltoliikkeen perusyhtälöstä =, jolloin saadaan (kun = 17 cm) ½ ¼ Ñ ¼ Ñ Ñ Ñ ¼Ñ ¼¼ÀÞ ½¼¼ÀÞ ¾¼¼ÀÞ Ñ eli ¼¼ Hz:n parittomat harmoniset. Tasapaksun putken akustiikka saadaan ratkaistua täydellisesti (muutamalla yksinkertaistavalla oletuksella) ja sen ymmärtämisestä on hyötyä jatkon kannalta joten käydään se läpi. Otetaan käsittelyyn tasapaksu putki jonka poikkipinta-ala on Ë ja jonka pituus on, ks. kuvio 3.2. Akustisesti kiinnostavat muuttujat ovat putkessa olevien ilmahiukkasten nopeus jota merkitään Ú Ü Øµ (eli pisteessä Ü olevan hiukkasen nopeus hetkellä Ø) ja tietyn pisteen ilmanpaine (tarkemmin paineen muutos vakioilmanpaineen ympärillä) jota merkitään Ô Ü Øµ. 38

43 39 Kuvio 3.1: Toisesta päästä umpinaisessa putkessa muodostuvat seisovat aallot. Kuvassa on näytetty paineenvaihtelu, joka on nolla umpinaisessa päässä ja suurimmillaan avonaisessa päässä. Kuvio 3.2: Notaatio tasapaksun putken akustiikan käsittelyyn: Ë on poikkipintaala, on putken pituus, Ü on etäisyys putken vasemmasta reunasta.

44 4 LUKU 3. AKUSTISTA FONETIIKKAA Oletetaan että paineaallot ovat tasomaisia, kohtisuorassa putken pituuteen nähden ja etenevät putken suuntaisesti. Tällä oletuksella voidaan hiukkasnopeuden Ú Ü Øµ sijaan käyttää myöhemmin käyttökelpoisempaa tilavuusnopeutta Ù Ü Øµ joka tarkoittaa pienen ilmapatsaan nopeutta pisteessä Ü ja hetkellä Ø, ja niiden välillä on yksinkertainen yhteys Ù Ü Øµ ËÚ Ü Øµ Paineen ja tilavuusnopeuden välillä ovat voimassa seuraavat ns. aaltoyhtälöt Ô Ü Ë Ù Ü Ù Ø (3.1) Ë ¾ Ô Ø (3.2) missä on ilmanpaine. Nämä aaltoyhtälöt saataisiin periaatteessa johdettua vielä perustavammista fysiikan laeista mutta mietitään sen sijaan mitä ne tarkoittavat. Yhtälö (3.1) sanoo että jos ilmanpaine kasvaa jossain kohdassa putkea, se aiheuttaa tilavuusnopeuden kasvun ajassa (joka on sitä suurempi mitä suurempi ilmanpaineen muutos ja pienempi poikkipinta-ala on). Jos vaikka ajatellaan jotain ilmahiukkasta pisteessä Ü joka ei liiku hetkellä Ø mutta ilmanpaine on suurempi pisteen Ü oikealla puolella niin paine-ero aiheuttaa sen että hiukkanen alkaa liikkua vasemmalle. Toinen yhtälö taas voidaan tulkita niin että tilavuusnopeuden muutos aiheuttaa paineen muutoksen. Jos ajatellaan että pisteessä Ü hetkellä Ø paine on mutta tilavuusnopeus on suurempi pisteen Ü vasemmalla kuin oikealla puolella niin hiukkaset kasaantuvat pisteeseen Ü eli paine kasvaa ajassa. Melko helposti nähdään (tarkistetaan alla) että jos ݵ on mielivaltainen funktio niin valitsemalla Ù Ü Øµ Ø Üµ Ô Ü Øµ Ë Ø Üµ differentiaaliyhtälöpari (3.1), (3.2) tulee toteutettua. Funktio Ø Üµ puolestaan voidaan tulkita äänen nopeudella eteenpäin (forward, tästä nimi) liikkuvaksi aalloksi: kun Ø kasvaa 1:llä ja Ü :n verran, funktio saa samat arvot kuin Ø:llä ja Ü:llä. Vastaavasti myös taaksepäin nopeudella liikkuva aalto toteuttaa aaltoyhtälöt ja vieläpä mielivaltainen summa tällaisista aalloista. Kaiken kaikkiaan aaltoyhtälöiden ratkaisu voidaan siis kirjoittaa muodossa Ù Ü Øµ Ø Üµ Ø Üµ

45 41 Ô Ü Øµ Ë Ø Üµ Ø Üµµ missä on mielivaltainen eteenpäin kulkeva ja taaksepäin kulkeva aalto. Tarkistetaan tämä sijoittamalla nämä yhtälöön (3.1) Ô Ü Ë Ù Ø Vasemmaksi puoleksi tulee (muistamalla sisäfunktion derivointisääntö) Ë ½µ ¼ Ø Üµ ½µ ¼ Ø Üµµ Ë ¼ Ø Üµ ¼ Ø Üµµ missä ¼ on funktion derivaatta ja vastaavasti funktiolle. Oikeaksi puoleksi saadaan Ë ¼ Ø Üµ ¼ Ø Üµµ joten tämä on kunnossa. Vastaava tarkistus differentiaaliyhtälölle (3.2) jätetään lukijan harteille. Ihmisen ääntöväylä ei ole tasapaksu putki, mutta silti vokaaliäänteissä formantteja on yleensä karkeasti ottaen 1 kilohertsiä kohden kuten tasapaksun putken tapauksessa. Formanttien taajuudet eivät vain enää ole harmonisissa suhteissa toisiinsa vaan niiden taajuudet siirtyvät ääntöväylän muodon mukana. Formanttitaajuuksien laskeminen ääntöväylän muodon perusteella on yleisesti analyyttisesti ratkeamaton ongelma (numeerisia ratkaisuja voidaan kyllä laskea). Tarkkaan puheentuoton malliin pyrittäessä pitäisi ottaa huomioon lukuisia seikkoja, kuten erilaiset kurkunpään herätteet, ajalliset ja paikasta riippuvat muutokset ääntöväylän muodossa, nenäväylän kytkeytyminen järjestelmään, huulten kohdalla tapahtuva ääniaallon leviäminen ympäristöön eli nk. säteily, erilaiset energiahäviöt, pyörteiset ilmavirtaukset jne. Yksinkertaistettujakin malleja tarkastelemalla päästään kuitenkin melko pitkälle äänentuoton ymmärryksessä. Erityisen kätevä lähestymistapa on ääntöväylän mallintaminen useamman peräkkäisen tasapaksun putken avulla, sillä tämä malli saadaan ratkaistua kohtuullisella vaivalla, ja sen tuloksetkin ovat käytännössä varsin hyviä. Kun liitämme kaksi tasapaksua putkea yhteen, tilavuusnopeusaallot kulkevat edelleen äänen nopeudella kummankin putken sisällä, mutta putkien liitoskohdassa tapahtuu myös heijastumista. Merkitään vasemman putken poikkipinta-alaa Ë Ò ja oikean Ë Ò ½. Määritellään heijastuskerroin Ò seuraavasti: Ë Ò ½ Ò Ë Ò Ë Ò Ë Ò ½

46 42 LUKU 3. AKUSTISTA FONETIIKKAA Huomaa että koska pinta-alat ovat positiivisia niin aina ½ Ò ½. Heijastuskerroin ilmaisee, kuinka suuri osa putkesta toiseen liikkuvasta tilavuusnopeusaallosta heijastuu takaisin. Katso käytetty notaatio kuvasta 3.3: Ò on eteenpäin kulkeva tilavuusaalto putkessa Ò ja Ò on taaksepäin kulkeva tilavuusaalto. Kuvio 3.3: Käytetty notaatio ja Kelly-Lochbaum yhtälöiden vuokaavio. Näytteistetään järjestelmän toiminta sillä näytteenottovälillä joka ääneltä kuluu yhden putken kulkemiseen (eli kun aalto kulkee putken päästä toiseen se viivästyy yhden tapin) ja esitetään järjestelmän toiminta Þ-muunnostasossa (eli kun aalto kulkee putken päästä toiseen se tulee kerrottua Þ ½ :lla). Nyt tilavuusaallon Þ- muunnoksen käyttäytyminen putkissa ja niiden liitoskohdissa voidaan esittää ns. Kelly-Lochbaum-yhtälöillä Ò ½ Þµ ½ Ò µ Ò ÞµÞ ½ Ò Ò ½ Þµ (3.3)

47 Ò Þµ Ò Ò ÞµÞ ¾ ½ Ò µ Ò ½ ÞµÞ ½ (3.4) jotka voidaan myös kirjoittaa matriisimuodossa Ò ½ Þµ Ò Þµ ½ Ò µþ ½ Ò Ò Þ ¾ ½ Ò µþ ½ Ò Þµ Ò ½ Þµ Esimerkiksi putkessa ½ oikealle kulkevasta tilavuusnopeudesta ½ :n ilmaisema osuus heijastuu takaisin putkeen ½ ja loppuosa (½ ½ ) etenee putken ¾ puolelle rajapinnan yli. Putkessa ¾ vasemmalle kulkevasta aallosta takaisin heijastuu ½ :n ilmaisema osuus. Loogisesti jos Ë Ò Ë Ò ½ niin heijastumista ei tapahdu. Myös loogisesti jos Ë Ò ½ ¼ niin koko aalto putkesta Ò heijastuu takaisin. Diskreettiaikainen malli ääntöväylälle saadaan nyt yksinkertaisesti liittämällä tasapaksuja putkia peräkkäin. Tätä varten ratkaistaan ensin Kelly-Lochbaumyhtälöistä Ò ½ Þµ ja Ò ½ Þµ muuttujien Ò Þµ ja Ò Þµ funktiona. Signaali Ò ½ Þµ saadaan suoraan yhtälöstä (3.4): 43 Ò ½ Þµ Ò Ò ÞµÞ ½ ½ Ò Sijoittamalla tämä yhtälöön (3.3) saadaan Ò ÞµÞ ½ Ò Ò ½ Þµ ½ Ò µ Ò ÞµÞ ½ Ò Ò Ò ÞµÞ ½ ½ Ò Ò ÞµÞ ½ Ò joka sievenee muotoon Ò ½ Þµ Ò ÞµÞ ½ ½ Ò Ò Ò ÞµÞ ½ Ò Nämä yhtälöt voidaan taas kirjoittaa matriisimuodossa Ò ½ Þµ Ò ½ Þµ Þ ½ ½ Ò ÒÞ ½ ½ Ò ÒµÞ ½ Ò Þ ½ Ò Ò Þµ Ò Þµ Merkitään tässä olevaan matriisia Ò. Jos meillä on Æ putkea kytkettynä peräkkäin niin saadaan Æ Þµ Æ Þµ Æ Æ ½ Þµ Æ ½ Þµ Æ Æ ½ Æ ¾ Þµ Æ ¾ Þµ. Æ Æ ½ ¼ ¼ Þµ ¼ Þµ

48 44 LUKU 3. AKUSTISTA FONETIIKKAA eli useamman putken siirtofunktio (jolla on 2 sisäänmenoa) saadaan näppärästi matriisien tulona. Kelly-Lochbaum-yhtälöiden mukaista suodatinrakennetta kutsutaan ristikkorakenteeksi (engl. lattice structure) ja se löytyy kuviosta 3.4. Ristikkorakenteelle on käyttöä muutenkin kuin ääntöväylän mallintamisessa, mm. adaptiivisten suodattimien yhteydessä. Kuvio 3.4: Ristikkorakenne. Kuviossa 3.4 suodattimella on 2 sisäänmenoa ja 2 ulostuloa mutta tästä saadaan helposti rehti suodatin yhdellä sisäänmenolla ja yhdellä ulostulolla vaikkapa poistamalla ensimmäisestä ja viimeisestä putkesta taaksepäin kulkevat aallot jolloin saadaan kuvion 3.5 suodatin. Tämä voitaisiin tehdä myös hieman realistisemmin esimerkiksi kytkemällä ensimmäisen putken taaksepäin kulkeva aalto eteenpäin menevään aaltoon mutta tämä ei ole tämän käsittelyn kannalta tarpeellista. Kuvio 3.5: Yhden sisäänmenon ja yhden ulostulon ristikkorakenne. Laskennallisesti siis pystymme toteuttamaan ristikkorakenteen kuvion 3.4 pohjalta. Tämän kurssin jatkon kannalta on kuitenkin oleellista selvittää mikä on ris-

49 tikkorakenteisen suodattimen siirtofunktio. Erityisesti haluamme osoittaa että se on all-pole-tyyppinen eli että siirtofunktiossa Þµ on pelkkiä napoja (eli osoittajan kaikki nollat ovat Þ ¼:ssa). Tämä ei ole aivan yksinkertaista mutta hoidam- Þµ me homman tekemällä suodattimelle käänteissuodattimen joka on FIR-tyyppinen, jolloin alkuperäisen suodattimen on oltava all-pole-tyyppinen. Lähdetään liikkeelle kuviosta 3.6 jossa on yksi lohko ristikkorakenteesta, sisään menevät Ò Þµ, Ò Þµ ja ulos tulevat Ò ½ Þµ, Ò ½ Þµ. Yritetään päästä takaisin muuttujiin Ò Þµ, Ò Þµ muuttujien Ò ½ Þµ, Ò ½ Þµ avulla, joka onnistuu ratkaisemalla edelliset jälkimmäisten avulla Kelly-Lochbaum yhtälöistä (3.3) ja (3.4). Yhtälöstä (3.3) saadaan Ò Þµ Ò ½ Þµ Ò Ò ½ Þµ ½ Ò µþ ½ Sijoittamalla tämä toiseen yhtälöön saadaan Ò ½ ÞµÞ ½ Ò Ò Ò ½ ÞµÞ ½ Ò Ò ½ ÞµÞ Ò Ò ½ ÞµÞ Ò Þµ Ò Þ ¾ ½ Ò µ Ò ½ ÞµÞ ½ ½ Ò joka pienen sieventelyn jälkeen taipuu muotoon Ò Þµ Ò Ò ½ ÞµÞ ½ Ò ½ ÞµÞ ½ ½ Ò ½ Ò Nämä yhtälöt voidaan toteuttaa kuvion 3.7 mukaisella suodattimella. Termi Þ joka vastaa siirtymistä ajassa eteenpäin voi vaikuttaa pelottavalta mutta sekin saadaan järjestykseen jäljempänä. Nyt jos kytkemme edelliseen tyyliin ristikkorakenteen jälkeen käänteislohkon jokaiselle ristikkorakenteen lohkolle (ensin lohko Ò, sitten Ò ½ jne.) niin lopputuloksena on se että siirtofunktio À Þµ koko suodattimen läpi on yksinkertaisesti À Þµ ½. Tilannetta on havainnollistettu kuviossa 3.8. Kun tarkemmin katsotaan käänteissuodatinta ristikkorakenteen jälkeen, havaitaan että siinä on vain viiveitä ja kertolaskuja, ja kaikki kytkennät ovat eteenpäin. Tämän perusteella suodatin on FIR-tyyppiä. Eli tilanne on seuraava: ristikkorakenteen siirtofunktio (jota ei tunneta) on Þµ Þµ ja sen jälkeisen suodattimen siirtofunktio (myös tuntematon mutta kuitenkin FIR) on Þµ, mutta kun nämä kytketään sarjaan niin siirtofunktio on Þµ Þµ ½ Þµ 45

50 46 LUKU 3. AKUSTISTA FONETIIKKAA Kuvio 3.6: Yksi lohko ristikkorakenteesta. Kuvio 3.7: Ristikkorakenteen lohko johon on liitetty käänteinen lohko. Mutta tästä taas seuraa että suodattimen Þµ osoittajan pitää olla ½ josta taas seuraa että Þµ on all-pole-suodatin. Varsin yleisesti puhetta mallinnetaan all-pole- Þµ Þµ suodattimilla (kuten seuraavan luvun lineaarisessa ennustuksessa) ja tässä on kohtuullisen hyvä perustelu sille miksi tämä toimii. Selvitellään vielä Þ-termit käänteissuodattimen toteutuksessa. Nämä ovat sikäli täysin loogisia että ristikkorakenne aiheuttaa signaaliin viivettä (aivan kuten sen

51 47 Kuvio 3.8: Ristikkorakenne johon on liitetty käänteissuodatin. esikuvana ollut akustinen putkimallikin). Tämän takia yleensä ollaan tyytyväisiä jos löydetään käänteissuodatin joka palauttaa alkuperäisen signaalin viivästettynä mutta ei tee siihen muita muutoksia. Tämä taas onnistuu ristikkorakenteen tapauksessa työntämällä Þ-termit suodattimen loppuun kuten kuviossa 3.9 on osoitettu (lukija voi taas varmistua itse siitä että tämä on sama suodatin kuin kuviossa 3.8 ja/tai tehtävä saattaa tulla harjoituksiin jos harjoitusten pitäjä huomaa tämän kommentin). Jos nämä Þ:t otetaan suodattimen lopusta pois, lopputuloksena on reaaliaikaisesti toteutettavissa oleva suodatin joka on käänteissuodatin siinä mielessä että ristikkorakenne ja tämä suodatin kytkettynä sarjaan aiheuttavat signaaliin puhtaan viiveen.

52 48 LUKU 3. AKUSTISTA FONETIIKKAA Kuvio 3.9: Käänteissuodatin jossa antiviiveet on siirretty loppuun.

53 Luku 4 Lineaarinen ennustus Lineaarinen ennustus (engl. linear prediction tai joskus linear predictive coding, lyhennys LP tai LPC) on yksi tärkeimmistä puheenkäsittelyn työkaluista. Puheenkäsittelyn kannalta LP:n tärkein ominaisuus on sen kyky mallintaa ääntöväylää. Kuten viime luvussa todettiin, ristikkorakenteinen ääntöväylän malli on all-pole suodatin eli suodatin, jossa on pelkästään napoja. Lineaarinen ennustus puolestaan on hyvä menetelmä tämän all-pole ääntöväyläsuodattimen parametrien estimointiin mitatun puhesignaalin perusteella. Termi lineaarinen ennustus saattaa vaikuttaa ensi alkuun oudolta mutta se tulee täysin loogisesti siitä että yritämme ennustaa puhesignaalin seuraavaa näytettä edellisten avulla, vieläpä lineaarisen suodattimen avulla. Kuten seuraavassa luvussa nähdään, tämän ennustussuodattimen avulla voidaan mallintaa ääntöväyläsuodatinta. Ääntöväyläsuodatin taas on puheentuoton kenties oleellisin piirre, joten jos se saadaan estimoitua hyvin siitä saadaan hyödyllistä informaatiota puheesta. Katsotaan alkuun esimerkki LP:n käyttökelpoisuudesta. Kuviossa 4.1 on esitetty 3 ms kehys vokaalista [a] näytteenottotaajuudella 16 khz. Kuviossa 4.2 on kehyksen amplitudispektri, jossa näkyvät puheen perustaajuus (tiheät piikit) sekä formantit (leveät piikit verhokäyrässä). Samassa kuviossa on aaltomuodosta lasketun LP-mallin amplitudivaste, joka vastaa varsin hyvin vokaalin amplitudispektrin verhokäyrää. Jatkossa kannattaa aina pitää mielessä että puhetta käsitellään lyhyissä kehyksissä ja LP-analyysi tehdään n. 1-3 ms välein. 4.1 Lineaarisen ennustuksen taustaa Termi lineaarinen ennustus viittaa kirjaimellisesti lineaarisen järjestelmän ulostulon ennustamiseen aikaisempien syötteiden Ü Òµ Ü Ò ½µ Ü Ò Õµ ja ulostulojen Ý Ò ½µ Ý Ò ¾µ Ý Ò Ôµ avulla. Tavoitteena on näiden muuttujien 49

54 5 LUKU 4. LINEAARINEN ENNUSTUS.8 ikkunoitu a äänne Kuvio 4.1: Hanning-ikkunoitu vokaalin [a] aaltomuoto. perusteella arvioida nykyinen ulostulo Ý Òµ. Tarkalleen ottaen ennustus tehdään kaavalla Ý Òµ Ô ½ µý Ò µ Æ ¼ µü Ò µ (4.1) missä Ý Òµ tarkoittaa Ý Òµ:n ennustusta tai estimaattia ja vakiot µ ja µ pyritään valitsemaan niin että ennustus on mahdollisimman hyvä (kuten jäljempänä nähdään). Myös mystinen miinusmerkki selviää myöhemmin. Sinänsä tämä ongelma ei ole nimenomaan sidoksissa puheenkäsittelyyn vaan kyse on yleisemmin tuntemattoman lineaarisen järjestelmän parametrien estimoinnista. Puheenkäsittelyn tapauksessa ajatellaan että järjestelmän syöte Ü Òµ on kurkunpää-ääni ja ulostulo Ý Òµ on mitattu puhesignaali. Käytetty lineaarinen malli voidaan vielä rajoittaa joksikin seuraavista: autoregressiivinen malli (autoregressive, AR) Tässä ulostulo Ý Òµ pyritään arvioimaan käyttäen vain edellisiä ulostulon arvoja sekä nykyistä sisäänmenon arvoa, eli µ ¼ kun ¼ ja vain µ ja ¼µ pitää määrittää. Vastaa all-pole suodatinta. liukuvan keskiarvon malli (moving average, MA) Tässä mallissa ulostulo en-

55 4.1. LINEAARISEN ENNUSTUKSEN TAUSTAA 51 4 Amplitudispektri ja LPC spektri taajuus, Hz Kuvio 4.2: [a]-äänteen amplitudispektri ja LP-spektri. nustetaan vain sisäänmenon avulla, eli µ ¼ kaikille :n arvoille. Vastaa FIR-suodatinta. autoregressiivinen liukuvan keskiarvon malli (ARMA) Tämä on yhtälön (4.1) mukainen yleinen malli. Vastaa yleistä lineaarista rekursiivista suodatinta. Käytännössä puheenkäsittelyssä käytetään AR-mallia, seuraavista syistä: syötettä (kurkunpää-ääntä) ei yleensä tunneta. parametrit µ pystytään laskemaan tehokkaasti AR-mallille. kuten aikaisemmin on esitetty, ääntöväylä on (tietyillä oletuksilla) teoreettisesti all-pole suodatin. korkeampiasteisella AR-mallilla voidaan mallintaa myös yleistä ARMAmallia.

56 52 LUKU 4. LINEAARINEN ENNUSTUS 4.2 Ääntöväylän mallinnus Ajatellaan all-pole järjestelmää, jonka siirtofunktio on missä Þµ (4.2) Þµ ½ ½µÞ ½ ÔµÞ Ô ja on vakio. Järjestelmän siirtofunktio on ulostulon Þµ ja sisäänmenon Þµ Þ-muunnosten suhde, eli josta seuraa että Þµ Þµ Þµ Þµ Þµ Þµ (4.3) Ottamalla yhtälöstä (4.3) käänteinen Þ-muunnos saadaan aikatasossa yhtälö eli Ý Òµ Ô ½ µý Ò Ý Òµ Ü Òµ Ô ½ µ Ü Òµ µý Ò µ (4.4) missä Ü Òµ on syöte, Ý Òµ vaste ja ½µ Ôµ suodattimen Þµ kertoimet. Tämän kaavan takia -kertoimet otetaan mukaan negatiivisina. Toisin sanoen, all-pole järjestelmän ulostulo voidaan ennustaa täydellisesti jos tunnetaan sisäänmeno ja aiemmat ulostulot. Käytännössä ennustus ei koskaan onnistu täydellisesti, sillä järjestelmät eivät yleensä ole täysin lineaarisia saati allpole tyyppisiä, ja ulostulossa on yleensä mukana jonkinasteista kohinaa. Lisäksi puheenkäsittelyn tapauksessa emme tunne järjestelmän sisäänmenoa Ü Òµ joten ennustus täytyy tehdä pelkän ulostulon pohjalta. Näistä seikoista huolimatta voidaan ääntöväylää (kuten mitä tahansa muutakin järjestelmää) mallintaa all-pole järjestelmällä, ja tässä tapauksessa malli vieläpä toimii melkoisen hyvin. Jos siis yhtälöstä (4.4) jätetään kylmästi pois riippuvuus syötteestä Ü Òµ, päädytään seuraavaan malliin, jota käytämme jatkossa: Ý Òµ Ô ½ µý Ò µ

57 4.2. ÄÄNTÖVÄYLÄN MALLINNUS 53 Hattu Ý:n päällä viittaa siihen, että kyseessä on estimaatti, eikä todellinen ulostulo. Tavoitteena on nyt määrittää parametrit ½µ ¾µ Ôµ siten että Ý Òµ olisi mahdollisimman lähellä todellista mitattua puhetta Ý Òµ. Muistutus: puhetta käsitellään kehyksittäin joten Ý Òµ on vain muutamien kymmenien millisekuntien pituinen ikkunoitu kehys. Kun parametrit on määritetty, voimme yhtälön (4.2) perusteella käyttää ääntöväyläsuodattimelle mallia ½ Þµ missä on käytetty ½ ( voidaan estimoida paljon tyylikkäämminkin, mutta tässä olemme lähinnä kiinnostuneita termistä Þµ). Huomaa yhteys mallin (4.2) ja ennustuskertoimien (4.5) välillä: jos malli on niin ennustus saadaan yhtälöstä ½ ½ ½ Þ ½ Ô Þ Ô Ý Òµ Ô ½ µý Ò µ eli ennustuskertoimet saadaan mallin nimittäjästä jättämällä ensimmäinen pois ja vaihtamalla merkit Autokorrelaatioyhtälöt Parametrit ½µ Ôµ määritetään yleensä niin, että neliövirheiden summa Ò Ý Òµ Ý Òµµ ¾ minimoituu, kun summa lasketaan kaikkien indeksien yli. Käytännössä summa on luonnollisesti äärellinen koska kyseessä on äärellisen pituinen ikkunoitu signaali, mutta tässä yhteydessä on kätevää ajatella kehys itse asiassa äärettömän pitkäksi signaaliksi, josta vain jotkin näytteet eroavat nollasta. Seuraavassa käytetään ulostulosta Ý Òµ merkintää Òµ (koska kyseessä ajatellaan olevan puhetta). Parametrien estimointi lähtee siitä, että meillä on ikkunoitu puhesignaali Òµ, jossa on siis vain äärellisen monta nollasta eroavaa arvoa. Määritellään virhesignaali Òµ kaavalla Òµ Òµ Òµ

58 54 LUKU 4. LINEAARINEN ENNUSTUS Annetuilla ennustuskertoimilla ½µ ¾µ Ôµ ennustusvirheen energia voidaan kirjoittaa muodossa Ô ½ Ò ½ ½ Ò ½ ½ Ò ½ Òµ ¾ Òµ Òµ Òµµ ¾ Ô ½ µ Ò µ ¾ missä Ô on ennustavan suodattimen pituus ja Òµ on Òµ:n estimaatti. Kun sovitaan että ¼µ ½, niin ennustusvirheen energia Ô voidaan kirjoittaa näppärästi muodossa Ô ½ Ò ½ Ô ¾ µ Ò µ ¼ Minimoidaan nyt Ô valitsemalla sopivat kertoimet ½µ ¾µ Ôµ. Välttämätön ehto kertoimen µ optimaalisuudelle on että funktion Ô osittaisderivaatta muuttujan µ suhteen on nolla. Huomaa että Ô riippuu kertoimista ½µ Ôµ, joten se oikeastaan pitäisi kirjoittaa rehtinä monen muuttujan funktionakin Ô ½µ Ôµµ mutta lyhyyden vuoksi näin ei tässä tehdä. Sitten vaan derivoimaan! Muuttujan µ suhteen ( ½ ¾ Ô) osittaisderivaatta on Ô µ È Ò ÈÔ ¼ µ Ò Ò Ò ¾ ¾ Ô ¼ Ô ¼ µ µ Ò µ µ Ò µ µµ¾ È Ô ¼ Ò µ µ Ò µ µ missä on hyödynnetty yhdistetyn funktion derivointisääntöä ܵµ ¼ ¼ ܵµ ¼ ܵ. Tämä voidaan ryhmitellä uudestaan seuraavasti: ½ Ò ½ ¾ ¾ Ô ¼ Ô ¼ ¾ µ Ô ¼ µ Ò µ ½ Ò ½ µö µ Ò µ Ò µ Ò µ

59 4.2. ÄÄNTÖVÄYLÄN MALLINNUS 55 missä Ö µ ½ Ò ½ Ò µ Ò µ Termi Ö µ taas on signaalin Òµ autokorrelaatio viiveellä eli Ö µ ½ Ò ½ Òµ Ò µµ Miten niin? Tekemällä muuttajan vaihto summauksessa todetaan että Ö µ ½ Ò ½ ½ Ò ½ ½ Ò ½ Ò µ Ò µ Ò µ µ Ò µ µ Òµ Ò µµ, merkitään sitä yhden muuttujan autokor- Koska Ö µ riippuu vain arvosta relaation avulla Ö µ Ö µ Huomaa myös että Ö µ Ö µ (harjoitustehtävä lukijalle). Edellä derivoitiin siis ennustusvirheen energian lauseke kertoimien ½µ ¾µ Ôµ suhteen. Kun nämä derivaatat asetetaan nollaksi, saadaan seuraava yhtälöryhmä: È Ô ¾ È µö ¼ Ô ¾ µö ¼ È. Ô ¾ µö ¼ ½µ ¼ ¾µ ¼ Ôµ ¼ joka voidaan myös kirjoittaa muodossa (muista että ¼µ ½ ja Ö µ Ö È Ô ½ µö ½µ Ö ½µ È Ô ½ µö ¾µ Ö ¾µ. È Ô µö ½ Ôµ Ö Ôµ µ)

60 56 LUKU 4. LINEAARINEN ENNUSTUS joka taasen voidaan ryhmitellä matriisimuodossa täten: ¾ Ö ¼µ Ö ½µ Ö ¾µ Ö Ô ½µ Ö ½µ Ö ¼µ Ö ½µ Ö Ô ¾µ ¾ ½µ ¾µ µ ¾ Ö ½µ Ö ¾µ Ö µ Ö ¾µ Ö ½µ Ö ¼µ Ö Ô µ Ö Ô ½µ Ö Ô ¾µ Ö Ô µ Ö ¼µ Ôµ Ö Ôµ (4.5) Huomaa että kerroinmatriisi on symmetrinen (koska Ö µ Ö µ) ja Toeplitz eli kaikilla diagonaaleilla on sama arvo (koska Ö µ Ö µ). Tämä on oleellista kun kertoimille ½µ ¾µ Ôµ etsitään nopea ratkaisumenetelmä. Siirtämällä vielä kaavassa (4.5) oikean puolen vektori vasemman puolen matriisiin (jolloin pitää lisätä kerroinvektoriin alkio 1) saadaan se muotoon ¾ Ö ½µ Ö ¼µ Ö ½µ Ö ¾µ Ö Ô ½µ Ö ¾µ Ö ½µ Ö ¼µ Ö ½µ Ö Ô ¾µ Ö µ Ö ¾µ Ö ½µ Ö ¼µ Ö Ô µ Ö Ôµ Ö Ô ½µ Ö Ô ¾µ Ö Ô µ Ö ¼µ ¾ ½ ½µ ¾µ µ. Ôµ Toinen oleellinen seikka jota tarvitaan jatkossa on seuraava: optimaalisilla - kertoimilla pitää paikkansa että Ô ¼ µö µ Ò ¾ ¼ ¼ ¼. ¼ Òµ Òµµ ¾ (4.6) Kaava (4.6) saadaan todistettua seuraavalla pyörittelyllä jossa käytetään yhtälöryhmää (4.5): Ò Ò ¼ Ò Òµ Òµ Òµµ ¾ Ô ½ Òµ¾ ¾ Ö ¼µ ¾ Ö ¼µ ¾ Ô ½ Ô ½ µ Ò µ Ô ½ µö µ µ ¾ µ Òµ Ò µ Ô ½ Ò Ô ½ Ô ½ µ Ò µ µµö µ Ô µ Ò µ Ô ½ Ô ½ ½ ¾ ½ µ Ò µ µ µ Ò Ò µ Ò µ

61 4.2. ÄÄNTÖVÄYLÄN MALLINNUS 57 Ö ¼µ ¾ Ö ¼µ Ö ¼µ Ö ¼µ Ô ¼ Ô Ô ½ ½ Ô Ô ½ ½ Ô ½ Ô ½ µö µ µ µ µö µ µ µö µ Ô ½ µö µ µµö µ Levinson-Durbin rekursio Ô Ô ½ ½ µ µö µ Kertaus: tässä vaiheessa olemme johtaneet yhtälöryhmän (ns. normaaliyhtälöt) ennustuskertoimille ½µ Ôµ sen perusteella, että ennustusvirhe minimoituu. Kertoimet voitaisiin nyt periaatteessa ratkaista kääntämällä autokorrelaatiomatriisi, mutta tämä on yleensä melko vaativa operaatio. Meidän onneksemme Levinson ja Durbin ovat kehittäneet tehokaan algoritmin edellisen tapaisen symmetrisen ja Toeplitz-tyyppisen yhtälöryhmän ratkaisemiseen. Algoritmin perusajatuksena on ratkaista symmetrinen Toeplitz-matriisiyhtälö ÊÜ Ý lohkoittain kasvattamalla vektorin Ü pituutta ja laskemalla uusi ratkaisu edellisten avulla. Yhtälöiden (4.6) ja (4.6) avulla normaaliyhtälöt voidaan kirjoittaa muodossa ¾ Ö ¼µ Ö ½µ Ö ¾µ Ö Ôµ Ö ½µ Ö ¼µ Ö ½µ Ö Ô ½µ Ö ¾µ Ö ½µ Ö ¼µ Ö Ô ¾µ Ö Ôµ Ö Ô ½µ Ö Ô ¾µ Ö ¼µ ¾ Ô ¼ ¼. ¼ ¾ ½ ½µ ¾µ. Ôµ Huomaa että vasemman puolen matriisi on edelleen symmetrinen Toeplitz-matriisi.

62 58 LUKU 4. LINEAARINEN ENNUSTUS Oletetaan, että olemme saaneet ratkaistuksi tämän yhtälön kun Ô ¾ ja merkitään vastaavia kertoimia ¾ ½µ ja ¾ ¾µ missä alaindeksi viittaa yhtälön asteeseen. Katsotaan miten näiden avulla voidaan ratkaista kertoimet ½µ ¾µ µ kun Ô. Eli tämä meillä on ratkaistuna: ¾ Ö ¼µ Ö ½µ Ö ¾µ Ö ½µ Ö ¼µ Ö ½µ Ö ¾µ Ö ½µ Ö ¼µ ¾ ¾ ¼ ¼ ¾ Matriisin Ê rakenteen ansiosta on nyt voimassa ¾ Ö ¼µ Ö ½µ Ö ¾µ Ö ½µ Ö ¼µ Ö ½µ Ö ¾µ Ö ½µ Ö ¼µ ¾ ¼ ¼ ¾ ¾ ½ ¾ ½µ ¾ ¾µ ¾ ¾µ ¾ ½µ eli: symmetrisillä Toeplitz-matriiseilla (ja vain näillä) on se hauska ominaisuus, että jos kerroinvektori ja tulosvektori käännetään, eli laitetaan viimeinen alkio ensimmäiseksi, toiseksi viimeinen toiseksi jne., niin yhtälöryhmä on edelleen voimassa. Yritetään nyt isommalle yhtälöryhmälle seuraavanlaista ratkaisua: ¾ Ö ¼µ Ö ½µ Ö ¾µ Ö µ Ö ½µ Ö ¼µ Ö ½µ Ö ¾µ Ö ¾µ Ö ½µ Ö ¼µ Ö ½µ Ö µ Ö ¾µ Ö ½µ Ö ¼µ ¾ ¾ ¼ ¼ Õ ¾ Õ ¼ ¼ ¾ ¾ ½ ¾ ½µ ¾ ¾µ ¼ ½ ¾ ¼ ¾ ¾µ ¾ ½µ missä on joku vielä määräämätön vakio ja È ¾ Õ ¼ ¾ µö µ. Jotta tämä olisi normaaliyhtälöiden ratkaisu, vaadimme vain, että oikean puolen vektorissa kaikki alkiot ensimmäistä lukuunottamatta ovat nollia. Tämä taas toteutuu, jos Õ ¾ ¼ ½

63 4.2. ÄÄNTÖVÄYLÄN MALLINNUS 59 eli Õ ¾ ½ ¾ ¾ ¼ ¾ µö µ Lisäksi saadaan ¾ Õ ¾ ¾ µ ¾ ½ ¾ µ Edellä siis totesimme että jos kokeilemme korkeampiasteisen yhtälöryhmän ratkaisuksi vektoria joka on summa alempiasteisesta ratkaisusta ja sen vakiolla painotetusta käännöksestä, saamme ratkaisun korkeampiasteiselle yhtälöryhmälle. Sama päättely toimii yleisestikin kun lohkon kokoa kasvatetaan Ò ½:stä Ò:ään. Tällöin saadaan Ò ½ Ò ½ Ò ½ ¼ Ò ½ µö Ò µ ja Ò Ò ½ ½ ¾ Ò µ Ò µ Ò ½ µ Ò Ò ½ Ò µ Yleisesti pidemmän suodattimen pienin mahdollinen ennustusvirhe on aina pienempi kuin lyhyemmän suodattimen (samalle ennustettavalle signaalille), eli Ò Ò ½, joka voidaan myös kirjoittaa muodossa Ò Ò ½ ½ Koska Ò Ò ½ ½ ¾ Ò µ niin saadaan Ò Ò ½ ½ ¾ Ò Tämä taasen toteutuu vain jos Ò ½. Arvoja Ò sanotaan heijastuskertoimiksi (aivan kuten akustisessa putkimallissakin). ½

64 6 LUKU 4. LINEAARINEN ENNUSTUS Levinson-Durbin rekursio aloitetaan ehdosta Ö ¼µ ¼ joka on ¼:nnen asteen ennustajan virheeksi (eli ei ennustusta ollenkaan eli virhe on signaalin neliöiden summa). Muitakin ratkaisuja ja variaatioita ääntöväylän mallintamiseksi on olemassa, mutta Levinson-Durbin algoritmin avulla lasketut kertoimet lienevät yleisin menetelmä. Tällä tavalla lasketuilla kertoimilla on vielä se tärkeä ominaisuus että tuloksena saatava all-pole suodatin on stabiili, eli sen navat eivät ole yksikköympyrän ulkopuolella. Itse asiassa ehto että heijastuskertoimet ovat itseisarvoltaan enintään 1 on ekvivalentti suodattimen stabiilisuuden kanssa ja tämä on näppärä tapa tarkistaa suodattimen stabiilisuus yleisestikin. Mallin aste Ô valitaan yleensä sen perusteella, että yksi napa vastaa yhtä formanttia, ja koska formantteja on suurin piirtein yksi aina yhtä khz:ä kohden, otetaan asteeksi näytteenottotaajuus khz:nä. Eli jos näytteenottotaajuus on 8kHz, niin mallin aste on 8. Yleensä otetaan vielä hieman korkeampi aste, jotta pystyttäisiin kompensoimaan epätarkkuuksia mallissa (kuten AR-oletusta yms.), eli esim. näytteenottotaajuudella 8 khz järjellinen aste on 1 tai 12, ja näytteenottotaajuudella 16 khz esim. 18 tai 2. Edellä käsitelty LP-analyysi on ehkä tärkein yksittäinen menetelmä puheenkäsittelyssä. Esim. puheenkoodauksessa sitä käytetään koodaamaan erikseen heräte ja ääntöväylä, puheentunnistuksessa antamaan tietoa äänteen spektristä (ja sitä kautta äänteestä) ja puhesynteesissä mahdollistamaan erikseen herätteen ja ääntöväylän ohjaaminen. Matlabissa LPC-analyysi onnistuu komennolla lpc.

65 Luku 5 Lineaarisen ennustuksen sovelluksia Lineaarisella ennustuksella on hyvin tärkeä asema monessa puheenkäsittelyn sovelluksessa. Seuraavassa on esitetty muutamia esimerkkejä siitä miten lineaarista ennustusta voidaan hyödyntää ja kursseilla SGN-45 Puheen koodaus ja SGN- 416 Puheentunnistus käsitellään tarkemmin miten lineaarista ennustusta hyödynnetään koodauksessa ja puheentunnistuksessa. Kaikki LP:n sovellukset perustuvat siihen, että puhe esitetään heräte/suodatin-mallin avulla, ts. esittämällä puhe herätteenä joka on suodatettu ääntöväyläsuodattimella. Ääntöväyläsuodatin puolestaan saadaan estimoitua lineaarisen ennustuksen avulla. 5.1 Formanttien estimointi Formanttien estimointi ääntöväyläsuodattimesta ½ Þµ perustuu siihen, että napaparilla ½ ½ Ö Þ ½ µ ½ Ö Þ ½ µ ½ ½ ¾Ö Ó µþ ½ Ö ¾ Þ ¾ on amplitudivasteen huippu kulmataajuudella eli taajuudella ¾µ, missä on näytteenottotaajuus. Formantin taajuuden lisäksi oleellinen parametri on formantin kaistanleveys, joka ilmaisee kuinka leveä formantti on. Mikäli formantti on hyvin jyrkkä, sen kaistanleveys on pieni, ja päinvastoin. Tarkasti ottaen LP-suodattimen napaparin kaistanleveys on ÐÒ Ö ¾ 61

66 62 LUKU 5. LINEAARISEN ENNUSTUKSEN SOVELLUKSIA joka siis riippuu ainoastaan Ö:sta, eli navan etäisyydestä origosta. Tämä on sen kaistan leveyden puolikas hertseinä, jossa navan amplitudivaste db maksimiarvostaan, kuten kuva 5.1 havainnollistaa. 1 Napaparin amplitudivaste Amplitudivaste db taajuus Hz Kuvio 5.1: Napaparin 3dB:n kaistanleveys. Seuraavaksi esitetään laskennallisia menetelmiä, joilla LP-suodattimen formanttien taajuuksia voidaan estimoida Tekijöihin jako Suoraviivainen tapa estimoida formanttitaajuudet on jakaa LP-polynomi tekijöihin Þµ ½ ½µÞ ½ ÔµÞ Ô Þµ ½ Þ ½ Þ ½ µ ½ Þ ¾ Þ ½ µ ½ Þ Ô Þ ½ µ missä Þ ½ Þ Ô ovat polynomin Þµ nollakohdat. Nyt Þ voidaan kirjoittaa muodossa Þ Ö

67 5.1. FORMANTTIEN ESTIMOINTI 63 jolloin suodattimella ½ Þµ on formantti taajuudella. Matlabissa polynomin juurtaminen onnistuu helposti komennolla roots. Ongelmana on reaaliaikaisten sovellusten kannalta lähinnä juurten etsimisen vaatima laskentateho. Käytännössä tekijöiden etsimiseen käytetään jotakin iteratiivista algoritmia, esim. Newton-Raphson menetelmää, joka toimii hyvin jos juurten alkuarvaukset ovat hyviä. Tämän takia kannattaa uuden kehyksen LP-polynomin nollien alkuarvoina käyttää edellisen kehyksen nollia, sillä ääntöväylä ja sen myötä LPpolynomin nollat muuttuvat suhteellisen hitaasti. Kuviossa 5.2 on spektrogrammi sanoista Suomen laki sekä tästä lasketut formantit. Nämä on saatu laskemalla kullekin 3 ms kehykselle 8:nnen asteen LP-polynomi, juurtamalla nimittäjä ja laskemalla nollien kulmat. Yritetään vielä siistiä tätä kuviota nostamalla LP-analyysin aste 12:een, ottamalla mukaan vain navat joiden säde on vähintään.9 ja jättämällä pois navat joiden kulma on alle 2 Hz. Näiden muutosten seurauksena saadaan kuvio spektrogrammi ja LP mallin formantit Frequency Time Kuvio 5.2: Spektrogrammi sanoista Suomen laki ja 8:nnen asteen LP-mallista lasketut formantit.

68 64 LUKU 5. LINEAARISEN ENNUSTUKSEN SOVELLUKSIA 4 spektrogrammi ja LP mallin formantit Frequency Time Kuvio 5.3: Spektrogrammi sanoista Suomen laki ja 12:nnen asteen LPsuodattimen nimittäjän nollat joiden säde ¼ ja joiden taajuus on yli 2 Hz Amplitudivasteen maksimien etsintä Toinen tapa selvittää formantit LP-polynomin Þµ perusteella on laskea siirtofunktion amplitudivaste; formanttitaajuuksien pitäisi olla tämän vasteen ½ Þµ maksimien kohdalla. Tämä taas on nopeampi laskea etsimällä suodattimen Þµ amplitudivasteen minimiarvot. Homma toimii pääsääntöisesti hyvin paitsi silloin kun kaksi formanttia on niin lähellä toisiaan että ne sulautuvat yhteen, ts. amplitudivasteessa ei ole kuin yksi maksimi, katso kuvio 5.4. Katsotaan joitakin menetelmiä miten tätä ongelmaa on yritetty ratkaista, lisäksi samalla saadaan käsitys siitä miten LP-mallia voidaan muokata tarpeen mukaan. Kätevä keino sulautumien erottamiseen on McCandlessin menetelmä, jossa lasketaan järjestelmän amplitudivaste ympyrän muotoisella kehällä yksikköympyrän sisällä eli pisteissä Ö µ missä ¼ Ö ½ ja ¼ ¾. Tämän johdosta napojen aiheuttamat amplitudivasteen piikit tulevat terävämmiksi ja helpommin eroteltaviksi. Laskennallisesti

http://www.opiskelijakirjasto.lib.helsinki.fi/fonterm/006.htm

http://www.opiskelijakirjasto.lib.helsinki.fi/fonterm/006.htm Luku 2 Fonetiikkaa Puhe on kaiken kaikkiaan hyvin monitasoinen ja monimutkainen inhimillinen ja fysikaalinen ilmiö, sisältäen kysymyksiä liittyen mm. kognitioon, kieleen, fysiologiaan, kuuloon ja akustiikkaan.

Lisätiedot

3 Ikkunointi. Kuvio 1: Signaalin ikkunointi.

3 Ikkunointi. Kuvio 1: Signaalin ikkunointi. 3 Ikkunointi Puhe ei ole stationaarinen signaali, vaan puheen ominaisuudet muuttuvat varsin nopeasti ajan myötä. Tämä on täysin luonnollinen ja hyvä asia, mutta tämä tekee sellaisten signaalinkäsittelyn

Lisätiedot

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN » Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN 1 Puhe-elimistä Helsingin Yliopiston sivuilla» Puhe-elimet voidaan jakaa

Lisätiedot

4 Fonetiikkaa. Puhe-elimet

4 Fonetiikkaa. Puhe-elimet 4 Fonetiikkaa Puhe on kaiken kaikkiaan hyvin monitasoinen ja monimutkainen inhimillinen ja fysikaalinen ilmiö, sisältäen kysymyksiä liittyen mm. kognitioon, kieleen, fysiologiaan, kuuloon ja akustiikkaan.

Lisätiedot

DSP:n kertausta. 1 Spektri, DFT, DTFT ja aika-taajuusresoluutio

DSP:n kertausta. 1 Spektri, DFT, DTFT ja aika-taajuusresoluutio DSP:n kertausta Kerrataan/käydään läpi: ffl Spektri, DFT, DTFT ja FFT ffl signaalin jaksollisuuden ja spektrin harmonisuuden yhteys ffl aika-taajuusresoluutio Spektri, DFT, DTFT ja aika-taajuusresoluutio

Lisätiedot

Foneettiset symbolit

Foneettiset symbolit Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...

Lisätiedot

4.2 Akustista fonetiikkaa

4.2 Akustista fonetiikkaa 4.2 Akustista fonetiikkaa Akustisessa fonetiikassa tutkitaan puheen akustisia ominaisuuksia ja sitä miten ne seuraavat puheentuottomekanismin toiminnasta. Aiheen tarkka käsitteleminen vaatisi oman kurssinsa,

Lisätiedot

4.3 Signaalin autokorrelaatio

4.3 Signaalin autokorrelaatio 5 4.3 Sigaali autokorrelaatio Sigaali autokorrelaatio kertoo kuika paljo sigaali eri illä korreloi itsesä kassa (josta imiki). Se o Fourier-muuokse ohella yksi käyttökelpoisimmista sigaalie aalysoitimeetelmistä.

Lisätiedot

Puheen akustiikan perusteita

Puheen akustiikan perusteita Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/39 Äänet, resonanssi ja spektrit ctl103 Fonetiikan perusteet kieliteknologeille

Lisätiedot

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat Martti Vainio -- syksy 2006 Artikulaatiotavat Konsonantit voivat siis vaihdella artikulaatipaikan mukaan ja sen mukaan ovatko ne soinnillisia vai eivät

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/39 ctl103 Fonetiikan perusteet kieliteknologeille

Lisätiedot

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen: Puheen anatomiaa ja fysiologiaa Puhesignaalin analyysi Puheen havaitseminen luku 11 Luento: Puhe Mitä puhe on? Ihmisen kehittämä symbolinen kommunikaatiojärjestelmä. Perustuu sovittuihin kielellisiin koodeihin

Lisätiedot

Puheen akustiikan perusteita

Puheen akustiikan perusteita Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 Äänet, resonanssi ja spektrit S-114.770 Kieli kommunikaatiossa...

Lisätiedot

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Kompleksiluvut signaalin taajuusjakauman arvioinnissa Kompleksiluvut signaalin taajuusjakauman arvioinnissa Vierailuluento IMA-kurssilla Heikki Huttunen Lehtori, TkT Signaalinkäsittely, TTY heikki.huttunen@tut.fi Department of Signal Processing Fourier-muunnos

Lisätiedot

Tietoliikennesignaalit & spektri

Tietoliikennesignaalit & spektri Tietoliikennesignaalit & spektri 1 Tietoliikenne = informaation siirtoa sähköisiä signaaleja käyttäen. Signaali = vaihteleva jännite (tms.), jonka vaihteluun on sisällytetty informaatiota. Signaalin ominaisuuksia

Lisätiedot

SIGNAALITEORIAN KERTAUSTA OSA 2

SIGNAALITEORIAN KERTAUSTA OSA 2 1 SIGNAALITEORIAN KERTAUSTA OSA 2 Miten spektri lasketaan moduloiduille ja näytteistetyille tietoliikennesignaaleille? KONVOLUUTIO JA KERTOLASKU 2 Kantataajuussignaali (baseband) = sanomasignaali ilman

Lisätiedot

z muunnos ja sen soveltaminen LTI järjestelmien analysointiin

z muunnos ja sen soveltaminen LTI järjestelmien analysointiin z muunnos ja sen soveltaminen LTI järjestelmien analysointiin muunnoksella (eng. transform) on vastaava asema diskreettiaikaisten signaalien ja LTI järjestelmien analyysissä kuin Laplace muunnoksella jatkuvaaikaisten

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe SGN-00 Signaalinkäsittelyn menetelmät Välikoe 9.3.009 Sivuilla - on. Älä vastaa siihen, jos et ollut ensimmäisessä välikokeessa. Tentin kysymykset ovat sivuilla 3-4. Vastaa vain jompaan kumpaan kokeeseen,

Lisätiedot

SIGNAALITEORIAN KERTAUSTA 1

SIGNAALITEORIAN KERTAUSTA 1 SIGNAALITEORIAN KERTAUSTA 1 1 (26) Fourier-muunnos ja jatkuva spektri Spektri taajuuden funktiona on kompleksiarvoinen funktio, jonka esittäminen graafisesti edellyttää 3D-kuvaajan piirtämisen. Yleensä

Lisätiedot

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on 13 Pistetulo Avaruuksissa R 2 ja R 3 on totuttu puhumaan vektorien pituuksista ja vektoreiden välisistä kulmista. Kuten tavallista, näiden käsitteiden yleistäminen korkeampiulotteisiin avaruuksiin ei onnistu

Lisätiedot

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.

Lisätiedot

Spektri- ja signaalianalysaattorit

Spektri- ja signaalianalysaattorit Spektri- ja signaalianalysaattorit Pyyhkäisevät spektrianalysaattorit Suora pyyhkäisevä Superheterodyne Reaaliaika-analysaattorit Suora analoginen analysaattori FFT-spektrianalysaattori DFT FFT Analysaattoreiden

Lisätiedot

Puhe ja kommunikaatio

Puhe ja kommunikaatio Puhe ja kommunikaatio Puhe on ihmisen kehittämistä kommunikoinnin muodoista hienostunein ja monimutkaisin -- siihen on kerrostunut useanlaista informaatiota, joiden määrittelyyn tarvitaan jonkinlainen

Lisätiedot

T-61.246 DSP: GSM codec

T-61.246 DSP: GSM codec T-61.246 DSP: GSM codec Agenda Johdanto Puheenmuodostus Erilaiset codecit GSM codec Kristo Lehtonen GSM codec 1 Johdanto Analogisen puheen muuttaminen digitaaliseksi Tiedon tiivistäminen pienemmäksi Vähentää

Lisätiedot

Organization of (Simultaneous) Spectral Components

Organization of (Simultaneous) Spectral Components Organization of (Simultaneous) Spectral Components ihmiskuulo yrittää ryhmitellä ja yhdistää samasta fyysisestä lähteestä tulevat akustiset komponentit yhdistelyä tapahtuu sekä eri- että samanaikaisille

Lisätiedot

IIR-suodattimissa ongelmat korostuvat, koska takaisinkytkennästä seuraa virheiden kertautuminen ja joissakin tapauksissa myös vahvistuminen.

IIR-suodattimissa ongelmat korostuvat, koska takaisinkytkennästä seuraa virheiden kertautuminen ja joissakin tapauksissa myös vahvistuminen. TL536DSK-algoritmit (J. Laitinen)..5 Välikoe, ratkaisut Millaisia ongelmia kvantisointi aiheuttaa signaalinkäsittelyssä? Miksi ongelmat korostuvat IIR-suodatinten tapauksessa? Tarkastellaan Hz taajuista

Lisätiedot

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM Puheenkoodaus Olivatpa kerran iloiset serkukset PCM, DPCM ja ADPCM PCM eli pulssikoodimodulaatio Koodaa jokaisen signaalinäytteen binääriseksi (eli vain ykkösiä ja nollia sisältäväksi) luvuksi kvantisointitasolle,

Lisätiedot

Digitaalinen signaalinkäsittely Desibeliasteikko, suotimen suunnittelu

Digitaalinen signaalinkäsittely Desibeliasteikko, suotimen suunnittelu Digitaalinen signaalinkäsittely Desibeliasteikko, suotimen suunnittelu Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen,

Lisätiedot

4 Matemaattinen induktio

4 Matemaattinen induktio 4 Matemaattinen induktio Joidenkin väitteiden todistamiseksi pitää näyttää, että kaikilla luonnollisilla luvuilla on jokin ominaisuus P. Esimerkkejä tällaisista väitteistä ovat vaikkapa seuraavat: kaikilla

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe SGN-100 Signaalinkäsittelyn menetelmät Välikoe 6.4.010 Sivuilla 1- on. Älä vastaa siihen, jos et ollut ensimmäisessä välikokeessa. Tentin kysymykset ovat sivuilla 3-4. Vastaa vain jompaan kumpaan kokeeseen,

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 21.3.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

Signaalit ja järjestelmät aika- ja taajuusalueissa

Signaalit ja järjestelmät aika- ja taajuusalueissa Signaalit ja järjestelmät aika- ja taajuusalueissa Signaalit aika ja taajuusalueissa Muunnokset aika ja taajuusalueiden välillä Fourier sarja (jaksollinen signaali) Fourier muunnos (jaksoton signaali)

Lisätiedot

Foneettiset symbolit. Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat. IPA jatkoa IPA. Martti Vainio -- syksy 2005

Foneettiset symbolit. Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat. IPA jatkoa IPA. Martti Vainio -- syksy 2005 Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2005 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 4 Jatkuvuus Jatkuvan funktion määritelmä Tarkastellaan funktiota f x) jossakin tietyssä pisteessä x 0. Tämä funktio on tässä pisteessä joko jatkuva tai epäjatkuva. Jatkuvuuden

Lisätiedot

5 Lineaarinen ennustus

5 Lineaarinen ennustus 5 Lineaarinen ennustus Lineaarinen ennustus (linear prediction, LP) on yksi tärkeimmistä puheenkäsittelyn työkaluista Sitä voidaan eri tilanteessa käyttää eri tavoilla, mutta puheenkäsittelyn kannalta

Lisätiedot

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen SGN-11 Signaalinkäsittelyn perusteet Välikoe 3.5.16 Heikki Huttunen Laskimen käyttö sallittu. Muiden materiaalien käyttö ei sallittu. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla 1-3 on. Sivuilla 4-5

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi

Lisätiedot

Matlab-tietokoneharjoitus

Matlab-tietokoneharjoitus Matlab-tietokoneharjoitus Tämän harjoituksen tavoitteena on: Opettaa yksinkertaisia piirikaavio- ja yksikkömuunnoslaskuja. Opettaa Matlabin perustyökaluja mittausten analysoimiseen. Havainnollistaa näytteenottotaajuuden,

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SGN-1200 Signaalinkäsittelyn menetelmät, Tentti 5.5.2008 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

Numeeriset menetelmät

Numeeriset menetelmät Numeeriset menetelmät Luento 13 Ti 18.10.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 13 Ti 18.10.2011 p. 1/43 p. 1/43 Nopeat Fourier-muunnokset Fourier-sarja: Jaksollisen funktion esitys

Lisätiedot

Matematiikan tukikurssi, kurssikerta 3

Matematiikan tukikurssi, kurssikerta 3 Matematiikan tukikurssi, kurssikerta 3 1 Epäyhtälöitä Aivan aluksi lienee syytä esittää luvun itseisarvon määritelmä: { x kun x 0 x = x kun x < 0 Siispä esimerkiksi 10 = 10 ja 10 = 10. Seuraavaksi listaus

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 24.4.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 30.1.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

= 2 L L. f (x)dx. coshx dx = 1 L. sinhx nπ. sin. sin L + 2 L. a n. L 2 + n 2 cos. tehdään approksimoinnissa virhe, jota voidaan arvioida integraalin

= 2 L L. f (x)dx. coshx dx = 1 L. sinhx nπ. sin. sin L + 2 L. a n. L 2 + n 2 cos. tehdään approksimoinnissa virhe, jota voidaan arvioida integraalin BMA7 - Integraalimuunnokset Harjoitus 9. Määritä -jaksollisen funktion f x = coshx, < x < Fourier-sarja. Funktion on parillinen, joten b n = kun n =,,3,... Parillisuudesta johtuen kertoimet a ja a n saadaan

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SGN-1200 Signaalinkäsittelyn menetelmät, Tentti 18.3.2008 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

5 Akustiikan peruskäsitteitä

5 Akustiikan peruskäsitteitä Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen

Lisätiedot

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla? 6.10.2006 1. Keppi, jonka pituus on m, taitetaan kahtia täysin satunnaisesti valitusta kohdasta ja muodostetaan kolmio, jonka kateetteina ovat syntyneet palaset. Kolmion pinta-ala on satunnaismuuttuja.

Lisätiedot

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients THE audio feature: MFCC Mel Frequency Cepstral Coefficients Ihmiskuulo MFCC- kertoimien tarkoituksena on mallintaa ihmiskorvan toimintaa yleisellä tasolla. Näin on todettu myös tapahtuvan, sillä MFCC:t

Lisätiedot

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

Puhesynteesin perusteet Luento 4: difonikonkatenaatio Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 6 Sarjojen suppeneminen Kiinnostuksen kohteena on edelleen sarja a k = a + a 2 + a 3 + a 4 +... k= Tämä summa on mahdollisesti äärellisenä olemassa, jolloin sanotaan

Lisätiedot

Analyysi III. Jari Taskinen. 28. syyskuuta Luku 1

Analyysi III. Jari Taskinen. 28. syyskuuta Luku 1 Analyysi III Jari Taskinen 28. syyskuuta 2002 Luku Sisältö Sarjat 2. Lukujonoista........................... 2.2 Rekursiivisesti määritellyt lukujonot.............. 8.3 Sarja ja sen suppenminen....................

Lisätiedot

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat Artikulatoriset piirteet Puheen tuotto ja havaitseminen II Konsonantit Martti Vainio Fonetiikan laitos, Helsingin yliopisto Konsonantit voidaan jakaa luokkiin sen mukaan miten ja missä kohtaa ääniväylää.

Lisätiedot

Puheen tuotto ja havaitseminen II

Puheen tuotto ja havaitseminen II Puheen tuotto ja havaitseminen II Konsonantit Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puheen tuotto ja havaitseminen II p.1/40 Artikulatoriset piirteet Konsonantit voidaan jakaa luokkiin sen

Lisätiedot

Diskreetti Fourier-muunnos ja sen hyödyntäminen signaalien spektrien muodostamisessa. Pentti Romppainen

Diskreetti Fourier-muunnos ja sen hyödyntäminen signaalien spektrien muodostamisessa. Pentti Romppainen Diskreetti Fourier-muunnos ja sen hyödyntäminen signaalien spektrien muodostamisessa Pentti Romppainen Kajaanin ammattikorkeakoulu Oy Kajaani University of Applied Sciences Diskreetti Fourier-muunnos ja

Lisätiedot

Puheenkäsittelyn menetelmät

Puheenkäsittelyn menetelmät 8003051 Puheenkäsittelyn menetelmät Luento 16.9.2004 Akustista fonetiikkaa Ääniaalto Ääniaallolla tarkoitetaan häiriön etenemistä väliaineessa ilman että väliaineen hiukkaset (yleensä ilman kaasumolekyylit)

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 5 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 5 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 5 (2016) Tavoitteet (teoria): Ymmärtää kausivaihtelun käsite ja sen yhteys otoshetkiin. Oppia käsittelemään periodogrammia.. Tavoitteet (R): Periodogrammin,

Lisätiedot

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen SGN- Signaalinkäsittelyn perusteet Välikoe.5.4 Heikki Huttunen Tentissä ja välikokeessa saa käyttää vain tiedekunnan laskinta. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla -3 on. Sivuilla 4-5 on. Sivulla

Lisätiedot

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat Artikulatoriset piirteet Puheen tuotto ja havaitseminen II Konsonantit Martti Vainio Fonetiikan laitos, Helsingin yliopisto Konsonantit voidaan jakaa luokkiin sen mukaan miten ja missä kohtaa ääniväylää.

Lisätiedot

Puheen tuotto ja havaitseminen II

Puheen tuotto ja havaitseminen II Puheen tuotto ja havaitseminen II Konsonantit Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puheen tuotto ja havaitseminen II p.1/40 Artikulatoriset piirteet Konsonantit voidaan jakaa luokkiin sen

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-00 Signaalinkäsittelyn menetelmät, Tentti..005 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle ja sen

Lisätiedot

Puheentuoton fonetiikan kertausta Vfo 251, Puhesynteesin perusteet. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen.

Puheentuoton fonetiikan kertausta Vfo 251, Puhesynteesin perusteet. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puheentuoton fonetiikan kertausta Vfo 251, Puhesynteesin perusteet Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheentuoton fonetiikan kertausta p.1/109 Vfo251 Puhesynteesin

Lisätiedot

Laskuharjoitus 2 ( ): Tehtävien vastauksia

Laskuharjoitus 2 ( ): Tehtävien vastauksia TT12S1E Tietoliikenteen perusteet Metropolia/A. Koivumäki Laskuharjoitus 2 (11.9.2013): Tehtävien vastauksia 1. Eräässä kuvitteellisessa radioverkossa yhdessä radiokanavassa voi olla menossa samanaikaisesti

Lisätiedot

Luento 2. Jaksolliset signaalit

Luento 2. Jaksolliset signaalit Luento Jaksollisten signaalien Fourier-sarjat Viivaspektri S-.7. Signaalit ja järjestelmät 5 op KK ietoliikennelaboratorio Jaksollinen (periodinen) Jaksolliset signaalit Jaksonaika - / / Perusjakso Amplitudi

Lisätiedot

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista 6 Epäyhtälöitä Epäyhtälöt ovat yksi matemaatikon voimakkaimmista työvälineistä. Yhtälö a = b kertoo sen, että kaksi ehkä näennäisesti erilaista asiaa ovat samoja. Epäyhtälö a b saattaa antaa keinon analysoida

Lisätiedot

1 Vastaa seuraaviin. b) Taajuusvasteen

1 Vastaa seuraaviin. b) Taajuusvasteen Vastaa seuraaviin a) Miten määritetään digitaalisen suodattimen taajuusvaste sekä amplitudi- ja vaihespektri? Tässä riittää sanallinen kuvaus. b) Miten viivästys vaikuttaa signaalin amplitudi- ja vaihespektriin?

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Näihin harjoitustehtäviin liittyvä teoria löytyy Adamsista: Ad6, Ad5, 4: 12.8, ; Ad3: 13.8,

Näihin harjoitustehtäviin liittyvä teoria löytyy Adamsista: Ad6, Ad5, 4: 12.8, ; Ad3: 13.8, TKK, Matematiikan laitos Gripenberg/Harhanen Mat-1.432 Matematiikan peruskurssi K2 Harjoitus 4, (A=alku-, L=loppuviikko, T= taulutehtävä, P= palautettava tehtävä, W= verkkotehtävä ) 12 16.2.2007, viikko

Lisätiedot

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1 T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

Audiosignaalin mallintaminen sineillä ja kohinalla

Audiosignaalin mallintaminen sineillä ja kohinalla 8323 Digitaalinen audio, harjoitustyö kevät 25: vaiheet I ja II Audiosignaalin mallintaminen sineillä ja kohinalla 1. Yleistä Sinikohinamalli on parametrinen tapa esittää audiosignaali kompaktisti. Siinä

Lisätiedot

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin

Lisätiedot

Synteesi-analyysi koodaus

Synteesi-analyysi koodaus Luku 2 Synteesi-analyysi koodaus Tärkein koodausmenetelmä puheenkoodausstandardeissa 9-luvulta alkaen on ollut synteesi-analyysi koodaus (engl. analysis-by-synthesis). Tässä lähestymistavassa optimaaliset

Lisätiedot

SGN-4200 Digitaalinen Audio Harjoitustyö-info

SGN-4200 Digitaalinen Audio Harjoitustyö-info 1 SGN-4200 Digitaalinen Audio Harjoitustyö-info 04.04.2012 Joonas Nikunen Harjoitystyö - 2 Suorittaminen ja Käytännöt Kurssin pakollinen harjoitustyö: Harjoitellaan audiosignaalinkäsittelyyn tarkoitetun

Lisätiedot

Ristitulolle saadaan toinen muistisääntö determinantin avulla. Vektoreiden v ja w ristitulo saadaan laskemalla determinantti

Ristitulolle saadaan toinen muistisääntö determinantin avulla. Vektoreiden v ja w ristitulo saadaan laskemalla determinantti 14 Ristitulo Avaruuden R 3 vektoreille voidaan määritellä pistetulon lisäksi niin kutsuttu ristitulo. Pistetulosta poiketen ristitulon tulos ei ole reaaliluku vaan avaruuden R 3 vektori. Ristitulosta on

Lisätiedot

2.1. Tehtävänä on osoittaa induktiolla, että kaikille n N pätee n = 1 n(n + 1). (1)

2.1. Tehtävänä on osoittaa induktiolla, että kaikille n N pätee n = 1 n(n + 1). (1) Approbatur 3, demo, ratkaisut Sovitaan, että 0 ei ole luonnollinen luku. Tällöin oletusta n 0 ei tarvitse toistaa alla olevissa ratkaisuissa. Se, pidetäänkö nollaa luonnollisena lukuna vai ei, vaihtelee

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-00 Signaalinkäsittelyn menetelmät, Tentti 6.3.006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle ja

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

Luku 8. Aluekyselyt. 8.1 Summataulukko

Luku 8. Aluekyselyt. 8.1 Summataulukko Luku 8 Aluekyselyt Aluekysely on tiettyä taulukon väliä koskeva kysely. Tyypillisiä aluekyselyitä ovat, mikä on taulukon välin lukujen summa tai pienin luku välillä. Esimerkiksi seuraavassa taulukossa

Lisätiedot

Jaksollisen signaalin spektri

Jaksollisen signaalin spektri Jaksollisen signaalin spektri LuK-tutkielma Topi Suviaro 2257699 Matemaattisten tieteiden laitos Oulun yliopisto Syksy 215 Sisältö Johdanto 2 1 Jaksollisuudesta 2 2 Spektristä 3 2.1 Symmetrian vaikutuksesta

Lisätiedot

Osa IX. Z muunnos. Johdanto Diskreetit funktiot

Osa IX. Z muunnos. Johdanto Diskreetit funktiot Osa IX Z muunnos A.Rasila, J.v.Pfaler () Mat-.33 Matematiikan peruskurssi KP3-i 9. lokakuuta 2007 298 / 322 A.Rasila, J.v.Pfaler () Mat-.33 Matematiikan peruskurssi KP3-i 9. lokakuuta 2007 299 / 322 Johdanto

Lisätiedot

Tekijä MAA2 Polynomifunktiot ja -yhtälöt = Vastaus a)

Tekijä MAA2 Polynomifunktiot ja -yhtälöt = Vastaus a) K1 a) Tekijä MAA Polynomifunktiot ja -yhtälöt 6.8.016 ( + + ) + ( ) = + + + = + + + = + 4 b) 4 4 ( 5 + ) ( 5 + 1) = 5 + + 5 + 1 4 = + + + 4 = + 5 5 1 1 Vastaus a) 4 + b) 4 + 1 K a) f ( ) = + 1 f () = +

Lisätiedot

MS-C1420 Fourier-analyysi osa II

MS-C1420 Fourier-analyysi osa II MS-C142 Fourier-analyysi osa II G. Gripenberg Aalto-yliopisto 14. helmikuuta 214 G. Gripenberg (Aalto-yliopisto) MS-C142 Fourier-analyysiosa II 14. helmikuuta 214 1 / 36 1 Fourier-sarjat ja Fourier-integraalit

Lisätiedot

Luento 15: Ääniaallot, osa 2

Luento 15: Ääniaallot, osa 2 Luento 15: Ääniaallot, osa 2 Aaltojen interferenssi Doppler Laskettuja esimerkkejä Luennon sisältö Aaltojen interferenssi Doppler Laskettuja esimerkkejä Aaltojen interferenssi Samassa pisteessä vaikuttaa

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi miten uudenaikainen tai kallis tahansa ja mittaaja olisi alansa huippututkija Tästä johtuen mittaustuloksista

Lisätiedot

8 KANNAT JA ORTOGONAALISUUS. 8.1 Lineaarinen riippumattomuus. Vaasan yliopiston julkaisuja 151

8 KANNAT JA ORTOGONAALISUUS. 8.1 Lineaarinen riippumattomuus. Vaasan yliopiston julkaisuja 151 Vaasan yliopiston julkaisuja 151 8 KANNAT JA ORTOGONAALISUUS KantaOrthogon Sec:LinIndep 8.1 Lineaarinen riippumattomuus Lineaarinen riippumattomuus on oikeastaan jo määritelty, mutta kirjoitamme määritelmät

Lisätiedot

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus 1 / 51 Lineaarikombinaatio Johdattelua seuraavaan asiaan (ei tarkkoja määritelmiä): Millaisen kuvan muodostaa joukko {λv λ R, v R 3 }? Millaisen

Lisätiedot

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N)

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N) Kohina Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N) N on suoraan verrannollinen integraatioaikaan t ja havaittuun taajuusväliin

Lisätiedot

Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén

Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén Sonifikaatio Menetelmä Sovelluksia Mahdollisuuksia Ongelmia Sonifikaatiosovellus: NIR-spektroskopia kariesmittauksissa

Lisätiedot

Ohjelmistoradio tehtävät 4. P1: Ekvalisointi ja demodulaatio. OFDM-symbolien generoiminen

Ohjelmistoradio tehtävät 4. P1: Ekvalisointi ja demodulaatio. OFDM-symbolien generoiminen Ohjelmistoradio tehtävät 4 P: Ekvalisointi ja demodulaatio Tässä tehtävässä dekoodata OFDM data joka on sijotetty synknonontisignaalin lälkeen. Synkronointisignaali on sama kuin edellisessä laskutehtävässä.

Lisätiedot

Joukot. Georg Cantor ( )

Joukot. Georg Cantor ( ) Joukot Matematiikassa on pyrkimys määritellä monimutkaiset asiat täsmällisesti yksinkertaisempien asioiden avulla. Tarvitaan jokin lähtökohta, muutama yleisesti hyväksytty ja ymmärretty käsite, joista

Lisätiedot

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos: 8 Kanta Tässä luvussa tarkastellaan aliavaruuden virittäjävektoreita, jotka muodostavat lineaarisesti riippumattoman jonon. Merkintöjen helpottamiseksi oletetaan luvussa koko ajan, että W on vektoreiden

Lisätiedot

Matematiikan tukikurssi, kurssikerta 5

Matematiikan tukikurssi, kurssikerta 5 Matematiikan tukikurssi, kurssikerta 5 1 Jonoista Matematiikassa jono (x n ) on yksinkertaisesti järjestetty, päättymätön sarja numeroita Esimerkiksi (1,, 3, 4, 5 ) on jono Jonon i:ttä jäsentä merkitään

Lisätiedot

TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen

TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op), K2005 1 Suorita oheisten ohjeiden mukaiset tehtävät Matlab-ohjelmistoa käyttäen. Kokoa erilliseen

Lisätiedot

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2 Johdatus diskreettiin matematiikkaan Harjoitus 4, 7.10.2015 1. Olkoot c 0, c 1 R siten, että polynomilla r 2 c 1 r c 0 on kaksinkertainen juuri. Määritä rekursioyhtälön x n+2 = c 1 x n+1 + c 0 x n, n N,

Lisätiedot

VAASAN YLIOPISTO TEKNILLINEN TIEDEKUNTA SÄHKÖTEKNIIKKA. Lauri Karppi j82095. SATE.2010 Dynaaminen kenttäteoria DIPOLIRYHMÄANTENNI.

VAASAN YLIOPISTO TEKNILLINEN TIEDEKUNTA SÄHKÖTEKNIIKKA. Lauri Karppi j82095. SATE.2010 Dynaaminen kenttäteoria DIPOLIRYHMÄANTENNI. VAASAN YLIOPISTO TEKNILLINEN TIEDEKUNTA SÄHKÖTEKNIIKKA Oskari Uitto i78966 Lauri Karppi j82095 SATE.2010 Dynaaminen kenttäteoria DIPOLIRYHMÄANTENNI Sivumäärä: 14 Jätetty tarkastettavaksi: 25.02.2008 Työn

Lisätiedot

Signaalien generointi

Signaalien generointi Signaalinkäsittelyssä joudutaan usein generoimaan erilaisia signaaleja keinotekoisesti. Tyypillisimpiä generoitavia aaltomuotoja ovat eritaajuiset sinimuotoiset signaalit (modulointi) sekä normaalijakautunut

Lisätiedot

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö 3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö Yhtälön (tai funktion) y = a + b + c, missä a 0, kuvaaja ei ole suora, mutta ei ole yhtälökään ensimmäistä astetta. Funktioiden

Lisätiedot

Injektio. Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim.

Injektio. Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim. Injektio Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim. Funktio f on siis injektio mikäli ehdosta f (x 1 ) = f (x 2 ) seuraa, että x 1 = x 2.

Lisätiedot

(iv) Ratkaisu 1. Sovelletaan Eukleideen algoritmia osoittajaan ja nimittäjään. (i) 7 = , 7 6 = = =

(iv) Ratkaisu 1. Sovelletaan Eukleideen algoritmia osoittajaan ja nimittäjään. (i) 7 = , 7 6 = = = JOHDATUS LUKUTEORIAAN (syksy 07) HARJOITUS 7, MALLIRATKAISUT Tehtävä Etsi seuraavien rationaalilukujen ketjumurtokehitelmät: (i) 7 6 (ii) 4 7 (iii) 65 74 (iv) 63 74 Ratkaisu Sovelletaan Eukleideen algoritmia

Lisätiedot

SGN-1251 Signaalinkäsittelyn sovellukset Välikoe Heikki Huttunen

SGN-1251 Signaalinkäsittelyn sovellukset Välikoe Heikki Huttunen SGN-5 Signaalinkäsittelyn sovellukset Välikoe.. Heikki Huttunen Tentissä ja välikokeessa saa käyttää vain tiedekunnan laskinta. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla - on. Sivuilla 4-6 on. Vastaa

Lisätiedot