MATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI

Koko: px
Aloita esitys sivulta:

Download "MATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI"

Transkriptio

1 I MATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI Kandidaatintyö Tarkastaja: Konsta Koppinen <>

2 II TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Tietotekniikan koulutusohjelma SIRONEN, MATTI: Puheen perustaajuuden estimointi Kandidaatintyö, 23 sivua Toukokuu 2007 Pääaine: Ohjelmistotuotanto Tarkastaja: Konsta Koppinen Avainsanat: Puheenkäsittely, perustaajuus, perustaajuuden estimointi Puheen perustaajuuden estimointi on yksi puhesignaalien käsittelyn perusongelmista. Varhaisimmat ratkaisut esitettiin jo 1960-luvun lopulla mutta uusien menetelmien kehittäminen sekä olemassaolevien ratkaisujen parantaminen jatkuu edelleen. Puheenkäsittely on usein hyvin sovellusriippuvainen signaalinkäsittelyn ala ja tämä pitää hyvin paikkansa myös perustaajuuden estimoinnin suhteen. Menetelmiä arvioidaan usein muidenkin kriteerien perusteella kuin suoranaisen taajuuden estimoinnin tarkkuuden suhteen ja algoritmien kehittämisessä keskitytäänkin usein jonkun tietyn ominaisuuden parantamiseen. Tämän johdosta sovellusalueet ja suunnittelutavoitteet ovat erittäin oleellisia perustaajuuden estimoinnin menetelmistä puhuttaessa. Tämä opinnäytetyö on luonteeltaan kirjallisuusselvityksen muotoinen. Tavoitteena on koota yhteen alan kirjallisuudessa sekä lehdissä julkaistua tutkimustietoa ja tarjota lukijalle ytimekäs katsaus perustaajuuden estimointiin ongelman teoreettisista lähtökohdista käytännön ratkaisuihin.

3 III ABSTRACT TAMPERE UNIVERSITY OF TECHNOLOGY Master s Degree Programme in Information Technology SIRONEN, MATTI: Speech pitch estimation methods Bachelor of Science Thesis, 23 pages May 2007 Major: Software engineering Examiner: Konsta Koppinen Keywords: Speech processing, fundamental frequency, pitch estimation Pitch estimation is one of the major research topics in speech processing. The earliest solutions date as far back as the late 1960s but new methods and improvements to older solutions are still being developed. Speech processing is often very application dependant and pitch estimation is a good example of this. Algorithms are often evaluated using criteria other than simple accuracy in pitch contour estimation and development is often focused on a certain property of the algorithm rather than improvement in all aspects. Application and design goals are thus very relevant when discussing pitch estimation methods. The format of this thesis is a literature report. The aim is to gather information from relevant literature and journals and offer the reader a concise view to the theory and practical solutions of pitch estimation.

4 IV SISÄLLYS 1.Johdanto Ihmisen puheentuotto Puhesignaalin mallinnus Perustaajuuden estimointi Estimoinnin haasteet Arviointimenetelmät ja kriteerit Jakson estimointitarkkuuden arviointi Soinnittomien segmenttien tunnistustarkkuuden arviointi Estimoinnin menetelmiä Aikatason menetelmät Autokorrelaatiomenetelmä rajaamisella Taajuustason menetelmät Kepstri-analyysiin perustuva menetelmä Aika/taajuustason menetelmät SIFT-estimointimenetelmä Yhteenveto...20 Lähteet... 22

5 5 1.JOHDANTO Puheenkäsittelylle tyypillinen tutkimuksen kohde on puheen esittäminen matemaattisena signaalina, jota tämän jälkeen voidaan käsitellä signaalinkäsittelystä yleisesti tutuilla menetelmillä kuten erilaisilla muunnoksilla sekä konvoluutiolla. Puheen akustisia ominaisuuksia tutkimalla on päästy malliin jossa puheen eri äänet ovat tulosta sekä ääniraon toiminnasta, joka aiheuttaa puheeseen sen perustaajuuden (joka yleensä on rinnastettavissa puheen havaittuun korkeuteen ), että ääntöväylästä joka puhallinsoittimen tapaan luo ääneen perustaajuuden suhteen resonoivia ääneksiä. Signaalinkäsittelyn termein tämä voidaan esittää ääniraon synnyttämänä herätteenä, joka kulkee ääntöväylän kuvaaman suodattimen läpi. Puhesignaalille saadaan näin parametrinen malli, joka voidaan koostaa estimoimalla sekä perustaajuutta että ääntöväylää esittävää suodatinta. Perustaajuuden estimointi on kuitenkin usein etualalla, joka on seurasta muun muassa siitä että ihmiskuulon on todettu olevan suuruusluokkaa herkempi perustaajuuden vaihtelulle verrattuna muihin puhesignaalin parametreihin [1]. Ihmisen puhe-elinten toimintaa puheen tuottamisessa sekä puhesignaalin analyyttistä mallia kuvataan tarkemmin myöhemmin tässä luvussa. Johtuen perustaajuuden roolista puhesignaalin mallinnuksessa sen estimointi on oleellista monissa eri puheenkäsittelysovelluksissa. Perustaajuutta tutkimalla voidaan muun muassa erottaa eri ikäiset ja eri sukupuolta edustavat puhujat toisistaan, joka on ilmeisen hyödyllistä puhujantunnistussovelluksissa. Akustisiin malleihin perustuvissa puhesynteesimenetelmissä perustaajuus on yksi tärkeimmistä parametreista joita varioimalla ulostulosignaali tuotetaan. Keskeinen osa perustaajuudella on myös puheenkoodauksessa, jossa tietyt perusmenetelmät hieman yksinkertaistaen perustuvat nimenomaan perustaajuuden tunnistamiseen ja siirtämiseen koodattuna. 1.1.Ihmisen puheentuotto Puheen tuottaminen tapahtuu muokkaamalla keuhkoista ulos kulkevan ilmavirran muotoa. Tähän tarkoitukseen käytetyt elimet voidaan karkeasti jakaa kurkunpäässä sijaitseviin elimiin äänirakoon asti sekä ääntöväylään, joka tarkoittaa kurkunpään jälkeisiä puhe-elimiä huuliin asti. Kuvaan 1.1 on merkitty tämän tarkastelun kannalta keskeisimpiä äänielimiä.

6 6 Kuva 1.1: Ääntöväylä ja äänirako (alkuperäinen kuva [2, s. 43]) Purkautuessaan keuhkoista uloshengitysilma muokkaantuu ensin kurkunpäässä sijaitsevassa ääniraossa (engl. glottis). Ääniraon toiminnnan perusteella erotetaan soinnilliset äänteet (suomen kielessä kaikki vokaalit ja jotkut konsonantit kuten m ja l) soinnittomista (tietyt konsonantit kuten p, t ja k); soinnillisten äänteiden tapauksessa äänirako aukeaa ja sulkeutuu jaksollisesti ja tästä värähdysnopeudesta johdetaan puheen senhetkinen perustaajuus. Ääniraon fyysiset ominaisuudet rajoittavat perustaajuuden välille Hz (miehillä taajuus on yleisesti välin alemmissa arvoissa, naisilla ja lapsilla ylempänä). Soinnittomissa äänteissä äänirako on auki muttei värähtele jolloin äänteellä ei myöskään ole perustaajuutta. Tämän jälkeen ilmavirta muokkautuu edelleen ääntöväylässä, jossa sitä ohjaa muun muassa kieli, kitapurje sekä huulet. Jokaista äännettä vastaa karkeasti ottaen tietty ääntöväylän muoto, jotka eri elimet yhdessä muodostavat. Ääntöväylän akustisista ominaisuuksista seuraa myös eri äänteille tyypilliset formanteiksi kutsutut resonanssitaajuudet, joiden erottaminen perustaajuudesta on yksi perustaajuuden estimoinnin tunnusomaisista ongelmista.

7 7 1.2.Puhesignaalin mallinnus Soinnilliset äänteet muodostuvat siis jaksollisesti värähtelevässä ääniraossa syntyvästä perustaajuudesta sekä ääntöväylässä muodostuvista resonanssitaajuuksista eli formanteista. Luontainen tapa mallintaa tämä signaalimuodossa on käsitellä äänteitä summautuneina sinitaajuuksina (kuva 1.2), jolloin siihen on suoraviivaista käyttää yleisiä signaalinkäsittelyn menetelmiä kuten Fourier-muunnosta. Kuva 1.2: 30 millisekunnin näyte a-äänteestä Puhe ei kuitenkaan koostu toisistaan täysin erillään lausutuista äänteistä vaan ne puhuessa muuntuvat edellisestä seuraavaan hyvin sulavasti, joten signaalia käsitellään paljon äänteitä lyhyemmissä osissa. Tämä tapahtuu jakamalla signaali millisekunnin pituisiin segmentteihin, jotka voivat olla osittain päällekkäisiä. Kuva 1.3: 30 millisekunnin Hanning-ikkunoitu näyte a-äänteestä Sovelluksesta riippuen nämä segmentit voidaan vielä kertoa jollain ikkunafunktiolla (segmentistä käytetään tällöin usein nimitystä ikkuna) joka vaimentaa signaalin näennäistä katkeamista segmentin reunalla (kuva 1.3). Tämä on tarpeellista lähinnä signaalin analysointia varten; signaalin kokoaminen takaisin yhtenäiseksi signaaliksi tehdään yleensä ikkunoimattomilla segmenteillä.

8 8 2.PERUSTAAJUUDEN ESTIMOINTI Puheenkäsittelyn merkityksen noustua viime vuosikymmeninä perustaajuuden estimointiin on esitetty kymmeniä eri lähestymistapoja, joista on sittemmin kehitetty satoja variantteja. Ensimmäiset ratkaisut ovat peräisin 60-luvun lopulta, mutta alan tieteellisissä lehdissä esitetään edelleen uusia algoritmeja ja parannuksia jo asemansa vakiinnuttaneisiin menetelmiin. Tässä luvussa käsitellään estimointimenetelmien yleisiä ominaisuuksia sekä estimoinnin haasteita ja menetelmiä jota taajuuden estimointialgoritmien arvioimiseen on kehitetty. Estimointimenetelmät voidaan jakaa lähestymistavan mukaan kolmeen eri päätyyppiin: Aikataso: Perustaajuuden jakso määritetään signaalin aikatason aaltomuodosta, joko suoraan mittaamalla näytteiden etäisyyksiä tai tutkimalla signaalia jonkin aikatasolle luontevan funktion arvona. Taajuustaso: Perustaajuus määritetään jonkin muunnoksen avulla tuotetusta taajuusspektristä (tai sen edelleen käsitellystä muodosta), jossa jaksollisen puhesignaalin taajuuskomponentit esiintyvät harmonisina piikkeinä. Aika-taajuustaso: Menetelmiä joissa tyypillisesti yhdistetään sekä aika- ja taajuustason operaatioilla saatavaa tietoa signaalista. Hetkelliseen taajuuteen perustuvat menetelmät ovat tärkeä alatyyppi; ne pyrkivät mallintamaan signaalin taajuussisältöä jatkuvana ajan funktiona. Perustaajuuden estimointimenetelmien päätehtävä on siis määrittää perustaajuus, yleensä segmenteittäin, sikäli kun segmentti sisältää sellaisen kohdan signaalista jolle perustaajuus on määritettävissä. Koska puhesignaalin sisältää yleensä huomattavissa määrin myös soinnittomia äänteitä sekä taukoja esimerkiksi lausahdusten välissä, nämä kohdat pyritään yleensä erottamaan soinnillisista kohdista. Vaikka useissa menetelmissä soinnillinen-soinniton erottelu voidaan tehdä itse estimointituloksen perusteella, tauot puheessa erotetaan yleensä ennen taajuusestimointia koska hiljaisuuden määrittäminen on useimpiin taajuudenmääritysalgoritmeihin verrattuna hyvin yksinkertainen operaatio. 2.1.Estimoinnin haasteet Perustaajuuden estimointiin liittyy lukuisia ongelmia, jotka liittyvät sekä aiheen teoreettisiin että käytännöllisiin seikkoihin. Suureksi osaksi tästä syystä ongelma on edelleen niinkin laajasti tutkittu kuin se vielä tänäkin päivänä on. Aloittaen ihmisen fysiologiaan liittyvistä seikoista, yksi perinnäinen ongelma seuraa ääniraon epätäsmällisyydestä jaksollisen signaalin tuottajana. Ihmispuheen perustaajuus

9 9 ei siis yleensä pysy tarkalleen vakiona edes hyvin lyhyitä aikajaksoja tarkasteltaessa, vaikkakin puhesignaalin mallinnuksessa näin oletetaan. Tämä ei tosin yleensä ole suuri ongelma vaan menetelmät voidaan suunnitella melko sietokykyisiksi kyseistä taajuushuojuntaa kohtaan. Huomattavasti suuremman ongelman muodostavat ihmisen ääntöväylän puheeseen muodostamat resonanssitaajuudet, joita kutsutaan formanttitaajuuksiksi. Nämä lisäävät perustaajuuden estimoinnin kannalta ylimääräisiä taajuuskomponentteja puhesignaaliin ja voivat usein olla hyvin hankalia erottaa perustaajuudesta koska ne ääntöväylän muodosta riippuen voivat esimerkiksi signaalin energian suhteen olla jopa selvemmin erottuvia kuin perustaajuus. Puhesignaalin formanttirakenteen määrittäminen ja vaimentaminen onkin yksi perustaajuuden estimoinnin tunnusomaisia ongelmia. Puhe on myös varsinkin ajan suhteen melko monimutkainen signaali, jota karakterisoi soinnillisten, soinnittomien ja hiljaisten kohtien vaihtelu. Rabiner et al [3, s. 400] mainitsee ongelmalliseksi esimerkiksi siirtymät soinnittomasta kohdasta matalatasoiseen soinnilliseen kohtaan, joissa muutos signaalissa on hyvin hienovarainen. Kohina on myös merkittävä tekijä sillä puhesignaali tuotetaan usein kohinaisessa sekä muita äänisignaaleja sisältävässä ympäristössä. Puhesignaalisen mittaamiseen ja tallentamiseen liittyy myös lähes välttämättä vaihteleva määrä kohinaa ellei sitä tehdä erikseen suunnitelluissa olosuhteissa. Tyypillisenä kohinalähteenä voidaan mainita puhelinjärjestelmät, joiden läpi puheenkoodauksen yhteydessä käsiteltävät signaalit ominaisesti kulkevat. Puhelinjärjestelmällä on myös muita ei-lineaarisia vaikutuksia puhesignaaliin, joita ovat esimerkiksi samanaikasesta puhumisesta johtuva puhesignaalien päällekkäisyys (crosstalk) sekä kovien äänien leikkaantuminen (clipping). 2.2.Arviointimenetelmät ja kriteerit Esitettyjen ratkaisujen kirjavuus loivat lähes välittömästi kysynnän vertailu- ja arviointimenetelmille joilla eri algoritmeja voitaisiin mielekkäästi verrata toisiinsa. Tarkasteltavien ominaisuuksien tärkeys riippuu kuitenkin suuresti sovelluksesta: kohinan sieto saattaa tietyissä olosuhteissa olla erittäin oleellinen, toteutuksen monimutkaisuus taas tärkeämpi toisaalla. Jotkut ominaisuudet ovat selkeästi mitattavissa, toiset taas ovat subjektiivisempia. Rabiner et al [3, s ] esittää seuraavat, luonteeltaan objektiiviset kriteerit: Perustaajuuden estimointitarkkuus Soinnillisten ja soinnittomien kohtien erottamistarkkuus Robustisuus erilaisia signaalin tallennus- ja toisto-olosuhteita kohtaan Toiminnan nopeus Käytettyjen algoritmien kompleksisuus Soveltuvuus toteutukseen sulautetuissa järjestelmissä ja Piiritason toteutuksen hinta.

10 10 Estimointimenetelmän nopeus, kompleksisuus ja piiritoteusnäkökulmat liittyvät melko kiinteästi toisiinsa. Monimutkaiset algoritmit ovat yleensä sekä verrattain hitaita toiminnaltaan sekä kalliita toteuttaa piiritasolla. Näille tekijöille ei ole esitetty laajasti levinnyttä mittaus- tai vertailukäytäntöä, mutta esimerkkinä voidaan mainita Rabiner et al:n [3, s. 417] esitystapa menetelmän tietyllä alustalla käyttämästä ajasta syötteenä käytetyn puhenäytteen pituuteen verrattuna sekä riippuvuus, esimerkiksi lineaarinen tai neliöllinen, käytetystä näytteenottotaajuudesta. Toteutuskustannuksia arvioitaessa voidaan myös tarkastella muun muassa algoritmin käyttämän muistin määrää sekä sitä, tarvitaanko toteutuksessa liukulukuaritmetiikkaa vai riittääkö kokonaislukulaskenta. Usein hyvin tärkeä ellei jopa tärkein tekijä on kuitenkin estimoinnin havaittu (eikä esimerkiksi referenssiä vastaan mitattu) tarkkuus, joka on luonteeltaan subjektiivinen kriteeri. Tätä määrittää pääasiallisesti se, miten luonnolliseksi ja/tai miellyttäväksi estimoinnin perusteella syntetisoitu tai uudelleenkoostettu puhe havaitaan. Mittaaminen suoritetaan yleensä kuuntelukokeilla. Usein paikkansa pitäväksi on todettu yhteys estimoidun taajuusjonon jatkuvuuden ja havaitun luonnollisuuden välillä; jotkut menetelmät pyrkivätkin pakottamaan tiettyjä jatkuvuusehtoja taajuusestimaattien välille. Tämä voidaan myös saada aikaiseksi jälkikäsittelyllä varsinaisesta estimointimenetelmästä riippumatta, johon on esitetty splini-mallinnukseen perustuva ratkaisu [4]. Tärkeä työkalu perustaajuuden estimointitarkkuuden arvioimisessa ovat referenssitietokannat, joihin arvioitavan algoritmin tuloksia voidaan verrata. Nämä tietokannat sisältävät yleensä sekä puhenäytteitä erilaisilta puhujilta että referenssitaajuuskäyrän, joka esittää perustaajuuden ajan funktiona. Julkisesti saatavilla olevia referenssitietokantoja ovat muuan muassa Keele Pitch Database [5] sekä The Centre for Speech Technology Researchin Fundamental Frequency Determination Algorithm (FDA) Database [6] Jakson estimointitarkkuuden arviointi Varsinaiseen perustaajuuden jakson estimointivirheen arvioimiseen Rabiner et al [3, s. 407] esittää seuraavat määritelmät: E(m) = P1 P2, jossa virhemuuttuja E kuvaa referenssitaajuuskäyrän arvon P1 ja mitatun menetelmän antaman arvon P2 erotusta segmentille m, yksikköinä jakson pituus näytteissä. Tästä määritelmästä johdetaan edelleen kaksi virhemäärettä, Gross Pitch Error (GPE) ja Fine Pitch Error (FPE): karkea estimointivirhe sekä hienoestimointivirhe. Karkea estimointivirheeksi (GPE) lasketaan erotuskäyrän arvot E(m) 10, jolloin mitattu jakso segmentille m poikkeaa referenssiarvosta yli 1 millisekunnin verran (joka Rabiner et al:n käytämmällä 10 khz näytteenottotaajuudella siis vastaa 10 näytettä). Tällöin estimoinnin katsotaan epäonnistuneen pahasti, yleensä johtuen joko jakson monistumis- tai puoliintumisvirheestä tai estimointia sotkeneesta formanttitaajuudesta. Poikkeuksena ovat tapaukset joissa ero johtuu siitä että mitattu

11 11 menetelmä virheellisesti luokittaa segmentin soinnittomaksi luokitetaan erilliseen kategoriaan eikä niitä lasketa GPE-virheeksi. Vertailulukuna karkean estimointivirheen yhteydessä käytetään suoraviivaisesti GPE-virheiden lukumäärää. Hienoestimointivirheeksi estimoinnissa (FPE) määritellään arvo E(m) 10, jolloin jakso on arvioitu oleellisesti oikein (lukuarvona jälleen 1 millisekuntia vastaava määrä näytteitä); ero katsotaan johtuvan lähinnä mittaustekniikasta. Vertailulukuina käytetään sekä hienoestimointivirheen keskiarvoa, joka kuvaa menetelmän taipumusta estimoida jakso joko liian pitkäksi tai lyhyeksi, sekä keskihajontaa joka kuvaa estimoinnin tarkkuutta yleisemmin Soinnittomien segmenttien tunnistustarkkuuden arviointi Virhemuuttujakäyrän E(m) avulla on määritetty Rabiner et al:n vertailussa [3, s. 417] myös virhemetriikka signaalin soinnittomien kohtien erottamiselle soinnillisista kohdista. Soinnittomat kohdat merkitään taajuuskäyrissä arvoilla 0, josta saadaan seuraavat virhemääreet: P1 0, P2 = 0, jolloin arvioitava menetelmä on luokittanut segmentin soinnittomaksi mutta referenssiestimaatin mukaan kohta on soinnillinen (voiced-to-unvoiced error). Vastaavasti määritellään tilanne P1 = 0, P2 0, jossa arvioitava menetelmä on tulkinnut segmentin soinnilliseksi ja edelleen määrittänyt sille nollasta poikkeavan jaksoarvon, kun taas referenssin mukaan segmentti on soinniton (unvoiced-to-voiced error). Koska luokitus soinnillisiin ja soinnittomiin segmentteihin tehdään usein yksittäistä arvoa tiettyyn raja-arvoon vertaamalla, on edellämainittujen virheiden välinen lukumääräsuhde usein helposti manipuloitavissa raja-arvoa muuttamalla. Näin voidaan menetellä jos esimerkiksi sovelluksen kannalta jompikumpi virhe on selkeästi toista haitallisempi.

12 12 3.ESTIMOINNIN MENETELMIÄ 3.1.Aikatason menetelmät Aikatason menetelmiksi lasketaan ne perustaajuuden estimointimenetelmät joissa perustaajuus määritetään pääasiassa signaalin aikatason esityksen (tyypillisesti signaalin aaltomuodon) avulla. Suoraviivaisin keino on määrittää eri näytteiden etäisyyksiä toisistaan, valiten näytteet siten että niiden välien voidaan katsoa edustavan perustaajuuden jaksonpituutta. Kuvassa 3.1 on esitetty yleisesti käytettyjä menetelmiä jakson alku- ja loppukohdan määrittämiseen: signaalin maksimikohdat (peak measurement) ja maksimia edeltävät nollan ylitykset (zero crossing measurement). Kuva 3.1: Jakson määrittämiseen käytetyt maksimi- ja nollaylityskriteerit [3, s.400] On huomioitava että eri mittaustavat voivat antaa eri tuloksia, mutta olennaista on lähinnä saman kriteerin käyttö koko signaalin kohdalla [3, s. 400]. Suoraan mittaamiseen aaltomuodosta perustuvat menetelmät ovat kuitenkin hyvin herkkiä puheen formanttirakennetta ja nollaylityskriteerin tapauksessa myös kohinaa kohtaan, ja uudemmat aikatason menetelmät perustuvatkin usein autokorrelaatiofunktion arvojen tarkasteluun. Autokorrelaatio mittaa signaalin korrelaatiota itsensä kanssa eri viiveen arvoilla. Autokorrelaatiofunktio r(k) puhesignaalin s(n) N:n näytteen pituiselle segmentille s(m) määritellään N-1-k r(k) = s(m) s(m+k), m=0 missä k on viiveen arvo. Funktion maksimiarvo on kohdassa k=0; muut paikalliset maksimit löytyvät arvoilla joiden suhteen signaali on erityisen toistuva. Erityisesti

13 13 puhesignaalien tapauksessa suurin nollasta poikkeava paikallinen maksimi on perustaajuuden jakson kohdalla, sikäli kun esimerkiksi formanttitaajuudet eivät ole tilannetta sotkemassa. Autokorrelaatiofunktion arvot vaimenevat k:n kasvaessa koska summattavat termit vähenevät, ja tämä saattaa vaikeuttaa perustaajuuden erottamista formanttitaajuuksista erityisesti matalien perustaajuuksien yhteydessä jolloin maksimit ovat lähellä autokorrelaation vaimentunutta loppuosaa [7, s. 6]. Esimerkki tästä on esitetty kuvassa 3.2, joka esittää autokorrelaatiofunktion puhesignaalille jonka perustaajuuden aiheuttama maksimi on noin viivearvon 80 kohdalla, mutta jonka arvo viivellä 160 on jo huomattavasti vaimentunut. Kuva 3.2: Autokorrelaatiofunktio puhesignaalille jonka perustaajuuden jakso on noin 80 näytettä [7, s. 4] Ratkaisuksi autokorrelaation vaimentumisesta johtuviin ongelmiin on esitetty ristikorrelaation käyttämistä autokorrelaation sijaan. Ristikorrelaatio c(k) puhesignaalin s(n) segmentille s(m) määritellään N-1 c(k) = s(m) s(m+k), m=0 joka k on viivemuuttuja ja N segmentin pituus kuten edellä. Vaikka ero autokorrelaatioon on vain summauksen ylärajan muuttuminen, funktion tulkinta muuttuu hieman monimutkaisemmaksi koska sen laskemissa arvoilla k>n joudutaan käyttämään segmentin m ulkopuolisia arvoja [7, s. 6]. Kuvasta 3.3 selviää kuitenkin ristikorrelaation selvä etu maksimien määrittämisessä korkeilla viivearvoilla (kuvaan on pisteviivalla merkitty myös saman segmentin autokorrelaatio):

14 14 Kuva 3.3: Ristikorrelaatiofunktion käyrä puhesignaalille jonka perustaajuuden jakso on noin 80 näytettä [7, s. 8] Ongelmaksi ristikorrelaation tapauksessa saattaa muodostua amplitudivaihtelut segmentin sisällä, jotka muuttavat korrelaatioarvoja signaalin muuttuvan energian mukaisesti. Ratkaisuksi tähän on esitetty ristikorrelaatiofunktion normalisointia signaalin energian mukaan [7, s. 9]. Koska edellä mainitut operaatiot eivät sellaisinaan sisällä mitään varmaa keinoa erottaa perustaajuutta muista taajuuskomponenteista, yhdistetään ne varsinaisissa estimointimenetelmissä usein jonkinlaiseen signaalin esikäsittelyyn. Tarkasteltava taajuusalue rajataan usein alipäästösuodatuksella sekä itse aaltomuotoa voidaan muokata esimerkiksi rajoittamalla näytearvot tietylle välille (clipping), johon perustuva autokorrelaatiomenetelmä esitellään ensi luvussa Autokorrelaatiomenetelmä rajaamisella Sondhi [8] on esitellyt autokorrelaatioon perustuvan menetelmän, joka yhdistää autokorrelaatiomittaukseen center clipping (keskirajaus)- tekniikka. Center clipping puhesignaalille s(n) määritellään y(n) = C[s(n)], jossa y(n) on keskirajattu puhesignaali ja C[] on rajausfunktio joka on esitetty kuvassa 3.4:

15 15 Kuva 3.4: Keskirajausfunktio C[]:n kuvaaja [7, s. 5] Rajausarvot -CL ja CL valitaan yleensä tiettyyn prosenttimäärään (esimerkiksi 30%) segmentin maksiminäytearvosta. Center clipping siis nollaa CL-arvojen alle jäävät näytteet sekä ylittävistä arvoista vähennetään CL (tai -CL): Kuva 3.5: Keskirajattu puhesignaali, rajausarvo 30% maksiminäytteestä [7, s. 7] Signaalin rajaaminen näin korostaa sen jaksollisuutta, jonka vaikutus autokorrelatiofunktion arvoihin on esitetty kuvassa 3.6:

16 16 Kuva 3.6: Keskirajatun puhesignaalin autokorrelaatio [7, s. 7] Rabiner et al:in esittämässä toteutuksessa [3, s. 401] Sondhin menetelmästä puhesignaali alipäästösuodatetaan 900 hertziin, jonka jälkeen se jaetaan 30 millisekunnin pituisiksi segmenteiksi. Taajuus estimoidaan jokaiselle 10 millisekunnin segmentille jolloin ne ovat 10 millisekunnin verran päällekkäisiä kumpaankin suuntaan. Segmenteille joita ei ole havaittu tauoksi signaalissa määritetään tämän jälkeen keskirajausarvo CL joka lasketaan mittaamalla segmentin ensimmäisen ja viimeisen 10 millisekunnin osan maksimiarvot ja asettamalla rajausarvo 64 prosenttiin pienemmästä maksimista. Tämän jälkeen segmentille suoritetaan vielä infinite peak clipping, joka pelkistää signaalin positiiviset arvot 1:een ja negatiiviset -1:een. Seuraavaksi segmentille suoritetaan autokorrelaatiolaskenta viivearvoilla näytettä ja lisäksi arvolla 0 tulosten normalisointia varten. Jos lasketun autokorrelaatiokäyrän normalisoitu maksimi ylittää arvon 0.3, segmentti katsotaan soinnilliseksi ja perustaajuus on maksimiarvon kohta näytteissä. Muussa tapauksessa segmentti luokitetaan soinnittomaksi ja perustaajuus asetetaan nollaksi. Testituloksissa menetelmä havaittiin tarkaksi sekä karkeiden (GPE) että hienoestimointivirheiden (FPE) osalta korkeaäänisten puhujien tapauksessa; matalaäänisen miespuhujan tapauksessa tulokset olivat suuruusluokkaa huonompia. Segmenttien luokittamisessa soinnilliseksi tai soinnittomaksi virheet noudattivat samaa taipumusta puhujan perustaajuutta kohtaan. Tämä tulos pääteltiin pääasiassa johtuvan valitusta 30 millisekunnin pituudesta segmenteille, joka ei testatun menetelmän tapauksessa ollut riittävän pitkä matalien perustaajuuksien tarkkaan määrittämiseen [3, s. 413].

17 Taajuustason menetelmät Taajuustason menetelmät perustuvat tunnusomaisesti perustaajuuden määrittämiseen taajuusspektrin avulla kun puhesignaalia käsitellään luvussa kaksi esitetyn mallin mukaisesti summautuneina sinitaajuuksina. Suoraviivainen keino olisikin mitata korkein taajuuspiikki signaalin Fourier-muunnoksesta mutta tämä ei anna kovin tarkkaa estimaattia taajuudesta koska taajuuden energia on tyypillisesti jakautunut useammalle taajuuspiikille; Babu [9] on esittänyt menetelmän Fourier-estimaatin tarkentamiseen taajuuspiikkien tehoarvojen avulla. Vakiintuneempi taajuustason menetelmä perustaajuuden estimointiin perustuu kepstri-analyysiin, jonka esitti vuonna 1963 Bogert et al [10]. Kepstrin cep(d) määritelmä puhesignaalille s(n) on cep(d) = FFT(log10[ FFT(s(n)) ]) jossa FFT on Fourier-muunnos sekä d on kepstrin indeksimuuttuja (quefrency), joka vastaa alkuperäisessä signaalissa jaksollista komponenttia jaksonpituudella d. Kepstri kuvaa tässä yhteydessä signaalin taajuussisällön muutosnopeutta ja se on havaittu erittäin hyödylliseksi sekä perustaajuuden määrittämisessä että ääntöväylän impulssivasteen esityksenä [7, s. 11]. Kuva 3.7: Esimerkki puhesignaalin segmentin kepstristä [7, s. 12] Kuvassa 3.7 on esitetty kepstri, jossa perustaajuus ilmenee selvänä piikkinä noin quefrency-arvolla 80.

18 Kepstri-analyysiin perustuva menetelmä Esimerkkinä taajuustason estimointimenetelmistä toteutuksessa käsittelemme Schafer & Rabinerin [11] esittelemän kepstriä hyödyntävän ratkaisun. Signaali jaetaan tässä menetelmässä 512 näytteen segmentteihin, jotka kerrotaan 512 arvon pituisella Hamming-ikkunafunktiolla, jonka jälkeen taukoa esittävät segmentit poistetaan myöhemmästä käsittelystä. Jokaiselle segmentille lasketaan tämän jälkeen kepstri, josta määritetään huippuarvo ja sen sijainti. Jos huippu ylittää valitun raja-arvon (tässä toteutuksessa 1/15 puhenäytteen absoluuttisesta huippuarvosta), segmentti luokitetaan soinnilliseksi ja perustaajuus saadaan suoraviivaisesti huipun sijainnista. Huippuarvon jäädessä rajaarvon alle ei segmenttiä kuitenkaan suoraan luokiteta soinnittomaksi vaan sille suoritetaan zero crossing (nollaylitys)-laskelma. Vasta nollaylityksien saavuttaessa määrätyn arvon segmentti määrätään soinnittomaksi, muussa tapauksessa se katsotaan soinnilliseksi ja taajuudeksi valitaan kepstrin huippuarvon antama estimaatti. Huomionarvoista useimpiin muihin menetelmiin on se ettei menetelmä sisällä minkäänlaista taajuussuodatusta vaan laskennassa on mukana kaikki alkuperäinen taajuusinformaatio. Rabiner et al:n GPE- ja FPE-mittaukset osoittavat kepstri-menetelmän suoriutuvan verrattain hyvin matalataajuuksisten puhujien osalta kun taas korkeaääniset puhujat aiheuttavat ongelmia. Selitykseksi tälle esitetään harmonisten taajuuksien vähyyden korkeaäänisillä puhujilla joka on epäedullista kepstri-analyysille, vaikeuttaen oikean taajuuden valintaa [3, s. 413]. Menetelmällä oli myös taipumus luokittaa soinnillisia segmenttejä soinnittomiksi; toisaalta luokitusvirhe toiseen suuntaan oli vastaavasti pieni luvussa esitetyn periaatteen mukaisesti. 3.3.Aika/taajuustason menetelmät Aika/taajuustason menetelmät tyypillisesti yhdistelevät aika- ja taajuustason operaatioita (josta seuraa myös nimitys hybridimenetelmä) kuten myöhemmin esiteltävä SIFT-menetelmä; jotkin menetelmät kuitenkin pyrkivät toimimaan nimenomaisesti taajuus/aikatasossa. Hetkelliseen taajuuteen (instantaneous frequency) perustuva estimointi kuitenkin mallintaa puhesignaalin perustaajuutta ajan funktiona; tällöin ei tarvita oletusta signaalin taajuussisällön paikallisesta muuttumattomuudesta. Tällaisten menetelmien GPE on tyypillisesti alhainen; jatkuvasta käyrästä on helppo tunnistaa ja eliminoida ympäröiviin arvoihin sopimattomat arvot jotka johtuvat esimerkiksi puolittuneesta tai monistuneesta jaksonpituudesta. Hetkellisen taajuuden määrittäminen puhesignaalille on kuitenkin verrattain haasteellista sillä se on mielekkäästi määriteltävissä vain signaaleille joilla on yksi taajuuskomponentti eli ensin täytyy eristää taajuus jonka hetkellistä arvoa halutaan esittää. Qui et al [12] on esittänyt kaistanpäästösuodatukseen perustuvan ratkaisun jolla

19 19 puhesignaalin taajuussisältö muokataan hetkellisen taajuuden määrittämiselle sopivaksi; suodatuksen monimutkainen toteutus nousee menetelmän pääosaan. Abe et al:n [13] menetelmässä hetkellinen taajuus lasketaan Fourier-muunnosvariantin avulla (Short Time Fourier Transform, STFT) SIFT-estimointimenetelmä Hybridimenetelmien toteutuksesta käsittelemme Simplified Inverse Filtering Technique (SIFT)-menetelmän jonka on esittänyt Markel [13] ja joka on Rabiner et al [3] suorittamassa vertailussa mukana. Menetelmä hyödyntää laajalti puheenkäsittelyssä käytettyä lineaarisen ennustamisen (linear predictive coding, LPC) tekniikkaa, jonka avulla voidaan estimoida ääntöväylää mallintavan suodattimen parametreja. Perustaajuuden estimoinnissa tämä suodatin on erittäin hyödyllinen sillä signaalin formanttitaajuudet voidaan vaimentaa tehokkaasti sen käänteissuodattimella. Estimointi aloitetaan kuitenkin alipäästösuodattamalla 40 millisekunnin pituiset segmentit 900 hertziin jonka jälkeen suodatettu signaali desimoidaan vielä 5:1 suhteella; tämän jälkeen segmenteille ratkaistaan edellä kuvattu käänteissuodin. Perustaajuus määritetään näin suodatetusta signaalista interpoloimalla autokorrelaatiofunktiota sen paikallisen maksimin läheisyydessä; segmentti luokitetaan soinnittomaksi jos näin saatu huippuarvo jää alle 0.4:n. Taukoa puheessa esittävät segmentit on karsittu samoin kuin aiemmin esitellyissä menetelmissä. Tämän SIFT-toteutuksen estimointitarkkuus osoittautui Rabiner et al:in [3] tekemissä mittauksissa hyväksi lukuunottamatta korkeaääniset lapsipuhujan tuottamaa testiaineistoa, jolloin tulokset olivat mitatuista estimointimenetelmistä selvästi huonoimmat. Tämä paljastaa ongelman taajuussisällön vaimentamisessa tilanteissa joissa spektri on jo luonnollisesti verrattain pelkistetty; tällöin myös vaimentuminen voi kohdistua myös perustaajuuteen [3, s. 413].

20 20 4.YHTEENVETO Tässä opinnäytetyössä on pyritty selvittämään lukijalle perustaajuuden estimoinnin taustaa, ongelman luonnetta sekä esitetty eri tyyppisiä käytännön ratkaisuja että niiden teoreettisia lähtökohtia. Apuna on käytetty sekä alan kirjallisuutta ja tuloksia alalla tehdyistä julkaisuista, joista huomattavin sekä eniten käytetty on Rabiner, Cheng, Rosenberg & McGonegalin suorittama kattava vertailu eri estimointimenetelmistä [3]. Perustaajuuden osa puheen mallintamisessa signaalina on merkittävä: se toimii herätteenä ääntöväylää kuvaavalle suodattimelle ja sillä on tällöin määräävä vaikutus ulostulosignaaliin; tämä vaikutus on vahvistettu myös kokeellisesti. Täten jos puhetta halutaan mallintaa mahdollisimman karsitulla tietosisällöllä kuten kapeakaistaisessa tiedonsiirrossa, kannattaa etusija antaa perustaajuuden tarkalle esittämiselle. Perustaajuutta tutkimalla voidaan myös saada tietoa puheen sisällöstä sekä puhujasta; kumpaakin voidaan tietyin rajoituksin hyödyntää puheen- että puhujantunnistusjärjestelmissä kehittyneempien kuvauksien kuten spektrogrammien tukena. Perustaajuuden sovelluksia tarkasteltaessa huomataankin sen olevan läsnä useimmissa puheenkäsittelyn aloista. Kaksi estimointimenetelmiltä lähes poikkeuksetta vaadittua perustoiminnallisuutta ovat perustaajuuskäyrän tuottaminen tietyllä (joko sovelluksen tai estimointimenetelmän määräämällä) intervallilla sekä soinnittomien kohtien erottaminen signaalista. Haasteita ratkaisujen kehittämiseen aiheutuu monesta lähteestä; puhesignaali on tyypillisesti muokkaantunut esimerkiksi puhelinjärjestelmässä tapahtuneen siirron yhteydessä eivätkä ihmisen puhe-elimet tuota erityisen täsmällisen jaksollista signaalia. Perustaajuuden estimointimenetelmiä suunniteltaessa niille voidaan asettaa tavoitteita monien kriteerien suhteen, jolloin tyypillisesti valitaan joku aikaisemmin esitetty lähestymistapa tai sellaisen pohjalta esitetty ratkaisu jota lähdetään kehittämään esimerkiksi estimointivirheiden keskihajonnan pienentämiseksi. Myös uusia lähestymistapoja kehitetään edelleen, usein valiten joku yleinen signaalinkäsittelyn menetelmä (joka tunnetaan esimerkiksi piiripohjaiseen toteutukseen sopivaksi) ja muokkaamalla sitä perustaajuuden estimointia palvelemaan. Ongelman parissa tehty tutkimus on tuottanut sekä toiminnaltaan että lähtökohdiltaan hyvin erilaisia ratkaisuja mutta ne pyritään kirjallisuuden usein luokittelemaan joko aikatason, taajuustason tai näiden yhdistelmämenetelmiksi sen mukaan millä keinoin ne määrittävät perustaajuuden. Eri tyyppisillä menetelmillä voidaan katsoa olevan tiettyjä etuja muiden tyyppisiä menetelmiä kohtaan: käytännössä näin ei juurikaan ole havaittu

21 21 olevan vaan jokainen menetelmä täytyy arvioida erikseen, erityisesti pitäen mielessä kulloisenkin sovelluksen vaatimukset.

22 22 LÄHTEET [1] Hess, W. Pitch Determination of Speech Signals: Algorithms and Devices. Berlin 1983, Springer. 698 s. [2] Clark J., Yallop C. An introduction to Phonetics and Phonology, 2nd edition. Oxford 1995, Blackwell. 490 s. [3] L.R. Rabiner, M.J. Cheng, A.H. Rosenberg and C.A. McGonegal, A comparative performance study of several pitch detection algorithms. IEEE Trans. Acoust., Speech, Signal Process. ASSP-24 (1976) (5), pp [4] A. Jefremov, W. B. Kleijn Spline-based continuous-time pitch estimation. IEEE International Conference on Acoustics Speech and Signal Processing, ICASSP 2002 Vol 1, pp. I [5] Keele Pitch Database [WWW]. University of Liverpool. [Viitattu ]. Saatavissa: [6] Fundamental Frequency Determination Algorithm (fda) Database [WWW]. The Centre for Speech Technology Research, University of Edinburgh. [Viitattu ]. Saatavissa: [7] R. Goldberg, L. Riek. A Practical Handbook of Speech Coders, Chapter 5: Pitch Extraction. Boca Raton 2000, CRC Press. 231 s. [8] M. M. Sondhi. New methods of pitch extraction. IEEE Trans. Audio Electroacoust. (Special Issue on Speech Communication and Processing-Part II) vol. AU-16, pp , [9] M.M. Babu. Efficient and accurate pitch estimation using FFT. Proceedings of IEEE International Joint Symposium Intelligence and Systems, 1998, pp [10] B. P. Bogert, M. J. R. Healy, and J. W. Tukey. The quefrency alanysis of time series for echoes: cepstrum, pseudo-autocovariance, cross-cepstrum, and saphe cracking. Proceedings of the Symposium on Time Series Analysis (M. Rosenblatt, Ed) Chapter 15, New York: Wiley, 1963.

23 23 [11] R. W. Schafer, L. R. Rabiner. System for automatic formant analysis of voiced speech. J. Acoust. Soc. Amer., vol. 47, pp , [12] L. Qiu, H. Yang, S-N. Koh. Fundamental frequency determination based on instantaneous frequency estimation. Signal Processing, Volume 44, Issue 2, June 1995, pp [13] T. Abe, T. Kobayashi, S. Imai, Robust pitch estimation with harmonics enhancement in noisy environments based on instantaneous frequency, Proceedings of ICSLP 96, vol. 2, 1996, pp [14] J.D. Markel. The SIFT algorithm for fundamental frequency estimation. IEEE Trans. Audio Electroacoust. AU-20 (1972), pp

SGN-4200 Digitaalinen Audio Harjoitustyö-info

SGN-4200 Digitaalinen Audio Harjoitustyö-info 1 SGN-4200 Digitaalinen Audio Harjoitustyö-info 04.04.2012 Joonas Nikunen Harjoitystyö - 2 Suorittaminen ja Käytännöt Kurssin pakollinen harjoitustyö: Harjoitellaan audiosignaalinkäsittelyyn tarkoitetun

Lisätiedot

Spektri- ja signaalianalysaattorit

Spektri- ja signaalianalysaattorit Spektri- ja signaalianalysaattorit Pyyhkäisevät spektrianalysaattorit Suora pyyhkäisevä Superheterodyne Reaaliaika-analysaattorit Suora analoginen analysaattori FFT-spektrianalysaattori DFT FFT Analysaattoreiden

Lisätiedot

Organization of (Simultaneous) Spectral Components

Organization of (Simultaneous) Spectral Components Organization of (Simultaneous) Spectral Components ihmiskuulo yrittää ryhmitellä ja yhdistää samasta fyysisestä lähteestä tulevat akustiset komponentit yhdistelyä tapahtuu sekä eri- että samanaikaisille

Lisätiedot

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Kompleksiluvut signaalin taajuusjakauman arvioinnissa Kompleksiluvut signaalin taajuusjakauman arvioinnissa Vierailuluento IMA-kurssilla Heikki Huttunen Lehtori, TkT Signaalinkäsittely, TTY heikki.huttunen@tut.fi Department of Signal Processing Fourier-muunnos

Lisätiedot

5 Akustiikan peruskäsitteitä

5 Akustiikan peruskäsitteitä Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...

Lisätiedot

T-61.246 DSP: GSM codec

T-61.246 DSP: GSM codec T-61.246 DSP: GSM codec Agenda Johdanto Puheenmuodostus Erilaiset codecit GSM codec Kristo Lehtonen GSM codec 1 Johdanto Analogisen puheen muuttaminen digitaaliseksi Tiedon tiivistäminen pienemmäksi Vähentää

Lisätiedot

Tietoliikennesignaalit & spektri

Tietoliikennesignaalit & spektri Tietoliikennesignaalit & spektri 1 Tietoliikenne = informaation siirtoa sähköisiä signaaleja käyttäen. Signaali = vaihteleva jännite (tms.), jonka vaihteluun on sisällytetty informaatiota. Signaalin ominaisuuksia

Lisätiedot

3 Ikkunointi. Kuvio 1: Signaalin ikkunointi.

3 Ikkunointi. Kuvio 1: Signaalin ikkunointi. 3 Ikkunointi Puhe ei ole stationaarinen signaali, vaan puheen ominaisuudet muuttuvat varsin nopeasti ajan myötä. Tämä on täysin luonnollinen ja hyvä asia, mutta tämä tekee sellaisten signaalinkäsittelyn

Lisätiedot

Signaalit ja järjestelmät aika- ja taajuusalueissa

Signaalit ja järjestelmät aika- ja taajuusalueissa Signaalit ja järjestelmät aika- ja taajuusalueissa Signaalit aika ja taajuusalueissa Muunnokset aika ja taajuusalueiden välillä Fourier sarja (jaksollinen signaali) Fourier muunnos (jaksoton signaali)

Lisätiedot

Digitaalinen audio

Digitaalinen audio 8003203 Digitaalinen audio Luennot, kevät 2005 Tuomas Virtanen Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2 Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot, sekä niissä

Lisätiedot

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

Puhesynteesin perusteet Luento 4: difonikonkatenaatio Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä

Lisätiedot

T SKJ - TERMEJÄ

T SKJ - TERMEJÄ T-61140 SKJ - termit Sivu 1 / 7 T-61140 SKJ - TERMEJÄ Nimi Opnro Email Signaalinkäsittelyyn liittyviä termejä ja selityksiä Kevät 2005 Täytä lomaketta kevään aikana ja kerää mahdollisesti puuttuvia termejä

Lisätiedot

MARKKU NIEMI PUHEEN AIKASKAALAUS. Kandidaatintyö

MARKKU NIEMI PUHEEN AIKASKAALAUS. Kandidaatintyö MARKKU NIEMI PUHEEN AIKASKAALAUS Kandidaatintyö Tarkastaja: Hanna Silén 16.12.2012 ii TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Tietotekniikan koulutusohjelma NIEMI, MARKKU: Puheen aikaskaalaus Kandidaatintyö,

Lisätiedot

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen: Puheen anatomiaa ja fysiologiaa Puhesignaalin analyysi Puheen havaitseminen luku 11 Luento: Puhe Mitä puhe on? Ihmisen kehittämä symbolinen kommunikaatiojärjestelmä. Perustuu sovittuihin kielellisiin koodeihin

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

EMC Säteilevä häiriö

EMC Säteilevä häiriö EMC Säteilevä häiriö Kaksi päätyyppiä: Eromuotoinen johdinsilmukka (yleensä piirilevyllä) silmulla toimii antennina => säteilevä magneettikenttä Yhteismuotoinen ei-toivottuja jännitehäviöitä kytkennässä

Lisätiedot

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.

Lisätiedot

SGN-4200 Digitaalinen audio

SGN-4200 Digitaalinen audio SGN-4200 Digitaalinen audio Luennot, kevät 2013, periodi 4 Anssi Klapuri Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2! Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot,

Lisätiedot

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients THE audio feature: MFCC Mel Frequency Cepstral Coefficients Ihmiskuulo MFCC- kertoimien tarkoituksena on mallintaa ihmiskorvan toimintaa yleisellä tasolla. Näin on todettu myös tapahtuvan, sillä MFCC:t

Lisätiedot

IIR-suodattimissa ongelmat korostuvat, koska takaisinkytkennästä seuraa virheiden kertautuminen ja joissakin tapauksissa myös vahvistuminen.

IIR-suodattimissa ongelmat korostuvat, koska takaisinkytkennästä seuraa virheiden kertautuminen ja joissakin tapauksissa myös vahvistuminen. TL536DSK-algoritmit (J. Laitinen)..5 Välikoe, ratkaisut Millaisia ongelmia kvantisointi aiheuttaa signaalinkäsittelyssä? Miksi ongelmat korostuvat IIR-suodatinten tapauksessa? Tarkastellaan Hz taajuista

Lisätiedot

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ Henna Tahvanainen 1, Jyrki Pölkki 2, Henri Penttinen 1, Vesa Välimäki 1 1 Signaalinkäsittelyn ja akustiikan laitos Aalto-yliopiston sähkötekniikan

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi

Lisätiedot

Kepstri - sisältö. Kepstrimuunnos ja puhesignaalien analyysi. Kepstri - Intro. Kepstri - Intro. Luento perustuu kepstri-lukuun teoksissa:

Kepstri - sisältö. Kepstrimuunnos ja puhesignaalien analyysi. Kepstri - Intro. Kepstri - Intro. Luento perustuu kepstri-lukuun teoksissa: Kepstrimuunnos ja puhesignaalien analyysi S-89.3640 Puheenkäsittelytekniikan metodit Kevät 2011 Unto K. Laine Kepstri - sisältö Kirjallisuuslähteet, taustamateriaali Kepstrin idea ja syntyhistoria Kepstrin

Lisätiedot

LOPPURAPORTTI 19.11.2007. Lämpötilahälytin. 0278116 Hans Baumgartner xxxxxxx nimi nimi

LOPPURAPORTTI 19.11.2007. Lämpötilahälytin. 0278116 Hans Baumgartner xxxxxxx nimi nimi LOPPURAPORTTI 19.11.2007 Lämpötilahälytin 0278116 Hans Baumgartner xxxxxxx nimi nimi KÄYTETYT MERKINNÄT JA LYHENTEET... 3 JOHDANTO... 4 1. ESISELOSTUS... 5 1.1 Diodi anturina... 5 1.2 Lämpötilan ilmaisu...

Lisätiedot

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N)

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N) Kohina Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N) N on suoraan verrannollinen integraatioaikaan t ja havaittuun taajuusväliin

Lisätiedot

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002. Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed. DAFX Digital Audio Effects. Wiley & Sons, 2002. Sisältö:! Johdanto!! Ajallinen käyttäytyminen! oteutus!

Lisätiedot

8003051 Puheenkäsittelyn menetelmät

8003051 Puheenkäsittelyn menetelmät 8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme

Lisätiedot

Numeeriset menetelmät

Numeeriset menetelmät Numeeriset menetelmät Luento 13 Ti 18.10.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 13 Ti 18.10.2011 p. 1/43 p. 1/43 Nopeat Fourier-muunnokset Fourier-sarja: Jaksollisen funktion esitys

Lisätiedot

ILKKA HULKKO TAAJUUDEN MITTAUS PAINESIGNAALISTA. Kandidaatintyö

ILKKA HULKKO TAAJUUDEN MITTAUS PAINESIGNAALISTA. Kandidaatintyö ILKKA HULKKO TAAJUUDEN MITTAUS PAINESIGNAALISTA Kandidaatintyö Tarkastaja: Konsta Koppinen Työ jätetty tarkastettavaksi: 8.5.2009 II TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Automaatiotekniikan koulutusohjelma

Lisätiedot

5 Lineaarinen ennustus

5 Lineaarinen ennustus 5 Lineaarinen ennustus Lineaarinen ennustus (linear prediction, LP) on yksi tärkeimmistä puheenkäsittelyn työkaluista Sitä voidaan eri tilanteessa käyttää eri tavoilla, mutta puheenkäsittelyn kannalta

Lisätiedot

4.2 Akustista fonetiikkaa

4.2 Akustista fonetiikkaa 4.2 Akustista fonetiikkaa Akustisessa fonetiikassa tutkitaan puheen akustisia ominaisuuksia ja sitä miten ne seuraavat puheentuottomekanismin toiminnasta. Aiheen tarkka käsitteleminen vaatisi oman kurssinsa,

Lisätiedot

DSP:n kertausta. 1 Spektri, DFT, DTFT ja aika-taajuusresoluutio

DSP:n kertausta. 1 Spektri, DFT, DTFT ja aika-taajuusresoluutio DSP:n kertausta Kerrataan/käydään läpi: ffl Spektri, DFT, DTFT ja FFT ffl signaalin jaksollisuuden ja spektrin harmonisuuden yhteys ffl aika-taajuusresoluutio Spektri, DFT, DTFT ja aika-taajuusresoluutio

Lisätiedot

Signaalien generointi

Signaalien generointi Signaalinkäsittelyssä joudutaan usein generoimaan erilaisia signaaleja keinotekoisesti. Tyypillisimpiä generoitavia aaltomuotoja ovat eritaajuiset sinimuotoiset signaalit (modulointi) sekä normaalijakautunut

Lisätiedot

Digitaalinen signaalinkäsittely Johdanto, näytteistys

Digitaalinen signaalinkäsittely Johdanto, näytteistys Digitaalinen signaalinkäsittely Johdanto, näytteistys Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen, Signaalinkäsittelyn

Lisätiedot

Ohjeita fysiikan ylioppilaskirjoituksiin

Ohjeita fysiikan ylioppilaskirjoituksiin Ohjeita fysiikan ylioppilaskirjoituksiin Kari Eloranta 2016 Jyväskylän Lyseon lukio 11. tammikuuta 2016 Kokeen rakenne Fysiikan kokeessa on 13 tehtävää, joista vastataan kahdeksaan. Tehtävät 12 ja 13 ovat

Lisätiedot

Mittalaitetekniikka. NYMTES13 Vaihtosähköpiirit Jussi Hurri syksy 2014

Mittalaitetekniikka. NYMTES13 Vaihtosähköpiirit Jussi Hurri syksy 2014 Mittalaitetekniikka NYMTES13 Vaihtosähköpiirit Jussi Hurri syksy 2014 1 1. VAIHTOSÄHKÖ, PERUSKÄSITTEITÄ AC = Alternating current Jatkossa puhutaan vaihtojännitteestä. Yhtä hyvin voitaisiin tarkastella

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

ELEC-C5210 Satunnaisprosessit tietoliikenteessä

ELEC-C5210 Satunnaisprosessit tietoliikenteessä ELEC-C5210 Satunnaisprosessit tietoliikenteessä Esa Ollila Aalto University, Department of Signal Processing and Acoustics, Finland esa.ollila@aalto.fi http://signal.hut.fi/~esollila/ Kevät 2017 E. Ollila

Lisätiedot

Digitaalinen signaalinkäsittely Desibeliasteikko, suotimen suunnittelu

Digitaalinen signaalinkäsittely Desibeliasteikko, suotimen suunnittelu Digitaalinen signaalinkäsittely Desibeliasteikko, suotimen suunnittelu Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen,

Lisätiedot

Puheen akustiikan perusteita

Puheen akustiikan perusteita Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 Äänet, resonanssi ja spektrit S-114.770 Kieli kommunikaatiossa...

Lisätiedot

Tuntematon järjestelmä. Adaptiivinen suodatin

Tuntematon järjestelmä. Adaptiivinen suodatin 1 1 Vastaa lyhyesti seuraaviin a) Miksi signaaleja ylinäytteistetään AD- ja DA-muunnosten yhteydessä? b) Esittele lohkokaaviona adaptiiviseen suodatukseen perustuva tuntemattoman järjestelmän mallinnus.

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 4 Jatkuvuus Jatkuvan funktion määritelmä Tarkastellaan funktiota f x) jossakin tietyssä pisteessä x 0. Tämä funktio on tässä pisteessä joko jatkuva tai epäjatkuva. Jatkuvuuden

Lisätiedot

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM Puheenkoodaus Olivatpa kerran iloiset serkukset PCM, DPCM ja ADPCM PCM eli pulssikoodimodulaatio Koodaa jokaisen signaalinäytteen binääriseksi (eli vain ykkösiä ja nollia sisältäväksi) luvuksi kvantisointitasolle,

Lisätiedot

Matlab-tietokoneharjoitus

Matlab-tietokoneharjoitus Matlab-tietokoneharjoitus Tämän harjoituksen tavoitteena on: Opettaa yksinkertaisia piirikaavio- ja yksikkömuunnoslaskuja. Opettaa Matlabin perustyökaluja mittausten analysoimiseen. Havainnollistaa näytteenottotaajuuden,

Lisätiedot

Mediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin

Mediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin Mediaanisuodattimet Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että niiden ominaisuudet tunnetaan hyvin niiden analysointiin on olemassa vakiintuneita menetelmiä

Lisätiedot

Käytännön radiotekniikkaa: Epälineaarinen komponentti ja signaalien siirtely taajuusalueessa (+ laboratoriotyön 2 esittely)

Käytännön radiotekniikkaa: Epälineaarinen komponentti ja signaalien siirtely taajuusalueessa (+ laboratoriotyön 2 esittely) Käytännön radiotekniikkaa: Epälineaarinen komponentti ja signaalien siirtely taajuusalueessa (+ laboratoriotyön 2 esittely) ELEC-C5070 Elektroniikkapaja, 21.9.2015 Huom: Kurssissa on myöhemmin erikseen

Lisätiedot

SIGNAALITEORIAN KERTAUSTA 1

SIGNAALITEORIAN KERTAUSTA 1 SIGNAALITEORIAN KERTAUSTA 1 1 (26) Fourier-muunnos ja jatkuva spektri Spektri taajuuden funktiona on kompleksiarvoinen funktio, jonka esittäminen graafisesti edellyttää 3D-kuvaajan piirtämisen. Yleensä

Lisätiedot

z muunnos ja sen soveltaminen LTI järjestelmien analysointiin

z muunnos ja sen soveltaminen LTI järjestelmien analysointiin z muunnos ja sen soveltaminen LTI järjestelmien analysointiin muunnoksella (eng. transform) on vastaava asema diskreettiaikaisten signaalien ja LTI järjestelmien analyysissä kuin Laplace muunnoksella jatkuvaaikaisten

Lisätiedot

PL 9/Siltavuorenpenger 5 A, 00014 Helsingin yliopisto etunimi.sukunimi@helsinki.fi

PL 9/Siltavuorenpenger 5 A, 00014 Helsingin yliopisto etunimi.sukunimi@helsinki.fi HMM-POHJAISEN PUHESYNTEESIN LAADUN PARANTAMINEN GLOTTISPULSSIKIRJASTON AVULLA Tuomo Raitio 1,AnttiSuni 2,HannuPulakka 1, Martti Vainio 2,PaavoAlku 1 1 Aalto-yliopisto, Signaalinkäsittelyn ja akustiikan

Lisätiedot

3 Raja-arvo ja jatkuvuus

3 Raja-arvo ja jatkuvuus 3 Raja-arvo ja jatkuvuus 3. Raja-arvon käsite Raja-arvo kuvaa funktion kättätmistä jonkin lähtöarvon läheisdessä. Raja-arvoa tarvitaan toisinaan siksi, että funktion arvoa ei voida laskea kseisellä lähtöarvolla

Lisätiedot

Kapeakaistainen signaali

Kapeakaistainen signaali Tiedonsiirrossa sellaiset signaalit ovat tyypillisiä, joilla informaatio jakautuu kapealle taajuusalueelle jonkun keskitaajuuden ympäristöön. Tällaisia signaaleja kutustaan kapeakaistaisiksi signaaleiksi

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA Oulun yliopisto Fysiikan opetuslaboratorio Fysiikan laboratoriotyöt 1 1 LIITE 1 VIRHEEN RVIOINNIST Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi miten uudenaikainen tai kallis tahansa ja mittaaja olisi alansa huippututkija Tästä johtuen mittaustuloksista

Lisätiedot

Digitaalinen signaalinkäsittely Kuvankäsittely

Digitaalinen signaalinkäsittely Kuvankäsittely Digitaalinen signaalinkäsittely Kuvankäsittely Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen, Signaalinkäsittelyn menetelmät,

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 LIITE 1 VIRHEEN ARVIOINNISTA Mihin tarvitset virheen arviointia? Mittaustulokset ovat aina todellisten luonnonvakioiden ja tutkimuskohdetta kuvaavien suureiden likiarvoja, vaikka mittauslaite olisi miten

Lisätiedot

IMPULSSIVASTEEN ANALYSOINTI AALLOKEMENETELMIN TIIVISTELMÄ 1 AALLOKEANALYYSI. Juha Urhonen, Aki Mäkivirta

IMPULSSIVASTEEN ANALYSOINTI AALLOKEMENETELMIN TIIVISTELMÄ 1 AALLOKEANALYYSI. Juha Urhonen, Aki Mäkivirta IMPULSSIVASTEEN ANALYSOINTI AALLOKEMENETELMIN Juha Urhonen, Aki Mäkivirta Genelec Oy Olvitie 5, 74100 IISALMI juha.urhonen@genelec.com TIIVISTELMÄ Kuvaamme impulssivasteen analyysiä käyttäen vakiojaksoista

Lisätiedot

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN » Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN 1 Puhe-elimistä Helsingin Yliopiston sivuilla» Puhe-elimet voidaan jakaa

Lisätiedot

FYS206/5 Vaihtovirtakomponentit

FYS206/5 Vaihtovirtakomponentit FYS206/5 Vaihtovirtakomponentit Tässä työssä pyritään syventämään vaihtovirtakomponentteihin liittyviä käsitteitä. Tunnetusti esimerkiksi käsitteet impedanssi, reaktanssi ja vaihesiirto ovat aina hyvin

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 24.4.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 30.1.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

HUUDETUN PUHEEN ANALYYSI JA SYNTEESI

HUUDETUN PUHEEN ANALYYSI JA SYNTEESI Tuomo Raitio 1, Antti Suni 2, Jouni Pohjalainen 1, Manu Airaksinen 1, Martti Vainio 2 ja Paavo Alku 1 1 Signaalinkäsittelyn ja akustiikan laitos, Aalto-yliopisto, Espoo Otakaari 5 A, PL 13000, 00076 AALTO

Lisätiedot

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea. Roolit Tommi Perälä Department of Mathematics, Hypermedia Laboratory Tampere University of Technology 25.3.2011 J. Kleinberg kehitti -algoritmin (Hypertext Induced Topic Search) hakukoneen osaksi. n taustalla

Lisätiedot

SIGNAALITEORIAN KERTAUSTA OSA 2

SIGNAALITEORIAN KERTAUSTA OSA 2 1 SIGNAALITEORIAN KERTAUSTA OSA 2 Miten spektri lasketaan moduloiduille ja näytteistetyille tietoliikennesignaaleille? KONVOLUUTIO JA KERTOLASKU 2 Kantataajuussignaali (baseband) = sanomasignaali ilman

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

Oikeanlaisten virtapihtien valinta Aloita vastaamalla seuraaviin kysymyksiin löytääksesi oikeantyyppiset virtapihdit haluamaasi käyttökohteeseen.

Oikeanlaisten virtapihtien valinta Aloita vastaamalla seuraaviin kysymyksiin löytääksesi oikeantyyppiset virtapihdit haluamaasi käyttökohteeseen. Oikeanlaisten virtapihtien valinta Aloita vastaamalla seuraaviin kysymyksiin löytääksesi oikeantyyppiset virtapihdit haluamaasi käyttökohteeseen. 1. Tuletko mittaamaan AC tai DC -virtaa? (DC -pihdit luokitellaan

Lisätiedot

1 Olkoon suodattimen vaatimusmäärittely seuraava:

1 Olkoon suodattimen vaatimusmäärittely seuraava: Olkoon suodattimen vaatimusmäärittely seuraava: Päästökaistan maksimipoikkeama δ p =.5. Estokaistan maksimipoikkeama δ s =.. Päästökaistan rajataajuus pb = 5 Hz. Estokaistan rajataajuudet sb = 95 Hz Näytetaajuus

Lisätiedot

KERTALUKUANALYYSI KAIVOSKONEEN MELUKARTOITUKSESSA 1 JOHDANTO 2 MITTAUKSET. Velipekka Mellin

KERTALUKUANALYYSI KAIVOSKONEEN MELUKARTOITUKSESSA 1 JOHDANTO 2 MITTAUKSET. Velipekka Mellin Velipekka Sandvik Mining and Construction Oy PL 434, 20101 TURKU velipekka.mellin@sandvik.com 1 JOHDANTO Kertalukuanalyysi (engl. order analysis) on pyörivään komponenttiin verrannollisen vasteen amplitudin

Lisätiedot

FYSP105 / K3 RC-SUODATTIMET

FYSP105 / K3 RC-SUODATTIMET FYSP105 / K3 R-SODATTIMET Työn tavoitteita tutustua R-suodattimien toimintaan oppia mitoittamaan tutkittava kytkentä laiterajoitusten mukaisesti kerrata oskilloskoopin käyttöä vaihtosähkömittauksissa Työssä

Lisätiedot

Puheen akustiikan perusteita

Puheen akustiikan perusteita Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/39 Äänet, resonanssi ja spektrit ctl103 Fonetiikan perusteet kieliteknologeille

Lisätiedot

Nimi: Muiden ryhmäläisten nimet:

Nimi: Muiden ryhmäläisten nimet: Nimi: Muiden ryhmäläisten nimet: PALKKIANTURI Työssä tutustutaan palkkianturin toimintaan ja havainnollistetaan sen avulla pienten ainepitoisuuksien havainnointia. Työn mittaukset on jaettu kolmeen osaan,

Lisätiedot

Identifiointiprosessi

Identifiointiprosessi Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi

Lisätiedot

TUULIVOIMALAMELU MITTAUS JA MALLINNUS VELI-MATTI YLI-KÄTKÄ

TUULIVOIMALAMELU MITTAUS JA MALLINNUS VELI-MATTI YLI-KÄTKÄ TUULIVOIMALAMELU MITTAUS JA MALLINNUS VELI-MATTI YLI-KÄTKÄ SISÄLTÖ Tuulivoimalamelun synty ja ominaisuudet Tuulivoimalamelun mallinnuksen haasteet Olhavan tuulipuiston melumittaukset MELUN SYNTY JA OMINAISUUDET

Lisätiedot

Erityinen suhteellisuusteoria (Harris luku 2)

Erityinen suhteellisuusteoria (Harris luku 2) Erityinen suhteellisuusteoria (Harris luku 2) Yliopistonlehtori, TkT Sami Kujala Mikro- ja nanotekniikan laitos Kevät 2016 Ajan ja pituuden suhteellisuus Relativistinen työ ja kokonaisenergia SMG-aaltojen

Lisätiedot

1 Vastaa seuraaviin. b) Taajuusvasteen

1 Vastaa seuraaviin. b) Taajuusvasteen Vastaa seuraaviin a) Miten määritetään digitaalisen suodattimen taajuusvaste sekä amplitudi- ja vaihespektri? Tässä riittää sanallinen kuvaus. b) Miten viivästys vaikuttaa signaalin amplitudi- ja vaihespektriin?

Lisätiedot

SWEPT SINE MITTAUSTEKNIIKKA (NOR121 ANALYSAATTORILLA)

SWEPT SINE MITTAUSTEKNIIKKA (NOR121 ANALYSAATTORILLA) SWEPT SINE MITTAUSTEKNIIKKA (NOR121 ANALYSAATTORILLA) KÄYTTÖKOHTEET: mittaukset tiloissa, joissa on kova taustamelu mittaukset tiloissa, joissa ääni vaimenee voimakkaasti lyhyiden jälkikaiunta-aikojen

Lisätiedot

Pinces AC-virtapihti ampèremetriques pour courant AC

Pinces AC-virtapihti ampèremetriques pour courant AC Pinces AC-virtapihti ampèremetriques pour courant AC MN-sarja Serie MN-SARJA Nämä ergonomiset mini-pihdit ovat sunniteltu matalien ja keskisuurien virtojen mittaamiseen välillä 0,01 A ja 240 A AC. Leukojen

Lisätiedot

Infraäänimittaukset. DI Antti Aunio, Aunio Group Oy

Infraäänimittaukset. DI Antti Aunio, Aunio Group Oy Infraäänimittaukset DI Antti Aunio, Aunio Group Oy antti.aunio@aunio.fi Mitä infraääni on? Matalataajuista ilmanpaineen vaihtelua Taajuusalue < 20 Hz Ihmisen kuuloalue on tyypillisesti 20-20 000 Hz Osa

Lisätiedot

Spektrin sonifikaatio

Spektrin sonifikaatio Spektrin sonifikaatio AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén Sisällysluettelo 1. Johdanto... 2 2. Tehtävän kuvaus ja työn rakenne... 2 3. Teoria... 2 3.1 Ääni mekaanisena aaltona...

Lisätiedot

Pianon äänten parametrinen synteesi

Pianon äänten parametrinen synteesi Pianon äänten parametrinen synteesi Jukka Rauhala Pianon akustiikkaa Kuinka ääni syntyy Sisält ltö Pianon ääneen liittyviä ilmiöitä Pianon äänen synteesi Ääniesimerkkejä Akustiikan ja äänenkäsittelytekniikan

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 21.3.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

Dynaamisten systeemien identifiointi 1/2

Dynaamisten systeemien identifiointi 1/2 Dynaamisten systeemien identifiointi 1/2 Mallin rakentaminen mittausten avulla Epäparametriset menetelmät: tuloksena malli, joka ei perustu parametreille impulssi-, askel- tai taajusvaste siirtofunktion

Lisätiedot

Algoritmi I kuvioiden ja niille johtavien ajourien erottelu. Metsätehon tuloskalvosarja 7a/2018 LIITE 1 Timo Melkas Kirsi Riekki Metsäteho Oy

Algoritmi I kuvioiden ja niille johtavien ajourien erottelu. Metsätehon tuloskalvosarja 7a/2018 LIITE 1 Timo Melkas Kirsi Riekki Metsäteho Oy Algoritmi I kuvioiden ja niille johtavien ajourien erottelu Metsätehon tuloskalvosarja 7a/2018 LIITE 1 Timo Melkas Kirsi Riekki Metsäteho Oy Algoritmi I kuvioiden ja niille johtavien ajourien erottelu

Lisätiedot

Kuulohavainnon perusteet

Kuulohavainnon perusteet Kuulohavainnon ärsyke on ääni - mitä ääni on? Kuulohavainnon perusteet - Ääni on ilmanpaineen nopeaa vaihtelua: Tai veden tms. Markku Kilpeläinen Käyttäytymistieteiden laitos, Helsingin yliopisto Värähtelevä

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/39 ctl103 Fonetiikan perusteet kieliteknologeille

Lisätiedot

PANK PANK-4122 ASFALTTIPÄÄLLYSTEEN TYHJÄTILA, PÄÄLLYSTETUTKAMENETELMÄ 1. MENETELMÄN TARKOITUS

PANK PANK-4122 ASFALTTIPÄÄLLYSTEEN TYHJÄTILA, PÄÄLLYSTETUTKAMENETELMÄ 1. MENETELMÄN TARKOITUS PANK-4122 PANK PÄÄLLYSTEALAN NEUVOTTELUKUNTA ASFALTTIPÄÄLLYSTEEN TYHJÄTILA, PÄÄLLYSTETUTKAMENETELMÄ Hyväksytty: Korvaa menetelmän: 9.5.2008 26.10.1999 1. MENETELMÄN TARKOITUS 2. MENETELMÄN SOVELTAMISALUE

Lisätiedot

SEBASTIAN RINTALA SIGNAALIN DOMINOIVAN TAAJUUDEN ARVIOINTI

SEBASTIAN RINTALA SIGNAALIN DOMINOIVAN TAAJUUDEN ARVIOINTI SEBASTIAN RINTALA SIGNAALIN DOMINOIVAN TAAJUUDEN ARVIOINTI Kandidaatintyö Tarkastaja: yliopistonlehtori Heikki Huttunen ii TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Signaalinkäsittelyn ja tietoliikennetekniikan

Lisätiedot

puheen laatu kärsii koodauksesta mahdollisimman vähän. puhe pakkautuu mahdollisimman pieneen määrään bittejä.

puheen laatu kärsii koodauksesta mahdollisimman vähän. puhe pakkautuu mahdollisimman pieneen määrään bittejä. Luku 1 Puheen koodaus Puheen koodauksella tarkoitetaan puhesignaalin esittämiseen tarvittavan bittimäärän pienentämistä sillä tavalla, että puhesignaalin laatu ja ymmärrettävyys kärsivät mahdollisimman

Lisätiedot

LUKU 7 TÄRKEIMPIEN ASIOIDEN KERTAUS A Tietoliikennetekniikka I Osa 30 Kari Kärkkäinen Kevät 2015

LUKU 7 TÄRKEIMPIEN ASIOIDEN KERTAUS A Tietoliikennetekniikka I Osa 30 Kari Kärkkäinen Kevät 2015 1 LUKU 7 TÄRKEIMPIEN ASIOIDEN KERTAUS 51357A Tietoliikennetekniikka I Osa 30 Kari Kärkkäinen Kevät 015 Kantatajuisen järjestelmän lähdön (SNR) D = P T /(N 0 W) käytetään referenssinä verrattaessa eri kantoaaltomodulaatioita

Lisätiedot

Radioamatöörikurssi 2014

Radioamatöörikurssi 2014 Radioamatöörikurssi 2014 Polyteknikkojen Radiokerho Radiotekniikka 4.11.2014 Tatu, OH2EAT 1 / 25 Vahvistimet Vahvistin ottaa signaalin sisään ja antaa sen ulos suurempitehoisena Tehovahvistus, db Jännitevahvistus

Lisätiedot

Historiaa musiikillisten äänten fysikaalisesta mallintamisesta

Historiaa musiikillisten äänten fysikaalisesta mallintamisesta Äänilähteiden fysikaalinen mallintaminen uusin äänisynteesimetodi simuloi soittimen äänentuottomekanismia käyttö musiikillisissa äänissä: -jäljitellään olemassaolevia akustisia instrumentteja -mahdollistaa

Lisätiedot

Tiistai klo 10-12 Jari Eerola 20.1.2015

Tiistai klo 10-12 Jari Eerola 20.1.2015 Tiistai klo 10-12 Jari Eerola 20.1.2015 } 20.1. Kuvaajatyypit ja ohjelmat Analyysiohjelmista Praat ja Sonic Visualiser Audacity } 27.1. Nuotinnusohjelmista Nuotinnusohjelmista Musescore } Tietokoneavusteinen

Lisätiedot

Foneettiset symbolit

Foneettiset symbolit Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-00 Signaalinkäsittelyn menetelmät, Tentti..005 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle ja sen

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

6 Lineaarisen ennustuksen sovelluksia

6 Lineaarisen ennustuksen sovelluksia 6 Lineaarisen ennustusen sovellusia Lineaarisella ennustusella on hyvin täreä asema monessa puheenäsittelyn sovellusessa. Seuraavassa on esitetty esimerejä siitä miten lineaarista ennustusta voidaan hyödyntää.

Lisätiedot

Radioamatöörikurssi 2015

Radioamatöörikurssi 2015 Radioamatöörikurssi 2015 Polyteknikkojen Radiokerho Radiotekniikka 5.11.2015 Tatu Peltola, OH2EAT 1 / 25 Vahvistimet Vahvistin ottaa signaalin sisään ja antaa sen ulos suurempitehoisena Tehovahvistus,

Lisätiedot