MARKKU NIEMI PUHEEN AIKASKAALAUS. Kandidaatintyö

Koko: px
Aloita esitys sivulta:

Download "MARKKU NIEMI PUHEEN AIKASKAALAUS. Kandidaatintyö"

Transkriptio

1 MARKKU NIEMI PUHEEN AIKASKAALAUS Kandidaatintyö Tarkastaja: Hanna Silén

2 ii TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Tietotekniikan koulutusohjelma NIEMI, MARKKU: Puheen aikaskaalaus Kandidaatintyö, 16 sivua Joulukuu 2012 Pääaine: Signaalinkäsittely Tarkastaja: Hanna Silén Avainsanat: Puhe, aikaskaalaus, SOLA, PSOLA Puheen aikaskaalaukselle on lukuisa joukko hyödyllisiä aktiivisesti käytettyjä käytännön sovelluksia kuten esimerkiksi erilaiset vieraiden kielten opetussovellukset tai mainostekstin täsmääminen käytettävissä olevaan mainosaikaan. Puheen aikaskaalauksen käyttökelpoisuuden edellytyksenä on, että puheen tulee kuulostaa aikaskaalauksen jälkeen mahdollisimman luonnolliselta ja alkuperäisen puheen kaltaiselta. Tähän tavoitteeseen pääseminen edellyttää puhesignaalin ja ihmisen kuulon ominaisuuksia hyödyntävien digitaalisten signaalinkäsittelymenetelmien käyttämistä. Tässä kandidaatintyössä tehtiin kirjallisuusselvitys puheen aikaskaalauksen eri menetelmistä. Työssä keskityttiin ainoastaan aikatason aikaskaalausmenetelmiin ja perehdyttiin erityisesti SOLA- ja PSOLA-algoritmien perusteisiin ja teoreettiseen taustaan. Työssä toteutettiin sekä SOLA-, että PSOLA-algoritmit MATLAB-ohjelmistolla. Toteutuksien avulla arvioitiin algoritmien toimivuutta eri aikaskaalaussuhteilla ja arvioitiin puheen laatua subjektiivisesti. Vertailukohtana käytettiin ainoastaan näytteenottotaajuuden muutoksella aikaansaatua aikaskaalattua puhesignaalia. Tuloksien perusteella voidaan todeta, että yksinkertainen SOLA-algoritmi tuottaa ymmärrettävää aikaskaalattua puhetta aikaskaalauskertoimilla mutta puheessa on selvästi havaittavia artefaktoja jo hyvin pienilläkin aikaskaalaussuhteilla. PSOLAalgoritmissa on kehitetty SOLA-algoritmia siten, että algoritmi käyttää hyväksi äänteiden eri perustaajuuksia kehysrakenteen muodostamisessa. Tulosten perusteella PSOLAmenetelmällä saadaan aikaan huomattava parannus aikaskaalatun puheen laatuun ja PSOLA-algoritmilla aikaskaalattu puhe on varsin hyvälaatuista kun aikaskaalauskertoimet vaihtelevat välillä

3 iii ALKUSANAT Tämä työ on tekniikan kandidaatin opinnäyte Tampereen teknillisen yliopiston signaalinkäsittelyn laitokselle. Työssä tehtiin kirjallisuustutkimus puheen aikaskaalauksen eri menetelmistä ja toteutettiin SOLA ja PSOLA-algoritmeihin perustuvat aikatason aikaskaalausmenetelmät MATLAB-ohjelmistolla. Haluan kiittää tutkimusjohtaja Alpo Värriä ja lehtori Heikki Huttusta mielenkiintoisen aiheen ehdottamisesta ja rakentavista kehitysehdotuksista työn kuluessa. Erityisesti haluan kiittää työn ohjaajaa ja tarkastajaa Hanna Sileniä erinomaisesta ohjauksesta, rakentavista kommenteista, kannustuksesta ja lukuisista käytännön neuvoista ja avusta työn eri vaiheissa. Kangasala, Markku Niemi Nokikuruntie Kangasala Puhelin:

4 iv SISÄLLYS Alkusanat... iii Sisällys... iv Termit ja niiden määritelmät... v 1 Johdanto Puhesignaalin ominaisuuksista Puheen aikaskaalausmenetelmät Puheen mallinnus ja käsittely Aikaskaalausmenetelmät PSOLA Toteutuksesta Toteutuksen arviointi Lähteet... 16

5 v TERMIT JA NIIDEN MÄÄRITELMÄT Aikaskaalauskerroin Artefakta FIR FFT IFFT LPC Perustaajuus PSOLA Puheen aikaskaalaus Soinniton äänne Soinnillinen äänne SOLA Aikaskaalatun puhenäytteen ajallisen pituuden suhde alkuperäisen puhenäytteen pituuteen. Aikaskaalauskerrointa on merkitty tekstissä symbolilla α (tai alpha). Keinotekoiselta tai luonnottomalta kuulostava häiriö. Finite Impulse Response. Fast Fourier Transform. Nopea Fourier muunnos. Inverse Fast Fourier Transform. Käänteinen nopea Fourier muunnos. Linear Predictive Coding Puheen perustaajuus (engl. pitch). Pitch-Syncronous Overlap-Add. Puhesignaalin toistaminen eri nopeudella verrattuna alkuperäisen puhesignaalin tallennuksessa käytettyyn nopeuteen. Soinniton äänne syntyy ilman äänihuulten värähtelelyä kurkussa. Yleensä soinnittomia äänteitä ovat vain konsonantit. Soinnillinen äänne syntyy äänihuulten värähdellessä kurkunpäässä. Vokaalit ovat luonnostaan soinnillisia äänteitä. Osalla konsonanteista on sekä soinnillinen, että soinniton variantti. Syncronous Overlap-Add.

6 1 1 JOHDANTO Puheen aikaskaalauksella tarkoitetaan tallennetun puhenäytteen toistamista eri nopeudella verrattuna alkuperäisen puhesignaalin tallennuksessa käytettyyn nopeuteen. Puheen aikaskaalauksella on monia hyödyllisiä ja varsin laajasti käytössä olevia käytännön sovelluksia. Yleisesti tunnettuja sovelluskohteita ovat esimerkiksi vieraiden kielten alkeisopinnot, radio- ja TV-uutiset, saneluäänitteet ja TV- ja radiomainokset. Puheen aikaskaalausta hyödyntävien sovellusten tavoitteena on välittää mahdollisimman suuri määrä informaatiota mahdollisimman lyhyessä ajassa mahdollisimman mieleenpainuvasti suhteutettuna kuulijan yksilöllisiin kykyihin. Joissakin sovelluksissa ja tilanteissa tämä voi tarkoittaa puhesignaalin toistamista nopeammin ja toisissa sovelluksissa ja tilanteissa puhesignaalia toistetaan hitaammin tavoitteen saavuttamiseksi. Puheen aikaskaalauksen hyödyllisyys pohjautuu osittain käyttäytymistieteelliseen tutkimukseen jossa on osoitettu, että ihminen pystyy omaksumaan tietoa nopeammin kuin mitä pystymme tuottamaan puhetta. Kuunneltaessa puhetta aivot toimivat tyypillisesti vain noin 30-50%:n kapasiteetilla verrattuna maksimikapasiteettiin. Ihminen pystyy omaksumaan tietoa tehokkaimmin lukunopeudella. Normaali lukunopeus englannin kielessä on noin sanaa minuutissa kun taas normaali puhenopeus on vain noin sanaa minuutissa. Yllä mainitut luvut pitävät paikkansa äidinkielenään englantia puhuville. Suhdeluku on suomen kielessä samantapainen mutta absoluuttiset lukuarvot ovat hieman eroavat johtuen englannin ja suomen kielen rakenteiden eroista. Aivojen toimiessa puolella teholla ajatukset alkavat harhailla. [3] Tätä ihmisen aivojen ominaisuutta voidaan hyödyntää esimerkiksi TV- ja radiomainoksissa. Mainoksen nopeuttaminen parantaa mainoksen tehoa koska nopeammin esitettynä ihmiset keskittyvät mainokseen tehokkaammin ja siten viesti jää tehokkaammin kuulijoiden mieleen. Koska mainokset ovat pääsääntöisesti aikapohjaisesti hinnoiteltuja, mainoksen nopeuttamisesta on myös taloudellista hyötyä. Mainokselle on yleensä varattu lähetyksestä etukäteen tietty täsmällinen pituus johon mainoksen pitää mahtua. Puheen aikaskaalauksella voidaan helposti sovittaa mainos täsmällisesti varattuun aikaikkunaan. Uutisten esittämisessä sekä puheen nopeuttamiselle, että hidastamiselle löytyy hyödyllisiä sovelluksia. Hidastetut uutiset helpottavat esimerkiksi vieraskielisten tai omaksumisongelmista kärsivien uutisten seuraamista. Radiossa tällä hetkellä esitettävä Yleisradion selkokieliset uutiset on esimerkki tällaisesta palvelusta. Uutisten nopeuttaminen puolestaan saattaa olla hyödyllistä esimerkiksi jos halutaan nopeasti tarkistaa onko päivän uutisissa ollut mielenkiintoisia aiheita tai jos halutaan etsiä jotain tiettyä

7 2 uutista pitkästä lähetyksestä nopeasti. Yleisemmin tiedon etsintä isosta aineistosta on varsin hyödyllinen puheen aikaskaalauksen sovelluskohde. Koulutussovelluksissa, kuten vieraiden kielten materiaaleissa puheen hidastamisesta on paljon hyötyä. Puheen hidastaminen mahdollistaa esimerkiksi vieraan kielen ääntämisen harjoittelun huomattavasti tehokkaammin. Hidastettuna vieraskielinen puhe on helpompi omaksua. Sanelukoneita käytetään varsin paljon esimerkiksi lääketieteessä ja oikeustieteessä. Sanelukoneen purkamisessa sekä puheen nopeuttamisesta, että hidastamisesta samanaikaisesti puheenlaatu säilyttäen on varsin ilmeistä hyötyä sanelun purkajalle. Johtuen monista käytännön kaupallisista sovelluskohteista puheen aikaskaalausta on tutkittu melko pitkään ja aiheesta löytyy paljon tieteellisiä julkaisuja. Puhesignaalin toistaminen pelkästään toistonopeutta muuttamalla vääristää signaalia. Vääristymä on yleensä sitä suurempi mitä suurempi on alkuperäisen tallennusnopeuden ja toistonopeuden suhteellinen ero. Alkuperäistä näytteenottotaajuutta nopeammin toistettu puhe tuottaa Aku Ankka tai pikkuorava ääntä. Alkuperäistä näytteenottotaajuutta hitaammin toistettu puhe taas voi kuulostaa esimerkiksi humalaiselta matalaääniseltä mieheltä. Nämä ilmiöt saattavat kuulostaa hauskoilta ja voivat olla hyödyllisiä joissakin hupisovelluksissa mutta luonnollisestikaan vääristymät eivät ole toivottavia käytännön sovellusten kannalta. Käytännön sovelluksissa puheen aikaskaalauksen käyttökelpoisuuden yhtenä tärkeimpänä kriteerinä on, että puhesignaali kuulostaa aikaskaalauksen jälkeen mahdollisimman luonnolliselta ja alkuperäisen puheen kaltaiselta. Tähän tavoitteeseen pääseminen edellyttää puheen aikaskaalaukseen kehitettyjen signaalinkäsittelymenetelmien käyttämistä. Nämä menetelmät hyödyntävät puhesignaalin ja ihmisen kuulon ominaisuuksia. Nykyään lähes kaikki puhetallenteet ovat valmiiksi digitaalisessa muodossa. Tämä mahdollistaa tallenteiden helpon ja nopean käsittelyn eri signaalinkäsittelyalgoritmeilla tietokoneella. Työssä esitellään aluksi puhesignaalin perusominaisuudet ja selostetaan näihin ominaisuuksiin pohjautuva yksinkertainen puheen matemaattinen malli. Tämän jälkeen tutustutaan kirjallisuudessa esitettyihin erilaisiin puheen aikaskaalauksen menetelmiin ja kuvaillaan miten menetelmät pohjautuvat puheen ominaisuuksiin ja puheen teoreettiseen malliin. Eri menetelmiä, niiden suorituskykyä ja muita ominaisuuksia vertaillaan kirjallisuuden pohjalta. Työssä keskitytään tarkemmin vain aikatason menetelmiin koska niiden on todettu soveltuvan puheelle verrattain pienillä aikaskaalaussuhteilla varsin hyvin. Taajuustason menetelmät soveltuvat aikatason menetelmiä paremmin puhetta monimutkaisemmille signaaleille, kuten esimerkiksi musiikille ja jos halutaan käyttää hyvin suuria aikaskaalaussuhteita. Taajuustason menetelmien haittapuolena on myös pienillä aikaskaalaussuhteilla muun muassa vaihevirheistä esiintyvät artefaktat, joita kehittyneissä aikatason menetelmissä ei esiinny [5].

8 3 Syncronous Overlap-Add (SOLA) algoritmi on varsin yksinkertainen lyhyiden, osittain päällekkäisten kehyksien poistamiseen ja lisäykseen, sekä kehysten päällekkäiselle alueelle suoritettavaan suodatukseen perustuva menetelmä. SOLA:sta jatkokehitetty Pitch-Syncronous Overlap-Add (PSOLA) algoritmi on yksi tunnetuimista ja parhaiten puheelle toimivista algoritmeista [7]. PSOLA eroaa SOLA:sta siten, että lyhyiden kehyksien paikka ja pituus synkronoidaan äänteiden perustaajuuden kanssa, jolloin voidaan minimoida kehyksien rajalla tapahtuvia epäjatkuvuuskohtia ja niistä aiheutuvia artefaktoja. PSOLA-algoritmin vaativin osuus on puheen perustaajuuden tunnistaminen luotettavasti. Työssä toteutettiin sekä SOLA, että PSOLA aikaskaalausmenetelmät MATLAB - ohjelmiksi, joilla voitiin testata ja vertailla eri puhenäytteiden nopeuden muuttamista käytännössä eri algoritmien parametreilla ja erilaisilla puheen nopeutus- ja hidastussuhteilla. Subjektiivisilla kuuntelutestien tulokset on esitetty kappaleessa 4. Kappaleessa 4 ehdotetaan myös muutamia jatkotutkimuskohteita.

9 4 2 PUHESIGNAALIN OMINAISUUKSISTA Puhesignaali koostuu peräkkäisistä äänteistä, äänteiden välissä olevista lyhyistä siirtymäjaksoista ja pidemmistä hiljaisista jaksoista sanojen välillä. Pääosa äänteistä voidaan jakaa joko soinnittomiin (engl. unvoiced) tai soinnillisiin äänteisin (engl. voiced). Soinnittomien äänteiden aikana äänihuulet eivät värähtele. Konsonantit ovat tyypillisesti soinnittomia äänteitä. Vokaalit ovat soinnillisia äänteitä joiden aikana äänihuulet värähtelevät kurkunpäässä. Tätä värähtelytaajuutta kutsutaan perustaajuudeksi (engl. pitch). Puhe voidaan mallintaa matemaattisesti kuvassa 1 esitetyllä yksinkertaistetulla systeemillä. Kuva 1. Puheen matemaattinen malli [1]. Mallissa valitaan aluksi herätteeksi joko säännöllinen impulssijono tai satunnainen kohinasignaali riippuen siitä onko kyseessä soinnillinen vai soinniton äänne. Herätteiden voimakkuutta eli amplitudia säädellään vastaavasti parametreilla Av ja AN. Ihmisen äänihuulien äännettä muokkaavaa vaikutusta mallinnetaan funktiolla G(z), kurkunpäästä, nenäontelosta ja kielestä muodostuvaa äänikanavaa mallinnetaan funktiolla V(z) ja lopuksi huulien äännettä muokkaavaa vaikutusta mallinnetaan funktiolla R(z). Malli on varsin yksinkertainen mutta se toimii hyvin erityisesti jatkuville äänille kuten vokaaleille jolloin mallin parametrit muuttuvat hitaasti. Malli ei toimi aivan niin hyvin äänteille joissa tapahtuu nopeita muutoksia. Äänteiden jako pelkästään soinnittomiin ja soinnillisiin ei vastaa täysin todellisuutta koska on olemassa äänteitä jotka ovat näiden välimuotoja. Esimerkkinä tällaisista äänteistä ovat nenässä muodostuvat äänteet (engl. nasals). Kirjallisuudessa on esitetty useita parannettuja monimutkaisempia malleja, joita ei tässä työssä esitellä. [1]

10 5 Johtuen sekä ihmisen tavasta tuottaa puhetta, että kielen rakenteesta puhesignaali sisältää paljon redundanssia. Redundanssi on selkeästi nähtävissä myös puheen matemaattisesta mallista, jossa esimerkiksi soinnillisten äänteiden heräte on vain säännöllinen impulssijono. Tarkasteltaessa puhetta pidemmällä ajanjaksolla (noin 1 s), puhe on hyvin epäsäännöllistä (Kuvan 2 yläosa). Puheessa on isoja amplitudivaihteluja ja verrattain pitkiä jaksoja jolloin amplitudi on lähes nolla. Kun puhesignaalia tarkastellaan huomattavasti lyhyemmällä aikavälillä (noin 150 ms) havaitaan, että signaali onkin melko säännöllistä (Kuvan 2 alaosa). Tätä lyhyehköllä aikavälillä havaittavissa olevaa säännöllistä taajuutta kutsutaan kyseisen äänteen perustaajuudeksi. Kuva 2. Esimerkki samasta puhesignaalista tarkasteltuna kahdella eri ajanjaksolla [6]. Puheenkoodaus- ja puheen aikaskaalausmenetelmissä pyritään käyttämään hyväksi puhesignaalin redundanssia, äänteiden rajoja ja soinnillisten äänteiden perustaajuutta eri tavoin. Digitaalisilla audiosignaaleilla yleisesti käytetty näytteenottotaajuus on 44.1 khz joka mahdollistaa taajuuskomponenttien 0 Hz khz esittämisen. Tämä näytteenottotaajuus on käytössä esimerkiksi CD-levyissä. Ihmiskuulo pystyy kuulemaan noin 20 Hz - 20 khz taajuudet, joten 44.1 khz näytteenottotaajuus on riittävä ihmisen kuultavissa oleville audiosignaaleille ilman ihmisen havaitsemaa informaation menettämistä. Pelkän puhesignaalin ominaisuuksista sekä ihmisen korvan rakenteesta johtuen puhesignaalin taajuuskaistaa voidaan rajoittaa edellä esitetystä merkittävästi menettämättä

11 oleellista informaatiota [8]. Esimerkiksi matkapuhelimissa taajuuskaista on rajoitettu välille 0-4 khz tai 0-8 khz eli käytetyt näytteenottotaajuudet ovat vastaavasti 8 khz tai 16 khz. Pienemmän näytteenottotaajuuden käyttäminen vähentää datan määrää näytteenottotaajuuden suhteessa. Jos näytteenottotaajuus puolitetaan, puolittuu käsiteltävän tiedon määrä aikayksikköä kohden olettaen, että näytteiden amplitudin esittämiseen käytetään kummassakin tapauksessa samaa tarkkuutta. Käsiteltävän ja välitettävän tiedon määrällä on luonnollisesti huomattava merkitys tarvittavaan laskentatehon tarpeeseen ja tarvittavaan tiedonsiirtokapasiteettiin. Puheelle käyttökelpoiset pienemmät näytteenottotaajuudet mahdollistavat puheen aikaskaalauksen reaaliajassa vaikka käytössä olisi paljon laskuoperaatioita vaativia algoritmeja. Musiikin aikaskaalaus reaaliajassa on vaativampaa koska musiikille on laajan taajuuskaistan vuoksi käytettävä suuria näytteenottotaajuuksia. 6

12 7 3 PUHEEN AIKASKAALAUSMENETELMÄT Puhesignaalin muunnos analogisesta digitaaliseksi voidaan esittää muodossa: jossa [ ]: digitaalinen signaali : analoginen signaali : kokonaisluku (0, 1, 2, 3, ) : näytteiden väli (s) [ ] ( ) (3.1) Yksinkertaisimmillaan puheen aikaskaalaus tarkoittaa näytteiden aikavälin T kasvattamista tai lyhentämistä toistovaiheessa eli kun signaali [ ] palautetaan takaisin analogiseen muotoon. Sama asia voidaan myös toteuttaa digitaalitasossa näytteenottotaajuutta muuttamalla. Kun alennetaan näytteenottotaajuutta kokonaisluvulla M saadaan uusi signaali: [ ] [ ] [ ] (3.2) Signaalista poimitaan joka M:s näyte uuteen signaaliin [ ]. Kun signaali [ ] toistetaan alkuperäisellä näytteenottotaajuudella T, puhesignaali nopeutuu koska näytteiden välinen aika pysyy samana mutta toistettavia näytteitä on vähemmän. Kummastakin edellä kuvatusta yksinkertaisesta tavasta skaalata signaalia aiheutuu merkittäviä muutoksia uuden signaalin taajuusvasteeseen. Nämä muutokset ovat ihmisen kuultavissa erilaisina artefaktoina aikaskaalatussa puheessa ja ovat puheen aikaskaalaussovelluksien kannalta hyvin häiritseviä. Kuvassa 3 on esitetty sama puhesignaali kolmella eri tavalla. Alkuperäisen aikaskaalattoman signaalin lisäksi näyte on aikaskaalattu käyttäen kahta eri aikaskaalauskerrointa. Kaikki kolme puhesignaalia on esitetty sekä aika-, että taajuustasossa. Aikaskaalaus on toteutettu käyttämällä pelkästään ylläkuvattua näytteenottotaajuuden muutosmenetelmää. Kuvassa 3 ylimpänä vasemmalla olevassa kaaviossa on alkuperäinen signaali aikatasossa ja ylimpänä oikealla on vastaavasti esitetty sama signaali taajuustasossa. Alkuperäisille signaaleille ei ole suoritettu aikaskaalausta eli aikaskaalauskerroin α = 1 (kuvan otsikossa merkitty alpha = 1). Keskimmäiset kuvat esittävät tilannetta, jossa puhet-

13 8 ta on nopeutettu kaksinkertaiseksi verrattuna alkuperäiseen nopeuteen, eli on käytetty aikaskaalauskerrointa α = 0.5. Aikaskaalaus on toteutettu poistamalla alkuperäisestä signaalista joka toinen näyte. Kuvassa 3 vasemmalla keskimmäisenä olevasta aikatason signaalista havaitaan, että puheen kesto nyt noin s, eli puolet alkuperäisen näytteen kestosta joka on noin 0.25 sekuntia. Oikealla keskellä olevasta kuvasta havaitaan, että taajuusvasteessa energia on selvästi siirtynyt korkeampien taajuuksien suuntaan. Alimmassa kuvaparissa on käytetty aikaskaalauskerrointa α = 2, eli puhetta on aikatasossa hidastettu puoleen verrattuna alkuperäiseen nopeuteen. Tämä on toteutettu lisäämällä alkuperäiseen signaaliin jokaisen näytteen väliin nolla. Puhenäytteen kesto on nyt kaksinkertainen alkuperäiseen näytteeseen verrattuna eli noin 0.5 sekuntia. Alimpana oikealla olevasta taajuusvasteesta havaitaan, että energiaa on siirtynyt matalammille taajuuksille verrattuna ylimpänä oikealla olevaan alkuperäisen signaalin taajuusvasteeseen. Kuva 3. Puhesignaali aika- ja taajuustasossa eri nopeuksilla [7]. Näytteenottotaajuuden muutoksien aiheuttamien taajuusvasteeseen tulevien muutosten teoreettista taustaa selvitetään perusteellisesti useissa signaalinkäsittelyn perusteoksissa. Esimerkiksi Oppenheim & Schafer: Discrete-Time Signal Processing [2] käsittelee asiaa.

14 9 3.1 Puheen mallinnus ja käsittely Puheen mallinnus ja käsittely voidaan jakaa kolmeen vaiheeseen: 1. Puhesignaalin analysointi ja mallinnus (analyysi) 2. Signaaliin tehtävät muutokset (muutokset) 3. Signaalin palautus muutetusta signaalista (synteesi) Analyysivaiheessa puhesignaalista luodaan parametrisoitu kuvan 1 mukainen matemaattinen malli. Kuvan 1 puheen mallin tapauksessa analyysivaiheen jälkeen on siis selvillä äänteiden perustaajuudet, kertoimet AN ja AV, joilla säädellään herätteiden amplitudia, sekä suodattimien G(z), V(z) ja R(z) parametrit. Muutosvaiheessa muutetaan analyysivaiheessa muodostetun mallin parametreja halutun lopputuloksen aikaansaamiseksi. Synteesivaiheessa rekonstruoidaan signaali puheen mallia ja muutettuja parametreja hyväksikäyttäen. Puheenkoodausta hyödyntävissä sovelluksissa muodostetun puheen mallin parametrit siirretään vastaanottajalle siirtotien yli. Vastaanottaja rekonstruoi (syntetisoi) siirrettyjen parametrien perusteella puheen uudelleen vastaanottavassa päässä. Puheenkoodauksessa ei ole välttämättä muutosvaihetta ollenkaan tai se on yhdistetty synteesivaiheeseen. Puheenkoodauksen yhteydessä puhutaankin yleensä analyysi-synteesi menetelmistä. Puheenkoodauksella saavutetaan huomattavia säästöjä tarvittavan tiedonsiirtokapasiteetin tarpeessa ja parannuksia systeemin kykyyn sietää siirtotiellä parametreihin aiheutuvia virheitä, jolla puolestaan on huomattava puheen laatua parantava vaikutus. Puheenkoodaussovelluksissa käytetyt mallit ja parametrit voivat olla hyvin monimutkaisia ja monivaiheisia. Aikaskaalaustekniikoissa voidaan käyttää hieman yksinkertaisempia malleja. Perusperiaatteet ovat kuitenkin kummassakin sovelluksessa samat. Kuva 4. Yksinkertaistettu puheen käsittelyn malli. Kuvan 4 mukaisia analyysi-synteesi -menetelmiä on tutkittu erittäin paljon erityisesti puheenkoodausta hyödyntävissä sovelluksissa. Digitaalisissa matkapuhelinverkoissa käytetyt puheenkoodausmenetelmät ovat ehkä yksi merkittävimmistä ja laajimmin käytetty analyysi-synteesi menetelmiä hyödyntävä käytännön sovellus. Matkapuhelimissa on merkittäviä taloudellisia, laadullisia ja luotettavuuteen liittyviä syitä välittää mahdollisimman hyvälaatuista puhetta mahdollisimman pienellä datamäärällä. Tämän johdosta alan tutkimukseen on panostettu erittäin paljon viimeisen vuoden ajan.

15 Aikaskaalausmenetelmät Aikaskaalausmenetelmät voidaan jakaa aika- ja taajuustason menetelmiin. Nimensä mukaisesti aikatason tekniikoissa puhesignaalin käsittely tapahtuu pelkästään aikatasossa. Taajuustason menetelmissä signaali muunnetaan ensin taajuustasoon yleensä käyttäen Fast Fourier Transform (FFT) menetelmää. Aikaskaalauksen vaatimat operaatiot suoritetaan taajuustasossa, jonka jälkeen signaali muutetaan takaisin aikatasoon käyttäen käänteistä FFT:tä (IFFT). Tässä työssä keskitytään tarkemmin vain aikatason menetelmiin koska niiden on todettu soveltuvan puheelle hyvin varsinkin verrattain pienillä (0.25 2) aikaskaalaussuhteilla. Taajuustason menetelmät soveltuvat aikatason menetelmiä paremmin puhetta monivivahteisimmille ja taajuusspektriltään runsaammille signaaleille, kuten esimerkiksi musiikille [5]. Taajuustason menetelmät toimivat myös puheelle aikatason menetelmiä paremmin jos käytetään hyvin suuria tai hyvin pieniä aikaskaalaussuhteita. Taajuustason menetelmien haittapuolena ovat lähes kaikissa tilanteissa esiintyvät vaihevirheistä johtuvat artefaktat, joita kehittyneissä aikatason menetelmissä ei esiinny [5]. Näitä taajuustason menetelmien artefaktoja esiintyy myös pienillä aikaskaalaussuhteilla. Taajuustason menetelmien haittapuolena on myös suuri laskentatehon tarve. Huolimatta tietokoneiden kasvaneesta laskentakapasiteetista tämä voi olla ongelma esimerkiksi jos halutaan suorittaa aikaskaalausta reaaliaikaisesti kannettavissa laitteissa kuten matkapuhelimissa. Aikatason menetelmiä ja menetelmien variaatiota on esitetty kirjallisuudessa suuri määrä. Useat aikaskaalausmenetelmät pohjautuvat signaalin lyhyiden osien (kehysten) analysointiin ja käsittelyyn ja synteesiin. Kehykset voivat olla joka vakio- tai vaihtuvanmittaisia. Synteesivaiheessa kehyksiä joko venytetään, lyhennetään, poistetaan tai kopioidaan riippuen siitä halutaanko puhetta nopeuttaa vai hidastaa. Kuva 5 esittää kehyksille tehtäviä yksinkertaisia aikatason aikaskaalausoperaatioita. Kuva 5. Periaatekuva kehyksille tehtävistä aikatason aikaskaalausoperaatioista [5].

16 11 Muutettujen kehyksien reuna-alueilla syntyy epäjatkuvuuskohtia jotka aiheuttavat useissa tapauksissa selvästi kuultavissa olevia häiriöitä puhesignaaliin. Leikkaa ja yhdistä menetelmissä (engl. overlap-add) näitä kehysten reuna-alueille muodostuvia epäjatkuvuuskohtia pyritään lieventämään asettamalla peräkkäiset kehykset limittäin toistensa kanssa ja käyttämällä kehysten päällekkäin menevillä reuna-alueilla erilaisia suodatusja painotusmenetelmiä. Synteesivaiheessa kehykset pyritään yhdistämään niin, että äänen perustaajuuteen tulee mahdollisimman vähän epäjatkuvuuskohtia. Parhaassa tapauksessa ei ole kuultavissa muuta muutosta kuin signaalin keston muutos. Kuvassa 6 on esitetty periaatteellinen esimerkki alkuperäisestä signaalista x(n) muodostetusta kehysrakenteesta x 1 (n), x 2 (n), ja x 3 (n). Kuvassa 6 on myös esimerkki kehyksien päällekkäisyydestä, sekä kehyksien päällekkäiselle osalle suoritettavasta suodatuksesta. Kuva 6. Periaatekuva SOLA-algoritmin kehysrakenteesta [7]. Kuvan 6 mukaista kehysrakennetta hyödyntävää aikaskaalausalgoritmia kutsutaan nimellä Syncronous Overlap-Add (SOLA). SOLA-algoritmissa parametreina ovat kehyksien päällekkäisyyden suuruus, kehyksen pituuden skaalauskerroin ja kehyksien välinen aikaviive. SOLA on yksinkertainen ja laskennallisesti tehokas tapa tehdä puheen aikaskaalaus. SOLA:lla saavutettava aikaskaalauksen laatu ei kuitenkaan ole kovin hyvä. [7] 3.3 PSOLA SOLA:sta jatkokehitetyssä Pitch-Syncronous Overlap Add (PSOLA) algoritmissa perusajatuksena on synkronoida kehyksien paikat ja pituudet puheen perustaajuuden kanssa siten, että pyritään minimoimaan puheen nopeuden muuttamisesta perustaajuuteen aiheutuvat epäjatkuvuuskohdat. Käyttäen edellä esiteltyä kolmivaiheista luokittelua PSOLA-algoritmi voidaan esittää seuraavasti: Analyysivaiheessa puhesignaali jaetaan lyhyisiin kehyksiin, jotka voivat mennä päällekkäin toistensa kanssa. Kehyksiä kutsutaan englanninkielisessä kirjallisuudessa nimellä short-term analysis signals (ST). Kehykset ( ) muodostetaan kertomalla signaali perustaajuuden suhteen synkronoiduilla ikkunoilla ( ):

17 12 ( ) ( ) ( ) (3.3) jossa alaindeksi m viittaan kehyksen indeksiin. PSOLA algoritmissa vaihdellaan kehyksien päällekkäisyyttä välillä 50% - 75% puheen perustaajuuden funktiona. Analyysivaiheen oleellisin ja samalla myös selvästi haastavin osa on selvittää luotettavasti kehyksen perustaajuusjakso (engl. pitch period), joka tarkoittaa siis soinnillisen äänteen perustaajuutta. Tämän lisäksi pitää tunnistaa eri perustaajuusjaksojen rajakohdat (engl. pitch mark). PSOLA-algoritmilla aikaskaalatun puheen laatu riippuu oleellisesti kuinka hyvin perustaajuus ja perustaajuusjaksojen rajat onnistutaan tunnistamaan. Perustaajuusjaksojen rajojen perusteella määritellään kehyksien keskikohdat. Luonnollisesti perustaajuuksien paikat voidaan määritellä vain soinnillisille äänteille. Soinnittomat äänteet käsitellään siten, että perustaajuus pidetään vakiona kunnes tunnistetaan seuraava soinnillinen äänne. Eräs tapa tunnistaa perustaajuus on etsiä maksimaalista korrelaatiota alkuperäisen ja saman mutta eri arvoilla viivästetyn puhekehyksen välillä. Viiveen arvo jolla korrelaatio on suurin vastaa perustaajuutta. Menetelmää, jossa haetaan korrelaatiota signaalista ja saman signaalin viivästetystä versiosta kutsutaan autokorrelaatioksi. Autokorrelaatiomenetelmä on varsin yksinkertainen mutta se ei kaikissa tilanteissa onnistu ennustamaan perustaajuutta oikein. Ongelmia aiheuttaa esimerkiksi puheen amplitudin vaihtelut ja se, että perustaajuus ei kaikilla puhujilla ja kaikissa olosuhteissa välttämättä aina ole täysin säännöllinen. Edistyneempi tekniikka perustaajuuden tunnistamiseen on autokorrelaatioon perustuva Linear Predictive Coding (LPC), jossa perustaajuutta mallinnetaan Finite Impulse Response (FIR) -suodattimen avulla. LPC menetelmässä tarkasteltavaa näytettä ennustetaan edellisten näytteiden lineaarisen yhdistelmän avulla. Menetelmällä ennustetun FIRsuodattimen taajuusvasteen perusteella saadaan perustaajuus selville. Tässä työssä käytettiin LPC menetelmää PSOLA-algoritmin lähtöparametrina tarvittavan perustaajuuden ennustamiseen. Perustaajuuden tunnistamiseen on kehitetty lukuisa joukko erilaisia parannettuja algoritmeja joihin ei tässä työssä paneuduta tämän enempää. Hyvä kuvaus lukuisista eri perustaajuuden tunnistamiseen käytetyistä menetelmistä on esitetty esimerkiksi lähteessä [9]. Perustaajuuden lisäksi PSOLA-algoritmi tarvitsee myös perustaajuusjaksot. Soinnillisten äänteiden perustaajuusjaksot voidaan määritellä etsimällä kehyksen signaalin amplitudin maksimiarvoja. Perustaajuusjakson etsiminen tarkoittaa siis löydetyn perustaajuuden vaiheen synkronointia. Soinnittomille äänteille perustaajuusjaksoa ei muuteta vaan käytetään edellisen soinnillisen ääneen perustaajuusjaksoa. Tässä työssä käytettiin tällaista yksinkertaista menetelmää. Myös perustaajuusjakson tunnistamiseen on esitetty kirjallisuudessa monia monimutkaisempia, esimerkiksi kehyksen energian paikallisen maksimin etsimiseen perustuvia menetelmiä Analyysivaiheen jälkeen suoritetaan muutosvaihe. Muutokset sisältävät kehyksien määrän muuttamista toistamalla kehyksiä useampaan kertaan tai poistamalla kehyksiä. Kehyksien välisiä viiveitä ja kehyksen sisältöä voidaan myös muuttaa. Synteesivaiheessa

18 13 muutetuista kehyksistä muodostetaan uusi signaali overlap-add -menetelmällä. Yksinkertaisimmillaan synteesivaiheessa muutetut kehykset vain yhdistetään peräkkäin. 3.4 Toteutuksesta Tässä työssä toteutettiin SOLA- ja PSOLA-algoritmit lähteessä [7] esitettyjä esimerkkejä ja algoritmeja hyödyntäen. Kehitystyöhön käytettiin MATLAB-ohjelmistoa. Toteutetut algoritmit käsittelevät puhesyötteen kokonaisuudessaan yhdellä kertaa ja antavat ulostulona käyttäjän asettamalla aikaskaalauskertoimella skaalatun puhenäytteen. Näytteen käsittely tapahtuu siis eräajona, ei reaaliaikaisesti. Algoritmit toteutettiin erillisinä MATLAB-funktiona eli m-tiedostoina. Pääfunktioissa kysytään käyttäjältä aikaskaalattavan tiedoston nimi ja haluttu aikaskaalauskerroin. Kehyksen pituuksia muita algoritmin parametreja voi vaihtaa editoimalla funktion m-tiedostoa. Algoritmit soittavat ulostulon ja kirjoittavat ulostulon myös vakionimiseen tiedostoon. Varsinaista käyttöliittymää ei tämän projektin puitteissa ohjelmoitu vaan tarvittavat komennot annetaan MAT- LAB:n komentoriviltä. Pelkästään näytteenottotaajuuden muutoksella tehdyt vertailusignaalit toteutettiin MATLAB:n downsample ja upsample funktioita hyväksi käyttäen. Algoritmin toteuttaminen reaaliaikaisena esimerkiksi C++ -kielellä mahdollistaisi erilaisten aikaskaalauskertoimien ja mahdollisesti myös algoritmin muiden parametrien vaihtamisen reaaliajassa kesken näytteen toiston. Näin eri aikaskaalauskertoimien väliset erot olisivat paremmin havaittavissa ja vertailtavissa kuuntelemalla. Luonnollisesti reaaliaikainen toteutus olisi myös huomattavasti lähempänä käytännön sovellusta esimerkiksi matkapuhelimeen. Käytännön sovellus vaatisi myös helppokäyttöisemmän käyttöliittymän toteuttamisen.

19 14 4 TOTEUTUKSEN ARVIOINTI Tässä työssä toteutettuja SOLA- ja PSOLA-algoritmeja arvioitiin erilaisilla aikaskaalauskertoimien arvoilla käyttäen muutamaa erilaista puhenäytettä. Algoritmien parametreja kuten erilaisia kehyspituuksia ei vaihdeltu kuuntelutestien aikana vaan algoritmien parametreille käytettiin kehitystyön aikana hyväksi todettuja vakioarvoja. Näin saatiin vertailtavien muuttujien ja näytteiden määrä pysymään kohtuullisen pienenä ja helposti hallittavana. Vertailunäytteenä käytettiin pelkästään näytteenottotaajuutta muuttamalla aikaansaatua aikaskaalattua puhetta. Arviointikriteerinä käytettiin aikaskaalatun puheen äänen laatua. Äänen laadun arviointi suoritettiin subjektiivisesti eli kuulonvaraisesti kirjoittajan toimesta. Tulosten perusteella voidaan todeta, että SOLA-algoritmi tuottaa hyvin ymmärrettävää puhetta ja tuottaa siten selvästi havaittavissa olevan puheen laadun parannuksen pelkästään näytteenottotaajuuden muutoksella aikaansaatuun vertailusignaaliin verrattuna. SOLA aiheuttaa kuitenkin puheeseen jo varsin pienilläkin aikaskaalauskertoimilla selvästi havaittavia artefaktoja joiden johdosta puhe ei kuulosta enää luonnolliselta vaikkakin puheen sisältö on vielä täysin ymmärrettävissä. PSOLA algoritmilla saavutetaan huomattava parannus SOLA-algoritmiin verrattuna. Pienillä aikaskaalaussuhteilla ( ) PSOLA-algoritmilla aikaskaalatussa puheessa ei ole havaittavissa kovin merkittävää epäluonnollisuutta. Kirjallisuudessa esitetään, että aikatason aikaskaalausmenetelmät tuottavat tyydyttävää puheenlaatua aikaskaalauskertoimilla [7]. Tässä työssä tehtyjen havaintojen perusteella tämä vaihteluväli vaikuttaa varsin oikeaan osuvalta. Suuremmilla ja pienemmillä aikaskaalauskertoimen arvoilla aikaskaalattuun puheeseen tulee selvästi havaittavia epäluonnolliselta kuulostavia häiriöitä. Jatkossa olisi mielenkiintoista vertailla useampaa eri aikaskaalausalgoritmia tarkemmin. Kuten aikaisemmin on todettu, PSOLA-algoritmin haastavin osuus on perustaajuuden tunnistaminen. Perustaajuuden analysointiin on olemassa isoa määrä erilaisia algoritmeja. Jatkossa olisi mielenkiintoista kokeilla näiden eri perustaajuuden tunnistamiseen suunniteltujen algoritmien toimivuutta osana PSOLA-menetelmää. Puheen laadun arviointiin olisi mielenkiintoista käyttää myös objektiivisia laskennallisia puheenlaadun mittareita subjektiivisen arvioinnin lisäksi. Myös laajempien subjektiivisten kuuntelukokeiden järjestäminen isommalla määrällä puhenäytteitä mahdollistaisi aikaskaalatun puheen laadun huomattavasti perusteellisemman ja luotettavamman arvioinnin. Katta-

20 vamman puheen laadun analysointiin olisi syytä myös käyttää huomattavasti isompaa määrää erilaisia puhenäytteitä. Yksi mielenkiintoinen jatkotutkimuskohde olisi aikaskaalausmenetelmien toimivuuden erojen vertailu eri kieltä olevilla näytteillä. Algoritmien laskentatehon tarpeen arviointia olisi myös mielenkiintoista tutkia tarkemmin. Tästä tiedosta olisi hyötyä esimerkiksi mahdollisille puheen aikaskaalausmenetelmien toteutuksille kannettavissa päätelaitteissa. 15

21 16 LÄHTEET [1] Rabiner J. R., Schafer R. W., Digital Processing of Speech Signals, Prentice-Hall International, 1974, 509 sivua. [2] Oppenheim Alan V., Schafer Ronald W., Discrete-Time Signal Processing, Prentice-Hall International, 1989, 896 sivua. [3] Stiefelman Lisa J. A study of rate discrimination of time-compressed speech. Journal of the American voice I/O society. Volume 16, November 1994, sivut [4] Moulines, Eric, Carpentier Francis. Pitch-Syncronous Waveform Processing Techniques for Text-to-Speech Synthesis using Diphones, Speech Communication 9 (1990), sivut [5] Roininen, Mikko. Musiikin aikaskaalaus. Kandidaatintyö. Tampereen teknillinen yliopisto, 2008, 25 sivua. [6] Heikkinen, Ari. High quality speech coding at 8 kbit/s. Diplomityö. Tampereen teknillinen korkeakoulu. 1994, 95 sivua. [7] Verfaille, V., Arfib, D., Keiler, F., von dem Knesebeck, A. and Zölzer, U., Adaptive Digital Audio Effects, DAFX: Digital Audio Effects, Second Edition (ed U. Zölzer), John Wiley & Sons, Ltd. 2011, Chichester, UK. [8] Järvinen, Kari, Frequency and Time Domain Coding of Speech for Digital Mobile Radiocommunication,Lisensiaattityö, Tampereen Teknillinen Korkeakoulu, 1987, 80 sivua. [9] Parsons, Thomas W., Voice and Speech Processing, McGraw-Hill Book Company, 1986, 383 sivua.

T-61.246 DSP: GSM codec

T-61.246 DSP: GSM codec T-61.246 DSP: GSM codec Agenda Johdanto Puheenmuodostus Erilaiset codecit GSM codec Kristo Lehtonen GSM codec 1 Johdanto Analogisen puheen muuttaminen digitaaliseksi Tiedon tiivistäminen pienemmäksi Vähentää

Lisätiedot

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

Puhesynteesin perusteet Luento 4: difonikonkatenaatio Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä

Lisätiedot

SGN-4200 Digitaalinen audio

SGN-4200 Digitaalinen audio SGN-4200 Digitaalinen audio Luennot, kevät 2013, periodi 4 Anssi Klapuri Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2! Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot,

Lisätiedot

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Kompleksiluvut signaalin taajuusjakauman arvioinnissa Kompleksiluvut signaalin taajuusjakauman arvioinnissa Vierailuluento IMA-kurssilla Heikki Huttunen Lehtori, TkT Signaalinkäsittely, TTY heikki.huttunen@tut.fi Department of Signal Processing Fourier-muunnos

Lisätiedot

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM Puheenkoodaus Olivatpa kerran iloiset serkukset PCM, DPCM ja ADPCM PCM eli pulssikoodimodulaatio Koodaa jokaisen signaalinäytteen binääriseksi (eli vain ykkösiä ja nollia sisältäväksi) luvuksi kvantisointitasolle,

Lisätiedot

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.

Lisätiedot

Digitaalinen audio

Digitaalinen audio 8003203 Digitaalinen audio Luennot, kevät 2005 Tuomas Virtanen Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2 Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot, sekä niissä

Lisätiedot

Spektri- ja signaalianalysaattorit

Spektri- ja signaalianalysaattorit Spektri- ja signaalianalysaattorit Pyyhkäisevät spektrianalysaattorit Suora pyyhkäisevä Superheterodyne Reaaliaika-analysaattorit Suora analoginen analysaattori FFT-spektrianalysaattori DFT FFT Analysaattoreiden

Lisätiedot

T SKJ - TERMEJÄ

T SKJ - TERMEJÄ T-61140 SKJ - termit Sivu 1 / 7 T-61140 SKJ - TERMEJÄ Nimi Opnro Email Signaalinkäsittelyyn liittyviä termejä ja selityksiä Kevät 2005 Täytä lomaketta kevään aikana ja kerää mahdollisesti puuttuvia termejä

Lisätiedot

SGN-4200 Digitaalinen Audio Harjoitustyö-info

SGN-4200 Digitaalinen Audio Harjoitustyö-info 1 SGN-4200 Digitaalinen Audio Harjoitustyö-info 04.04.2012 Joonas Nikunen Harjoitystyö - 2 Suorittaminen ja Käytännöt Kurssin pakollinen harjoitustyö: Harjoitellaan audiosignaalinkäsittelyyn tarkoitetun

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.

Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002. Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed. DAFX Digital Audio Effects. Wiley & Sons, 2002. Sisältö:! Johdanto!! Ajallinen käyttäytyminen! oteutus!

Lisätiedot

Organization of (Simultaneous) Spectral Components

Organization of (Simultaneous) Spectral Components Organization of (Simultaneous) Spectral Components ihmiskuulo yrittää ryhmitellä ja yhdistää samasta fyysisestä lähteestä tulevat akustiset komponentit yhdistelyä tapahtuu sekä eri- että samanaikaisille

Lisätiedot

3 Ikkunointi. Kuvio 1: Signaalin ikkunointi.

3 Ikkunointi. Kuvio 1: Signaalin ikkunointi. 3 Ikkunointi Puhe ei ole stationaarinen signaali, vaan puheen ominaisuudet muuttuvat varsin nopeasti ajan myötä. Tämä on täysin luonnollinen ja hyvä asia, mutta tämä tekee sellaisten signaalinkäsittelyn

Lisätiedot

Integrointialgoritmit molekyylidynamiikassa

Integrointialgoritmit molekyylidynamiikassa Integrointialgoritmit molekyylidynamiikassa Markus Ovaska 28.11.2008 Esitelmän kulku MD-simulaatiot yleisesti Integrointialgoritmit: mitä integroidaan ja miten? Esimerkkejä eri algoritmeista Hyvän algoritmin

Lisätiedot

Korkean resoluution ja suuren kuva-alueen SAR

Korkean resoluution ja suuren kuva-alueen SAR Korkean resoluution ja suuren kuva-alueen SAR MATINE tutkimusseminaari 17.11.2016 Risto Vehmas, Juha Jylhä, Minna Väilä, Ari Visa Tampereen teknillinen yliopisto Signaalinkäsittelyn laitos Hankkeelle myönnetty

Lisätiedot

Laskuharjoitus 4 ( ): Tehtävien vastauksia

Laskuharjoitus 4 ( ): Tehtävien vastauksia TT12S1E Tietoliikenteen perusteet Metropolia/A. Koivumäki Laskuharjoitus 4 (2.10.2013): Tehtävien vastauksia 1. Tutkitaan signaalista näytteenotolla muodostettua PAM (Pulse Amplitude Modulation) -signaalia.

Lisätiedot

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients THE audio feature: MFCC Mel Frequency Cepstral Coefficients Ihmiskuulo MFCC- kertoimien tarkoituksena on mallintaa ihmiskorvan toimintaa yleisellä tasolla. Näin on todettu myös tapahtuvan, sillä MFCC:t

Lisätiedot

Flash AD-muunnin. Ominaisuudet. +nopea -> voidaan käyttää korkeataajuuksisen signaalin muuntamiseen (GHz) +yksinkertainen

Flash AD-muunnin. Ominaisuudet. +nopea -> voidaan käyttää korkeataajuuksisen signaalin muuntamiseen (GHz) +yksinkertainen Flash AD-muunnin Koostuu vastusverkosta ja komparaattoreista. Komparaattorit vertailevat vastuksien jännitteitä referenssiin. Tilanteesta riippuen kompraattori antaa ykkösen tai nollan ja näistä kootaan

Lisätiedot

Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka. Vfo135 ja Vfp124 Martti Vainio

Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka. Vfo135 ja Vfp124 Martti Vainio Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka Vfo135 ja Vfp124 Martti Vainio Akustiikka Äänityksen tarkoitus on taltioida paras mahdo!inen signaali! Tärkeimpinä kolme akustista muuttujaa:

Lisätiedot

TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen

TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op), K2005 1 Suorita oheisten ohjeiden mukaiset tehtävät Matlab-ohjelmistoa käyttäen. Kokoa erilliseen

Lisätiedot

Digitaalinen signaalinkäsittely Johdanto, näytteistys

Digitaalinen signaalinkäsittely Johdanto, näytteistys Digitaalinen signaalinkäsittely Johdanto, näytteistys Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen, Signaalinkäsittelyn

Lisätiedot

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN ARVIOINNISSA Seppo Uosukainen, Jukka Tanttari, Heikki Isomoisio, Esa Nousiainen, Ville Veijanen, Virpi Hankaniemi VTT PL, 44 VTT etunimi.sukunimi@vtt.fi Wärtsilä Finland Oy

Lisätiedot

Pianon äänten parametrinen synteesi

Pianon äänten parametrinen synteesi Pianon äänten parametrinen synteesi Jukka Rauhala Pianon akustiikkaa Kuinka ääni syntyy Sisält ltö Pianon ääneen liittyviä ilmiöitä Pianon äänen synteesi Ääniesimerkkejä Akustiikan ja äänenkäsittelytekniikan

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 24.4.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

Laskuharjoitus 2 ( ): Tehtävien vastauksia

Laskuharjoitus 2 ( ): Tehtävien vastauksia TT12S1E Tietoliikenteen perusteet Metropolia/A. Koivumäki Laskuharjoitus 2 (11.9.2013): Tehtävien vastauksia 1. Eräässä kuvitteellisessa radioverkossa yhdessä radiokanavassa voi olla menossa samanaikaisesti

Lisätiedot

Mediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin

Mediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin Mediaanisuodattimet Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että niiden ominaisuudet tunnetaan hyvin niiden analysointiin on olemassa vakiintuneita menetelmiä

Lisätiedot

Kuulohavainnon perusteet

Kuulohavainnon perusteet Kuulohavainnon ärsyke on ääni - mitä ääni on? Kuulohavainnon perusteet - Ääni on ilmanpaineen nopeaa vaihtelua: Tai veden tms. Markku Kilpeläinen Käyttäytymistieteiden laitos, Helsingin yliopisto Värähtelevä

Lisätiedot

1 PID-taajuusvastesuunnittelun esimerkki

1 PID-taajuusvastesuunnittelun esimerkki Enso Ikonen, Oulun yliopisto, systeemitekniikan laboratorio 2/23 Säätöjärjestelmien suunnittelu 23 PID-taajuusvastesuunnittelun esimerkki Tehtävänä on suunnitella säätö prosessille ( ) = = ( +)( 2 + )

Lisätiedot

Algebralliset menetelmät virheenkorjauskoodin tunnistamisessa

Algebralliset menetelmät virheenkorjauskoodin tunnistamisessa Algebralliset menetelmät virheenkorjauskoodin tunnistamisessa Jyrki Lahtonen, Anni Hakanen, Taneli Lehtilä, Toni Hotanen, Teemu Pirttimäki, Antti Peltola Turun yliopisto MATINE-tutkimusseminaari, 16.11.2017

Lisätiedot

Tietoliikennesignaalit & spektri

Tietoliikennesignaalit & spektri Tietoliikennesignaalit & spektri 1 Tietoliikenne = informaation siirtoa sähköisiä signaaleja käyttäen. Signaali = vaihteleva jännite (tms.), jonka vaihteluun on sisällytetty informaatiota. Signaalin ominaisuuksia

Lisätiedot

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen SGN- Signaalinkäsittelyn perusteet Välikoe.5.4 Heikki Huttunen Tentissä ja välikokeessa saa käyttää vain tiedekunnan laskinta. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla -3 on. Sivuilla 4-5 on. Sivulla

Lisätiedot

6. Analogisen signaalin liittäminen mikroprosessoriin 2 6.1 Näytteenotto analogisesta signaalista 2 6.2. DA-muuntimet 4

6. Analogisen signaalin liittäminen mikroprosessoriin 2 6.1 Näytteenotto analogisesta signaalista 2 6.2. DA-muuntimet 4 Datamuuntimet 1 Pekka antala 19.11.2012 Datamuuntimet 6. Analogisen signaalin liittäminen mikroprosessoriin 2 6.1 Näytteenotto analogisesta signaalista 2 6.2. DA-muuntimet 4 7. AD-muuntimet 5 7.1 Analoginen

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 21.3.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...

Lisätiedot

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen

SGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen SGN-11 Signaalinkäsittelyn perusteet Välikoe 3.5.16 Heikki Huttunen Laskimen käyttö sallittu. Muiden materiaalien käyttö ei sallittu. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla 1-3 on. Sivuilla 4-5

Lisätiedot

S-108.3020 Elektroniikan häiriökysymykset. Laboratoriotyö, kevät 2010

S-108.3020 Elektroniikan häiriökysymykset. Laboratoriotyö, kevät 2010 1/7 S-108.3020 Elektroniikan häiriökysymykset Laboratoriotyö, kevät 2010 Häiriöiden kytkeytyminen yhteisen impedanssin kautta lämpötilasäätimessä Viimeksi päivitetty 25.2.2010 / MO 2/7 Johdanto Sähköisiä

Lisätiedot

Signaalien generointi

Signaalien generointi Signaalinkäsittelyssä joudutaan usein generoimaan erilaisia signaaleja keinotekoisesti. Tyypillisimpiä generoitavia aaltomuotoja ovat eritaajuiset sinimuotoiset signaalit (modulointi) sekä normaalijakautunut

Lisätiedot

TL5503 DSK, laboraatiot (1.5 op) Suodatus 1 (ver 1.0) Jyrki Laitinen

TL5503 DSK, laboraatiot (1.5 op) Suodatus 1 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op) Suodatus 1 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op), K2005 1 Suorita oheisten ohjeiden mukaiset tehtävät Matlab-ohjelmistoa käyttäen. Kokoa erilliseen

Lisätiedot

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen 16.06.2014 Ohjaaja: Urho Honkanen Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston

Lisätiedot

Virheen kasautumislaki

Virheen kasautumislaki Virheen kasautumislaki Yleensä tutkittava suure f saadaan välillisesti mitattavista parametreistä. Tällöin kokonaisvirhe f määräytyy mitattujen parametrien virheiden perusteella virheen kasautumislain

Lisätiedot

Harjoitus 6: Simulink - Säätöteoria. Syksy 2006. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1

Harjoitus 6: Simulink - Säätöteoria. Syksy 2006. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoitus 6: Simulink - Säätöteoria Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen säätötekniikkaan Takaisinkytkennän

Lisätiedot

Digitaalinen signaalinkäsittely Kuvankäsittely

Digitaalinen signaalinkäsittely Kuvankäsittely Digitaalinen signaalinkäsittely Kuvankäsittely Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen, Signaalinkäsittelyn menetelmät,

Lisätiedot

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys 2013 -seminaari 6.5.2013 / Juha Lehtonen

AV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys 2013 -seminaari 6.5.2013 / Juha Lehtonen AV-muotojen migraatiotyöpaja - ääni KDK-pitkäaikaissäilytys 2013 -seminaari 6.5.2013 / Juha Lehtonen Äänimuodot Ääneen vaikuttavia asioita Taajuudet Äänen voimakkuus Kanavien määrä Näytteistys Bittisyvyys

Lisätiedot

5 Akustiikan peruskäsitteitä

5 Akustiikan peruskäsitteitä Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen

Lisätiedot

Säätötekniikan ja signaalinkäsittelyn työkurssi

Säätötekniikan ja signaalinkäsittelyn työkurssi Säätötekniikan ja signaalinkäsittelyn työkurssi Työ D102: Sinimuotoisen signaalin suodattaminen 0.4 op. Julius Luukko Lappeenrannan teknillinen yliopisto Sähkötekniikan osasto/säätötekniikan laboratorio

Lisätiedot

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn

Lisätiedot

Toinen harjoitustyö. ASCII-grafiikkaa

Toinen harjoitustyö. ASCII-grafiikkaa Toinen harjoitustyö ASCII-grafiikkaa Yleistä Tehtävä: tee Javalla ASCII-merkkeinä esitettyä grafiikkaa käsittelevä ASCIIArt-ohjelma omia operaatioita ja taulukoita käyttäen. Työ tehdään pääosin itse. Ideoita

Lisätiedot

MS-C1340 Lineaarialgebra ja

MS-C1340 Lineaarialgebra ja MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Matriisinormi, häiriöalttius Riikka Kangaslampi Kevät 2017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Matriisinormi Matriisinormi Matriiseille

Lisätiedot

Kanavat 61-69 eivät ole enää pelkästään broadcasting käytössä Uudet palvelut kuten teräväpiirtolähetykset vaativat enemmän kapasiteettia

Kanavat 61-69 eivät ole enää pelkästään broadcasting käytössä Uudet palvelut kuten teräväpiirtolähetykset vaativat enemmän kapasiteettia DVB-T2 standardi valmis Mitä vaikutuksia alan toimintaan? Antennialan tekniikkapäivä 12.11.2009 Kari Risberg Tekninen Johtaja, Digita NorDig T2 ryhmän puheenjohtaja Kari Risberg Miksi DVB-T2 standardi?

Lisätiedot

Kohti uuden sukupolven digitaalipianoja

Kohti uuden sukupolven digitaalipianoja Kohti uuden sukupolven digitaalipianoja Heidi-Maria Lehtonen, DI Aalto-yliopiston teknillinen korkeakoulu Signaalinkäsittelyn ja akustiikan laitos Esitys RISS:n kokouksessa 17.11.2010 Esityksen sisältö

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti

SGN-1200 Signaalinkäsittelyn menetelmät, Tentti SG-1200 Signaalinkäsittelyn menetelmät, Tentti 30.1.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

Successive approximation AD-muunnin

Successive approximation AD-muunnin AD-muunnin Koostuu neljästä osasta: näytteenotto- ja pitopiiristä, (sample and hold S/H) komparaattorista, digitaali-analogiamuuntimesta (DAC) ja siirtorekisteristä. (successive approximation register

Lisätiedot

Liikehavaintojen estimointi langattomissa lähiverkoissa. Diplomityöseminaari Jukka Ahola

Liikehavaintojen estimointi langattomissa lähiverkoissa. Diplomityöseminaari Jukka Ahola Liikehavaintojen estimointi langattomissa lähiverkoissa Diplomityöseminaari Jukka Ahola ESITYKSEN SISÄLTÖ Työn tausta Tavoitteen asettelu Johdanto Liikehavaintojen jakaminen langattomassa mesh-verkossa

Lisätiedot

Sisältö. Työn lähtökohta ja tavoitteet Lyhyt kertaus prosessista Käytetyt menetelmät Työn kulku Tulokset Ongelmat ja jatkokehitys

Sisältö. Työn lähtökohta ja tavoitteet Lyhyt kertaus prosessista Käytetyt menetelmät Työn kulku Tulokset Ongelmat ja jatkokehitys Loppuraportti Sisältö Työn lähtökohta ja tavoitteet Lyhyt kertaus prosessista Käytetyt menetelmät Työn kulku Tulokset Ongelmat ja jatkokehitys Työn lähtökohta ja tavoitteet Voimalaitoskattiloiden tulipesässä

Lisätiedot

Tehtävä 2: Tietoliikenneprotokolla

Tehtävä 2: Tietoliikenneprotokolla Tehtävä 2: Tietoliikenneprotokolla Johdanto Tarkastellaan tilannetta, jossa tietokone A lähettää datapaketteja tietokoneelle tiedonsiirtovirheille alttiin kanavan kautta. Datapaketit ovat biteistä eli

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi

Lisätiedot

MATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI

MATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI I MATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI Kandidaatintyö Tarkastaja: Konsta Koppinen II TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Tietotekniikan koulutusohjelma SIRONEN, MATTI: Puheen perustaajuuden

Lisätiedot

S-114.3812 Laskennallinen Neurotiede

S-114.3812 Laskennallinen Neurotiede S-114.381 Laskennallinen Neurotiede Projektityö 30.1.007 Heikki Hyyti 60451P Tehtävä 1: Virityskäyrästön laskeminen Luokitellaan neuroni ensin sen mukaan, miten se vastaa sinimuotoisiin syötteisiin. Syöte

Lisätiedot

Matlab-tietokoneharjoitus

Matlab-tietokoneharjoitus Matlab-tietokoneharjoitus Tämän harjoituksen tavoitteena on: Opettaa yksinkertaisia piirikaavio- ja yksikkömuunnoslaskuja. Opettaa Matlabin perustyökaluja mittausten analysoimiseen. Havainnollistaa näytteenottotaajuuden,

Lisätiedot

Mitä on konvoluutio? Tutustu kuvankäsittelyyn

Mitä on konvoluutio? Tutustu kuvankäsittelyyn Mitä on konvoluutio? Tutustu kuvankäsittelyyn Tieteenpäivät 2015, Työohje Sami Varjo Johdanto Digitaalinen signaalienkäsittely on tullut osaksi arkipäiväämme niin, ettemme yleensä edes huomaa sen olemassa

Lisätiedot

havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä

havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä FYSP0 / K3 DOPPLERIN ILMIÖ Työn tavoitteita havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä harjoitella mittausarvojen poimimista Capstonen kuvaajalta sekä kerrata maksimiminimi

Lisätiedot

Tiedonkeruu ja analysointi

Tiedonkeruu ja analysointi Tiedonkeruu ja analysointi ViDRoM Virtual Design of Rotating Machines Raine Viitala 30.9.2015 ViDRoM Virtual Design of Rotating Machines Mitataan dynaamista käyttäytymistä -> nopeuden funktiona Puhtaat

Lisätiedot

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N)

Kohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N) Kohina Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N) N on suoraan verrannollinen integraatioaikaan t ja havaittuun taajuusväliin

Lisätiedot

Numeeriset menetelmät

Numeeriset menetelmät Numeeriset menetelmät Luento 13 Ti 18.10.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 13 Ti 18.10.2011 p. 1/43 p. 1/43 Nopeat Fourier-muunnokset Fourier-sarja: Jaksollisen funktion esitys

Lisätiedot

SIGNAALITEORIAN KERTAUSTA 1

SIGNAALITEORIAN KERTAUSTA 1 SIGNAALITEORIAN KERTAUSTA 1 1 (26) Fourier-muunnos ja jatkuva spektri Spektri taajuuden funktiona on kompleksiarvoinen funktio, jonka esittäminen graafisesti edellyttää 3D-kuvaajan piirtämisen. Yleensä

Lisätiedot

Monikanavaäänen perusteet. Tero Koski

Monikanavaäänen perusteet. Tero Koski Monikanavaäänen perusteet Tero Koski Lähtökohdat Monikanavaääni tarkoi6aa äänital8ota, jossa on toiste6avia kanavia enemmän kuin kaksi 2.1 ; 3.0 ; 3.1 ; 4.0 ; 4.1 ; 7.2 ; 10.2 ; 22.2 ; Monikanavaääntä

Lisätiedot

1 Vastaa seuraaviin. b) Taajuusvasteen

1 Vastaa seuraaviin. b) Taajuusvasteen Vastaa seuraaviin a) Miten määritetään digitaalisen suodattimen taajuusvaste sekä amplitudi- ja vaihespektri? Tässä riittää sanallinen kuvaus. b) Miten viivästys vaikuttaa signaalin amplitudi- ja vaihespektriin?

Lisätiedot

Varauspumppu-PLL. Taulukko 1: ulostulot sisääntulojen funktiona

Varauspumppu-PLL. Taulukko 1: ulostulot sisääntulojen funktiona Varauspumppu-PLL Vaihevertailija vertaa kelloreunoja aikatasossa. Jos sisääntulo A:n taajuus on korkeampi tai vaihe edellä verrattuna sisääntulo B:hen, ulostulo A on ylhäällä ja ulostulo B alhaalla ja

Lisätiedot

SGN-1251 Signaalinkäsittelyn sovellukset Välikoe Heikki Huttunen

SGN-1251 Signaalinkäsittelyn sovellukset Välikoe Heikki Huttunen SGN-5 Signaalinkäsittelyn sovellukset Välikoe.. Heikki Huttunen Tentissä ja välikokeessa saa käyttää vain tiedekunnan laskinta. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla - on. Sivuilla 4-6 on. Vastaa

Lisätiedot

Algoritmit 2. Luento 13 Ti Timo Männikkö

Algoritmit 2. Luento 13 Ti Timo Männikkö Algoritmit 2 Luento 13 Ti 30.4.2019 Timo Männikkö Luento 13 Simuloitu jäähdytys Merkkijonon sovitus Horspoolin algoritmi Ositus ja rekursio Rekursion toteutus Algoritmit 2 Kevät 2019 Luento 13 Ti 30.4.2019

Lisätiedot

S09 04 Kohteiden tunnistaminen 3D datasta

S09 04 Kohteiden tunnistaminen 3D datasta AS 0.3200 Automaatio ja systeemitekniikan projektityöt S09 04 Kohteiden tunnistaminen 3D datasta Loppuraportti 22.5.2009 Akseli Korhonen 1. Projektin esittely Projektin tavoitteena oli algoritmin kehittäminen

Lisätiedot

8003051 Puheenkäsittelyn menetelmät

8003051 Puheenkäsittelyn menetelmät 8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

Videotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi

Videotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi Videotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi - Android 4.3 Jelly Bean ja 4.4 Kitkat käyttöjärjestelmien videotoiston suorituskyvyn vertailu Nexus 7 tabletilla

Lisätiedot

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen Hävittäjälentokoneen reitin suunnittelussa käytettävän dynaamisen ja monitavoitteisen verkko-optimointitehtävän ratkaiseminen A*-algoritmilla (valmiin työn esittely) Joonas Haapala 8.6.2015 Ohjaaja: DI

Lisätiedot

Algoritmit 1. Luento 3 Ti Timo Männikkö

Algoritmit 1. Luento 3 Ti Timo Männikkö Algoritmit 1 Luento 3 Ti 17.1.2017 Timo Männikkö Luento 3 Algoritmin analysointi Rekursio Lomituslajittelu Aikavaativuus Tietorakenteet Pino Algoritmit 1 Kevät 2017 Luento 3 Ti 17.1.2017 2/27 Algoritmien

Lisätiedot

screenforce.fi 1

screenforce.fi 1 12.2.2019 screenforce.fi 1 AGENDA 9.00-9.15 Mitä on hyvä TV mainonta? Anna Lujanen, Screenforce 9.15-9.30 TV nyt ja tulevaisuudessa - Tina Åström, Sanoma 9.30 9.50 Katselun eri mielentilat - Anna Porvari,

Lisätiedot

Puhesynteesin perusteet Luento 5: unit selection -synteesi

Puhesynteesin perusteet Luento 5: unit selection -synteesi Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen

Lisätiedot

Signaalien datamuunnokset. Digitaalitekniikan edut

Signaalien datamuunnokset. Digitaalitekniikan edut Signaalien datamuunnokset Datamuunnosten teoriaa Muunnosten taustaa Muunnosten teoriaa Muunnosten rajoituksia ja ongelmia Petri Kärhä 09/02/2009 Signaalien datamuunnokset 1 Digitaalitekniikan edut Tarkoituksena

Lisätiedot

Signaalien datamuunnokset

Signaalien datamuunnokset Signaalien datamuunnokset Datamuunnosten teoriaa Muunnosten taustaa Muunnosten teoriaa Muunnosten rajoituksia ja ongelmia Petri Kärhä 06/02/2004 Luento 4a: Signaalien datamuunnokset 1 Digitaalitekniikan

Lisätiedot

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? 2012-2013 Lasse Lensu 2 Ongelma 2: Voidaanko dataa tai informaatiota tallettaa tiiviimpään tilaan koodaamalla se uudelleen? 2012-2013 Lasse

Lisätiedot

Ohjelmistoradio. Mikä se on:

Ohjelmistoradio. Mikä se on: 1 Mikä se on: SDR = Software Defined Radio radio, jossa ohjelmisto määrittelee toiminnot ja ominaisuudet: otaajuusalue olähetelajit (modulaatio) olähetysteho etuna joustavuus, jota tarvitaan sovelluksissa,

Lisätiedot

Tiistai klo 10-12 Jari Eerola 20.1.2015

Tiistai klo 10-12 Jari Eerola 20.1.2015 Tiistai klo 10-12 Jari Eerola 20.1.2015 } 20.1. Kuvaajatyypit ja ohjelmat Analyysiohjelmista Praat ja Sonic Visualiser Audacity } 27.1. Nuotinnusohjelmista Nuotinnusohjelmista Musescore } Tietokoneavusteinen

Lisätiedot

Signaalien datamuunnokset. Näytteenotto ja pito -piirit

Signaalien datamuunnokset. Näytteenotto ja pito -piirit Signaalien datamuunnokset Muunnoskomponentit Näytteenotto ja pitopiirit Multiplekserit A/D-muuntimet Jännitereferenssit D/A-muuntimet Petri Kärhä 26/02/2008 Signaalien datamuunnokset 1 Näytteenotto ja

Lisätiedot

Mono- ja stereoääni Stereoääni

Mono- ja stereoääni Stereoääni 1 Mitä ääni on? Olet ehkä kuulut puhuttavan ääniaalloista, jotka etenevät ilmassa näkymättöminä. Ääniaallot käyttäytyvät meren aaltojen tapaan. On suurempia aaltoja, jotka ovat voimakkaampia kuin pienet

Lisätiedot

Algoritmit 1. Luento 10 Ke Timo Männikkö

Algoritmit 1. Luento 10 Ke Timo Männikkö Algoritmit 1 Luento 10 Ke 14.2.2018 Timo Männikkö Luento 10 Algoritminen ongelmanratkaisu Suunnittelumenetelmät Raaka voima Järjestäminen eli lajittelu Kuplalajittelu Lisäyslajittelu Valintalajittelu Permutaatiot

Lisätiedot

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe

SGN-1200 Signaalinkäsittelyn menetelmät Välikoe SGN-100 Signaalinkäsittelyn menetelmät Välikoe 6.4.010 Sivuilla 1- on. Älä vastaa siihen, jos et ollut ensimmäisessä välikokeessa. Tentin kysymykset ovat sivuilla 3-4. Vastaa vain jompaan kumpaan kokeeseen,

Lisätiedot

Vasteaika. Vasteaikaa koskeva ohje ei ole juuri muuttunut Robert B. Millerin vuonna 1968 pitämästä esityksestä:

Vasteaika. Vasteaikaa koskeva ohje ei ole juuri muuttunut Robert B. Millerin vuonna 1968 pitämästä esityksestä: Nielsen: "Olen tutkinut Webin käytettävyyttä vuodesta 1994, ja jokaisessa tutkimuksessa esiin on noussut sama asia: käyttäjät haluaisivat sivujen latautuvan nopeammin. Aluksi olin sitä mieltä, että käyttäjät

Lisätiedot

5 Lineaarinen ennustus

5 Lineaarinen ennustus 5 Lineaarinen ennustus Lineaarinen ennustus (linear prediction, LP) on yksi tärkeimmistä puheenkäsittelyn työkaluista Sitä voidaan eri tilanteessa käyttää eri tavoilla, mutta puheenkäsittelyn kannalta

Lisätiedot

Ajalliset muunnokset eksploratiivisen paikkatietoanalyysin työkaluna. Salla Multimäki ProGIS Ry Paikkatietomarkkinat

Ajalliset muunnokset eksploratiivisen paikkatietoanalyysin työkaluna. Salla Multimäki ProGIS Ry Paikkatietomarkkinat Ajalliset muunnokset eksploratiivisen paikkatietoanalyysin työkaluna Salla Multimäki ProGIS Ry Paikkatietomarkkinat 7.11.2017 Informaatiokuorma kognitiivinen kuorma - ylikuormitus Information load muodostuu

Lisätiedot

Tuntematon järjestelmä. Adaptiivinen suodatin

Tuntematon järjestelmä. Adaptiivinen suodatin 1 1 Vastaa lyhyesti seuraaviin a) Miksi signaaleja ylinäytteistetään AD- ja DA-muunnosten yhteydessä? b) Esittele lohkokaaviona adaptiiviseen suodatukseen perustuva tuntemattoman järjestelmän mallinnus.

Lisätiedot

Laskennallinen menetelmä puun biomassan ja oksien kokojakauman määrittämiseen laserkeilausdatasta

Laskennallinen menetelmä puun biomassan ja oksien kokojakauman määrittämiseen laserkeilausdatasta Laskennallinen menetelmä puun biomassan ja oksien kokojakauman määrittämiseen laserkeilausdatasta Pasi Raumonen, Mikko Kaasalainen ja Markku Åkerblom Tampereen teknillinen ylipisto, Matematiikan laitos

Lisätiedot

Videon tallentaminen Virtual Mapista

Videon tallentaminen Virtual Mapista Videon tallentaminen Virtual Mapista Kamera-ajon tekeminen Karkean kamera ajon teko onnistuu nopeammin Katseluohjelmassa (Navigointi > Näkymät > Tallenna polku). Liikeradan ja nopeuden tarkka hallinta

Lisätiedot

Luku 8. Aluekyselyt. 8.1 Summataulukko

Luku 8. Aluekyselyt. 8.1 Summataulukko Luku 8 Aluekyselyt Aluekysely on tiettyä taulukon väliä koskeva kysely. Tyypillisiä aluekyselyitä ovat, mikä on taulukon välin lukujen summa tai pienin luku välillä. Esimerkiksi seuraavassa taulukossa

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot