MARKKU NIEMI PUHEEN AIKASKAALAUS. Kandidaatintyö
|
|
- Väinö Kähkönen
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 MARKKU NIEMI PUHEEN AIKASKAALAUS Kandidaatintyö Tarkastaja: Hanna Silén
2 ii TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Tietotekniikan koulutusohjelma NIEMI, MARKKU: Puheen aikaskaalaus Kandidaatintyö, 16 sivua Joulukuu 2012 Pääaine: Signaalinkäsittely Tarkastaja: Hanna Silén Avainsanat: Puhe, aikaskaalaus, SOLA, PSOLA Puheen aikaskaalaukselle on lukuisa joukko hyödyllisiä aktiivisesti käytettyjä käytännön sovelluksia kuten esimerkiksi erilaiset vieraiden kielten opetussovellukset tai mainostekstin täsmääminen käytettävissä olevaan mainosaikaan. Puheen aikaskaalauksen käyttökelpoisuuden edellytyksenä on, että puheen tulee kuulostaa aikaskaalauksen jälkeen mahdollisimman luonnolliselta ja alkuperäisen puheen kaltaiselta. Tähän tavoitteeseen pääseminen edellyttää puhesignaalin ja ihmisen kuulon ominaisuuksia hyödyntävien digitaalisten signaalinkäsittelymenetelmien käyttämistä. Tässä kandidaatintyössä tehtiin kirjallisuusselvitys puheen aikaskaalauksen eri menetelmistä. Työssä keskityttiin ainoastaan aikatason aikaskaalausmenetelmiin ja perehdyttiin erityisesti SOLA- ja PSOLA-algoritmien perusteisiin ja teoreettiseen taustaan. Työssä toteutettiin sekä SOLA-, että PSOLA-algoritmit MATLAB-ohjelmistolla. Toteutuksien avulla arvioitiin algoritmien toimivuutta eri aikaskaalaussuhteilla ja arvioitiin puheen laatua subjektiivisesti. Vertailukohtana käytettiin ainoastaan näytteenottotaajuuden muutoksella aikaansaatua aikaskaalattua puhesignaalia. Tuloksien perusteella voidaan todeta, että yksinkertainen SOLA-algoritmi tuottaa ymmärrettävää aikaskaalattua puhetta aikaskaalauskertoimilla mutta puheessa on selvästi havaittavia artefaktoja jo hyvin pienilläkin aikaskaalaussuhteilla. PSOLAalgoritmissa on kehitetty SOLA-algoritmia siten, että algoritmi käyttää hyväksi äänteiden eri perustaajuuksia kehysrakenteen muodostamisessa. Tulosten perusteella PSOLAmenetelmällä saadaan aikaan huomattava parannus aikaskaalatun puheen laatuun ja PSOLA-algoritmilla aikaskaalattu puhe on varsin hyvälaatuista kun aikaskaalauskertoimet vaihtelevat välillä
3 iii ALKUSANAT Tämä työ on tekniikan kandidaatin opinnäyte Tampereen teknillisen yliopiston signaalinkäsittelyn laitokselle. Työssä tehtiin kirjallisuustutkimus puheen aikaskaalauksen eri menetelmistä ja toteutettiin SOLA ja PSOLA-algoritmeihin perustuvat aikatason aikaskaalausmenetelmät MATLAB-ohjelmistolla. Haluan kiittää tutkimusjohtaja Alpo Värriä ja lehtori Heikki Huttusta mielenkiintoisen aiheen ehdottamisesta ja rakentavista kehitysehdotuksista työn kuluessa. Erityisesti haluan kiittää työn ohjaajaa ja tarkastajaa Hanna Sileniä erinomaisesta ohjauksesta, rakentavista kommenteista, kannustuksesta ja lukuisista käytännön neuvoista ja avusta työn eri vaiheissa. Kangasala, Markku Niemi Nokikuruntie Kangasala Puhelin:
4 iv SISÄLLYS Alkusanat... iii Sisällys... iv Termit ja niiden määritelmät... v 1 Johdanto Puhesignaalin ominaisuuksista Puheen aikaskaalausmenetelmät Puheen mallinnus ja käsittely Aikaskaalausmenetelmät PSOLA Toteutuksesta Toteutuksen arviointi Lähteet... 16
5 v TERMIT JA NIIDEN MÄÄRITELMÄT Aikaskaalauskerroin Artefakta FIR FFT IFFT LPC Perustaajuus PSOLA Puheen aikaskaalaus Soinniton äänne Soinnillinen äänne SOLA Aikaskaalatun puhenäytteen ajallisen pituuden suhde alkuperäisen puhenäytteen pituuteen. Aikaskaalauskerrointa on merkitty tekstissä symbolilla α (tai alpha). Keinotekoiselta tai luonnottomalta kuulostava häiriö. Finite Impulse Response. Fast Fourier Transform. Nopea Fourier muunnos. Inverse Fast Fourier Transform. Käänteinen nopea Fourier muunnos. Linear Predictive Coding Puheen perustaajuus (engl. pitch). Pitch-Syncronous Overlap-Add. Puhesignaalin toistaminen eri nopeudella verrattuna alkuperäisen puhesignaalin tallennuksessa käytettyyn nopeuteen. Soinniton äänne syntyy ilman äänihuulten värähtelelyä kurkussa. Yleensä soinnittomia äänteitä ovat vain konsonantit. Soinnillinen äänne syntyy äänihuulten värähdellessä kurkunpäässä. Vokaalit ovat luonnostaan soinnillisia äänteitä. Osalla konsonanteista on sekä soinnillinen, että soinniton variantti. Syncronous Overlap-Add.
6 1 1 JOHDANTO Puheen aikaskaalauksella tarkoitetaan tallennetun puhenäytteen toistamista eri nopeudella verrattuna alkuperäisen puhesignaalin tallennuksessa käytettyyn nopeuteen. Puheen aikaskaalauksella on monia hyödyllisiä ja varsin laajasti käytössä olevia käytännön sovelluksia. Yleisesti tunnettuja sovelluskohteita ovat esimerkiksi vieraiden kielten alkeisopinnot, radio- ja TV-uutiset, saneluäänitteet ja TV- ja radiomainokset. Puheen aikaskaalausta hyödyntävien sovellusten tavoitteena on välittää mahdollisimman suuri määrä informaatiota mahdollisimman lyhyessä ajassa mahdollisimman mieleenpainuvasti suhteutettuna kuulijan yksilöllisiin kykyihin. Joissakin sovelluksissa ja tilanteissa tämä voi tarkoittaa puhesignaalin toistamista nopeammin ja toisissa sovelluksissa ja tilanteissa puhesignaalia toistetaan hitaammin tavoitteen saavuttamiseksi. Puheen aikaskaalauksen hyödyllisyys pohjautuu osittain käyttäytymistieteelliseen tutkimukseen jossa on osoitettu, että ihminen pystyy omaksumaan tietoa nopeammin kuin mitä pystymme tuottamaan puhetta. Kuunneltaessa puhetta aivot toimivat tyypillisesti vain noin 30-50%:n kapasiteetilla verrattuna maksimikapasiteettiin. Ihminen pystyy omaksumaan tietoa tehokkaimmin lukunopeudella. Normaali lukunopeus englannin kielessä on noin sanaa minuutissa kun taas normaali puhenopeus on vain noin sanaa minuutissa. Yllä mainitut luvut pitävät paikkansa äidinkielenään englantia puhuville. Suhdeluku on suomen kielessä samantapainen mutta absoluuttiset lukuarvot ovat hieman eroavat johtuen englannin ja suomen kielen rakenteiden eroista. Aivojen toimiessa puolella teholla ajatukset alkavat harhailla. [3] Tätä ihmisen aivojen ominaisuutta voidaan hyödyntää esimerkiksi TV- ja radiomainoksissa. Mainoksen nopeuttaminen parantaa mainoksen tehoa koska nopeammin esitettynä ihmiset keskittyvät mainokseen tehokkaammin ja siten viesti jää tehokkaammin kuulijoiden mieleen. Koska mainokset ovat pääsääntöisesti aikapohjaisesti hinnoiteltuja, mainoksen nopeuttamisesta on myös taloudellista hyötyä. Mainokselle on yleensä varattu lähetyksestä etukäteen tietty täsmällinen pituus johon mainoksen pitää mahtua. Puheen aikaskaalauksella voidaan helposti sovittaa mainos täsmällisesti varattuun aikaikkunaan. Uutisten esittämisessä sekä puheen nopeuttamiselle, että hidastamiselle löytyy hyödyllisiä sovelluksia. Hidastetut uutiset helpottavat esimerkiksi vieraskielisten tai omaksumisongelmista kärsivien uutisten seuraamista. Radiossa tällä hetkellä esitettävä Yleisradion selkokieliset uutiset on esimerkki tällaisesta palvelusta. Uutisten nopeuttaminen puolestaan saattaa olla hyödyllistä esimerkiksi jos halutaan nopeasti tarkistaa onko päivän uutisissa ollut mielenkiintoisia aiheita tai jos halutaan etsiä jotain tiettyä
7 2 uutista pitkästä lähetyksestä nopeasti. Yleisemmin tiedon etsintä isosta aineistosta on varsin hyödyllinen puheen aikaskaalauksen sovelluskohde. Koulutussovelluksissa, kuten vieraiden kielten materiaaleissa puheen hidastamisesta on paljon hyötyä. Puheen hidastaminen mahdollistaa esimerkiksi vieraan kielen ääntämisen harjoittelun huomattavasti tehokkaammin. Hidastettuna vieraskielinen puhe on helpompi omaksua. Sanelukoneita käytetään varsin paljon esimerkiksi lääketieteessä ja oikeustieteessä. Sanelukoneen purkamisessa sekä puheen nopeuttamisesta, että hidastamisesta samanaikaisesti puheenlaatu säilyttäen on varsin ilmeistä hyötyä sanelun purkajalle. Johtuen monista käytännön kaupallisista sovelluskohteista puheen aikaskaalausta on tutkittu melko pitkään ja aiheesta löytyy paljon tieteellisiä julkaisuja. Puhesignaalin toistaminen pelkästään toistonopeutta muuttamalla vääristää signaalia. Vääristymä on yleensä sitä suurempi mitä suurempi on alkuperäisen tallennusnopeuden ja toistonopeuden suhteellinen ero. Alkuperäistä näytteenottotaajuutta nopeammin toistettu puhe tuottaa Aku Ankka tai pikkuorava ääntä. Alkuperäistä näytteenottotaajuutta hitaammin toistettu puhe taas voi kuulostaa esimerkiksi humalaiselta matalaääniseltä mieheltä. Nämä ilmiöt saattavat kuulostaa hauskoilta ja voivat olla hyödyllisiä joissakin hupisovelluksissa mutta luonnollisestikaan vääristymät eivät ole toivottavia käytännön sovellusten kannalta. Käytännön sovelluksissa puheen aikaskaalauksen käyttökelpoisuuden yhtenä tärkeimpänä kriteerinä on, että puhesignaali kuulostaa aikaskaalauksen jälkeen mahdollisimman luonnolliselta ja alkuperäisen puheen kaltaiselta. Tähän tavoitteeseen pääseminen edellyttää puheen aikaskaalaukseen kehitettyjen signaalinkäsittelymenetelmien käyttämistä. Nämä menetelmät hyödyntävät puhesignaalin ja ihmisen kuulon ominaisuuksia. Nykyään lähes kaikki puhetallenteet ovat valmiiksi digitaalisessa muodossa. Tämä mahdollistaa tallenteiden helpon ja nopean käsittelyn eri signaalinkäsittelyalgoritmeilla tietokoneella. Työssä esitellään aluksi puhesignaalin perusominaisuudet ja selostetaan näihin ominaisuuksiin pohjautuva yksinkertainen puheen matemaattinen malli. Tämän jälkeen tutustutaan kirjallisuudessa esitettyihin erilaisiin puheen aikaskaalauksen menetelmiin ja kuvaillaan miten menetelmät pohjautuvat puheen ominaisuuksiin ja puheen teoreettiseen malliin. Eri menetelmiä, niiden suorituskykyä ja muita ominaisuuksia vertaillaan kirjallisuuden pohjalta. Työssä keskitytään tarkemmin vain aikatason menetelmiin koska niiden on todettu soveltuvan puheelle verrattain pienillä aikaskaalaussuhteilla varsin hyvin. Taajuustason menetelmät soveltuvat aikatason menetelmiä paremmin puhetta monimutkaisemmille signaaleille, kuten esimerkiksi musiikille ja jos halutaan käyttää hyvin suuria aikaskaalaussuhteita. Taajuustason menetelmien haittapuolena on myös pienillä aikaskaalaussuhteilla muun muassa vaihevirheistä esiintyvät artefaktat, joita kehittyneissä aikatason menetelmissä ei esiinny [5].
8 3 Syncronous Overlap-Add (SOLA) algoritmi on varsin yksinkertainen lyhyiden, osittain päällekkäisten kehyksien poistamiseen ja lisäykseen, sekä kehysten päällekkäiselle alueelle suoritettavaan suodatukseen perustuva menetelmä. SOLA:sta jatkokehitetty Pitch-Syncronous Overlap-Add (PSOLA) algoritmi on yksi tunnetuimista ja parhaiten puheelle toimivista algoritmeista [7]. PSOLA eroaa SOLA:sta siten, että lyhyiden kehyksien paikka ja pituus synkronoidaan äänteiden perustaajuuden kanssa, jolloin voidaan minimoida kehyksien rajalla tapahtuvia epäjatkuvuuskohtia ja niistä aiheutuvia artefaktoja. PSOLA-algoritmin vaativin osuus on puheen perustaajuuden tunnistaminen luotettavasti. Työssä toteutettiin sekä SOLA, että PSOLA aikaskaalausmenetelmät MATLAB - ohjelmiksi, joilla voitiin testata ja vertailla eri puhenäytteiden nopeuden muuttamista käytännössä eri algoritmien parametreilla ja erilaisilla puheen nopeutus- ja hidastussuhteilla. Subjektiivisilla kuuntelutestien tulokset on esitetty kappaleessa 4. Kappaleessa 4 ehdotetaan myös muutamia jatkotutkimuskohteita.
9 4 2 PUHESIGNAALIN OMINAISUUKSISTA Puhesignaali koostuu peräkkäisistä äänteistä, äänteiden välissä olevista lyhyistä siirtymäjaksoista ja pidemmistä hiljaisista jaksoista sanojen välillä. Pääosa äänteistä voidaan jakaa joko soinnittomiin (engl. unvoiced) tai soinnillisiin äänteisin (engl. voiced). Soinnittomien äänteiden aikana äänihuulet eivät värähtele. Konsonantit ovat tyypillisesti soinnittomia äänteitä. Vokaalit ovat soinnillisia äänteitä joiden aikana äänihuulet värähtelevät kurkunpäässä. Tätä värähtelytaajuutta kutsutaan perustaajuudeksi (engl. pitch). Puhe voidaan mallintaa matemaattisesti kuvassa 1 esitetyllä yksinkertaistetulla systeemillä. Kuva 1. Puheen matemaattinen malli [1]. Mallissa valitaan aluksi herätteeksi joko säännöllinen impulssijono tai satunnainen kohinasignaali riippuen siitä onko kyseessä soinnillinen vai soinniton äänne. Herätteiden voimakkuutta eli amplitudia säädellään vastaavasti parametreilla Av ja AN. Ihmisen äänihuulien äännettä muokkaavaa vaikutusta mallinnetaan funktiolla G(z), kurkunpäästä, nenäontelosta ja kielestä muodostuvaa äänikanavaa mallinnetaan funktiolla V(z) ja lopuksi huulien äännettä muokkaavaa vaikutusta mallinnetaan funktiolla R(z). Malli on varsin yksinkertainen mutta se toimii hyvin erityisesti jatkuville äänille kuten vokaaleille jolloin mallin parametrit muuttuvat hitaasti. Malli ei toimi aivan niin hyvin äänteille joissa tapahtuu nopeita muutoksia. Äänteiden jako pelkästään soinnittomiin ja soinnillisiin ei vastaa täysin todellisuutta koska on olemassa äänteitä jotka ovat näiden välimuotoja. Esimerkkinä tällaisista äänteistä ovat nenässä muodostuvat äänteet (engl. nasals). Kirjallisuudessa on esitetty useita parannettuja monimutkaisempia malleja, joita ei tässä työssä esitellä. [1]
10 5 Johtuen sekä ihmisen tavasta tuottaa puhetta, että kielen rakenteesta puhesignaali sisältää paljon redundanssia. Redundanssi on selkeästi nähtävissä myös puheen matemaattisesta mallista, jossa esimerkiksi soinnillisten äänteiden heräte on vain säännöllinen impulssijono. Tarkasteltaessa puhetta pidemmällä ajanjaksolla (noin 1 s), puhe on hyvin epäsäännöllistä (Kuvan 2 yläosa). Puheessa on isoja amplitudivaihteluja ja verrattain pitkiä jaksoja jolloin amplitudi on lähes nolla. Kun puhesignaalia tarkastellaan huomattavasti lyhyemmällä aikavälillä (noin 150 ms) havaitaan, että signaali onkin melko säännöllistä (Kuvan 2 alaosa). Tätä lyhyehköllä aikavälillä havaittavissa olevaa säännöllistä taajuutta kutsutaan kyseisen äänteen perustaajuudeksi. Kuva 2. Esimerkki samasta puhesignaalista tarkasteltuna kahdella eri ajanjaksolla [6]. Puheenkoodaus- ja puheen aikaskaalausmenetelmissä pyritään käyttämään hyväksi puhesignaalin redundanssia, äänteiden rajoja ja soinnillisten äänteiden perustaajuutta eri tavoin. Digitaalisilla audiosignaaleilla yleisesti käytetty näytteenottotaajuus on 44.1 khz joka mahdollistaa taajuuskomponenttien 0 Hz khz esittämisen. Tämä näytteenottotaajuus on käytössä esimerkiksi CD-levyissä. Ihmiskuulo pystyy kuulemaan noin 20 Hz - 20 khz taajuudet, joten 44.1 khz näytteenottotaajuus on riittävä ihmisen kuultavissa oleville audiosignaaleille ilman ihmisen havaitsemaa informaation menettämistä. Pelkän puhesignaalin ominaisuuksista sekä ihmisen korvan rakenteesta johtuen puhesignaalin taajuuskaistaa voidaan rajoittaa edellä esitetystä merkittävästi menettämättä
11 oleellista informaatiota [8]. Esimerkiksi matkapuhelimissa taajuuskaista on rajoitettu välille 0-4 khz tai 0-8 khz eli käytetyt näytteenottotaajuudet ovat vastaavasti 8 khz tai 16 khz. Pienemmän näytteenottotaajuuden käyttäminen vähentää datan määrää näytteenottotaajuuden suhteessa. Jos näytteenottotaajuus puolitetaan, puolittuu käsiteltävän tiedon määrä aikayksikköä kohden olettaen, että näytteiden amplitudin esittämiseen käytetään kummassakin tapauksessa samaa tarkkuutta. Käsiteltävän ja välitettävän tiedon määrällä on luonnollisesti huomattava merkitys tarvittavaan laskentatehon tarpeeseen ja tarvittavaan tiedonsiirtokapasiteettiin. Puheelle käyttökelpoiset pienemmät näytteenottotaajuudet mahdollistavat puheen aikaskaalauksen reaaliajassa vaikka käytössä olisi paljon laskuoperaatioita vaativia algoritmeja. Musiikin aikaskaalaus reaaliajassa on vaativampaa koska musiikille on laajan taajuuskaistan vuoksi käytettävä suuria näytteenottotaajuuksia. 6
12 7 3 PUHEEN AIKASKAALAUSMENETELMÄT Puhesignaalin muunnos analogisesta digitaaliseksi voidaan esittää muodossa: jossa [ ]: digitaalinen signaali : analoginen signaali : kokonaisluku (0, 1, 2, 3, ) : näytteiden väli (s) [ ] ( ) (3.1) Yksinkertaisimmillaan puheen aikaskaalaus tarkoittaa näytteiden aikavälin T kasvattamista tai lyhentämistä toistovaiheessa eli kun signaali [ ] palautetaan takaisin analogiseen muotoon. Sama asia voidaan myös toteuttaa digitaalitasossa näytteenottotaajuutta muuttamalla. Kun alennetaan näytteenottotaajuutta kokonaisluvulla M saadaan uusi signaali: [ ] [ ] [ ] (3.2) Signaalista poimitaan joka M:s näyte uuteen signaaliin [ ]. Kun signaali [ ] toistetaan alkuperäisellä näytteenottotaajuudella T, puhesignaali nopeutuu koska näytteiden välinen aika pysyy samana mutta toistettavia näytteitä on vähemmän. Kummastakin edellä kuvatusta yksinkertaisesta tavasta skaalata signaalia aiheutuu merkittäviä muutoksia uuden signaalin taajuusvasteeseen. Nämä muutokset ovat ihmisen kuultavissa erilaisina artefaktoina aikaskaalatussa puheessa ja ovat puheen aikaskaalaussovelluksien kannalta hyvin häiritseviä. Kuvassa 3 on esitetty sama puhesignaali kolmella eri tavalla. Alkuperäisen aikaskaalattoman signaalin lisäksi näyte on aikaskaalattu käyttäen kahta eri aikaskaalauskerrointa. Kaikki kolme puhesignaalia on esitetty sekä aika-, että taajuustasossa. Aikaskaalaus on toteutettu käyttämällä pelkästään ylläkuvattua näytteenottotaajuuden muutosmenetelmää. Kuvassa 3 ylimpänä vasemmalla olevassa kaaviossa on alkuperäinen signaali aikatasossa ja ylimpänä oikealla on vastaavasti esitetty sama signaali taajuustasossa. Alkuperäisille signaaleille ei ole suoritettu aikaskaalausta eli aikaskaalauskerroin α = 1 (kuvan otsikossa merkitty alpha = 1). Keskimmäiset kuvat esittävät tilannetta, jossa puhet-
13 8 ta on nopeutettu kaksinkertaiseksi verrattuna alkuperäiseen nopeuteen, eli on käytetty aikaskaalauskerrointa α = 0.5. Aikaskaalaus on toteutettu poistamalla alkuperäisestä signaalista joka toinen näyte. Kuvassa 3 vasemmalla keskimmäisenä olevasta aikatason signaalista havaitaan, että puheen kesto nyt noin s, eli puolet alkuperäisen näytteen kestosta joka on noin 0.25 sekuntia. Oikealla keskellä olevasta kuvasta havaitaan, että taajuusvasteessa energia on selvästi siirtynyt korkeampien taajuuksien suuntaan. Alimmassa kuvaparissa on käytetty aikaskaalauskerrointa α = 2, eli puhetta on aikatasossa hidastettu puoleen verrattuna alkuperäiseen nopeuteen. Tämä on toteutettu lisäämällä alkuperäiseen signaaliin jokaisen näytteen väliin nolla. Puhenäytteen kesto on nyt kaksinkertainen alkuperäiseen näytteeseen verrattuna eli noin 0.5 sekuntia. Alimpana oikealla olevasta taajuusvasteesta havaitaan, että energiaa on siirtynyt matalammille taajuuksille verrattuna ylimpänä oikealla olevaan alkuperäisen signaalin taajuusvasteeseen. Kuva 3. Puhesignaali aika- ja taajuustasossa eri nopeuksilla [7]. Näytteenottotaajuuden muutoksien aiheuttamien taajuusvasteeseen tulevien muutosten teoreettista taustaa selvitetään perusteellisesti useissa signaalinkäsittelyn perusteoksissa. Esimerkiksi Oppenheim & Schafer: Discrete-Time Signal Processing [2] käsittelee asiaa.
14 9 3.1 Puheen mallinnus ja käsittely Puheen mallinnus ja käsittely voidaan jakaa kolmeen vaiheeseen: 1. Puhesignaalin analysointi ja mallinnus (analyysi) 2. Signaaliin tehtävät muutokset (muutokset) 3. Signaalin palautus muutetusta signaalista (synteesi) Analyysivaiheessa puhesignaalista luodaan parametrisoitu kuvan 1 mukainen matemaattinen malli. Kuvan 1 puheen mallin tapauksessa analyysivaiheen jälkeen on siis selvillä äänteiden perustaajuudet, kertoimet AN ja AV, joilla säädellään herätteiden amplitudia, sekä suodattimien G(z), V(z) ja R(z) parametrit. Muutosvaiheessa muutetaan analyysivaiheessa muodostetun mallin parametreja halutun lopputuloksen aikaansaamiseksi. Synteesivaiheessa rekonstruoidaan signaali puheen mallia ja muutettuja parametreja hyväksikäyttäen. Puheenkoodausta hyödyntävissä sovelluksissa muodostetun puheen mallin parametrit siirretään vastaanottajalle siirtotien yli. Vastaanottaja rekonstruoi (syntetisoi) siirrettyjen parametrien perusteella puheen uudelleen vastaanottavassa päässä. Puheenkoodauksessa ei ole välttämättä muutosvaihetta ollenkaan tai se on yhdistetty synteesivaiheeseen. Puheenkoodauksen yhteydessä puhutaankin yleensä analyysi-synteesi menetelmistä. Puheenkoodauksella saavutetaan huomattavia säästöjä tarvittavan tiedonsiirtokapasiteetin tarpeessa ja parannuksia systeemin kykyyn sietää siirtotiellä parametreihin aiheutuvia virheitä, jolla puolestaan on huomattava puheen laatua parantava vaikutus. Puheenkoodaussovelluksissa käytetyt mallit ja parametrit voivat olla hyvin monimutkaisia ja monivaiheisia. Aikaskaalaustekniikoissa voidaan käyttää hieman yksinkertaisempia malleja. Perusperiaatteet ovat kuitenkin kummassakin sovelluksessa samat. Kuva 4. Yksinkertaistettu puheen käsittelyn malli. Kuvan 4 mukaisia analyysi-synteesi -menetelmiä on tutkittu erittäin paljon erityisesti puheenkoodausta hyödyntävissä sovelluksissa. Digitaalisissa matkapuhelinverkoissa käytetyt puheenkoodausmenetelmät ovat ehkä yksi merkittävimmistä ja laajimmin käytetty analyysi-synteesi menetelmiä hyödyntävä käytännön sovellus. Matkapuhelimissa on merkittäviä taloudellisia, laadullisia ja luotettavuuteen liittyviä syitä välittää mahdollisimman hyvälaatuista puhetta mahdollisimman pienellä datamäärällä. Tämän johdosta alan tutkimukseen on panostettu erittäin paljon viimeisen vuoden ajan.
15 Aikaskaalausmenetelmät Aikaskaalausmenetelmät voidaan jakaa aika- ja taajuustason menetelmiin. Nimensä mukaisesti aikatason tekniikoissa puhesignaalin käsittely tapahtuu pelkästään aikatasossa. Taajuustason menetelmissä signaali muunnetaan ensin taajuustasoon yleensä käyttäen Fast Fourier Transform (FFT) menetelmää. Aikaskaalauksen vaatimat operaatiot suoritetaan taajuustasossa, jonka jälkeen signaali muutetaan takaisin aikatasoon käyttäen käänteistä FFT:tä (IFFT). Tässä työssä keskitytään tarkemmin vain aikatason menetelmiin koska niiden on todettu soveltuvan puheelle hyvin varsinkin verrattain pienillä (0.25 2) aikaskaalaussuhteilla. Taajuustason menetelmät soveltuvat aikatason menetelmiä paremmin puhetta monivivahteisimmille ja taajuusspektriltään runsaammille signaaleille, kuten esimerkiksi musiikille [5]. Taajuustason menetelmät toimivat myös puheelle aikatason menetelmiä paremmin jos käytetään hyvin suuria tai hyvin pieniä aikaskaalaussuhteita. Taajuustason menetelmien haittapuolena ovat lähes kaikissa tilanteissa esiintyvät vaihevirheistä johtuvat artefaktat, joita kehittyneissä aikatason menetelmissä ei esiinny [5]. Näitä taajuustason menetelmien artefaktoja esiintyy myös pienillä aikaskaalaussuhteilla. Taajuustason menetelmien haittapuolena on myös suuri laskentatehon tarve. Huolimatta tietokoneiden kasvaneesta laskentakapasiteetista tämä voi olla ongelma esimerkiksi jos halutaan suorittaa aikaskaalausta reaaliaikaisesti kannettavissa laitteissa kuten matkapuhelimissa. Aikatason menetelmiä ja menetelmien variaatiota on esitetty kirjallisuudessa suuri määrä. Useat aikaskaalausmenetelmät pohjautuvat signaalin lyhyiden osien (kehysten) analysointiin ja käsittelyyn ja synteesiin. Kehykset voivat olla joka vakio- tai vaihtuvanmittaisia. Synteesivaiheessa kehyksiä joko venytetään, lyhennetään, poistetaan tai kopioidaan riippuen siitä halutaanko puhetta nopeuttaa vai hidastaa. Kuva 5 esittää kehyksille tehtäviä yksinkertaisia aikatason aikaskaalausoperaatioita. Kuva 5. Periaatekuva kehyksille tehtävistä aikatason aikaskaalausoperaatioista [5].
16 11 Muutettujen kehyksien reuna-alueilla syntyy epäjatkuvuuskohtia jotka aiheuttavat useissa tapauksissa selvästi kuultavissa olevia häiriöitä puhesignaaliin. Leikkaa ja yhdistä menetelmissä (engl. overlap-add) näitä kehysten reuna-alueille muodostuvia epäjatkuvuuskohtia pyritään lieventämään asettamalla peräkkäiset kehykset limittäin toistensa kanssa ja käyttämällä kehysten päällekkäin menevillä reuna-alueilla erilaisia suodatusja painotusmenetelmiä. Synteesivaiheessa kehykset pyritään yhdistämään niin, että äänen perustaajuuteen tulee mahdollisimman vähän epäjatkuvuuskohtia. Parhaassa tapauksessa ei ole kuultavissa muuta muutosta kuin signaalin keston muutos. Kuvassa 6 on esitetty periaatteellinen esimerkki alkuperäisestä signaalista x(n) muodostetusta kehysrakenteesta x 1 (n), x 2 (n), ja x 3 (n). Kuvassa 6 on myös esimerkki kehyksien päällekkäisyydestä, sekä kehyksien päällekkäiselle osalle suoritettavasta suodatuksesta. Kuva 6. Periaatekuva SOLA-algoritmin kehysrakenteesta [7]. Kuvan 6 mukaista kehysrakennetta hyödyntävää aikaskaalausalgoritmia kutsutaan nimellä Syncronous Overlap-Add (SOLA). SOLA-algoritmissa parametreina ovat kehyksien päällekkäisyyden suuruus, kehyksen pituuden skaalauskerroin ja kehyksien välinen aikaviive. SOLA on yksinkertainen ja laskennallisesti tehokas tapa tehdä puheen aikaskaalaus. SOLA:lla saavutettava aikaskaalauksen laatu ei kuitenkaan ole kovin hyvä. [7] 3.3 PSOLA SOLA:sta jatkokehitetyssä Pitch-Syncronous Overlap Add (PSOLA) algoritmissa perusajatuksena on synkronoida kehyksien paikat ja pituudet puheen perustaajuuden kanssa siten, että pyritään minimoimaan puheen nopeuden muuttamisesta perustaajuuteen aiheutuvat epäjatkuvuuskohdat. Käyttäen edellä esiteltyä kolmivaiheista luokittelua PSOLA-algoritmi voidaan esittää seuraavasti: Analyysivaiheessa puhesignaali jaetaan lyhyisiin kehyksiin, jotka voivat mennä päällekkäin toistensa kanssa. Kehyksiä kutsutaan englanninkielisessä kirjallisuudessa nimellä short-term analysis signals (ST). Kehykset ( ) muodostetaan kertomalla signaali perustaajuuden suhteen synkronoiduilla ikkunoilla ( ):
17 12 ( ) ( ) ( ) (3.3) jossa alaindeksi m viittaan kehyksen indeksiin. PSOLA algoritmissa vaihdellaan kehyksien päällekkäisyyttä välillä 50% - 75% puheen perustaajuuden funktiona. Analyysivaiheen oleellisin ja samalla myös selvästi haastavin osa on selvittää luotettavasti kehyksen perustaajuusjakso (engl. pitch period), joka tarkoittaa siis soinnillisen äänteen perustaajuutta. Tämän lisäksi pitää tunnistaa eri perustaajuusjaksojen rajakohdat (engl. pitch mark). PSOLA-algoritmilla aikaskaalatun puheen laatu riippuu oleellisesti kuinka hyvin perustaajuus ja perustaajuusjaksojen rajat onnistutaan tunnistamaan. Perustaajuusjaksojen rajojen perusteella määritellään kehyksien keskikohdat. Luonnollisesti perustaajuuksien paikat voidaan määritellä vain soinnillisille äänteille. Soinnittomat äänteet käsitellään siten, että perustaajuus pidetään vakiona kunnes tunnistetaan seuraava soinnillinen äänne. Eräs tapa tunnistaa perustaajuus on etsiä maksimaalista korrelaatiota alkuperäisen ja saman mutta eri arvoilla viivästetyn puhekehyksen välillä. Viiveen arvo jolla korrelaatio on suurin vastaa perustaajuutta. Menetelmää, jossa haetaan korrelaatiota signaalista ja saman signaalin viivästetystä versiosta kutsutaan autokorrelaatioksi. Autokorrelaatiomenetelmä on varsin yksinkertainen mutta se ei kaikissa tilanteissa onnistu ennustamaan perustaajuutta oikein. Ongelmia aiheuttaa esimerkiksi puheen amplitudin vaihtelut ja se, että perustaajuus ei kaikilla puhujilla ja kaikissa olosuhteissa välttämättä aina ole täysin säännöllinen. Edistyneempi tekniikka perustaajuuden tunnistamiseen on autokorrelaatioon perustuva Linear Predictive Coding (LPC), jossa perustaajuutta mallinnetaan Finite Impulse Response (FIR) -suodattimen avulla. LPC menetelmässä tarkasteltavaa näytettä ennustetaan edellisten näytteiden lineaarisen yhdistelmän avulla. Menetelmällä ennustetun FIRsuodattimen taajuusvasteen perusteella saadaan perustaajuus selville. Tässä työssä käytettiin LPC menetelmää PSOLA-algoritmin lähtöparametrina tarvittavan perustaajuuden ennustamiseen. Perustaajuuden tunnistamiseen on kehitetty lukuisa joukko erilaisia parannettuja algoritmeja joihin ei tässä työssä paneuduta tämän enempää. Hyvä kuvaus lukuisista eri perustaajuuden tunnistamiseen käytetyistä menetelmistä on esitetty esimerkiksi lähteessä [9]. Perustaajuuden lisäksi PSOLA-algoritmi tarvitsee myös perustaajuusjaksot. Soinnillisten äänteiden perustaajuusjaksot voidaan määritellä etsimällä kehyksen signaalin amplitudin maksimiarvoja. Perustaajuusjakson etsiminen tarkoittaa siis löydetyn perustaajuuden vaiheen synkronointia. Soinnittomille äänteille perustaajuusjaksoa ei muuteta vaan käytetään edellisen soinnillisen ääneen perustaajuusjaksoa. Tässä työssä käytettiin tällaista yksinkertaista menetelmää. Myös perustaajuusjakson tunnistamiseen on esitetty kirjallisuudessa monia monimutkaisempia, esimerkiksi kehyksen energian paikallisen maksimin etsimiseen perustuvia menetelmiä Analyysivaiheen jälkeen suoritetaan muutosvaihe. Muutokset sisältävät kehyksien määrän muuttamista toistamalla kehyksiä useampaan kertaan tai poistamalla kehyksiä. Kehyksien välisiä viiveitä ja kehyksen sisältöä voidaan myös muuttaa. Synteesivaiheessa
18 13 muutetuista kehyksistä muodostetaan uusi signaali overlap-add -menetelmällä. Yksinkertaisimmillaan synteesivaiheessa muutetut kehykset vain yhdistetään peräkkäin. 3.4 Toteutuksesta Tässä työssä toteutettiin SOLA- ja PSOLA-algoritmit lähteessä [7] esitettyjä esimerkkejä ja algoritmeja hyödyntäen. Kehitystyöhön käytettiin MATLAB-ohjelmistoa. Toteutetut algoritmit käsittelevät puhesyötteen kokonaisuudessaan yhdellä kertaa ja antavat ulostulona käyttäjän asettamalla aikaskaalauskertoimella skaalatun puhenäytteen. Näytteen käsittely tapahtuu siis eräajona, ei reaaliaikaisesti. Algoritmit toteutettiin erillisinä MATLAB-funktiona eli m-tiedostoina. Pääfunktioissa kysytään käyttäjältä aikaskaalattavan tiedoston nimi ja haluttu aikaskaalauskerroin. Kehyksen pituuksia muita algoritmin parametreja voi vaihtaa editoimalla funktion m-tiedostoa. Algoritmit soittavat ulostulon ja kirjoittavat ulostulon myös vakionimiseen tiedostoon. Varsinaista käyttöliittymää ei tämän projektin puitteissa ohjelmoitu vaan tarvittavat komennot annetaan MAT- LAB:n komentoriviltä. Pelkästään näytteenottotaajuuden muutoksella tehdyt vertailusignaalit toteutettiin MATLAB:n downsample ja upsample funktioita hyväksi käyttäen. Algoritmin toteuttaminen reaaliaikaisena esimerkiksi C++ -kielellä mahdollistaisi erilaisten aikaskaalauskertoimien ja mahdollisesti myös algoritmin muiden parametrien vaihtamisen reaaliajassa kesken näytteen toiston. Näin eri aikaskaalauskertoimien väliset erot olisivat paremmin havaittavissa ja vertailtavissa kuuntelemalla. Luonnollisesti reaaliaikainen toteutus olisi myös huomattavasti lähempänä käytännön sovellusta esimerkiksi matkapuhelimeen. Käytännön sovellus vaatisi myös helppokäyttöisemmän käyttöliittymän toteuttamisen.
19 14 4 TOTEUTUKSEN ARVIOINTI Tässä työssä toteutettuja SOLA- ja PSOLA-algoritmeja arvioitiin erilaisilla aikaskaalauskertoimien arvoilla käyttäen muutamaa erilaista puhenäytettä. Algoritmien parametreja kuten erilaisia kehyspituuksia ei vaihdeltu kuuntelutestien aikana vaan algoritmien parametreille käytettiin kehitystyön aikana hyväksi todettuja vakioarvoja. Näin saatiin vertailtavien muuttujien ja näytteiden määrä pysymään kohtuullisen pienenä ja helposti hallittavana. Vertailunäytteenä käytettiin pelkästään näytteenottotaajuutta muuttamalla aikaansaatua aikaskaalattua puhetta. Arviointikriteerinä käytettiin aikaskaalatun puheen äänen laatua. Äänen laadun arviointi suoritettiin subjektiivisesti eli kuulonvaraisesti kirjoittajan toimesta. Tulosten perusteella voidaan todeta, että SOLA-algoritmi tuottaa hyvin ymmärrettävää puhetta ja tuottaa siten selvästi havaittavissa olevan puheen laadun parannuksen pelkästään näytteenottotaajuuden muutoksella aikaansaatuun vertailusignaaliin verrattuna. SOLA aiheuttaa kuitenkin puheeseen jo varsin pienilläkin aikaskaalauskertoimilla selvästi havaittavia artefaktoja joiden johdosta puhe ei kuulosta enää luonnolliselta vaikkakin puheen sisältö on vielä täysin ymmärrettävissä. PSOLA algoritmilla saavutetaan huomattava parannus SOLA-algoritmiin verrattuna. Pienillä aikaskaalaussuhteilla ( ) PSOLA-algoritmilla aikaskaalatussa puheessa ei ole havaittavissa kovin merkittävää epäluonnollisuutta. Kirjallisuudessa esitetään, että aikatason aikaskaalausmenetelmät tuottavat tyydyttävää puheenlaatua aikaskaalauskertoimilla [7]. Tässä työssä tehtyjen havaintojen perusteella tämä vaihteluväli vaikuttaa varsin oikeaan osuvalta. Suuremmilla ja pienemmillä aikaskaalauskertoimen arvoilla aikaskaalattuun puheeseen tulee selvästi havaittavia epäluonnolliselta kuulostavia häiriöitä. Jatkossa olisi mielenkiintoista vertailla useampaa eri aikaskaalausalgoritmia tarkemmin. Kuten aikaisemmin on todettu, PSOLA-algoritmin haastavin osuus on perustaajuuden tunnistaminen. Perustaajuuden analysointiin on olemassa isoa määrä erilaisia algoritmeja. Jatkossa olisi mielenkiintoista kokeilla näiden eri perustaajuuden tunnistamiseen suunniteltujen algoritmien toimivuutta osana PSOLA-menetelmää. Puheen laadun arviointiin olisi mielenkiintoista käyttää myös objektiivisia laskennallisia puheenlaadun mittareita subjektiivisen arvioinnin lisäksi. Myös laajempien subjektiivisten kuuntelukokeiden järjestäminen isommalla määrällä puhenäytteitä mahdollistaisi aikaskaalatun puheen laadun huomattavasti perusteellisemman ja luotettavamman arvioinnin. Katta-
20 vamman puheen laadun analysointiin olisi syytä myös käyttää huomattavasti isompaa määrää erilaisia puhenäytteitä. Yksi mielenkiintoinen jatkotutkimuskohde olisi aikaskaalausmenetelmien toimivuuden erojen vertailu eri kieltä olevilla näytteillä. Algoritmien laskentatehon tarpeen arviointia olisi myös mielenkiintoista tutkia tarkemmin. Tästä tiedosta olisi hyötyä esimerkiksi mahdollisille puheen aikaskaalausmenetelmien toteutuksille kannettavissa päätelaitteissa. 15
21 16 LÄHTEET [1] Rabiner J. R., Schafer R. W., Digital Processing of Speech Signals, Prentice-Hall International, 1974, 509 sivua. [2] Oppenheim Alan V., Schafer Ronald W., Discrete-Time Signal Processing, Prentice-Hall International, 1989, 896 sivua. [3] Stiefelman Lisa J. A study of rate discrimination of time-compressed speech. Journal of the American voice I/O society. Volume 16, November 1994, sivut [4] Moulines, Eric, Carpentier Francis. Pitch-Syncronous Waveform Processing Techniques for Text-to-Speech Synthesis using Diphones, Speech Communication 9 (1990), sivut [5] Roininen, Mikko. Musiikin aikaskaalaus. Kandidaatintyö. Tampereen teknillinen yliopisto, 2008, 25 sivua. [6] Heikkinen, Ari. High quality speech coding at 8 kbit/s. Diplomityö. Tampereen teknillinen korkeakoulu. 1994, 95 sivua. [7] Verfaille, V., Arfib, D., Keiler, F., von dem Knesebeck, A. and Zölzer, U., Adaptive Digital Audio Effects, DAFX: Digital Audio Effects, Second Edition (ed U. Zölzer), John Wiley & Sons, Ltd. 2011, Chichester, UK. [8] Järvinen, Kari, Frequency and Time Domain Coding of Speech for Digital Mobile Radiocommunication,Lisensiaattityö, Tampereen Teknillinen Korkeakoulu, 1987, 80 sivua. [9] Parsons, Thomas W., Voice and Speech Processing, McGraw-Hill Book Company, 1986, 383 sivua.
T-61.246 DSP: GSM codec
T-61.246 DSP: GSM codec Agenda Johdanto Puheenmuodostus Erilaiset codecit GSM codec Kristo Lehtonen GSM codec 1 Johdanto Analogisen puheen muuttaminen digitaaliseksi Tiedon tiivistäminen pienemmäksi Vähentää
LisätiedotPuhesynteesin perusteet Luento 4: difonikonkatenaatio
Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä
LisätiedotSGN-4200 Digitaalinen audio
SGN-4200 Digitaalinen audio Luennot, kevät 2013, periodi 4 Anssi Klapuri Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2! Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot,
LisätiedotKompleksiluvut signaalin taajuusjakauman arvioinnissa
Kompleksiluvut signaalin taajuusjakauman arvioinnissa Vierailuluento IMA-kurssilla Heikki Huttunen Lehtori, TkT Signaalinkäsittely, TTY heikki.huttunen@tut.fi Department of Signal Processing Fourier-muunnos
LisätiedotPuheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM
Puheenkoodaus Olivatpa kerran iloiset serkukset PCM, DPCM ja ADPCM PCM eli pulssikoodimodulaatio Koodaa jokaisen signaalinäytteen binääriseksi (eli vain ykkösiä ja nollia sisältäväksi) luvuksi kvantisointitasolle,
LisätiedotSGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja
SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.
LisätiedotDigitaalinen audio
8003203 Digitaalinen audio Luennot, kevät 2005 Tuomas Virtanen Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2 Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot, sekä niissä
LisätiedotSpektri- ja signaalianalysaattorit
Spektri- ja signaalianalysaattorit Pyyhkäisevät spektrianalysaattorit Suora pyyhkäisevä Superheterodyne Reaaliaika-analysaattorit Suora analoginen analysaattori FFT-spektrianalysaattori DFT FFT Analysaattoreiden
LisätiedotT SKJ - TERMEJÄ
T-61140 SKJ - termit Sivu 1 / 7 T-61140 SKJ - TERMEJÄ Nimi Opnro Email Signaalinkäsittelyyn liittyviä termejä ja selityksiä Kevät 2005 Täytä lomaketta kevään aikana ja kerää mahdollisesti puuttuvia termejä
LisätiedotSGN-4200 Digitaalinen Audio Harjoitustyö-info
1 SGN-4200 Digitaalinen Audio Harjoitustyö-info 04.04.2012 Joonas Nikunen Harjoitystyö - 2 Suorittaminen ja Käytännöt Kurssin pakollinen harjoitustyö: Harjoitellaan audiosignaalinkäsittelyyn tarkoitetun
LisätiedotÅbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto
Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on
LisätiedotDynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed.) DAFX Digital Audio Effects. Wiley & Sons, 2002.
Dynamiikan hallinta Lähde: Zölzer. Digital audio signal processing. Wiley & Sons, 2008. Zölzer (ed. DAFX Digital Audio Effects. Wiley & Sons, 2002. Sisältö:! Johdanto!! Ajallinen käyttäytyminen! oteutus!
LisätiedotOrganization of (Simultaneous) Spectral Components
Organization of (Simultaneous) Spectral Components ihmiskuulo yrittää ryhmitellä ja yhdistää samasta fyysisestä lähteestä tulevat akustiset komponentit yhdistelyä tapahtuu sekä eri- että samanaikaisille
Lisätiedot3 Ikkunointi. Kuvio 1: Signaalin ikkunointi.
3 Ikkunointi Puhe ei ole stationaarinen signaali, vaan puheen ominaisuudet muuttuvat varsin nopeasti ajan myötä. Tämä on täysin luonnollinen ja hyvä asia, mutta tämä tekee sellaisten signaalinkäsittelyn
LisätiedotIntegrointialgoritmit molekyylidynamiikassa
Integrointialgoritmit molekyylidynamiikassa Markus Ovaska 28.11.2008 Esitelmän kulku MD-simulaatiot yleisesti Integrointialgoritmit: mitä integroidaan ja miten? Esimerkkejä eri algoritmeista Hyvän algoritmin
LisätiedotKorkean resoluution ja suuren kuva-alueen SAR
Korkean resoluution ja suuren kuva-alueen SAR MATINE tutkimusseminaari 17.11.2016 Risto Vehmas, Juha Jylhä, Minna Väilä, Ari Visa Tampereen teknillinen yliopisto Signaalinkäsittelyn laitos Hankkeelle myönnetty
LisätiedotLaskuharjoitus 4 ( ): Tehtävien vastauksia
TT12S1E Tietoliikenteen perusteet Metropolia/A. Koivumäki Laskuharjoitus 4 (2.10.2013): Tehtävien vastauksia 1. Tutkitaan signaalista näytteenotolla muodostettua PAM (Pulse Amplitude Modulation) -signaalia.
LisätiedotTHE audio feature: MFCC. Mel Frequency Cepstral Coefficients
THE audio feature: MFCC Mel Frequency Cepstral Coefficients Ihmiskuulo MFCC- kertoimien tarkoituksena on mallintaa ihmiskorvan toimintaa yleisellä tasolla. Näin on todettu myös tapahtuvan, sillä MFCC:t
LisätiedotFlash AD-muunnin. Ominaisuudet. +nopea -> voidaan käyttää korkeataajuuksisen signaalin muuntamiseen (GHz) +yksinkertainen
Flash AD-muunnin Koostuu vastusverkosta ja komparaattoreista. Komparaattorit vertailevat vastuksien jännitteitä referenssiin. Tilanteesta riippuen kompraattori antaa ykkösen tai nollan ja näistä kootaan
LisätiedotJohdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka. Vfo135 ja Vfp124 Martti Vainio
Johdanto tieto- viestintäteknologian käyttöön: Äänitystekniikka Vfo135 ja Vfp124 Martti Vainio Akustiikka Äänityksen tarkoitus on taltioida paras mahdo!inen signaali! Tärkeimpinä kolme akustista muuttujaa:
LisätiedotTL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen
TL5503 DSK, laboraatiot (1.5 op) Suodatus 2 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op), K2005 1 Suorita oheisten ohjeiden mukaiset tehtävät Matlab-ohjelmistoa käyttäen. Kokoa erilliseen
LisätiedotDigitaalinen signaalinkäsittely Johdanto, näytteistys
Digitaalinen signaalinkäsittely Johdanto, näytteistys Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen, Signaalinkäsittelyn
LisätiedotRYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN
ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN ARVIOINNISSA Seppo Uosukainen, Jukka Tanttari, Heikki Isomoisio, Esa Nousiainen, Ville Veijanen, Virpi Hankaniemi VTT PL, 44 VTT etunimi.sukunimi@vtt.fi Wärtsilä Finland Oy
LisätiedotPianon äänten parametrinen synteesi
Pianon äänten parametrinen synteesi Jukka Rauhala Pianon akustiikkaa Kuinka ääni syntyy Sisält ltö Pianon ääneen liittyviä ilmiöitä Pianon äänen synteesi Ääniesimerkkejä Akustiikan ja äänenkäsittelytekniikan
LisätiedotSGN-1200 Signaalinkäsittelyn menetelmät, Tentti
SG-1200 Signaalinkäsittelyn menetelmät, Tentti 24.4.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle
LisätiedotLaskuharjoitus 2 ( ): Tehtävien vastauksia
TT12S1E Tietoliikenteen perusteet Metropolia/A. Koivumäki Laskuharjoitus 2 (11.9.2013): Tehtävien vastauksia 1. Eräässä kuvitteellisessa radioverkossa yhdessä radiokanavassa voi olla menossa samanaikaisesti
LisätiedotMediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin
Mediaanisuodattimet Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että niiden ominaisuudet tunnetaan hyvin niiden analysointiin on olemassa vakiintuneita menetelmiä
LisätiedotKuulohavainnon perusteet
Kuulohavainnon ärsyke on ääni - mitä ääni on? Kuulohavainnon perusteet - Ääni on ilmanpaineen nopeaa vaihtelua: Tai veden tms. Markku Kilpeläinen Käyttäytymistieteiden laitos, Helsingin yliopisto Värähtelevä
Lisätiedot1 PID-taajuusvastesuunnittelun esimerkki
Enso Ikonen, Oulun yliopisto, systeemitekniikan laboratorio 2/23 Säätöjärjestelmien suunnittelu 23 PID-taajuusvastesuunnittelun esimerkki Tehtävänä on suunnitella säätö prosessille ( ) = = ( +)( 2 + )
LisätiedotAlgebralliset menetelmät virheenkorjauskoodin tunnistamisessa
Algebralliset menetelmät virheenkorjauskoodin tunnistamisessa Jyrki Lahtonen, Anni Hakanen, Taneli Lehtilä, Toni Hotanen, Teemu Pirttimäki, Antti Peltola Turun yliopisto MATINE-tutkimusseminaari, 16.11.2017
LisätiedotTietoliikennesignaalit & spektri
Tietoliikennesignaalit & spektri 1 Tietoliikenne = informaation siirtoa sähköisiä signaaleja käyttäen. Signaali = vaihteleva jännite (tms.), jonka vaihteluun on sisällytetty informaatiota. Signaalin ominaisuuksia
LisätiedotSGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen
SGN- Signaalinkäsittelyn perusteet Välikoe.5.4 Heikki Huttunen Tentissä ja välikokeessa saa käyttää vain tiedekunnan laskinta. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla -3 on. Sivuilla 4-5 on. Sivulla
Lisätiedot6. Analogisen signaalin liittäminen mikroprosessoriin 2 6.1 Näytteenotto analogisesta signaalista 2 6.2. DA-muuntimet 4
Datamuuntimet 1 Pekka antala 19.11.2012 Datamuuntimet 6. Analogisen signaalin liittäminen mikroprosessoriin 2 6.1 Näytteenotto analogisesta signaalista 2 6.2. DA-muuntimet 4 7. AD-muuntimet 5 7.1 Analoginen
LisätiedotSGN-1200 Signaalinkäsittelyn menetelmät, Tentti
SG-1200 Signaalinkäsittelyn menetelmät, Tentti 21.3.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle
LisätiedotPuheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä
Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...
LisätiedotSGN Signaalinkäsittelyn perusteet Välikoe Heikki Huttunen
SGN-11 Signaalinkäsittelyn perusteet Välikoe 3.5.16 Heikki Huttunen Laskimen käyttö sallittu. Muiden materiaalien käyttö ei sallittu. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla 1-3 on. Sivuilla 4-5
LisätiedotS-108.3020 Elektroniikan häiriökysymykset. Laboratoriotyö, kevät 2010
1/7 S-108.3020 Elektroniikan häiriökysymykset Laboratoriotyö, kevät 2010 Häiriöiden kytkeytyminen yhteisen impedanssin kautta lämpötilasäätimessä Viimeksi päivitetty 25.2.2010 / MO 2/7 Johdanto Sähköisiä
LisätiedotSignaalien generointi
Signaalinkäsittelyssä joudutaan usein generoimaan erilaisia signaaleja keinotekoisesti. Tyypillisimpiä generoitavia aaltomuotoja ovat eritaajuiset sinimuotoiset signaalit (modulointi) sekä normaalijakautunut
LisätiedotTL5503 DSK, laboraatiot (1.5 op) Suodatus 1 (ver 1.0) Jyrki Laitinen
TL5503 DSK, laboraatiot (1.5 op) Suodatus 1 (ver 1.0) Jyrki Laitinen TL5503 DSK, laboraatiot (1.5 op), K2005 1 Suorita oheisten ohjeiden mukaiset tehtävät Matlab-ohjelmistoa käyttäen. Kokoa erilliseen
LisätiedotSimulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen
Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen 16.06.2014 Ohjaaja: Urho Honkanen Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston
LisätiedotVirheen kasautumislaki
Virheen kasautumislaki Yleensä tutkittava suure f saadaan välillisesti mitattavista parametreistä. Tällöin kokonaisvirhe f määräytyy mitattujen parametrien virheiden perusteella virheen kasautumislain
LisätiedotHarjoitus 6: Simulink - Säätöteoria. Syksy 2006. Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1
Harjoitus 6: Simulink - Säätöteoria Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen säätötekniikkaan Takaisinkytkennän
LisätiedotDigitaalinen signaalinkäsittely Kuvankäsittely
Digitaalinen signaalinkäsittely Kuvankäsittely Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen, Signaalinkäsittelyn menetelmät,
LisätiedotAV-muotojen migraatiotyöpaja - ääni. KDK-pitkäaikaissäilytys 2013 -seminaari 6.5.2013 / Juha Lehtonen
AV-muotojen migraatiotyöpaja - ääni KDK-pitkäaikaissäilytys 2013 -seminaari 6.5.2013 / Juha Lehtonen Äänimuodot Ääneen vaikuttavia asioita Taajuudet Äänen voimakkuus Kanavien määrä Näytteistys Bittisyvyys
Lisätiedot5 Akustiikan peruskäsitteitä
Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen
LisätiedotSäätötekniikan ja signaalinkäsittelyn työkurssi
Säätötekniikan ja signaalinkäsittelyn työkurssi Työ D102: Sinimuotoisen signaalin suodattaminen 0.4 op. Julius Luukko Lappeenrannan teknillinen yliopisto Sähkötekniikan osasto/säätötekniikan laboratorio
LisätiedotSay it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn
LisätiedotToinen harjoitustyö. ASCII-grafiikkaa
Toinen harjoitustyö ASCII-grafiikkaa Yleistä Tehtävä: tee Javalla ASCII-merkkeinä esitettyä grafiikkaa käsittelevä ASCIIArt-ohjelma omia operaatioita ja taulukoita käyttäen. Työ tehdään pääosin itse. Ideoita
LisätiedotMS-C1340 Lineaarialgebra ja
MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Matriisinormi, häiriöalttius Riikka Kangaslampi Kevät 2017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Matriisinormi Matriisinormi Matriiseille
LisätiedotKanavat 61-69 eivät ole enää pelkästään broadcasting käytössä Uudet palvelut kuten teräväpiirtolähetykset vaativat enemmän kapasiteettia
DVB-T2 standardi valmis Mitä vaikutuksia alan toimintaan? Antennialan tekniikkapäivä 12.11.2009 Kari Risberg Tekninen Johtaja, Digita NorDig T2 ryhmän puheenjohtaja Kari Risberg Miksi DVB-T2 standardi?
LisätiedotKohti uuden sukupolven digitaalipianoja
Kohti uuden sukupolven digitaalipianoja Heidi-Maria Lehtonen, DI Aalto-yliopiston teknillinen korkeakoulu Signaalinkäsittelyn ja akustiikan laitos Esitys RISS:n kokouksessa 17.11.2010 Esityksen sisältö
LisätiedotSGN-1200 Signaalinkäsittelyn menetelmät, Tentti
SG-1200 Signaalinkäsittelyn menetelmät, Tentti 30.1.2006 Kirjoita nimesi ja opiskelijanumerosi jokaiseen paperiin. Vastauspaperit tullaan irrottamaan toisistaan. Jos tila ei riitä, jatka kääntöpuolelle
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
LisätiedotSuccessive approximation AD-muunnin
AD-muunnin Koostuu neljästä osasta: näytteenotto- ja pitopiiristä, (sample and hold S/H) komparaattorista, digitaali-analogiamuuntimesta (DAC) ja siirtorekisteristä. (successive approximation register
LisätiedotLiikehavaintojen estimointi langattomissa lähiverkoissa. Diplomityöseminaari Jukka Ahola
Liikehavaintojen estimointi langattomissa lähiverkoissa Diplomityöseminaari Jukka Ahola ESITYKSEN SISÄLTÖ Työn tausta Tavoitteen asettelu Johdanto Liikehavaintojen jakaminen langattomassa mesh-verkossa
LisätiedotSisältö. Työn lähtökohta ja tavoitteet Lyhyt kertaus prosessista Käytetyt menetelmät Työn kulku Tulokset Ongelmat ja jatkokehitys
Loppuraportti Sisältö Työn lähtökohta ja tavoitteet Lyhyt kertaus prosessista Käytetyt menetelmät Työn kulku Tulokset Ongelmat ja jatkokehitys Työn lähtökohta ja tavoitteet Voimalaitoskattiloiden tulipesässä
LisätiedotTehtävä 2: Tietoliikenneprotokolla
Tehtävä 2: Tietoliikenneprotokolla Johdanto Tarkastellaan tilannetta, jossa tietokone A lähettää datapaketteja tietokoneelle tiedonsiirtovirheille alttiin kanavan kautta. Datapaketit ovat biteistä eli
LisätiedotS-114.2720 Havaitseminen ja toiminta
S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi
LisätiedotMATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI
I MATTI SIRONEN PUHEEN PERUSTAAJUUDEN ESTIMOINTI Kandidaatintyö Tarkastaja: Konsta Koppinen II TIIVISTELMÄ TAMPEREEN TEKNILLINEN YLIOPISTO Tietotekniikan koulutusohjelma SIRONEN, MATTI: Puheen perustaajuuden
LisätiedotS-114.3812 Laskennallinen Neurotiede
S-114.381 Laskennallinen Neurotiede Projektityö 30.1.007 Heikki Hyyti 60451P Tehtävä 1: Virityskäyrästön laskeminen Luokitellaan neuroni ensin sen mukaan, miten se vastaa sinimuotoisiin syötteisiin. Syöte
LisätiedotMatlab-tietokoneharjoitus
Matlab-tietokoneharjoitus Tämän harjoituksen tavoitteena on: Opettaa yksinkertaisia piirikaavio- ja yksikkömuunnoslaskuja. Opettaa Matlabin perustyökaluja mittausten analysoimiseen. Havainnollistaa näytteenottotaajuuden,
LisätiedotMitä on konvoluutio? Tutustu kuvankäsittelyyn
Mitä on konvoluutio? Tutustu kuvankäsittelyyn Tieteenpäivät 2015, Työohje Sami Varjo Johdanto Digitaalinen signaalienkäsittely on tullut osaksi arkipäiväämme niin, ettemme yleensä edes huomaa sen olemassa
Lisätiedothavainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä
FYSP0 / K3 DOPPLERIN ILMIÖ Työn tavoitteita havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä harjoitella mittausarvojen poimimista Capstonen kuvaajalta sekä kerrata maksimiminimi
LisätiedotTiedonkeruu ja analysointi
Tiedonkeruu ja analysointi ViDRoM Virtual Design of Rotating Machines Raine Viitala 30.9.2015 ViDRoM Virtual Design of Rotating Machines Mitataan dynaamista käyttäytymistä -> nopeuden funktiona Puhtaat
LisätiedotSanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa
Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
LisätiedotKohina. Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N)
Kohina Havaittujen fotonien statistinen virhe on kääntäen verrannollinen havaittujen fotonien lukumäärän N neliö juureen ( T 1/ N) N on suoraan verrannollinen integraatioaikaan t ja havaittuun taajuusväliin
LisätiedotNumeeriset menetelmät
Numeeriset menetelmät Luento 13 Ti 18.10.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 13 Ti 18.10.2011 p. 1/43 p. 1/43 Nopeat Fourier-muunnokset Fourier-sarja: Jaksollisen funktion esitys
LisätiedotSIGNAALITEORIAN KERTAUSTA 1
SIGNAALITEORIAN KERTAUSTA 1 1 (26) Fourier-muunnos ja jatkuva spektri Spektri taajuuden funktiona on kompleksiarvoinen funktio, jonka esittäminen graafisesti edellyttää 3D-kuvaajan piirtämisen. Yleensä
LisätiedotMonikanavaäänen perusteet. Tero Koski
Monikanavaäänen perusteet Tero Koski Lähtökohdat Monikanavaääni tarkoi6aa äänital8ota, jossa on toiste6avia kanavia enemmän kuin kaksi 2.1 ; 3.0 ; 3.1 ; 4.0 ; 4.1 ; 7.2 ; 10.2 ; 22.2 ; Monikanavaääntä
Lisätiedot1 Vastaa seuraaviin. b) Taajuusvasteen
Vastaa seuraaviin a) Miten määritetään digitaalisen suodattimen taajuusvaste sekä amplitudi- ja vaihespektri? Tässä riittää sanallinen kuvaus. b) Miten viivästys vaikuttaa signaalin amplitudi- ja vaihespektriin?
LisätiedotVarauspumppu-PLL. Taulukko 1: ulostulot sisääntulojen funktiona
Varauspumppu-PLL Vaihevertailija vertaa kelloreunoja aikatasossa. Jos sisääntulo A:n taajuus on korkeampi tai vaihe edellä verrattuna sisääntulo B:hen, ulostulo A on ylhäällä ja ulostulo B alhaalla ja
LisätiedotSGN-1251 Signaalinkäsittelyn sovellukset Välikoe Heikki Huttunen
SGN-5 Signaalinkäsittelyn sovellukset Välikoe.. Heikki Huttunen Tentissä ja välikokeessa saa käyttää vain tiedekunnan laskinta. Tenttikysymyksiä ei tarvitse palauttaa. Sivuilla - on. Sivuilla 4-6 on. Vastaa
LisätiedotAlgoritmit 2. Luento 13 Ti Timo Männikkö
Algoritmit 2 Luento 13 Ti 30.4.2019 Timo Männikkö Luento 13 Simuloitu jäähdytys Merkkijonon sovitus Horspoolin algoritmi Ositus ja rekursio Rekursion toteutus Algoritmit 2 Kevät 2019 Luento 13 Ti 30.4.2019
LisätiedotS09 04 Kohteiden tunnistaminen 3D datasta
AS 0.3200 Automaatio ja systeemitekniikan projektityöt S09 04 Kohteiden tunnistaminen 3D datasta Loppuraportti 22.5.2009 Akseli Korhonen 1. Projektin esittely Projektin tavoitteena oli algoritmin kehittäminen
Lisätiedot8003051 Puheenkäsittelyn menetelmät
8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
LisätiedotVideotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi
Videotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi - Android 4.3 Jelly Bean ja 4.4 Kitkat käyttöjärjestelmien videotoiston suorituskyvyn vertailu Nexus 7 tabletilla
LisätiedotJoonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen
Hävittäjälentokoneen reitin suunnittelussa käytettävän dynaamisen ja monitavoitteisen verkko-optimointitehtävän ratkaiseminen A*-algoritmilla (valmiin työn esittely) Joonas Haapala 8.6.2015 Ohjaaja: DI
LisätiedotAlgoritmit 1. Luento 3 Ti Timo Männikkö
Algoritmit 1 Luento 3 Ti 17.1.2017 Timo Männikkö Luento 3 Algoritmin analysointi Rekursio Lomituslajittelu Aikavaativuus Tietorakenteet Pino Algoritmit 1 Kevät 2017 Luento 3 Ti 17.1.2017 2/27 Algoritmien
Lisätiedotscreenforce.fi 1
12.2.2019 screenforce.fi 1 AGENDA 9.00-9.15 Mitä on hyvä TV mainonta? Anna Lujanen, Screenforce 9.15-9.30 TV nyt ja tulevaisuudessa - Tina Åström, Sanoma 9.30 9.50 Katselun eri mielentilat - Anna Porvari,
LisätiedotPuhesynteesin perusteet Luento 5: unit selection -synteesi
Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen
LisätiedotSignaalien datamuunnokset. Digitaalitekniikan edut
Signaalien datamuunnokset Datamuunnosten teoriaa Muunnosten taustaa Muunnosten teoriaa Muunnosten rajoituksia ja ongelmia Petri Kärhä 09/02/2009 Signaalien datamuunnokset 1 Digitaalitekniikan edut Tarkoituksena
LisätiedotSignaalien datamuunnokset
Signaalien datamuunnokset Datamuunnosten teoriaa Muunnosten taustaa Muunnosten teoriaa Muunnosten rajoituksia ja ongelmia Petri Kärhä 06/02/2004 Luento 4a: Signaalien datamuunnokset 1 Digitaalitekniikan
LisätiedotOngelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?
Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? 2012-2013 Lasse Lensu 2 Ongelma 2: Voidaanko dataa tai informaatiota tallettaa tiiviimpään tilaan koodaamalla se uudelleen? 2012-2013 Lasse
LisätiedotOhjelmistoradio. Mikä se on:
1 Mikä se on: SDR = Software Defined Radio radio, jossa ohjelmisto määrittelee toiminnot ja ominaisuudet: otaajuusalue olähetelajit (modulaatio) olähetysteho etuna joustavuus, jota tarvitaan sovelluksissa,
LisätiedotTiistai klo 10-12 Jari Eerola 20.1.2015
Tiistai klo 10-12 Jari Eerola 20.1.2015 } 20.1. Kuvaajatyypit ja ohjelmat Analyysiohjelmista Praat ja Sonic Visualiser Audacity } 27.1. Nuotinnusohjelmista Nuotinnusohjelmista Musescore } Tietokoneavusteinen
LisätiedotSignaalien datamuunnokset. Näytteenotto ja pito -piirit
Signaalien datamuunnokset Muunnoskomponentit Näytteenotto ja pitopiirit Multiplekserit A/D-muuntimet Jännitereferenssit D/A-muuntimet Petri Kärhä 26/02/2008 Signaalien datamuunnokset 1 Näytteenotto ja
LisätiedotMono- ja stereoääni Stereoääni
1 Mitä ääni on? Olet ehkä kuulut puhuttavan ääniaalloista, jotka etenevät ilmassa näkymättöminä. Ääniaallot käyttäytyvät meren aaltojen tapaan. On suurempia aaltoja, jotka ovat voimakkaampia kuin pienet
LisätiedotAlgoritmit 1. Luento 10 Ke Timo Männikkö
Algoritmit 1 Luento 10 Ke 14.2.2018 Timo Männikkö Luento 10 Algoritminen ongelmanratkaisu Suunnittelumenetelmät Raaka voima Järjestäminen eli lajittelu Kuplalajittelu Lisäyslajittelu Valintalajittelu Permutaatiot
LisätiedotSGN-1200 Signaalinkäsittelyn menetelmät Välikoe
SGN-100 Signaalinkäsittelyn menetelmät Välikoe 6.4.010 Sivuilla 1- on. Älä vastaa siihen, jos et ollut ensimmäisessä välikokeessa. Tentin kysymykset ovat sivuilla 3-4. Vastaa vain jompaan kumpaan kokeeseen,
LisätiedotVasteaika. Vasteaikaa koskeva ohje ei ole juuri muuttunut Robert B. Millerin vuonna 1968 pitämästä esityksestä:
Nielsen: "Olen tutkinut Webin käytettävyyttä vuodesta 1994, ja jokaisessa tutkimuksessa esiin on noussut sama asia: käyttäjät haluaisivat sivujen latautuvan nopeammin. Aluksi olin sitä mieltä, että käyttäjät
Lisätiedot5 Lineaarinen ennustus
5 Lineaarinen ennustus Lineaarinen ennustus (linear prediction, LP) on yksi tärkeimmistä puheenkäsittelyn työkaluista Sitä voidaan eri tilanteessa käyttää eri tavoilla, mutta puheenkäsittelyn kannalta
LisätiedotAjalliset muunnokset eksploratiivisen paikkatietoanalyysin työkaluna. Salla Multimäki ProGIS Ry Paikkatietomarkkinat
Ajalliset muunnokset eksploratiivisen paikkatietoanalyysin työkaluna Salla Multimäki ProGIS Ry Paikkatietomarkkinat 7.11.2017 Informaatiokuorma kognitiivinen kuorma - ylikuormitus Information load muodostuu
LisätiedotTuntematon järjestelmä. Adaptiivinen suodatin
1 1 Vastaa lyhyesti seuraaviin a) Miksi signaaleja ylinäytteistetään AD- ja DA-muunnosten yhteydessä? b) Esittele lohkokaaviona adaptiiviseen suodatukseen perustuva tuntemattoman järjestelmän mallinnus.
LisätiedotLaskennallinen menetelmä puun biomassan ja oksien kokojakauman määrittämiseen laserkeilausdatasta
Laskennallinen menetelmä puun biomassan ja oksien kokojakauman määrittämiseen laserkeilausdatasta Pasi Raumonen, Mikko Kaasalainen ja Markku Åkerblom Tampereen teknillinen ylipisto, Matematiikan laitos
LisätiedotVideon tallentaminen Virtual Mapista
Videon tallentaminen Virtual Mapista Kamera-ajon tekeminen Karkean kamera ajon teko onnistuu nopeammin Katseluohjelmassa (Navigointi > Näkymät > Tallenna polku). Liikeradan ja nopeuden tarkka hallinta
LisätiedotLuku 8. Aluekyselyt. 8.1 Summataulukko
Luku 8 Aluekyselyt Aluekysely on tiettyä taulukon väliä koskeva kysely. Tyypillisiä aluekyselyitä ovat, mikä on taulukon välin lukujen summa tai pienin luku välillä. Esimerkiksi seuraavassa taulukossa
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
Lisätiedot