Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto
Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on ilmainen puheanalyysiohjelma, joka on laajassa käytössä. Vapaasti ladattavissa osoitteesta http://www.praat.org Toimii melkein missä käyttöjärjestelmässä tahansa, tiedostot myös yhteensopivia. Helppo asentaa (ei vaadi ylläpitäjän oikeuksia) ja kaatuu harvoin. Avoimen lähdekoodin ohjelma. Hyvin tuettu: ohjelmapäivityksiä ainakin noin kerran kuukaudessa ohjelman sisällä manuaali, josta voi hakea ohjeita ja lisätietoja käyttäjille tarkoitettu keskustelupalsta: http://uk.groups.yahoo.com/group/praat-users/ suomenkielinen Praat-opas: http://www.helsinki.fi/puhetieteet/atk/praat/
Praat-puheanalyysiohjelma Millaista puheaineistoa Praatilla voi tutkia? Äänitystilanteessa huomioitavaa Tietokoneella tehtävää analyysia varten tarvitaan digitaalinen ääninäyte (äänitiedosto). Akustisia analyyseja silmälläpitäen on kiinnitettävä huomiota äänitys- ja tallennusolosuhteisiin: mahdollisimman hälytön ja kaiuton tila hyvä mikrofoni (miel. kondensaattorimikrofoni), joka on asetettu oikein ja pysyy mahdollisimman paikallaan puhujaan nähden riittävä näytteenottotaajuus ja näytteen koko (mieluiten väh. 22050 Hz ja 16 bit)
Praat-puheanalyysiohjelma Millaista puheaineistoa Praatilla voi tutkia? Äänitystilanteessa huomioitavaa Useiden ihmisten tuottamaa päällekkäistä puhetta tai melulähteitä ei nykymenetelmillä ole mahdollista jälkikäteen erotella tai poistaa äänitteestä. Heikkolaatuinen tietokoneen äänikortti tai -piiri saattaa pilata äänitteen digitointivaiheessa eli siinä vaiheessa, kun äänitystä tehdään kyseisellä koneella tai kun ääntä siirretään toiselta laitteelta tietokoneen analogista linja- tai mikrofonisisääntuloa käyttäen. Kun äänitiedosto on kerran digitoitu ja tallennettu riittävän hyvälaatuisena, sitä voi tutkia minkätasoisella tietokoneella tahansa.
Praat-puheanalyysiohjelma Millaista puheaineistoa Praatilla voi tutkia? Millaisia äänitiedostoja Praatilla voi käsitellä? Turvallisimpia äänitiedostoformaatteja ovat AIFF ja WAV (pakkaamattomia, laajasti yhteensopivia). Praatilla voi lukea myös MP3-äänitiedostoja, mutta MP3-muodossa ei voi tallentaa (koska MP3 ei ole avoimen lähdekoodin formaatti). Häviöllisesti pakatut äänitiedostot (kuten MP3) eivät kuitenkaan sovellu puheen akustiseen tutkimukseen! Jos välttämättä tarvitaan äänen pakkausta, voi käyttää FLAC-muotoa.
Puheen akustinen kuvantaminen Äänilähde-suodinmalli Äänilähde ja suodin puheentuoton mallina äänilähde: äänihuulten tuottama värähtely (kaikki soinnilliset äänteet) ja/tai ylempänä ääntöväylässä syntynyt (frikaatio)häly (monet konsonantit) suodin: matemaattinen malli, joka kuvaa ääntöväylän muodosta johtuvia resonansseja ( äänen spektristä tietyllä ajanhetkellä havaittavat formantit) Puheen akustisilla analyyseilla yritetään tavallisesti takaperin päätellä jotakin joko äänilähteen toiminnasta taikka ääntöväylän muodosta.
Puheen akustinen kuvantaminen Äänen aaltomuoto Äänen aaltomuoto Äänen aaltomuoto kuvaa ilmanpainevaihteluja, jotka on mikrofonin avulla rekisteröity ja muunnettu sähköisiksi jännitemuutoksiksi. s i k A sika 0 0.543084 Time (s) Figure: Aaltomuotokäyrä ja äännesegmenttien rajat naispuhujan tuottamasta sanasta sika.
Figure: Lyhytaikaisspektri vokaalista [A] (vasemmalla) sekä konsonantista [s] sanassa sika. Äänen spektri vs. äänen havaittu väri Puheääni on kompleksista l. se sisältää monentaajuisia värähtelyjä samanaikaisesti (osasävelet, spektri). Äänen spektrirakenne vaikuttaa äänen värin havaintoon. Lyhytaikaisspektrin ulkonäköön vaikuttaa, kuinka pitkästä pätkästä ääntä se on laskettu. 20 Sound pressure level (db/hz) 20 0 Sound pressure level (db/hz) 0 20 20 0 7000 Frequency (Hz) 0 7000 Frequency (Hz)
Spektrogrammi: spektriesitys ajan suhteen Spektrogrammi koostuu oikeastaan lyhytaikaisspektreistä, joita on laskettu osittain päällekkäisistä aikaikkunoista. 5000 Hz Osasävelen taajuus s i k A 0 Hz sika 0 0.543084 Time (s) Figure: Spektrogrammi ja äännesegmenttien rajat naispuhujan tuottamasta sanasta sika.
Äänen perustaajuus (Pitch) Perustaajuusanalyysin minimi- ja maksimitaajuus on säädettävä puhujakohtaisesti. Perustaajuutta ei näy soinnittomien äänteiden kohdalla. Väärät asetukset tai puhujan epämodaalinen äänenlaatu (esim. narina) voivat aiheuttaa oktaavihyppyjä tai perustaajuuskäyrän ylimääräisen katkoksen. 400 Hz Perustaajuus eli F0 miten kehittyvät supervaltojen suhteet 100 Hz Miten kehittyvät supervaltojen suhteet? 0 2.16109 Time (s) Figure: Praat-ohjelmalla piirretty perustaajuus- eli F0-käyrä.
Puheen akustinen kuvantaminen Patologisen äänen tutkiminen Praatilla Patologisen äänen tutkiminen Praatilla jitter shimmer HNR (Harmonicity) voice breaks Voice report Perustaajuusanalyysin asetusten kanssa on oltava huolellinen! Vertailukelpoisuus esim. MDVP:n kanssa: ks. Praatin sisäinen manuaali, sivu Voice
Viitteet Boersma, P. and Weenink, D. (2010). Praat: doing phonetics by computer (Version 5.2.03). [Computer program]. <http://www.praat.org/>.