4 Fonetiikkaa Puhe on kaiken kaikkiaan hyvin monitasoinen ja monimutkainen inhimillinen ja fysikaalinen ilmiö, sisältäen kysymyksiä liittyen mm. kognitioon, kieleen, fysiologiaan, kuuloon ja akustiikkaan. Fonetiikka tarkoittaa yleisesti puheen tutkimusta, joka sisältää piirteitä edellisistä tieteenaloista. Puheenkäsittelyn kannalta joudumme toistaiseksi keskittymään puheen alempiin tasoihin, joissa kysytään esimerkiksi: Millaisia erilaisia äänteitä on olemassa? Mikä on perustaajuus/mitkä ovat formantit tietyllä hetkellä? Miten puhetta kannattaa koodata? Mitä foneemeja tietyssä puhejaksossa esiintyy? Näiden ja muiden kysymysten selvittämiseksi tarvitaan fonetiikan perustietoja siitä, millainen signaali puhe oikeastaan on. Suuri osa puheen akustisista ominaisuuksista juontaa juurensa ihmisen puheentuottojärjestelmän ominaisuuksiin. Siksi tämän järjestelmän toiminta katsotaan ensin läpi, ja sen jälkeen sitä pyritään mallintamaan. Puhe-elimet Hyviä kuvioita liittyen oheiseen tekstiin löytyy osoitteesta http://www.opiskelijakirjasto.lib.helsinki.fi/fonterm/006.htm Akustisesti puhe on ilmanpaineen vaihtelua, jonka voimanlähteenä on keuhkoissa oleva tiivistetty ilma. Sisäänhengityksessä pallea ja kylkivälilihakset jännittyvät, jolloin rintakehä laajenee ja keuhkoihin syntyy alipaine ja ilmaa virtaa niihin. Uloshengityksen aikana lihakset rentoutuvat, jolloin rintakehä supistuu, ja ilmaa virtaa ulos keuhkojen ylipaineesta johtuen. Puhetta esiintyy lähes yksinomaan uloshengityksen aikana. Kannattaa pitää mielessä, että puhe-elimet (keuhkot, kieli, äänihuulet, yms.) ovat alun perin kehittyneet mahdollistamaan ihmisen muita toimintoja, lähinnä hengityksen ja syömisen, ja ovat vasta myöhemmin adaptoituneet myös puheen tuottamiseen. Kurkunpää on kehittynyt elin, jonka tarkoituksena puheentuoton kannalta on muuttaa keuhkoista lähtevä ilmavirta jaksolliseksi paineenvaihteluksi. Kurkunpää muodostuu seuraavista osista: kilpirusto (aataminomena), äänihuulet ja kannurustot. Äänihuulten välissä olevaa rakoa nimitetään ääniraoksi eli glottikseksi ja se muodostuu huuliraosta (äänihuulten välissä) ja rustoraosta (kannurustojen välissä). Ihminen pystyy säätelemään monipuolisesti ääniraon muotoa kurkunpään lihaksilla. Ääntöväylällä tarkoitetaan yleensä puhe-elimiä kurkunpään jälkeen. Nämä jakautuvat seuraaviin alueisiin: nieluontelo, nenäontelo ja suuontelo. Tärkeimmät puhe-elimet ääntöväylässä ovat kieli, kitapurje, alaleuka ja huulet. Kieli on puheentuoton tärkein elin: sen eri asennot määräävät suurimman osan äänteistä. Kitapurje on lihas, jonka avulla voidaan erottaa nieluontelo nenäontelosta. Ohessa lyhyt suomi-englanti-termistö aiheesta: alveolar ridge hammasvalli arytenoid cartilage kannurusto bronchus keuhkoputki cartilage rusto cricoid cartilage rengasrusto diaphragm pallea 16
epiglottis kurkunkansi false vocal folds taskuhuulet glottis äänirako hyoid bone kieliluu larynx kurkunpää lungs keuhkot nasal cavity nenäontelo palate kitalaki thyroid cartilage kilpirusto tongue kieli trachea henkitorvi vocal folds äänihuulet vocal tract ääntöväylä oral pharynx, pharyngeal cavity nieluontelo pharynx nielu uvula kitakieleke velum, soft palate kitapurje Puheentuotto Puhetta muodostuu, kun keuhkoista lähtevä ilmavirta kulkee äänihuulten ohi ja moduloituu ääntöväylässä. Ääniraosta (glottis) lähtevä ääni voidaan tulkita herätteeksi, jonka ääntöväylä suodattaa. Ilmavirtaus sinänsä on äänetöntä, joten äänteet muodostetaan tavalla tai toisella aiheuttamalla muutoksia keuhkoista lähtevään ilmaan. Tärkeimmät mekanismit ovat äänihuulten värähtely, joka aiheuttaa jaksollisen herätteen, kapeikon muodostaminen ääntöväylään, mikä aiheuttaa kohinaisen herätteen, sekä ääntöväylän sulkeminen kokonaan jostain kohdasta ja tämän jälkeen tapahtuva sulkeuman poistaminen, mikä aiheuttaa impulssimaisen herätteen. Seuraavassa luetellaan erilaiset kurkunpäässä syntyvät herätteet: fonaatio tärkein herätetyyppi, joka muodostuu äänihuulten säännöllisestä värähtelystä. Glottis aukenee ja sulkeutuu jaksollisesti, mikä aiheuttaa ilmavirran paloittelun, tyypillisesti n. 50-500 Hz taajuudella, puhujasta riippuen. Yhtä auki-kiinni jaksoa sanotaan värähdykseksi, ja sen kesto määrää äänen perustaajuuden. Äänteitä, joissa äänihuulet värähtelevät, sanotaan soinnillisiksi (esim. vokaalit ja resonanttiäänteet). 17
Kuvio 1: Ääniväylän puhe-elimet (T.W. Parsons, Voice and Speech Processing, McGraw-Hill, Inc., 1987. s. 63). hengitys normaalin hengityksen aikana (ilman puhetta) glottis on täysin auki. soinnittomat äänteet näissä äänteissä äänirako on (enemmän tai vähemmän) auki, ja äänihuulet eivät värähtele. kuiskaus kuiskauksen aikana huulirako on kiinni ja rustorako auki, jolloin muodostuu hankaushälyä (friction). Modulointi muuttaa (suodattaa) herätteen tavalla, joka riippuu puhe-elinten asennosta. Kunkin äänteen aikana ääntöväylällä on tyypillinen äänteestä riippuva muoto, jota voidaan mallintaa akustisena putkena. Tällä putkella on muotonsa johdosta tietyt resonanssitaajuudet, joiden johdosta äänteen spektrissä on havaittavissa vahvistuneita osavärähtelyalueita eli formantteja. Formantit ovat tärkein seuraus ääniväylän moduloinnista; niiden avulla voidaan luokitella kaikki vokaalit sekä osa konsonanteista. Alla on selitetty tämän kurssin jatkon kannalta oleellisimmat perustiedot siitä, miten puhe-elimet tuottavat tietyn äänteen ja millaisia akustisia ominaisuuksia äänteellä tästä konfiguraatiosta johtuen on. Artikulatorinen fonetiikka tutkii, millä tavalla puhe-elimet sijoittuvat tietyn äänteen aikaansaami- 18
Kuvio 2: Äänihuulten asento eri äännetyypeissä. seksi. Akustisessa fonetiikassa tutkitaan akustisen aallon ja puhe-elinten asentojen yhteyttä, ja siihen palataan luvussa 4.2. 4.1 Artikulatorista fonetiikkaa Eräs tärkeä fonetiikan tavoite on luokitella äänteet, joita eri kielissä esiintyy. Tätä tarkoitusta varten kehitettiin vuonna 1888 International phonetic alphabet (IPA). IPA:n luokittelusta ollaan jokseenkin yksimielisiä, mutta lähinnä merkinnällisistä syistä (IPAssa käytetyttyjä symboleita ei löydy kirjoituskoneesta) käytetään muitakin foneettisia aakkostoja, mm. Arpabet. IPA-luokitus löytyy osoitteesta http://www.arts.gla.ac.uk/ipa/fullchart.html Äänteitä voidaan käsitellä foneettiselta kannalta, jolloin tarkastelu ei ole sidoksissa mihinkään tiettyyn kieleen, vaan äänteet pyritään kuvaamaan mahdollisimman täsmällisesti niiden artikuloinnin (puhe-elinten asennon) avulla. Toinen lähestymistapa on fonologinen, jossa tarkastellaan tietyssä kielessä esiintyviä eri äänteitä, erityisesti niiden äänteiden luokkaa jotka tulkitaan samaksi. Esimerkiksi [k] ja [p] ovat suomen kielessä eri äänteitä koska sanaa kala ei ymmärretä samaksi kuin sanaa pala. Sen sijaan äänteet [s] ja "suhu-[s]"(kuten esim. sanassa shekki) eivät muuta sanan merkitystä, joten ne tulkitaan suomen kielessä samaksi äänteeksi, kun taas esim. venäjän kielessä ne ovat eri äänteitä. Fonologiseen lähestymistapaan palataan äänteiden kuvauksen jälkeen. Äänteiden kuvaus Ihmisen puheentuottoelimillä saa aikaan useita erityyppisiä ääniä, mutta vain joitain näistä käytetään hyväksi puheessa. Ohessa on äänteiden käyttökelpoinen ryhmittely. Vokaalit. Kaikkien kielten äänteet jakautuvat vokaaleihin ja konsonantteihin. Vokaalit (engl. vowels) ovat soinnillisia äänteitä, joissa ääniväylä on avoin. Eri kielissä saattaa kuitenkin esiintyä tarvetta edellisen määritelmän hienosäätöön, esim. suomen kielessä vokaalit määritellään äänteiksi, joissa ääntä pääsee esteettä suun keskeltä ulos (näin päästään eroon nasaaleista [n] ja [m] sekä lateraalista [l]). Vokaalit luokitellaan seuraavien ominaisuuksien perusteella: kielen asento huulten pyöreys nasaalisuus 19
Erityisesti kielen asennossa on oleellista ääntöväylän kapeimman kohdan sijainti. Tämä voidaan esittää vokaalidiagrammin avulla, jossa on kuvallisesti esitetty kielen keskiviivan korkein kohta suussa. [i] [y] [u] [e] [ö] [o] [ä] [a] Kuvio 3: Vokaalidiagrammi, jossa on esitettynä kielen korkein kohta suomen eri vokaaleissa. Kuvio esittää pelkistetysti vasemmalle katsovan henkilön suuonteloa. Huulten asennon perusteella äänteitä nimitetään labiaalisiksi (jos huulet ovat pyöristetyt) tai illabiaalisiksi (jos eivät). Esim. suomen [i] ja [y] eroavat lähinnä huulten pyöreyden perusteella. Nasaalisuus liittyy siihen, onko kitapurje alhaalla vai ylhäällä. Kun kitapurje on alhaalla eli auki, ilmavirta pääsee nenäonteloon ja syntyy nasaalinen äänne, ja vastaavasti kitapurjeen ollessa ylhäällä syntyy oraalinen äänne. Suomen kielessä vokaaleja ovat [a],[e],[i],[o],[u],[y],[ä] ja [ö]. Lisäksi on olemassa diftongeja, eli kahdesta peräkkäisestä, samaan tavuun kuuluvasta erilaisesta vokaalista muodostuvia äänteitä, esim. sanoissa suo ja auto. Vastaavasti, varsinkin englannin kielessä, esiintyy triftongeja, kolmesta peräkkäisestä vokaalista muodostuvia äänteitä, esim. fire, tower. Konsonantit. Konsonanteille on artikulatoriselta kannalta tyypillistä, että niissä ilmavirta ei pääse vapaasti suun kautta ulos. Konsonantit voidaan luokitella seuraavien ominaisuuksien perusteella: ääntymätapa sointi ääntymäpaikka Ääntymätavalla tarkoitetaan sitä, kuinka vapaasti ilmavirta pääsee virtaamaan konsonanttia äännettäessä. Niitä konsonantteja joissa ilmavirralla on vapaa ulospääsy sanotaan resonanteiksi ja niitä joissa ilmavirralla ei ole vapaata ulospääsyä sanotaan obstruenteiksi. Resonantit voidaan edelleen ryhmitellä tarkemmin: 20
puolivokaalit. Nämä muistuttavat vokaaleja, mutta kielellä tai huulilla muodostettava kapeikko on ahtaampi kuin vokaaleilla. Suomen puolivokaaleja ovat [j] ja [v]. nasaalit. Nasaaleissa ilmavirta kulkee ulos vain nenän kautta, suomessa [n], [m], [ng]. likvidat. Näissä ilmavirta tulee suusta eri tavalla kuin vokaaleissa. Likvidat jaotellaan edelleen lateraaleiksi joissa ilmavirta kulkee kielen laitojen yli (suomessa [l]) ja tremulanteiksi joissa ilmavirta on katkonainen (suomessa [r]). Samoin obstruenttien jakoa voidaan hienontaa: klusiilit. Näissä obstruenteissa ilmavirta katkaistaan kokonaan (suomessa [p], [t], [k]). Myös [b], [d], [g] voidaan laskea suomen kielen foneemeiksi vaikka kaikki suomea puhuvat eivät käytä näitä puheessa; nämä ovat muuten samat kuin äänteet [p], [t] ja [k], mutta ovat soinnillisia. frikatiivit. Ilmavirta estetään osittain, suomessa [s], [h], sekä vieraampana [f]. Lisäksi suomessa kaikki äänteet poislukien [d], [g], [f] voidaan kahdentaa, esimerkiksi muta, mutta, muuta, mutaa ja muuttaa ovat kaikki eri sanoja. "Äng-äänne"[ng] esiintyy tosin aina pitkänä (esim. kengät) ellei sitä seuraa konsonantti (kenkä), ja [v] ja [h] eivät yleensä esiinny pitkinä paitsi joskus loppukahdennuksen yhteydessä (homevvaurio). Seuraavassa kerrataan vielä aänteiden jaottelu ääntymätavan mukaan, ja luetellaan suomen kielessä luokkia edustavat äänteet (pitkiä äänteitä ei ole merkitty erikseen): vokaalit: [a],[e],[i],[o],[u],[y],[ä],[ö] konsonantit resonantit puolivokaalit: [j],[v] nasaalit: [n],[m],[ng] lateraali: [l] tremulantti: [r] obstruentit frikatiivit: [h],[s] (joidenkin puheessa myös [f]) klusiilit: [p],[t],[k] ([b],[d],[g]) Sointi ilmaisee onko konsonantti soinnillinen vai soinniton. Soinnillisia konsonantteja suomessa ovat kaikki paitsi [p],[t],[k],[h] ja [s] (sekä [f]). Itse asiassa [h] voi esiintyä ns. henkäyssoinnillisena äänteenä (kuten sanassa paha), jolloin ääniraon huulirako värähtelee etuosaltaan ja rustorako on auki. Ääntymäpaikka kertoo missä kohdassa ääntöväylää muodostuu tärkein kapeikko. Esimerkiksi [p] ja [t] ovat molemmat soinnittomia klusiileja, mutta [p] ääntyy huulissa ja [t] hampaiden takana. Eri ääntymäpaikat ovat: bilabiaalinen huulten välissä labiodentaalinen alahuulen ja ylähampaiden välissä 21
dentaalinen hampaiden välissä alveolaarinen hammasvallin ja kielen välissä palato-alveolaarinen kitalaen etuosan ja kielen välissä palataalinen kitalaen ja kielen välissä velaarinen kitapurjeen ja kielen välissä uvulaarinen kitapurjeen kärjen (uvula) ja kielen välissä faryngaalinen nielun takaosan ja kielen välissä Edellisten kolmen ominaisuuden perusteella voidaan luokitella kaikki konsonantit. Esimerkkejä: [m] on soinnillinen bilabiaalinen nasaali ja [k] on soinniton palataalinen klusiili. Fonologiaa Yleistä abstraktia äänneluokkaa kutsutaan foneemiksi, kun taas yksittäistä puhuttua realisaatiota kutsutaan fooniksi (kaikki foonit ovat siis periaatteessa erilaisia). Tietyssä kielessä samaan äänneluokkaan kuuluvia äänteitä, joilla on kuitenkin joku foneettinen ero, sanotaan allofoneiksi, esimerkiksi suomen kielessä kaikki vokaalit voidaan ääntää joko nasaalisina tai ei, eli nämä äänteet ovat suomen kielessä toistensa allofoneja. Toisin sanoen nasaalisuus on suomen kielessä foneettinen (tai eifonologinen) piirre, mutta esim. ranskassa se on fonologinen piirre. Yhteisartikulointi Vaikka kielen äänteet kuullaan diskreetteinä foneemeina, itse äänteet eivät ole diskreettejä, tasaisia aaltomuotoja, vaan äänteet sulautuvat toisiinsa. Tämä johtuu paljolti siitä, että puhe-elinten siirtyminen ei ole hetkellinen tapahtuma vaan vaatii aikaa, ja tämän siirtymisen aikana aaltomuoto muuttuu tasaisesti. Lisäksi, yleensä kun puhe-elimet ovat saaneet äänteen riittävän hyvin äännettyä (eli niin hyvin että kuulija sen ymmärtää), ne alkavat siirtyä seuraavan äänteen vaatimaan asentoon. Lisäksi äänteessä käytetty allofoni riippuu usein ympäröivistä äänteistä, erityisesti seuraavasta äänteestä. Puheen prosodiaa Prosodialla tarkoitetaan puheen pidempiaikaisia ominaisuuksia, joita ovat lähinnä kvantiteetti, paino ja intonaatio. Prosodian pienin yksikkö foneemin sijasta on yleensä tavu. Tavun yleispätevää määritelmää ei ole olemassa, mutta kielikohtainen määritteleminen onnistuu. Suomen kielessä tavutuksen pääsääntö on se, että tavun raja kulkee jokaisen CV (konsonatti, vokaali) ryhmän edellä (esim. puheen-kä-sit-te-ly). Tavu on kielellisesti usein käyttökelpoisempi yksikkö kuin yksittäiset foneemit. Akustisesti tavurajat voidaan karkeasti asettaa puheen aaltomuodon tehon minimikohtiin. Kvantiteetilla tarkoitetaan äänteiden pituutta. Joissakin kielissä (esim. espanja) kvantiteetin muutoksella ei saada sanan merkitystä muuttumaan. Sen sijaan suomen kielessä kvantiteetitti on erottava piirre sekä vokaaleissa (muta, muuta) että konsonanteissa (muta, mutta). Äänteen kvantiteetti riippuu monesta eri tekijästä, kuten äänteen luonnollisesta kestosta, viereisten äänteiden laadusta ja kestosta, äänteiden asemasta tavussa sekä äänteen painosta. 22
Paino tarkoittaa nimensä mukaisesti jonkin äänteen painottamista, yleensä suuremmalla teholla tai muuttuneella äänenkorkeudella. Käytännössä paino saadaan siis aikaan vaihtelemalla keuhkojen ilmanpainetta ja äänihuulten jännitystä. Paino voi viitata joko tavupainoon (painotetaan tiettyä tavua sanassa) tai sanapainoon (painotetaan tiettyä sanaa virkkeessä), tosin suomen kielessä tavupaino on aina ensimmäisellä tavulla. Intonaatio viittaa puheen äänenkorkeuden muutokseen pidemmän jakson, esim. virkkeen aikana. Äänenkorkeudella voidaan muuttaa joissain kielissä sanojen merkityksiä (esim. kiina) mutta sitä käytetään muissakin kielissä ilmaisemaan esim. välimerkkejä. Esimerkiksi englannin kielessä äänenkorkeus nousee kysymyslauseen lopussa, kun taas suomen kielessä koko kysymyslauseen sävelkorkeus on jonkin verran korkeampi kuin vastaavan väitelauseen. Intonaatio toteutetaan lähinnä äänihuulten jännitystä säätelemällä. 23