Luku 2 Fonetiikkaa Puhe on kaiken kaikkiaan hyvin monitasoinen ja monimutkainen inhimillinen ja fysikaalinen ilmiö, sisältäen kysymyksiä liittyen mm. kognitioon, kieleen, fysiologiaan, kuuloon ja akustiikkaan. Fonetiikka tarkoittaa yleisesti puheen tutkimusta, joka sisältää piirteitä edellisistä tieteenaloista. Puheenkäsittelyn kannalta joudumme toistaiseksi keskittymään puheen alempiin tasoihin, joissa kysytään esimerkiksi: Millaisia erilaisia äänteitä on olemassa? Mikä on perustaajuus/puheen resonanssitaajuudet tietyllä hetkellä? Miten puhetta kannattaa koodata? Mitä foneemeja tietyssä puhejaksossa esiintyy? Näiden ja muiden kysymysten selvittämiseksi tarvitaan perustietoja siitä, millainen signaali puhe oikeastaan on. Suuri osa puheen akustisista ominaisuuksista juontaa juurensa ihmisen puheentuottojärjestelmän ominaisuuksiin. Siksi tämän järjestelmän toiminta katsotaan ensin läpi, ja sen jälkeen sitä pyritään mallintamaan. 2.1 Puhe-elimet Hyviä kuvioita liittyen oheiseen tekstiin löytyy osoitteesta http://www.opiskelijakirjasto.lib.helsinki.fi/fonterm/006.htm Akustisesti puhe on ilmanpaineen vaihtelua, jonka voimanlähteenä on keuhkoissa oleva tiivistetty ilma. Sisäänhengityksessä pallea ja kylkivälilihakset jännittyvät, jolloin rintakehä laajenee ja keuhkoihin syntyy alipaine ja ilmaa virtaa niihin. Uloshengityksen aikana lihakset rentoutuvat, jolloin rintakehä supistuu, ja ilmaa virtaa ulos keuhkojen ylipaineesta johtuen. Puhetta esiintyy lähes yksinomaan uloshengityksen aikana. Kannattaa pitää mielessä, että puhe-elimet (keuhkot, kieli, äänihuulet, yms.) ovat alun perin kehittyneet mahdollistamaan ihmi- 19
20 LUKU 2. FONETIIKKAA sen muita toimintoja, lähinnä hengityksen ja syömisen, ja ovat vasta myöhemmin adaptoituneet myös puheen tuottamiseen. Kurkunpää on kehittynyt elin, jonka päätarkoituksena on toimia läppänä jokaa erottaa ruokatorven henkitorvesta nielaisemisen ajaksi. Puheentuoton kannalta oleellisinta kurkunpäässä on että se muokkaa keuhkoista lähtevän äänettömän ilmavirran jollain tapaa kuuluvaksi. Kurkunpää muodostuu seuraavista osista: kilpirusto (aataminomena), äänihuulet ja kannurustot. Äänihuulten välissä olevaa rakoa nimitetään ääniraoksi eli glottikseksi ja se muodostuu huuliraosta (äänihuulten välissä) ja rustoraosta (kannurustojen välissä), ks. kuvio 2.1. Ihminen pystyy säätelemään monipuolisesti ääniraon muotoa kurkunpään lihaksien avulla. Kuvio 2.1: Kurkunpään poikkileikkaus äänihuulten kohdalta ylhäältä katsottuna, kuvion leikattu henkilö katsoo ylöspäin (http://www.opiskelijakirjasto.lib.helsinki.fi/fonterm/). Ääntöväylällä tarkoitetaan yleensä puhe-elimiä kurkunpään jälkeen, ks. kuvio 2.2. Nämä jakautuvat seuraaviin alueisiin: nieluontelo, nenäontelo ja suuontelo. Tärkeimmät puhe-elimet ääntöväylässä ovat kieli, kitapurje, alaleuka ja huulet. Kieli on puheentuoton tärkein elin: sen eri asennot määräävät suurimman osan äänteistä. Kitapurje on lihas, jonka avulla voidaan erottaa nieluontelo nenäontelosta. Ohessa lyhyt suomi-englanti-termistö aiheesta:
2.1. PUHE-ELIMET 21 alveolar ridge hammasvalli bronchus keuhkoputki cricoid cartilage rengasrusto epiglottis kurkunkansi glottis äänirako larynx kurkunpää nasal cavity nenäontelo thyroid cartilage kilpirusto trachea henkitorvi vocal tract ääntöväylä pharynx nielu velum, soft palate kitapurje arytenoid cartilage kannurusto cartilage rusto diaphragm pallea false vocal folds taskuhuulet hyoid bone kieliluu lungs keuhkot palate kitalaki tongue kieli vocal folds äänihuulet oral pharynx, pharyngeal cavity nieluontelo uvula kitakieleke Kuvio 2.2: Ääniväylän puhe-elimet (Thomas W. Parsons, Voice and Speech Processing, McGraw-Hill, Inc., 1987. s. 63).
22 LUKU 2. FONETIIKKAA 2.2 Puheentuotto Puhetta muodostuu, kun keuhkoista lähtevä ilmavirta kulkee ääniraon eli glottiksen läpi ja moduloituu ääntöväylässä. Ääniraosta lähtevä ääni voidaan ajatella herätteeksi, jonka ääntöväylä suodattaa. Ilmavirtaus sinänsä on äänetöntä, joten äänteet muodostetaan tavalla tai toisella aiheuttamalla muutoksia keuhkoista lähtevään ilmavirtaan. Alla on lueteltu glottiksen eri herätetyypit. soinnilliset äänteet Glottis aukenee ja sulkeutuu jaksollisesti, mikä aiheuttaa katkonaisen ilmavirran. Yhtä auki-kiinni jaksoa sanotaan värähdykseksi, ja sen kesto määrää äänen perustaajuuden jota säädetään esim. laulamisessa. Tyypillisesti taajuus on n. 50-500Hz (matalampi miehillä, korkeampi naisilla ja lapsilla). Äänteitä, joissa äänihuulet värähtelevät, sanotaan soinnillisiksi (esim. kaikki vokaalit). hengitys Glottis on auki. Ilmavirta on tasaista ja sen takia (lähes) äänetöntä. soinnittomat äänteet Glottis on jonkin verran auki mutta äänihuulet eivät värähtele. kuiskaus Glottis on kiinni mutta rustorako auki, jolloin muodostuu kuultavaa hankaushälyä (friction). Kuvio 2.3: Äänihuulten asento eri äännetyypeissä (Kalevi Wiik, Fonetiikan Peruskurssi, WSOY, 1981). Ääntöväylä suodattaa glottisherätteen puhe-elinten asennosta riippuvalla tavalla. Kunkin äänteen aikana ääntöväylällä on tyypillinen (äänteestä riippuva) muotonsa, jota voidaan mallintaa akustisena putkena. Tällä putkella on erityisesti tietyt resonanssitaajuudet, joiden johdosta äänteen spektrissä on havaittavissa vahvistuneita osavärähtelyalueita eli formantteja. Formantit ovat tärkein seuraus ääniväylän moduloinnista; niiden avulla voidaan luokitella kaikki vokaalit. Toinen tapa muodostaa äänteitä on aiheuttaa ääntöväylän johonkin osaan kapeikko jonka
2.3. ARTIKULATORISTA FONETIIKKAA 23 läpi kulkiessaan ilmavirta muuttuu pyörteiseksi. Kolmas laaja äänteiden luokka saadaan sulkemalla hetkeksi ääntöväylä kokonaan joltain kohtaa ja avaamalla se, jolloin ilmavirta poksahtaa ulos. Seuraavassa luvussa on selitetty tämän kurssin jatkon kannalta oleellisimmat tiedot siitä, miten puhe-elimet tuottavat tietyn äänteen ja millaisia akustisia ominaisuuksia äänteellä tästä konfiguraatiosta johtuen on. Yleisesti artikulatorinen fonetiikka tutkii, millä tavalla puhe-elimet sijoittuvat tietyn äänteen aikaansaamiseksi kun taas akustisessa fonetiikassa tutkitaan akustisen aallon ja puhe-elinten asentojen yhteyttä (tästä lisää myöhemmin). 2.3 Artikulatorista fonetiikkaa Eräs tärkeä fonetiikan tavoite on luokitella eri kielissä esiintyvät äänteet. Tätä tarkoitusta varten kehitettiin vuonna 1888 International phonetic alphabet (IPA). IPA:n luokittelusta ollaan jokseenkin yksimielisiä, mutta lähinnä merkinnällisistä syistä (IPAssa käytetyttyjä symboleita ei löydy kirjoituskoneesta) käytetään muitakin foneettisia aakkostoja, mm. Arpabet. IPA-luokitus löytyy osoitteesta http://www.arts.gla.ac.uk/ipa/fullchart.html Äänteitä voidaan käsitellä foneettiselta kannalta, jolloin tarkastelu ei ole sidoksissa mihinkään tiettyyn kieleen, vaan äänteet pyritään kuvaamaan mahdollisimman täsmällisesti niiden artikuloinnin (puhe-elinten asennon) avulla. Toinen lähestymistapa on fonologinen, jossa tarkastellaan tietyssä kielessä esiintyviä eri äänteitä, erityisesti niiden äänteiden luokkaa jotka tulkitaan samaksi. Esimerkiksi [k] ja [p] ovat suomen kielessä eri äänteitä koska sanaa kala ei ymmärretä samaksi kuin sanaa pala. Sen sijaan äänteet [s] ja "suhu-[s]"(kuten esim. sanassa shekki) eivät muuta sanan merkitystä, joten ne tulkitaan suomen kielessä samaksi äänteeksi, kun taas esim. venäjän kielessä ne ovat eri äänteitä. Kaikkien maailman kielten äänteet jakautuvat vokaaleihin ja konsonantteihin (selitetty tarkemmin alla), joita edelleen jakaa tarkemmin eri ominaisuuksien perusteella (myös selitetty tarkemmin alla). Kannattaa koko ajan pitää mielessä että tämän kappaleen luokittelu on tullut pyrkimyksestä selittää miten ihmisten äänteet muodostuvat; puhuminen onnistuu varsin hyvin tietämättä tästä luokituksesta mitään (joskus jopa paremmin). 2.3.1 Vokaalit Vokaalit (engl. vowel) ovat soinnillisia äänteitä, joissa ääniväylä on avoin. Eri kielissä saattaa kuitenkin esiintyä tarvetta edellisen määritelmän hienosäätöön, esim. suomen kielessä vokaalit määritellään äänteiksi joissa ääntä pääsee esteettä suun keskeltä ulos (näin päästään eroon nasaaleista [n] ja [m] sekä lateraalista [l]).
24 LUKU 2. FONETIIKKAA Vokaalit taas voidaan luokitella seuraavien ominaisuuksien perusteella: kielen asento huulten pyöreys nasaalisuus Erityisesti kielen asennossa on oleellista ääniväylän kapeimman kohdan sijainti. Tämä voidaan esittää ns. vokaalidiagrammin avulla, jossa on kuvallisesti esitetty kielen keskiviivan korkein kohta suussa. [i] [y] [u] [e] [ö] [o] [ä] [a] Kuvio 2.4: Vokaalidiagrammi, jossa on esitettynä kielen korkein kohta suomen eri vokaaleissa. Kuvio esittää pelkistetysti vasemmalle katsovan henkilön suuonteloa. Huulten asennon perusteella äänteitä nimitetään labiaalisiksi (jos huulet ovat pyöristetyt) tai illabiaalisiksi (jos eivät). Esim. suomen [i] ja [y] eroavat lähinnä huulten pyöreyden perusteella. Nasaalisuus liittyy siihen, onko kitapurje alhaalla vai ylhäällä. Kun kitapurje on alhaalla eli auki, ilmavirta pääsee nenäonteloon ja syntyy nasaalinen äänne, ja vastaavasti kitapurjeen ollessa ylhäällä syntyy oraalinen äänne.
2.3. ARTIKULATORISTA FONETIIKKAA 25 2.3.2 Konsonantit Konsonanteissa (engl. consonant) ilmavirta ei pääse vapaasti suun kautta ulos. Tarkemmin ottaen konsonantit voidaan luokitella seuraavien ominaisuuksien perusteella: ääntymäpaikka ääntymätapa sointi Ääntymäpaikka (engl. place of articulation) kertoo missä kohdassa ääntöväylää muodostuu tärkein kapeikko. Esimerkisi [p]-äänteessä kapeikko muodostuu huulten välissä ja [t]-äänteessä kielen ja ylähampaiden takana. Eri ääntymäpaikat ovat (ks. kuvio 2.5): bilabiaalinen huulten välissä labiodentaalinen alahuulen ja ylähampaiden välissä dentaalinen hampaiden välissä alveolaarinen hammasvallin ja kielen välissä palato-alveolaarinen kitalaen etuosan ja kielen välissä palataalinen kitalaen ja kielen välissä velaarinen kitapurjeen ja kielen välissä uvulaarinen kitapurjeen kärjen (uvula) ja kielen välissä faryngaalinen nielun takaosan ja kielen välissä Ääntymätavalla (engl. manner of articulation) tarkoitetaan sitä, kuinka vapaasti ilmavirta pääsee virtaamaan konsonanttia äännettäessä. Konsonantteja joissa ilmavirralla on vapaa ulospääsy sanotaan resonanteiksi ja niitä joissa ei sanotaan obstruenteiksi. Resonantit voidaan edelleen ryhmitellä tarkemmin: puolivokaalit (engl. approximant). Nämä muistuttavat vokaaleja, mutta kielellä tai huulilla muodostettava kapeikko on ahtaampi kuin vokaaleilla. Suomen puolivokaaleja ovat [j] ja [v].
26 LUKU 2. FONETIIKKAA Kuvio 2.5: Konsonanttien ääntymäpaikat: 1: bilabiaalinen, 2: labiodentaalinen, 3: interdentaalinen, 4: dentaalinen, 5: alveoraalinen, 6: palataalinen, 7: velaarinen, 8: uvulaarinen, 9: faryngaalinen, 10: laryngaalinen, 11: apikaalinen, 12: koronaalinen, 13: laminaalinen, 14: dorsaalinen, 15: radikaalinen, 16: sublingvaalinen, 17: epiglottaalinen. nasaalit. Nasaaleissa ilmavirta kulkee ulos vain nenän kautta, suomessa [n], [m], [ng]. likvidat. Näissä ilmavirta tulee suusta eri tavalla kuin vokaaleissa. Likvidat jaotellaan edelleen lateraaleiksi joissa ilmavirta kulkee kielen laitojen yli (suomessa [l]) ja tremulanteiksi joissa ilmavirta on katkonainen (suomessa [r]). Samoin obstruenttien jakoa voidaan hienontaa: klusiilit (engl. plosive). Näissä obstruenteissa ilmavirta katkaistaan kokonaan (suomessa [p], [t], [k]). Myös [b], [d], [g] voidaan laskea suomen kielen foneemeiksi vaikka kaikki suomea puhuvat eivät käytä näitä puheessa; nämä ovat muuten samat kuin äänteet [p], [t] ja [k], mutta ovat soinnillisia. frikatiivit. Ilmavirta estetään osittain, suomessa [s], [h], sekä vieraampana [f].
2.4. SUOMEN KIELEN ÄÄNTEET 27 Sointi ilmaisee onko konsonantti soinnillinen vai soinniton. Soinnillisia konsonantteja suomen kielessä ovat kaikki paitsi [p],[t],[k],[h] ja [s] (sekä [f]). Itse asiassa [h] voi esiintyä ns. henkäyssoinnillisena äänteenä (kuten sanassa paha), jolloin ääniraon huulirako värähtelee etuosaltaan ja rustorako on auki. Edellisten kolmen ominaisuuden (ääntymäpaikka, ääntymätapa ja sointi) perusteella voidaan luokitella kaikki konsonantit. Esimerkkejä: [m] on soinnillinen bilabiaalinen nasaali ja [k] on soinniton palataalinen klusiili. Kysymys: onko suomen kielessä soinnitonta dentaalista klusiilia? Entä soinnillista labiodentaalista resonanttia? 2.4 Suomen kielen äänteet Alla on suomen kielen äänteiden jaottelu ääntymätavan mukaan: vokaalit: [a],[e],[i],[o],[u],[y],[ä],[ö] konsonantit resonantit puolivokaalit: [j],[v] nasaalit: [n],[m],[ng] lateraali: [l] tremulantti: [r] obstruentit frikatiivit: [h],[s] (myös [f]) klusiilit: [p],[t],[k] (myös [b],[d],[g]) Lisäksi suomessa kaikki äänteet poislukien [d], [g], [f] voidaan kahdentaa, esimerkiksi muta, mutta, muuta, mutaa ja muuttaa ovat kaikki eri sanoja. "Äng-äänne"[ng] esiintyy tosin aina pitkänä (esim. kengät) ellei sitä seuraa konsonantti (kenkä), ja [v] ja [h] eivät yleensä esiinny pitkinä paitsi joskus loppukahdennuksen yhteydessä (homevvaurio). 2.5 Muita foneettisia piirteitä Yleistä äänneluokkaa kutsutaan foneemiksi, kun taas yksittäistä puhuttua realisaatiota kutsutaan fooniksi (kaikki foonit ovat siis periaatteessa erilaisia). Tietyssä
28 LUKU 2. FONETIIKKAA kielessä samaan äänneluokkaan kuuluvia äänteitä, joilla on kuitenkin joku foneettinen ero, sanotaan allofoneiksi. Yleinen periaate jonkin kielen foneemien määrittämisessä on se voiko jonkin äänteen muuttaminen toiseksi muuttaa sanan merkitystä. Esimerkiksi suomen kielessä kaikki vokaalit voidaan ääntää joko nasaalisina tai ei-nasaalisina sanan merkityksen muuttumatta kun taas vaikkapa ranskan kielessä myös merkitys voi muuttua. Vaikka kielen äänteet kuullaan diskreetteinä foneemeina, itse äänteet eivät ole diskreettejä, äkillisesti toisiinsa muuttuvia aaltomuotoja, vaan äänteet sulautuvat toisiinsa. Tätä ilmiötä kutsutaan yhteisartikuloinniksi (engl. coarticulation). Yhteisartikulointi johtuu pitkäli siitä että puhe-elinten siirtyminen ei ole hetkellinen tapahtuma vaan vaatii aikaa, ja tämän siirtymisen aikana aaltomuoto muuttuu tasaisesti. Lisäksi, yleensä kun puhe-elimet ovat saaneet äänteen riittävän hyvin äännettyä (eli niin hyvin että kuulija sen ymmärtää), ne alkavat siirtyä seuraavan äänteen vaatimaan asentoon. Lisäksi äänteessä käytetty allofoni riippuu usein ympäröivistä äänteistä, erityisesti seuraavasta äänteestä. Prosodialla tarkoitetaan puheen pidempiaikaisia ominaisuuksia, joita ovat lähinnä kvantiteetti, paino ja intonaatio (määrittelyt alla). Prosodian pienin yksikkö foneemin sijasta on yleensä tavu. Tavun yleispätevää määritelmää ei ole olemassa, mutta kielikohtainen määritteleminen onnistuu. Suomen kielessä tavutuksen pääsääntö on se, että tavun raja kulkee jokaisen CV (konsonatti, vokaali) ryhmän edellä (esim. pu-heen-kä-sit-te-ly). Tavu on kielellisesti usein käyttökelpoisempi yksikkö kuin yksittäiset foneemit. Kvantiteetilla tarkoitetaan äänteiden pituutta. Joissakin kielissä (esim. espanja) kvantiteetin muutoksella ei saada sanan merkitystä muuttumaan. Sen sijaan suomen kielessä kvantiteetitti on erottava piirre (eli sillä voidaan muuttaa sanan merkitystä) sekä vokaaleissa (muta, muuta) että konsonanteissa (muta, mutta). Äänteen kvantiteetti riippuu monesta eri tekijästä, kuten äänteen luonnollisesta kestosta, viereisten äänteiden laadusta ja kestosta, äänteiden asemasta tavussa sekä äänteen painosta. Paino tarkoittaa jonkin äänteen painottamista, yleensä suuremmalla teholla tai muuttuneella äänenkorkeudella. Paino voi viitata joko tavupainoon (painotetaan tiettyä tavua sanassa) tai sanapainoon (painotetaan tiettyä sanaa virkkeessä). Suomen kielessä tavupaino on aina ensimmäisellä tavulla (jonka takia suomen kieli on ei-suomalaisen korviin melko monotonisen kuuloista). Intonaatio viittaa puheen äänenkorkeuden muutokseen pidemmän jakson, esim. virkkeen aikana. Äänenkorkeudella voidaan muuttaa joissain kielissä sanojen merkityksiä (esim. kiina) mutta sitä käytetään muissakin kielissä ilmaisemaan esim. välimerkkejä. Esimerkiksi englannin kielessä äänenkorkeus nousee kysymyslauseen lopussa, kun taas suomen kielessä koko kysymyslauseen sävelkorkeus on jonkin verran korkeampi kuin vastaavan väitelauseen.