Mitä puhe on? Fonetiikan perusteet kieliteknologeille

Samankaltaiset tiedostot
Mitä puhe on? Fonetiikan perusteet kieliteknologeille. Puheen analyysin viitekehys. Puhe ja Kommunikaatio. Puhe ja kommunikaatio (jatkoa)

Mitä puhe on? Fonetiikan perusteet kieliteknologeille

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä

Puhe ja kommunikaatio

Prosodian havaitsemisesta: suomen lausepaino ja focus

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus

Puhutun ja kirjoitetun rajalla

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Åbo Akademi klo Mietta Lennes Nykykielten laitos Helsingin yliopisto

Suomen prosodian variaation tutkimuksesta

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat

4. FONOLOGIA eli kielen äännerakenne

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Kieli ja viestinnän kokonaisuus

Varhainen leikki ja sen arviointi

Yhdyssana suomen kielessä ja puheessa

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

5 Akustiikan peruskäsitteitä

Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio

Foneettiset symbolit

11.4. Context-free kielet 1 / 17

Ainakin vuosien 2004 ja 2006 fonetiikan

Prominenssin toteutuminen kolmessa yleispuhesuomen varieteetissa

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu

Lapsen tyypillinen kehitys. -kommunikaatio -kielellinen kehitys

Sisällys. Sisällys. Esipuhe Äänteellisen kehityksen peruskäsitteet I Äänteellisen kehityksen edellytykset

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

Tommi Nieminen. 35. Kielitieteen päivät Vaasa

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Avoimen lähdekoodin kaksitasokielioppikääntäjä

Käyttöliittymä. Ihmisen ja tuotteen välinen rajapinta. ei rajoitu pelkästään tietokoneisiin

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat

Puheen tuotto ja havaitseminen II

Organization of (Simultaneous) Spectral Components

Lauseen käsitteestä ja käsittämättömyydestä SVK:ssa

FORMAALI SYSTEEMI (in Nutshell): aakkosto: alkeismerkkien joukko kieliopin määräämä syntaksi: sallittujen merkkijonojen rakenne, formaali kuvaus

Kieli merkitys ja logiikka. 4: Luovuus, assosiationismi. Luovuus ja assosiationismi. Kielen luovuus. Descartes ja dualismi

Puheen tuotto ja havaitseminen I Vokaalit. Puheentuoton lähde-suodin -malli. Glottaalinen äänilähde. Fonaatio

Puheen tuotto ja havaitseminen I

S Havaitseminen ja toiminta

Verbin valenssi määrää, minkälaisia argumentteja ja komplementteja verbi odottaa saavansa millaisissa lauseissa verbi voi esiintyä.

Ruma merkitys. Tommi Nieminen. XLII Kielitieteen päivät. Kielitieteen epäilyttävin välttämätön käsite. Itä-Suomen yliopisto ...

8. Kieliopit ja kielet

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003

Mitä suomen intonaatiosta tiedetään

Tiistai klo Jari Eerola

Oulun murteessa on käytössä myös nää-pronomini, joka tarkoittaa sinä. Sää on kuitenkin enemmän käytetty.

Tieteenfilosofia 2/4. Heikki J. Koskinen, FT, Dos. Helsingin yliopisto / Suomen Akatemia

Kuulohavainnon perusteet

FUNKTIONAALIANALYYSIN PERUSKURSSI Johdanto

Tekstien ääniä. Tommi Nieminen Itä-Suomen yliopisto

Yleisen kielitieteen opetus

Semioottinen Analyysi

Fonetiikan perusteet (FA1/Clt 120): ääni II, ilmavirtamekanismit ja äänteet


1.5. Fonologia Vokaalit. Luku 1. Johdanto 11

Sana rakenteen kategoriana (A. Radford: Transformational Grammar. A First Course)

JOHDATUS TEKOÄLYYN TEEMU ROOS

Näkökulmia kirjallisuuteen, 5 tyylistä ja runoudesta

Suomen puherytmi typologisessa katsannossa

Muotoilumaailman hahmottaminen - Tuotesemantiikka

ATLAS.ti -ohjelma laadullisen analyysin tukena Miten me sitä on käytetty?

Helpon suomen alkeet. Miten puhua niin, että kielenoppijakin ymmärtää? Salla Kurhila & Taija Udd, Suomen kieli ja kulttuuri, Helsingin yliopisto

Rajoittamattomat kieliopit (Unrestricted Grammars)

Lukemaan ja kirjoittamaan oppiminen toisella kielellä

Kielellisen datan käsittely ja analyysi tutkimuksessa

FI3 Tiedon ja todellisuuden filosofia LOGIIKKA. 1.1 Logiikan ymmärtämiseksi on tärkeää osata erottaa muoto ja sisältö toisistaan:

Miten tutkia lähdekielen vaikutusta oppijankielen universaalina piirteenä?

AAC -menetelmien sovellus kehitysvammahuoltoon. Kirsi Vainio

Automaatit. Muodolliset kielet

Onko empiirinen käänne vain empirian kääntötakki?

Musiikkipäiväkirjani: Tutkitaan, improvisoidaan ja sävelletään (EIC1) Kerrotaan tarina eri äänteillä, äänillä tai melodioilla, joita on luotu yhdessä.

KUN LUKEMINEN ON HANKALAA. Helena Sorsa

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat

Puheen tuotto ja havaitseminen II

Intonaation analyysi ja annotointi puhekorpuksissa

Laskuharjoitus 2 ( ): Tehtävien vastauksia

S BAB ABA A aas bba B bbs c

Kieli merkitys ja logiikka. Luento 6: Merkitys ja kieli

on rekursiivisesti numeroituva, mutta ei rekursiivinen.

Musiikkipäiväkirjani: Maalataan, kirjoitetaan ja luetaan musiikkia (PWR1) Valitaan värejä, kuvia tai symboleja erilaisille äänille.

Lafayette Smart Käyttöopas

4 Fonetiikkaa. Puhe-elimet

Mitä on morfologia? Tommi Jantunen Jyväskylän yliopisto Kielten laitos Suomalainen viittomakieli

Tietokoneohjelmien käyttö laadullisen aineiston analyysin apuna

Suotuisia ja haasteellisia luku- ja kirjoitustaidon profiileja

Rekursiolause. Laskennan teorian opintopiiri. Sebastian Björkqvist. 23. helmikuuta Tiivistelmä

Äärellisten automaattien ja säännöllisten kielten ekvivalenssi

Englanti. 3. luokan keskeiset tavoitteet

Puheen akustiikan perusteita

Aivotutkimus kielenoppimisen edistäjänä

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Miksi prosodiasta tulee olla kiinnostunut? Prosodia. Äänteiden yläpuolella. Mitä? ja Miten?

Prosodia. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Prosodia p.1/46

Valmistautuminen ja strategiat: tulkkaukseen valmistautuminen ja tulkkausstrategioiden suunnittelu. Osallistava tulkkaus.

Transkriptio:

Mitä puhe on? Fonetiikan perusteet kieliteknologeille Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mitä puhe on? p.1/55

Tyypillinen ilmaus: 6 khz frequency 0 Hz 150 Hz F0 50 Hz 81 db intensity 37 db 0.4404 0 0.6982 0 2.513 Time (s) Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.2/55

Puheketju Puhe alkaa puhujan aivoissa viestinä, jonka puhuja aikoo siirtää kuulijalle Puhee koodataan akustikseksi signaaliksi erilaisten artikulaatioon osallistuvien elinten liikkeinä (engl. gesture) Akustinen signaali kulkee ilman kautta Kuulijan kuuloelimet vastaanottavat akustisen signaalin ja ekstrahoi siitä kestoa, taajuutta, laatua ja intensiteettiä koskevaa informaatiota Tästä informaatiosta muodostuu taas puhetta kun kuulijan keskushermosto purkaa koodin Vastaava puheketju on olemassa visuaalisessa modaliteetissa viittomakieltä käytettäessä. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.3/55

Kultainen sääntö Puhe on sitä, miksi me sen teemme: 1. Puhe on olemassa ainoastaan puhujien ja kuulijoiden mielissä 2. Tietyissä olosuhteissa muutkin kuin artikulaatioelimillä tuotetut äänet voidaan havaita puheena esim. ns. siniaaltopuhe ja toisaalta puhe voidaan havaita muuna kuin puheena oopperalaulu. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.4/55

Puheen tuoton prosessi: Input Information Grammar rules Prosody rules Physiological constraints Physical constraints Linguistic: Lexical Syntactic Semantic Pragmatic Message Planning Utterance Planning Motor Command Generation... Speech Sound Production Segmental and Suprasegmental Features of Speech Paralinguistic: Intentional Attitudinal Stylistic Extralinguistic: Physical Emotional Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.5/55

Rakenne puheessa Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.6/55

Pitkän [ ]:n aaltomuoto: 0.5618 0 0.4538 0 0.0287075 Time (s) Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.7/55

Pitkän [ ]:n spektri: Sound pressure level (db/hz) 40 20 0 0 2000 Frequency (Hz) Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.8/55

Logatomin [ ] spektrogrammi: 3000 Frequency (Hz) 0 0 0.5831 Time (s) Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.9/55

Klusiilin laukeamavaiheen rakenne: Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.10/55

Klusiilia seuraava transitio: Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.11/55

Foneettinen rakenne: Ilmauksen äänteiden muodostama rakenne: tarkka kirurgi varoo näköään tarkka kirurgi varoo t A r k: A k i r u r g i v A 0 1.1 Time (s) Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.12/55

Prosodinen rakenne: 200 0 sateenkaari muodostuu valkoisen valon jakaantuessa useiksi kauniiksi väreiksi 0 4.682 Time (s) Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.13/55

Puheen analyysin viitekehys Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.14/55

Puhe ja Kommunikaatio Puhe on ihmisen kehittämistä kommunikoinnin muodoista hienostunein ja monimutkaisin siihen on kerrostunut useanlaista informaatiota, joiden määrittelyyn tarvitaan jonkinlainen semioottinen viitekehys. Tällainen viitekehys toimii pohjana puheen ja etenkin puhutun kielen analysoinnille. Puhe koostuu ihmisen tuottamista artefakteista, jotka toimivat elementteinä merkkien muodostamassa koodatussa järjestelmässä. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.15/55

Puhe ja kommunikaatio (jatkoa) Koodi voi toimia vain jos sitä käyttävät ihmiset ovat harjaantuneet koodin suhteen relevanttien merkkien tuottamiseen ja tulkitsemiseen. Puhe sisältää: 1. Kommunikatiiviset merkit ja 2. Kommunikatiiviset mekanismit, joilla kuulija vastaanottaa (perceive) puhujan tuottamat merkit, 3. sekä ne prosessit, joiden avulla informaatio tuottajasta siirtyy merkeissä. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.16/55

Puheen sisältämä informaatio Semanttinen informaatio. Ts. "suora", propositionaalinen merkitys. EI siis pragmaattinen merkitys; esim. täällä on kylmä sulje ovi Todisteellinen (evidential) informaatio. Regulatorinen informaatio. Esim. puhujan rooli keskustelussa; "time sharing", puheenvuoron antaminen ja ottaminen. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.17/55

Puheen sisältämä informaatio Evidentiaalinen informaatio sisältää: Fyysiset markkerit (physical markers); sukupuoli, ikä, terveyden tila jne. Sosiaaliset markkerit; sosiolingvistiikka ja -fonetiikka. Psykologiset markkerit; emootiot, suhtautuminen puheeseen ja tilanteeseen. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.18/55

Kommunikoinnin tavat: äänteellisys Äänteellinen vs. ei-äänteellinen toiminta (vocal vs non-vocal) Puheen äänteellinen puoli sisältää muutakin kuin vain puhuttua kieltä. Ei-vokaalinen puhetoiminta sisältää eleet, pään liikkeet, asennot jne. Nämä eivät yleensä sellaisenaan kuulu puheen tutkimukseen. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.19/55

Kommunikoinnin tavat: verbaalisuus Verbaalinen vs. ei-verbaalinen toiminta Puheen verbaalit elementit määritellään sellaisiksi kommunikatiivisen toiminnan osiksi, jotka edesauttavat sanojen identifioimista puhutussa kielessä. Esim. vokaalit, konsonantit ja paino ovat verbaalisia kun taas ns. äänensävy (tone of voice) on ei-verbaalista; ei-verbaali kommunikaatio sisältää siis sekä lingvistisiä että ei-lingvistisiä prosesseja. Esimerkkinä ei-verbaalisesta, ei-vokaalisesta kommunikoinnista ovat kasvojen ilmeet. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.20/55

Merkit ja symbolit Olion (referent) ja merkin (sign) suhde voi olla joko mielivaltainen (arbitrary) tai ei-mielivaltainen (non-arbitrary): symbolinen; "lentää". onomatopoeettinen; "kukkuu"käestä tai Puheäänne (speech-sound) toimii osoittimena lingvistisen koodin abstraktiin elementtiin; esim. tietty tapa toimia tunnistetaan yleensä tietyksi konsonantiksi. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.21/55

Lingvistisen koodin dualistisuus Kieliopillinen (grammatical) taso koostuu yleensä yksiköistä, joilla voi olla ulkoinen viittaus semanttiseen maailmaan (sanat, lauseet, virkkeet). Fonologinen taso koostuu yksiköistä, jotka toimivat kieliopillisten yksiköiden rakennuspalikoina; ts. äänteet ("äännökset", speech-sounds) edustavat tietyn (kyseisen) kielen abstrakteja fonologisia yksiköitä. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.22/55

Muoto ja substanssi Abstrakteja muotoja fyysisessä substanssissa Vaihtelevuus (variability) ja hahmot (patterns). Vaihtelevuudesta huolimatta kuulijan täytyy pystyä ottamaan vastaan distinktiivisiä hahmoja (distinctive patterns) puheen virrasta. Läheskään aina puheen substanssi (akustinen tai muunlainen) EI sisällä näitä distinktioita. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.23/55

Muoto ja substanssi (jatkoa) Hahmo (pattern) sellaisenaan on abstrakti käsite ja tarvitsee fyysisen reaalistuman (realization, manifestation) ollakseen osana reaalimaailmaa. Usein käytetään käsitettä muoto (form) kuvaamaan hahmoa, joka edustaa lingvististä yksikköä ja käsitettä substanssi kuvaamaan sitä ainesta (medium), jossa lingvistiset hahmot reaalistuvat. Puhetta tutkittaessa erotetaan muodon tutkiminen - fonologia - substanssin tutkimisesta - fonetiikka. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.24/55

Koodi ja aines Puhuja koodaa viestin lingvistiseen muotoon manipuloimalla puheen ainesta (medium of speech) ja kuulija avaa koodin (dekoodaa) tunnistamalla koodatut distinktiiviset hahmot ja käyttämällä ennustavaa tietoa: lingvististen sekvenssien todennäköisyys ja sanaston valinnan todennäköisyys. Avatessamme koodia voimme kuitenkin yleensä identifioida muitakin asioita aineksesta: esim. puhujan sukupuolen, iän jne. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.25/55

Puheen toiminnan muodot Puhetoiminta on muodoltaan sekä kommunikatiivista että informatiivista Signaali on kommunikatiivinen jos sen lähettäjän aikomus on saada vastaanottaja tietoiseksi jostain, josta hän ei ole aikaisemmin ollut tietoinen. Signaali on informatiivinen jos sen lähettäjä intentioistaan huolimatta saa vastaanottajan tietoiseksi jostain, josta hän ei ole aikaisemmin ollut tietoinen. Näiden määritelmien mukaan lingvistinen toiminta on sekä kommunikatiivista että informatiivista. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.26/55

Toiminnan muodot (jatkoa) Lingvistinen, paralingvistinen ja ekstralingvistinen toiminta Kaikki kolme tyyppiä ovat informatiivisia, mutta vain lingvistinen ja paralingvistinen ovat kommunikatiivisia. Lingvistinen toiminta viittaa arkielämän käsitteeseen kielellisyydestä (vrt. lingvistiikka = kielitiede). Puhe on yleisin lingvistisen toiminnan muoto, joka käyttää kaksitasoista fonologisista yksikoista koostuvaa koodia. Muita lingvistisen toiminnan muotoja ovat kirjoittaminen ja viittomakieli. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.27/55

Toiminnan muodot (jatkoa) Paralingvistinen toiminta on ei-kielellistä (non-linguistic); sillä on kaksi keskusteluun liittyvää tarkoitusta: se kertoo puhujan affektiivisesta ja emotionaalisesta tilasta sekä reguloi keskustelun ajankäyttöä. Ekstralingvistinen toiminta on se mitä puheeseen jää jäljelle kun kahden edellisen toiminnan tulokset on siitä analysoitu pois. Sellaisia ovat mm. äänen laadun vaihtelut, äänen korkeuden ja voimakkuuden vaihtelurajat (range). Ekstralingvistinen toiminta on siis luonteeltaan informatiivista (edellä olevan määritelmän mukaisesti) muttei kommunikatiivista. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.28/55

Fonetiikan ja fonologian suhde Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.29/55

Puheen analyysin tasot Puheen analyysi voidaan jaotella seuraaviin tasoihin: Akustinen Perkeptuaalinen Orgaaninen Foneettinen Fonologinen Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.30/55

Akustinen taso Puhetapahtumat ovat laadultaan tai ajoitukseltaan erilaisia jos jokin akustinen analyysi-instrumentti rekisteröi niiden eron saman ihmisen tuottamat lingvistisesti ja paralingvistisesti samanlaisten ilmauksien toistot ovat todennäköisesti akustisesti erilaiset. Kahden eri ihmisen lingvistisesti ja paralingvistisesti samanlaiset tuotokset ovat lähes varmasti erilaiset. Akustisen tason analyysi kuuluu akustisen fonetiikan piiriin (hyvä perusteos on Ken Stevensin Acoustic Phonetics, MIT Press 1999). Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.31/55

Perkeptuaalinen taso Pääosin auditorista, mutta myös taktiilista (oman puheen suhteen) ja visuaalista (muiden puheen suhteen). Puheen auditorisen havaitsemisen suhteen on olemassa neljä ulottuvuutta joiden avulla kaikki äänet voidaan erotella: 1. Laatu (quality) 2. Kesto (duration) 3. Äänenkorkeus (pitch) 4. Äänen voimakkuus, äänekkyys (loudness) Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.32/55

Orgaaninen taso Puhujat eroavat orgaanisesti toisistaan anatomisten tekijöidensä suhteen. Esim. ääntöelinten mitat ja massat eroavat suuresti puhujien välillä. Ääntöelinten erot ovat suuruusluokaltaan samanlaisia kuin kasvonpiirteiden erot. Myös pienemmillä fysiologisilla eroilla on merkitystä puheessa: esim. väsymys tai hormonaalinen tila vaikuttavat lihasten jännittämiseen tavalla, jota puhujan on vaikea tai mahdoton kontrolloida. Toisaalta terveydentila voi vaikuttaa ääntöelinten mittoihin; nuha pienentää nenäväylän tilavuutta jne. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.33/55

Foneettinen taso Foneettinen viittaa kaikkeen opittavissa olevaan puheentuottoelimistön käyttöön. Foneettinen toiminta on sosiaalisen kontekstin ja samankaltaisuuden normien kautta lapsena opittua käyttäytymistä. Foneettisen teorian peruslähtökohtana on, että orgaanisesti erilaiset puhujat pystyvät foneettisesti samankaltaisiin tuotoksiin. Foneettinen samuus (phonetic sameness) johtaa siihen, että foneettinen teoria on abstraktia. Peruspuhetapahtumaa (speech event), joka voi osoittaa foneettisen ekvivalenssin kahden puhujan välillä kutsutaan äänteeksi (phone). Foneettinen ekvivalenssi on ääripää foneettisen samankaltaisuuden jatkumolla. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.34/55

Foneettinen taso (jatkoa) Foneettinen kuvaus perustuu olettamukseen, että kuvauksen prosessi ei vaadi tietoa kuvattujen tapahtumien formaaleista linvgistisistä arvoista. Foneettinen kuvaus on siis riippumatonta saman aineksen fonologisesta kuvauksesta. Edellisen perusteella foneettista teoriaa voidaan soveltaa kaikkiin maailman kieliin ja niiden äänteisiin (näin ei voi sanoa olevan kielitieteellisten teorioiden kanssa). Foneettisessa kuvauksessa käytetään notaatiota, jossa äänteet esitetään hakasulkeissa:. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.35/55

Fonologinen taso Fonologian tehtävä on suhteuttaa foneettiset tapahtumat kieliopillisiin yksiköihin (grammatical units), jotka toimivat kielen morfologisella, leksikaalisella, syntaktisella ja semanttisella tasolla. Fonetiikka ja fonologia ovat intiimissä suhteessa keskenään eikä toista voi kunnolla tutkia tuntematta toista. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.36/55

Fonologia Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.37/55

Fonologia Fonologinen oppositio: Kun kaksi lausetta (utterance) ovat fonologisella tasolla samat yhtä erottavaa piirrettä lukuunottamatta niitä kutsutaan minimipariksi (minimal pair); esim. sanatasolla suomen sanat kota ja tota ovat minimipari. Samoin sanat muta ja mutta. Minimipareja erottavilla äänteillä on siis kontrastiivinen funktio ja ne ovat fonologisessa oppositiossa keskenään. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.38/55

Fonologinen esitys Fonologiset elementit esitetään yleensä kenoviivojen välissä: esim. /kota/ ja /tota/. Fonologisen esityksen avulla voidaan siis esittää lyhyesti fonologisten elementtien foneettinen status; voidaan esimerkiksi osoittaa, että sana /kolme/ voidaan joissain murteissa tuottaa muodossa. Tai vieläkin lyhyemmin: /kolme/ = Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.39/55

Fonologinen järjestelmä Myös muut äänteet /k/:n ja /t/:n lisäksi voivat olla kontrastissa keskenään ollessaan sananalkuisia sellaisessa sanassa, joka päättyy äänteisiin /ota/. Ts. meillä voi olla /sota/, /jota/, /kota/ jne. Ylläolevien potentiaalisten konsonanttien joukkoa kutsutaan fonologiseksi (osa)järjestelmäksi (phonological system) joka on systeemisessä kontrastissa (systemic contrast). Tällaiset minimaalisesti kontrastoivat sanajoukot muodostavat ns. paradigman ja paradigmaattinen oppositio onkin synonyyminen kontrastiivisen opposition kanssa. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.40/55

Fonologinen rakenne Edellisten esimerkkien sanajoukot edustavat samanlaisia fonologisia rakenteita ts. kaikki ovat sananalkuisen konsonantin ja sitä seuraavan vokaalin sekä sitä seuraavan tavunalkuisen konsonantin ja sitä seuraavan vokaalin muodostamia sekvenssejä. Sanat voivat luonnollisesti vaihdella myös tämän rakenteen suhteen; esim. sanat essi, messi ja stressi eroavat rakenteellisesti toisistaan. Jos käytämme merkkiä C osoittamaan konsonanttia ja V osoittamaan vokaalia, saamme seuraavat rakenteet: VCCV, CVCCV ja CCCVCCV. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.41/55

Fonologinen tavu Yleensä edellisen kaltaista esitysmuotoa käytetään käsiteltäessä fonologisen rakenteen tavuja. Tavut luokitellaan joko avoimiksi tai suljetuiksi: avoin tavu päättyy vokaaliin ja suljettu konsonanttiin. Kielet eroavat toisistaan sen mukaan, millaisia tavurakenteita ne sallivat; esim. puhdas suomenkieli ei salli usean konsonantin jonoja sanojen alussa. Näin ollen /stressi/ on usein /ressi/. Englannissa taas kolmen konsonantin jonot sanan alussa ovat yleisiä. Englannissa on kuitenkin muita kombinatorisia rajoitteita samassa asemassa; esim. /stw/ ja /spw/ eivät ole sallittuja. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.42/55

Fonologinen tavu (jatkoa) Tavun ytimenä (nucleus) on aina vokaali. Muut tavun osat ovat alku/aluke (onset) ja kooda (coda). Kaikilla tavuilla kaikissa kielissä on ydin, mutta konsonanttialuke ei ole useimmissa kielissä pakollinen ei myöskään kooda. Esimerkiksi suomi ja englanti sallivat sekä avoimet että suljetut tavut. Näin on laita useimpien kielten kanssa. Lainatessaan sanoja muista kielistä, puhujat yleensä muokkaavat ne oman kielensä tavurakenteen mukaisiksi naturalisointi (naturalization). Esim. hausan (afrikkalainen kieli) naturalisoitu muoto englannin sanasta screwdriver on [ ]. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.43/55

Fonologinen konteksti Strukturaalinen konteksti; esim. englannin /h/ voi esiintyä vain tavunalkuisena, muttei muualla /hat/ ja /perhaps/ (CVC ja CVC + CVCC). Vastaavasti / / voi suomessa (ja englannissa) esiintyä vain tavun lopussa / / ja / /. (Entä suomen / /?). Toinen kontekstiin liittyvä aspekti on äänteen ympäristö (environment) ja sen muodostama konteksti (environmental context). Esim. englannin / / voi yksitavuisissa sanoissa esiintyä vain kestoltaan lyhyen äänteen jälkeen: / / ja / /. Vastaavanlaista säännönmukaisuutta liittyy äänteiden jälkeiseen ympäristöön (right context). Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.44/55

Fonologinen konteksti (jatkoa) Edellisen mukaan äänteet ovat siis herkkiä sekä rakenteellisen kontekstin että muun ympäristönsä suhteen. Esim. /p/ on englannin sanoissa pan ja span erilainen rakenteellinen konteksti: vs.. Vastaavasti span vs. spoon: vs.. Tässä tapauksessa ero johtuu äänteiden ympäristöstä, eli /p/:tä seuraavasta (right context) pyöreästä vokaalista. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.45/55

Fonologinen jakauma (distribuutio) Fonologisella distribuutiolla tarkoitetaan niitä rajoitteita joiden mukaan äänteet voivat kielessä esiintyä. Niihin kuuluvat sallitut tavurakenteet ja äänteiden ympäristön määrittelemät kontekstit. Sen mukaan voidaan esim. päätellä etteivät /sloti/ tai /aittä/ ole suomenkielisiä sanoja. Näitä rajoitteita kutsutaan yleensä fonotaksiksi. Usein verrataan kahden äänteen distribuutioita; tällöin ne voivat olla ns. vapaassa vaihtelussa (free variation) fonotaksin suhteen tai komplementaarisessa distribuutiossa (complementary distribution), jolloin ne eivät jaa positiota rakenteiden suhteen. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.46/55

Syntagma ja paradigma Äänteiden väliset suhteet voidaan siis kuvata kahden akselin avulla: systeemisellä akselilla (osana järjestelmää) ja kontekstuaalisella akselilla (osana rakennetta). Näin ollen jokainen, vaikkapa konsonantti, on ensisijaisesti osa konsonanttien ja äänteiden järjestelmää, jossa se kilpailee muiden konsonanttien kanssa rakenteellisesta paikastaan sanoissa. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.47/55

Syntagma ja paradigma (jatkoa) Systeeminen akseli voidaan käsittää vertikaaliseksi; esim. sananalkuisten konsonanttien joukko kaksitavuisten sanojen alussa muodostaa paradigman, jota voidaan graafisesti kuvata seuraavalla tavalla: s k j / _ o t a / Toisaalta jokainen äänne ottaa osaa kontekstuaalisen distribuution ja fonotaktisten mahdollisuuksiensa kautta horisontaaliseen järjestelmään josta käytetään yleensä nimitystä syntagma. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.48/55

Foneemi ja allofoni Tässä vaiheessa meillä on tarpeeksi tietoa, jotta voimme esitellä kaksi fonetiikan ja fonologian keskeistä termiä: foneemi ja allofoni. Foneemi on kielitieteen suhteen sillä tavalla ongelmallinen, että sille on yleensä yhtä monta määritelmää kuin on määrittelijääkin. Fonetiikan suhteen sen määritteleminen helpottaa kuitenkin työskentelyä. Määrittelemmekin sen tässä kaksiosaisesti, joistä ensimmäinen keskittyy kontrastiivisuuteen ja toinen osa distributionaalisiin tekijöihin. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.49/55

Foneemi ja allofoni (jatkoa) 1. Kahden äänteen voidaan sanoa olevan eri foneemin reaalistumia tietyn kielen tietyssä murteessa jos ne toimivat erottavina tekijöinä kahden muuten fonologiselta rakenteeltaan samanlaisen sanan välillä ja jos ne sijaitsevat samassa ja yhdessä paikassa tätä rakennetta. 2. Sellaiset äänteet, jotka toistuvasti esiintyvät erilaisissa rakenteissa ja yhteyksissä (konteksteissa) voidaan luokitella tietyn foneemin edustajiksi jos niiden esiintyminen on komplementaarisessa distribuutiossa muihin äänteisiin nähden ja jos niiden foneettinen samankaltaisuus on sen asteista, että ne voidaan järkevästi luokitella yhteisen joukon jäseniksi. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.50/55

Foneemi ja allofoni (jatkoa) Foneemi on siis allofonien muodostama joukko! Foneemit osoitetaan muiden fonologisten yksikköjen tapaan kenoviivoin kun taas allofonit osoitetaan hakasulkein. Allofonin käsite on kuitenkin abstrakti eikä sitä pidä suoraan verrata äänteen (phone) käsitteeseen, joka on yksittäinen foneettisesti erottuva tapahtuma. Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.51/55

Fonologiset säännöt Usein on hyödyllistä kuvata fonologisia ilmiöitä sääntöjen muodossa; esim. A = B / C D on jotakuinkin A reaalistuu B:nä C:n jälkeen ennen D:tä Sääntöjen jäsenet voivat olla foneemeita, foneettisia tapahtumia, foneettisten tai fonologisten piirteiden joukkoja jne. Esim. /X/ = [y] / /C/ /D/ Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.52/55

Fonologiset säännöt (jatkoa) Kontekstuaalinen spesifikaatio voi taas koostua vaihtoehdoista: [y]//c/ /D/ /x/ = [z]//f/ [x] Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.53/55

Fonologiset säännöt (jatkoa) Italian alveolaarista nasaalia voi siis kuvata seuraavanlaisen säännön avulla: { } / /n/ = /n/ = { / CVELAR } Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.54/55

Fonologiset säännöt (jatkoa) Vokaalin nasaalistumista (monissa kielissä) ennen nasaalikonsonantteja voidaan kuvata seuraavasti: { } [ Ṽ ]/ C /V/ = NAS [V ] Ctl103 Fonetiikan perusteet kieliteknologeille Syksy 2001 p.55/55