Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus

Samankaltaiset tiedostot
Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio

Vfo254: Puhekorpusten käyttö

Foneettiset symbolit

Vfo254: Puhekorpusten käyttö

Puhe ja kommunikaatio

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Prosodian havaitsemisesta: suomen lausepaino ja focus

Puhutun ja kirjoitetun rajalla

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003

Suomen prosodian variaation tutkimuksesta

Yhdyssana suomen kielessä ja puheessa

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat

Mitä suomen intonaatiosta tiedetään

Åbo Akademi klo Mietta Lennes Nykykielten laitos Helsingin yliopisto

4. FONOLOGIA eli kielen äännerakenne

Automaattinen semanttinen annotointi

4 Fonetiikkaa. Puhe-elimet

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

Mitä puhe on? Fonetiikan perusteet kieliteknologeille. Puheen analyysin viitekehys. Puhe ja Kommunikaatio. Puhe ja kommunikaatio (jatkoa)

Mitä puhe on? Fonetiikan perusteet kieliteknologeille

Puheenkäsittelyn menetelmät

Varhainen leikki ja sen arviointi

Fonetiikan perusteet (FA1/Clt 120): ääni II, ilmavirtamekanismit ja äänteet

Foneettiset symbolit. Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat. IPA jatkoa IPA. Martti Vainio -- syksy 2005

Mitä puhe on? Fonetiikan perusteet kieliteknologeille


Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

1.5. Fonologia Vokaalit. Luku 1. Johdanto 11

Lausuminen kertoo sanojen määrän

Alkukartoitus Opiskeluvalmiudet

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Sisällys. Sisällys. Esipuhe Äänteellisen kehityksen peruskäsitteet I Äänteellisen kehityksen edellytykset

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

Press Brake Productivity -pikaopas

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

Annotaatioon liittyvä ydinkäsitteistö

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Tommi Nieminen. 35. Kielitieteen päivät Vaasa

Puheen tuotto ja havaitseminen I Vokaalit. Puheentuoton lähde-suodin -malli. Glottaalinen äänilähde. Fonaatio

Puheen tuotto ja havaitseminen I

Fonetiikan perusteet (FA1/Clt 120): ääni II, ilmavirtamekanismit ja äänteet

Fonetiikan perusteet (Clt 120): ääni II, ilmavirtamekanismit ja äänteet sekä liikkeet. Martti Vainio,

Puhesynteesin perusteet: Lingvistinen esikäsittely

Lukemisvaikeuden arvioinnista kuntoutukseen. HYVÄ ALKU- messut Jyväskylä, Elisa Poskiparta, Turun yliopisto, Oppimistutkimuksen keskus

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015

Intonaation analyysi ja annotointi puhekorpuksissa

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat

Puheen tuotto ja havaitseminen II

11.4. Context-free kielet 1 / 17

Kuva 1. Jokaisen tavallisen kuvan tasotyökalussa näkyy vain yksi taso, tässä nimellä tausta.

KUN LUKEMINEN ON HANKALAA. Helena Sorsa

uv n, v 1, ja uv i w A kaikilla

Luonnolliset vs. muodolliset kielet

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu

Sana rakenteen kategoriana (A. Radford: Transformational Grammar. A First Course)

1 Kannat ja kannanvaihto

Ainakin vuosien 2004 ja 2006 fonetiikan

Kielellisen datan käsittely ja analyysi tutkimuksessa

ISO SUOMEN KIELIOPPI S2- OPETUKSESSA. Muutama havainto

Kerta 2. Kerta 2 Kerta 3 Kerta 4 Kerta Toteuta Pythonilla seuraava ohjelma:

Puhesynteesin perusteet Luento 5: unit selection -synteesi

Ohjelmistojen mallintaminen, mallintaminen ja UML

Muodolliset kieliopit

Rekursiolause. Laskennan teorian opintopiiri. Sebastian Björkqvist. 23. helmikuuta Tiivistelmä

Ctl160 Tekstikorpusten tietojenkäsittely Viides luento

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

S Havaitseminen ja toiminta

Puheaineiston annotaatio eli nimikointi. Mietta Lennes Sanna Ahjoniemi

Organization of (Simultaneous) Spectral Components

Vaatimusmäärittely Ohjelma-ajanvälitys komponentti

ELM GROUP 04. Teemu Laakso Henrik Talarmo

Musiikkipäiväkirjani: Maalataan, kirjoitetaan ja luetaan musiikkia (PWR1) Valitaan värejä, kuvia tai symboleja erilaisille äänille.

Pong-peli, vaihe Aliohjelman tekeminen. Muilla kielillä: English Suomi. Tämä on Pong-pelin tutoriaalin osa 3/7. Tämän vaiheen aikana

Espanjan kielen ääntäminen suomenkielisen opiskelijan näkökulmasta

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Artikulatoriset piirteet. Puheen tuotto ja havaitseminen II Konsonantit. Piirteiden tyypit. Artikulaatiotavat

Puheen tuotto ja havaitseminen II

The OWL-S are not what they seem

Sanaluokkajäsennystä rinnakkaisilla transduktoreilla

Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33

LASTEN ÄÄNTEELLINEN KEHITYS: TUTKIMUSMETODOLOGIAA

Tentti erilaiset kysymystyypit

Lausekkeiden rakenteesta (osa 2) & omistusliitteistä

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot

Vastauksia. Topologia Syksy 2010 Harjoitus 1

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

Kieli merkitys ja logiikka. 4: Luovuus, assosiationismi. Luovuus ja assosiationismi. Kielen luovuus. Descartes ja dualismi

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

8. Kieliopit ja kielet

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 19. tammikuuta 2012

Hannu Mäkiö. kertolasku * jakolasku / potenssiin korotus ^ Syöte Geogebran vastaus

Transkriptio:

Symbolinen representaatio Vfo 254: Puhekorpusten käsittely: Puhekorpusten lingvistinen representaatio Martti Vainio Puhekorpuksen tutkimininen on mahdollista vain symbolisen representaation kautta näytteistettyä puhetta ei sellaisenaan voi tutkia. Kaikki korpuksen representaatiot ovat jonkinlaisen analyysin tai luokittelun tulosta. Representaatiot eivät itse ole puhetta, vaan abstraktioita! Yleensä symbolinen representaatio tarkoittaa transkriptioita, joita käytetään niin foneettisessa kuin sosiologisessakin tutkimuksessa. Käytetyn transkription tyyppi riippuu hyvin paljon, siitä mihin tarkoitukseen se on tehty. Näin ollen niiden taso ja tarkkuus vaihtelevat suuresti. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 1 Transkription tarkkuus Suuria korpuksia on mahdotonta annotoida kovin tarkasti tarkka foneettinen segmentointi vaatii paljon taitoa ja aikaa. Yleensä suuret (spontaania puhetta) sisältävät korpukset on annotoitu vain ortografisesti (ATIS, Switchboard). Pienemmät korpukset voidaan kuitenkin analysoida ja annotoida tarkemmin segmentaalisin merkein ja jopa segmentoiden äännetasolla (TIMIT, PhonDAt). Ortografinen translitteraatio voidaan myöhemmin muuntaa ns. kanoniseen foneemiseen muotoon vaikkapa grafeemi-foneemi -säännöin. On huomattu, että luotettavien foneettisten transkriptioiden tekeminen suurille korpuksille ei ole mahdollista. Luetun vs. spontaanin puheen transkripointi Luetun puheen pohjana on kirjoitettu teksti spontaanille puheelle teksti täytyy tuottaa jälkikäteen. Spontaanin puheen luovuus aiheuttaa monia merkittäviä piirteitä, jotka erottavat sen luetusta puheesta: se on täynnä taukoja, väärin lausuttuja sanoja, vääriä aloituksia ja toistoa. Riippuen tilanteesta, spontaani puhe sisältää myös ns. puhekielisiä, epästandardeja muotoja ja reduktiota, jolloin jopa kokonaiset sanat voivat kadota. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 2 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 3

Dialogin transkripoiminen Ilmaus spontaanissa ja luetussa puheessa Eräs tärkeä erottava piirre spontaanin ja lukupuhunnan välillä on ilmauksen (utterance) määritteleminen: lukupuhunnassa ilmaukset yleensä korreloivat lauseiden tai virkkeiden kanssa, spontaanissa näin ei tietenkään voi olla. Spontaanin puheen suhteen joudutaan yleensä tarkasti määrittelemään ilmaukset: dialogissa ne liittyvät useinmiten (puheen)vuoroihin; monologeissa ilmaus määritellään usein taukojen rajaamaksi intervalliksi, jolla on jonkinlainen syntaktinen, semanttinen, pragmaattinen ja prosodinen rakenne. Puhujien välisessä keskustelussa on usein keskeytyksiä, jotka voivat olla kokonaisia ilmauksia tai vaikkapa affirmatiivisiä yhden sanan tai äänteen muodostamia; joo tai hmm. Yleensä keskeytykset tapahtuvat samanaikaisesti muun puheen kanssa päällekkäispuhunta tulee merkitä annotointeihin. Ortografisessa transkriptiossa voidaan käyttää esim. Switchboardin tapaan #-symbolia: A: # Right, bye # B: # Bye bye # Useamman kuin kahden puhujan kanssa tilanne monimutkaistuu ja voidaan käyttää esim. ns. partituurinotaatiota (engl. score). Esim. Praatin TextGrid. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 4 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 5 Transkription tasot ja tyypit Transkription tasot ja tyypit Transkriptioden tyypit Transkriptiot ja niistä tuotetut representaatiot Tärkein ero on itse transkriptioden ja niiden avulla tuotettujen muiden representaatioden välillä: Transkriptoita tehdessä joudutaan aina joko manuaalisesti tai koneellisesti monitoroimaan puhesignaalia. Transkriptioista tuotettujen representaatioiden suhteen puhesignaalia ei välttämättä tarvita: tällaiset representaatiot voivat olla esim. ortografiasta tuotetut fonologiset, morfologiset, syntaktiset yms. analyysit. Transkriptiot voidaan jakaa seuraaviin tyyppeihin, jotka kaikki voidaan kohdentaa puhesignaaliin: 1. Translitteraatiot (engl. script); esim. tuomioistuinten tallenteet 2. Ortografiset transkriptiot 3. Morfologiset, syntaktiset, semanttiset ja pragmaattiset representaatiot 4. Foneemiset (sitaatiomuotoiset) representaatiot 5. Karkeat (engl. broad) foneettiset transkriptiot 6. Tarkat (engl. narrow) foneettiset transkriptiot 7. Akustis-foneettiset transkriptiot 8. Fyysiset transkriptiot 9. Prosodiset transkriptiot Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 6 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 7

Segmentointi ja nimikointi Segmentoinnilla tarkoitetaan puhesignaalin jakamista ei-päällekkäisiin osiin, jotka vastaavat tiettyjä lingvistisiä tai fyysisiä yksiköitä. Nimikointi (engl. labeling) tarkoittaa segmentoitujen kappaleiden nimeämistä fyysisesti tai lingvistisesti määritetyillä symboleilla. Rajatut segmentit voivat olla monen tyyppisiä riippuen korpuksen käyttötarkoituksesta. Yleisesti suositellaan ainakin seuraavia tasoja: ortografinen foneettinen tarkka foneettinen Varoituksen sana Puheen käsittäminen lineaariseksi sekvenssiksi erilaisia yksiköitä on mukavuussyistä kehitetty fiktiivinen harha. Esim. monien äänteiden väliset rajat ovat hyvinkin vaikeita paikantaa vokaalit vs. puolivokaalit, vokaalit vs. vokaalit. Toisaalta konsonanttien identiteetti ääntymäpaikan suhteen on koodattuna sitä ympäröivissä vokaaleissa jne. Näin ollen puhetta ei voida käsitellä jonona diskteettejä äänteitä tai muitakaan yksiköitä äänteellinen segmentointi on kuitenkin tiettyyn pisteeseen saakka täysin mahdollista ja arbitraarinen raja on parempi kuin ei mitään. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 8 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 9 CRIL konventiot CRIL (Computer Representation of Individual Languages) määriteltiin IPA:n 1989 Kielin konventiossa ja koostuu kahdesta osasta: 1. IPA-kategorioiden mappaus standardeihin IPA-numeroihin ja symbolien nimiin. 2. Puheentuoton representoimiseen kolmella distinktiivisellä tasolla. Ensimmäisen osan tarkoitus on on laajentaa IPA:n deskriptiivisten kategoroiden ja symbolien sekä tarkkeiden (diakriittien) käyttöä kuvaamaan normaalia ja häiriintynyttä puheentuottoa. Toinen CRILin komponentti pyrkii puheentuoton standardoituun representaatioon. CRILin kolme transkriptiotasoa CRILissä on kolme systemaattista ja distinktiivistä tasoa, jotka pyrkivät spesifioimaan jotain, jota voitaisiin kutsua puheen tekstiksi : 1. Ortografinen taso: puhutun tekstin ortografinen representaatio. 2. Foneettinen taso: sanojen täydelliset (redusoimattomat) foneettiset muodot; ns. sitaatiomuodot. 3. Kapea foneettinen taso: kapea foneettinen transkriptio, siitä, mitä oikeasti sanottiin. Vain viimeisellä tasolla voidaan foneettiset kategoriat suoraan assosioida signaaliin. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 10 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 11

Manuaalinen segmentointi Manuaalisella segmentoinnilla tarkoitetaan prosessia, jossa asiantuntija (esim. foneettisesti koulutettu transkripoija) segmentoi ja nimikoi puhesignaalia käsin. Manuaalista segmentointia ei voida koskaan kokonaan korvata automaatisilla tai puoli-automaattisilla menetelmillä menettämättä segmentoinnin tarkkuudessa. Manuaalisen segmentoinnin avulla varmistetaan myös segmentoitujen yksiköiden perkeptuaalinen validiteetti. Segmentoinnin tarkkuutta voidaan mitata mm. eri transkripoijien välisellä yhdenmukaisuudella; kunnolliseen yksimielisyyteen (> 90 %) päästään vain ns. helppojen yksiköiden suhteen (frikatiivit, lateraalit ja nasaalit). Automaattinen ja puoliautomaattinen segmentointi Automaattinen segmentointi tarkoittaa koko segmentointiprosessin suorittamista automaattisesti esim. HMM-pohjaisen tunnistimen avulla. Puoliautomaattisella segmentoinnilla tarkoitetaan prosessia, jossa automaattisen segmentoinnin tulos tarkistetaan ja korjataan käsin. Automatisoitua segmentointia tarvitaan suurten korpusten tekemiseen, mutta sen antama tarkkuus jättää toivomisen varaa. Virheitä voi sattua monella tasolla: järjestelmälle annettu symbolijono on väärä tai järjestelmä ei yksinkertaisesti löydä sopivaa rajaa signaalista. Toisaalta, järjestelmien ns. frame-koko on usein liian suuri, jotta päästäisiin tarpeelliseen tarkkuuteen. Automaattisten segmentointijärjestelmien tarkkuutta voidaan mitata vertaamalla niiden tuotosta manuaaliseen segmentointiin. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 12 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 13 Ortografinen transkriptio Ortografisella transkriptiolla tarkoitetaan kielen standardikirjoitusasun mukaista asua. Translitteraatiot ja ns. skriptit Luetun puheen suhteen yksinkertaisin ja nopein taso annotaatioissa on ortografinen muoto, joka on helposti saatavilla; esim. radiouutiset. Useinmiten taso on kuitenkin riittämätön ja tarvitaan muitakin tasoja. Ortografista transkriptiota käytetään (etenkin suurissa korpuksissa) silloin kun tarkempaa tietoa puheentuotosta ei tarvita. Standardin kirjoitusasun käyttö tarkoittaa, että representaation ja puhutun välillä täytyy tehdä kompromissi, joka on erityisen suuri spontaanin puheen kohdalla ja esim. voidaan käyttää redusoituneita muotoja (für den fürn) ja kirjoitettua murretta. Vastaavasti numerot ja lyhenteet voidaan kirjoittaa auki. Myös interjektioiden yms. kirjoituksessa käytetään standardia, ja jos sellaiste ei ole, sovitaan niiden kirjoituksesta erikseen. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 14 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 15

Morfologiset, syntaktiset, semanttiset ja pragmaattiset representaatiot Korpukset voidaan myös merkitä tai tagata lingvistisesti foneemisen tason yläpuolisilla yksiköillä. Tällaiset representaatiot ovat tärkeitä esim. tutkittaessa syntatkisen rakenteen suhdetta prosodiaan. Syntaktisella tasolla voidaan merkitä esim. lause- ja lausekerajat, yhdyssanojen sisäiset rajat jne. Lingvistiset representaatiot johdetaan yleensä automaattisten jäsentimien ym. avulla ortografisista transkriptioista. Foneemiset (sitaatiomuotoiset) representaatiot Sisältää yleensä ortografian avulla tehdyn foneemijonon. Foneemien symboleina käytetään yleensä jotain IPA:n numeerista tai ASCII -muotoa. Euroopan kielille on määritelty SAMPA-aakkosto, josta voidaan edelleen määritellä ala-aakkostot kielikohtaisesti. Sampan etu on yksi grafeemi per foneemi, jolloin foneemisekvenssi voidaan kirjoittaa ortografian lailla yhteen. Toinen ASCII-muotoinen representaatio IPAsta on Worlbet, joka on hiukan IPAa laajempi vaatii kuitenkin usein kaksi merkkiä per foneemi. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 16 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 17 Tarkat (engl. narrow) foneettiset transkriptiot Karkeat (engl. broad) foneettiset transkriptiot Karkealla foneettisella tasolla voidaan kuvata jo sellaisia ilmiöitä, kuin assimilaatio tai vokaalien reduktio. Tasoa kutsutaan joskus fonotyyppiseksi (Autesserre, 1989) ja se voidaan tuottaa automaattisesti fonologisten sääntöjen avulla foneemisesta kuvauksesta. Näin ollen tämäkään taso ei vielä välttämättä vaadi suoraa viittausta puhesignaaliin, mutta käytännössä tämä taso jää usein alimmaksi ja yksiköt kohdennetaan signaaliin. Tällä tasolla symbolien määrä on vielä rajallinen ja taso sopiikin myös suurten tietokantojen annotointiin. Ensimmäinen representaatiotaso, jossa transkripoija ei voi välttyä kuuntelemasta itse signaalia. Kapea foneettinen tarkekirjoitus pyrkii kuvaamaan, sitä mitä puhuja todella sanoi tuottaessaan ilmauksen. Työ on manuaalista ja kasvattaa tietokannan luomiseen tarvittavien resurssien määrää huomattavasti. Tarvittavien symbolien inventaario kasvaa kun tarvitaan symboleita myös sellaisille äänteille, joilla ei ole foneemista statusta kielessä; esim. glottaaliklusiili ja aspiraatio suomessa. Tarkkojen rajojen asettaminen on kuitenkin usein ongelmallista, mutta keskimääräinen lopputulos on melko tarkka kuva puheesta. Usein riittää, että vain osa korpuksesta on kuvattu tällä tarkkuudella. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 18 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 19

Akustis-foneettiset transkriptiot Tällä tasolle erotellaan kaikki akustisesti joko aaltomuodosta tai spektrogrammista erottuvat osat. Tällaisiin kuuluvat mm. klusiilien sulkeumat, eksploosiot ja aspiraatiot sekä vokaalien glottaaliset alukkeet ja nasaalien sekä frikatiivien mahdolliset soinnilliset osat. Nimikointi tehdään suhteessa selkeisiin artikulatorisiin kategorioihin, jotka voidaan edelleen helposti suhteuttaa lingvistisiin yksiköihin. Fyysiset transkriptiot Kaikista kuvaustasoista yksityiskohtaisin. Voidaan liittää myös muihin kuin akustisiin signaaleihin: esim. palatografin signaaleihin tai videkuvaan multimodaalisissa tietokannoissa. Fyysiset tapahtumat voivat olla joko diskreettejä tai päällekkäisiä ajan suhteen ja jokainen parametri kuvataankin omalla kanavallaan tai rivillään. Toistaiseksi fyysisiä transkriptioita käytetään vähän, mutta tulevaisuuden luonnollisuutta vaativat aplikaatiot vaativat niiden olemassaoloa. Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 20 Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 21 Prosodiset transkriptiot Seuraava luento! Vfo254: Puhekorpusten käyttö Martti Vainio HY - Fonetiikan laitos Kalvo 22