Puhe ja kieli, 21 :4, 153-162 (2001) 153 ITSEORGANISOITUVAT KARTAT INTONAATIOTUTKIMUKSEN APUVÄLINEENÄ Kieliteknologia, Vieraiden kielten laitos, Joensuun yliopisto stefan.werner@joensuu.fi Itseorganisoituva kartta on nykyaikainen menetelmä, joka soveltuu erityisesti eksploratiivisiin tutkimuksiin monen numeerisen muuttujan asetelmissa. Puheentutkimuksessa itseorganisoituvaa karttaa voidaan käyttää esimerkiksi intonaation akustisten parametrien tutkimiseen. Avainsanat: SOM, FO, intonaatio 1. JOHDANTO 2. ITSEORGANISOITUVA KARTTA Tässä artikkelissa on tarkoitus esitellä lingvistisessä puheentutkimuksessa vielä vähän käytettyjä menetelmiä, joita sovelletaan laajasti muiden alojen empiirisissä tutkimuksissa. Keinotekoisten hermoverkkojen ideaan perustuvia analyysi-, luokittelu-, synteesi- ja mallintamismenetelmiä on nykyisin tarjolla laaja valikoima. Samaan aikaan myös lingvistisessä ja foneettisessa tutkimuksessa on totuttu lisääntyvään kvantitatiivisten menetelmien ja tietokonepohjaisten työvälineiden käyttöön, muttatoistaiseksi vain harvoin turvaudutaan tähän uusien metodien luokkaan, johon itseorganisoituvat kartatkin lukeutuvat. Artikkelin tavoitteena on tutustuttaa tilastollisten menetelmien rajoja kohdanneet puheen- tai kielentutkijat metodiin, jota he voivat hyödyntää analysoidessaan empiiristä aineistoa. 2.1. Teoria Itseorganisoituvien karttojen (self-organizing maps/som) tarkoitus on löytää rakenteita kompleksisesta empiirisestä aineistosta. Jos aineistossa on monta muuttujaa, perinteiset tilastolliset analyysit eivät useimmiten pysty selvittämään, mitkä havainnot ovat samankaltaisia ja voisivat kuulua yhteiseen luokkaan. Itseorganisoituvassa kartassa sen sijaan aineiston monet ulottuvuudet projisoidaan litteälle pinnalle niin, että eri havaintojen samankaltaisuudet ja erilaisuudet näkyvät etäisyyksinä kartan pisteiden välillä. Menetelmän kehittäjän Kohosen (1989: 148) mukaan: "[...] the self-organized mapping does directly what would be hard for clustering methods, namely, to display the overall similarity relations in a metric way, twodimensionally. For this reason the self-or-
154 ganized mappings might be used to visualize topologies and hierarchical structures ofhigh-dimensional pattern spaces." Kohosen (1996: 4) käyttämä analogia selventänee itseorganisoituvan kartan perusajatuksen: tietojen rakenne pyritään säilyttämään samantapaisesti kuin kukka voidaan kuivattaa puristimessa niin, että se näyttää kaksiulotteiselta kuvalta itsestään. Kolmiulotteisen kukan muodon ja rakenteen pystymme tosin tajuamaan myös ulottuvuuksia redusoimatta, mutta neljästä ulottuvuudesta lähtien ihminen tarvitsee hahmottamiseen apuvälineitä, joista yksi hyvin joustava on SOM. Itseorganisoituva kartta, joka kuuluu neuraaliverkkojen perheeseen, oppii ohjaamattomasti kuvaamaan empiirisen havaintoaineiston karttayksiköiden hilana, jossa jokaiseen yksikköön kuuluu tietty parametrivektori sekä etäisyysmitta hilanaapureihin; samaaetäisyysmittaakäytetään myös aineiston ja karttayksiköiden parametrivektoreita vertailtaessa, joten kaikki havainnot voidaan liittää parhaiten sopivaan eli lähimpään yksikköön. Hilalla voi olla joko suorakulmainen (kuvio 1) tai heksagonaalinentopologia, millävoidaanvaikuttaaeri rakenteidenvisuaaliseen esitystapaan. Muista hermoverkkomenetelmistä itseorganisoituvan kartan etottaa ratkaisevasti itsenäinen oppiminen: sitä ei tarvitse opettaa valmiiden oikeiden tulosten avulla, vaan karttaverkko löytää itse vastauksia. Toisin kuin perinteisessä tilastollisessa ryväsanalyysissä SOM-analyysissäei edellytetä tietoa tai arvauksia siitä, montako eri ryvästä tai luokkaa aineistosta on löydettävissä, vaan ohjaamaton oppiminen johtaasellaiseen rakenteen esittämiseen, josta tutkija voi nähdä, mitkä havainnot kuuluvat yhteen, mitkä eivät (ks. yksinkertaistettu esimerkki kuvassa 2). Tämä päättely on hyvin perusteltu siksi, että itseorganisoituvat kartat tuottavat myös luokitteluun tarpeelliset etäisyyden ja tiheyden mitat. Itseorganisoituvia karttoja voidaan käyttää sekä eksploratiiviseen parametriavaruuden visualisointiin että suoraan ryväsanalyysin. Niiden teorian ja toiminnan tarkka formaalinen kuvaus löytyy esim. teoksesta Kohonen (2001). 2.2. Sovellukset Viime vuosikymmenten aikana SOM-menetelmää on käytetty mitä erilaisimpiin käyttötarkoituksiin ja sovelluksiin. Tässä muutama esimerkki: kasvojen tunnistus (Tolba & Abu-Rezq, 1999), kulutustottumusten analyysi (Cottrell et al., 1997), KUVA 1. Kaksiulotteinen karttahila yksiköineen (ympyrät).
Itseorganisoituvat kartat ja intonaatiotutkimus 155 robotin kävelytyylin arviointi (Xuemin et al., 1997), kasvien siementenluokittelu (Goodacre et al., 1996), terveiden ja patologisten äänten erottelu (Callan et al., 1999), dysleksian tutkimus (Miikkulainen, 1997). 3.ITSEORGANISOITUVAT KARTAT PUHEEN- JA KIELENTUTKIMUKSESSA 3.1 "Perinteisiä" sovelluksia Itseorganisoituvien karttojen ensimmäinen laajasti huomiota herättänyt sovellus tapahtui juuri puheentutkimuksessa. Vuonna 1987 Kohosen ryhmä julkaisi "foneemisen kirjoituskoneen" kuvauksen (Kohonen et al., 1987); tutkijat olivat onnistuneet luokittelemaan akustisia parametrivektoreita (jotka sisälsivät lähinnä tietoja spektristä) äännetyypeiksi. Tämän jälkeen on jatkuvasti ilmestynyt uusia puheen- tai kielentutkimukseen liittyviä tutkimuksia, pääasiallisesti kieliteknologian (esim. Honkelaetal., 1995; Lagus, 2000) ja puheen- sekä puhujantunnistuksen (esim. Mujunen et al., 1993; Ramesh et al., 1991; Chen et al., 1996; Anderson, 1994; Anderson & Patterson, 1994) aloilla. Valtaosa näistä julkaisuistaon kuitenkin syntynyt insinööritieteissä eikä fonetiikassa tai kielitieteessä (ks.laaja viitekokoelma osoitteessa http://www.cis.hut.fi/research/som-bibll). (a) (b) (e) (d) KlNA 2. Itseorganisoituva kartta, jolle syöterään ympäröivän kolmion reunapisteiden koordinaarreja eri vaiheissa oppimisprosessia. Yhden operuskierroksen aikana syötetään kerran kaikkien pisteiden kaikki parametrit (eli tässä koordinaatit). (a) 10 opetuskierroksen jälkeen (b) 100 opetuskierroksen jälkeen (e) 1000 opetuskierroksen jälkeen (d) 5000 operuskierroksen jälkeen
156 3.2. UUSI SOVELLUSESIMERKKI: INTONAATIOMALLIT Eri intonaatioteoriat, -mallit, ja -kuvaukset käyttävät kirjavaa joukkoa akustisia ja lingvistisiä kriteereitä sävelkulkuilmiöiden luokitteluun. Empiirisiä tutkimuksia kaikkien näiden kriteereidenvaikutuksista ja keskinäisistä suhteista ei ole paljonkaan tehty, vaikka juuri tällainen selvitys vasta mahdollistaisi eri lähestymistapojen systemaattisia vertailuja. Näin on useimmiten tyydytty yksittäisten esimerkkien kritiikkiin tai taustalla olevan teorian yleiseen arviointiin ja vältetty perusteellisia aineistopohjaisia kontrastiivisia analyysejä vedoten mallien keskinäiseen yhteensopimattomuuteen. Esimerkiksi IPQ-koulukunnanprototyyppisiä FO-kontuureja ('t Hart et al., 1990) ei suoraan voi verratatobi:n (Silverman et al., 1992) kaltaisiin toonipisteisiin tai Fujisakin (1997) fraasi- ja aksenttikomentoihin, koska relevanttien FO-vaihtelujen representaatiot näissä kolmessa äärityypissä ovat liian erilaisia. Seuraavassa hahmottelen, miten itseorganisoituvat kartat voivat toimia tutkimuksen apuvälineenä, joka sittenkin mahdollistaa tällaiset vertailut. Ensimmäinen askel on yhteisen representaation löytäminen kaikkien mallien kategorioille. Koska nämä kategoriat on määritelty suhteessa akustisiin ilmiöihin, joskaan ei yhteismitaliisin suurein, niiden kuvaamisen pitäisi onnistua sopivan laajalla akustisten parametrien joukolla. Vaikka tietty malli ei käytäkään kuin pientä osajoukkoa, johon ei välttämättä edes kuulu yhtään jonkin toisen mallin käyttämää parametria, malleja voidaan kuitenkin vertailla toisiinsa sellaisten havaintojen kautta, joille on tiedossa kaikkien parametrien arvot. Mutta mikä on akustisten mittausten kohde? FO-käyrä pitääeritelläjoiksikindiskreeteiksi yksiköiksi, jotka ovat tarpeeksi pieniä toimiakseen minkä tahansa FO-representaation rakennuspalikkoina. Yksi tämän ehdon täyttäväyksikkö on kahdenvierekkäisen FOkäännekohdan pari. FO-käyrän suoristaminen siinä määrin, että mikroprosodiset vaihtelut (segmentaaliset vaikutukset FO:aan) häviävät, säilyttää kuulohavainnon samanlaisena eli ei muuta intonatorista funktiota. Lisäksi kahden käännekohdan välisistä suorista viivoista voi rakentaa IPO-kontuureja yhtä hyvin kuintobi-pisteitäyhdistäviä suoria tai jopaperseptuaalisesti ekvivalenttejalikimääräistyksiä FujisakinFO-jatkumoista. Kuvassa 3 nähdään, miten joitakin esimerkkiparametreja mitataan FO-käännekohtapareiksi eritellystä käyrästä. Seuraavassa selitän kuvan merkinnät: Suora 1-4: FO-käännekohtien väliset lineaariset approksimaatiot FOK: FO-suoran kesto FOa, FOI: Fo-arvot suoran alussa ja lopussa FOero: FOI-FOa voi: "vowel onset interval": aikaväli vokaa- Iin alusta seuraavan vokaalin alkuun vk: vokaalin kesto tk: tavun kesto sk: sanan kesto ak: "aksenttiryhmän" kesto: aikaväli (iause)painollisen tavun alusta seuraavan painollisen tavun alkuun tafoa: aikaväli tavun alusta FO-suoran alkuun vlfol: aikaväli vokaaiin lopusta FOsuoran loppuun. Parametrisen representaation tarkoitus on siis sisältää vähintään kaikki eri malleissa sovelletut akustiset muuttujat sekä lisäksi kaikki muutkin mitattavat suureet, joilla mahdollisesti on vaikutus intonaatioon. SOM-menetelmän yksi etu on, että tutkijan ei tarvitse jättää huomion ulkopuolelle potentiaalisia tekijöitä esimerkiksi rajallisten
Itseorganisoituvat kartat ja intonaatiotutkimus 157 fi1e=001.sfs speaker=rtd token=ool Time (s) 12494 Hz -8829 300 200 100 fx1oad(fi1e=001.fo.signaix,rate=loo,offset~0) FOa FOI Suora 3 t:---::?5;~ ~- ~-----------------J~:ro ak FX.01 FOK tafoa sk vlfol KlNA 3. FO-käyrän erittely käännekohrapareiksi ja esimerkkejä akustisren parmetrien mitrauksesra. laskentaresurssien takia, vaan karsiminen voi odottaa, kunnes sitä puoltavaa empiiristä näyttöä on saatu. Toinen askel on mallikategorioiden koodaus sopivilla akustisilla parametreillä; mitä laajempaa muuttujaosajoukkoa tähän sovelletaan, sitä tarkempaan vertailutyöhön itseorganisoituva kartta myöhemmin pystyy. Seuraavaksi mitataan ja tallennetaan empiirisen FO-aineiston kaikki aikaisemmin valitut akustiset parametrit. Juuri tämän aineiston kautta vertailu saadaan aikaan: kartassa FO-havainnot ryhmittyvät rypäiksi ja nämä ryppäiden sijainnit voidaan suhteuttaa mallikategorioiden sijoituspaikkoihin. Neljäs ja viimeinen askel on siis itseorganisoituvan kartan'opetus' empiirisel1ä aineistolla ja mallikategorioiden asettaminen samaan karttaan. Silmämääräisesti voi sitten tarkastella aineiston sisäisen rakenteen suhdetta eri mallien saman parametriavaruuden jaotteluun sekä verrata suoraan mallikategorioiden jakaumia keskenään. Havainnol1istavana esimerkkinä voin käyttää kolmen saksan kielen intonaatiomallin vertailua (Werner, 2000). Fujisaki-, ToBI- ja IPO-mallin sovelluksista saksan kieleen tutkittiin seuraavia malleja: Möbius (1993), Benzmiiller & Grice (1997) ja Adriaens (1991). Parametrien koodaus oli IPO- ja ToBI-mallin kohdalla triviaalia, ja myös Fujisaki-säännöstö (Möbius, 1993, 167 170) saatiin muunnettua FO- ja aikaparametreiksi generoimalla säännöstön perusteella prototyyppi-käyriä mittauskohteiksi. Empiiriset parametriarvot saatiin analysoimalla
158 PHONDAT-korpusta (Kohler, 1994). Kuvassa 4 on esitetty kolmen akustisen parametrin 'komponenttitasot' eli yhden erillisen muuttujan arvojen projisoinnit karttaan. Lopullinen kartta yhdistää kaikki komponenttitasot (tässä tapauksessa 32) yhdeksi kaksiulotteiseksi koordinaatistoksi. Komponenttitasoja voidaan pitää eräänlaisena parametrin tilastollisen jakauman visualisointina. Jotta havaintojen sijoittumispaikka ja etäisyys naapureihin saataisiin näkymään samassa kuvassa, käytetään kokonaiskartan esittämiseksi erilaisia graafisia havainnollistamismenetelmiä, jotka hyöydyntävät perspektiiviä tai värejä kolmannen ulottuvuuden esittämiseksi. Useimmiten valitaan joko U-matriisi (Ultsch, 1993), kuten kuvassa 5, tai Sammonin kuvaus (Sammon Jr., 1969), kuten kuvassa 6. Näissä esimerkeissä Möbiuksen Fujisaki-kategorioiden numerot on sijoitettu 12 x 8 -kokoiseen karttaan. Kaikki havainnot voidaan paikallistaa tarkempaa tutkimista varten, mutta jo ensisil- mäyksellä voi huomata mm. seuraavat seikat: kategoria 3 on levinnyt hyvin laajalle, se ei ilmeisesti pysty kovin tarkkaan rajaamaan tai määrittelemään aineiston havaintoja kategoria 2 on huomattavasti selvemmin hahmotettava omaksi ryhmäksi (vaikka kaksi hajahavaintoakin löytyy) muut kategoriat joko puuttuvat kokonaan tai esiintyvät erittäin harvoin, joten voidaan kysyä esimerkiksi, onko määritelmissä puutteita tai onko korpus liian pieni tai ei riittävän edustava. Kun samoihin karttoihin sijoittaa vielä muidenkin mallien kategoriat, pystyy helposti muodostamaan hypoteeseja kunkin mallin heikkouksista ja vahvuuksista sekä mallien välisistä suhteista. Tällaiset visualisoinnin avulla syntyneet hypoteesit on sitten helppo tilastollisesti tarkastaa karttakoordinaattien ja numeeristen etäisyysmittojen analyysillä. KUVA 4. Kolmen parametrin komponenttitasot (30 x 20 karttayksikköä). FO-suoran jyrkkyyden ja loppufrekvenssin (kuviot aja b) tiheysjakaumat muistuttavat toisiaan, mutta tafoa-parametrin (ajallinen etäisyys tavun alusta FO-suoran loppuun, kuvio c) useimmiten esiintyvät arvot sijoittuvat kartassa muualle. (a) jyrkkyys (b) FOI (c) tafoa
Itseorganisoituvat kartat ja intonaatiotutkimus 159 rtd4-12-s.map.moebius-all - Dim: 29, Size: 12*S units, bubble neighborhood KUVA 5. U-matriisi Möbius-mallin kategorioista puhekorpuksen kartassa. Pisteet ja luvut edustavat karrrayksiköitä, harmaasävyt etäisyyksiä (mitä vaaleampi, sitä suurempi välimatka). KUVA 6. Sarnmonin kuvaus Möbius-mallin kategorioista puhekorpuksen kartassa. Karttayksiköiden sijoittaminen kolmiulotteiseen tilaan edustaa niiden välisiä etäisyyksiä (vrt. kuva 1).
160 Itseorganisoituvien karttojen tärkeä anti tässä esimerkissä on ensinnäkin tämä ainutlaatuinen kaikkia parametreja yhdistävä ja toisiinsa suhtautuva analyyttinen esitystapa, joka ratkaisevasti edesauttaa eksploratiivisia tutkimuksia. Toiseksi, nimettyjen havaintojen (tässä mallikategorioiden edustajien) sijoittaminen empiirisen aineiston perusteella luotuun karttaan mahdollistaa ei-yhteismitallisten representaatioiden suoran vertailun. 4. LOPUKSI Itseorganisoituvat kartat ovat varteenotettava menetelmävalintaesimerkin kaltaisissa tapauksissa. Kuten mitä tahansa menetelmää, niitä ei kuitenkaan pidä soveltaa varauksettomasti ja ilman tarkkaa harkintaa. Esimerkiksi kategoriamuuttujien uudelleenkoodaus numeerisiksi, jotta niidenarvotsopisivat kartan opetussyötteiksi, on vain harvoin perusteltavissa eikä todennäköisesti tuota tuloksia, joita ei olisi saatu helpommin perinteisellä tilastomenetelmällä. On myös otettava huomioon, että SOM-menetelmiensoveltuvuus tiettyjen tietorakenteiden pelkkään visualisointiin ei takaa yhtä hyvää samojen tietojen luokittelukykyä ja päinvastoin (ks. Flexer, 1999). Lopuksi annettakoon metodologiasta kiinnostuneille muutama käytännön vihje niitä monia tilanteita varten, joissa itseorganisoituvista kartoista voi olla hyötyä. Edellä mainitun Kohosen teoksen (2001) lisäksi tai rinnalle kelpaavat tiedonlähteinä mm. seuraavat verkkodokumentit, jotkaosittainsisältävät myös interaktiivisia harjoitusesimerkkejä: http://www.cis.hur.filresearch/somresearchlsom.shtml http://www.cis.hut.fi/research/ javasomdemol http://www.cis.hur.fi/~jhimbergldippal node5.html http://davis.wpi.edul ~matticoursesl soms/#introduction Teknillisen Korkeakoulun informaatiotekniikan laboratorion sivuilta löytyy ohjelmistopaketti SOM_PAK, jolla karttojen alustus, opetus ja visualisointi voidaan suorittaa omassa tietokoneessa. Myös vapaasti saatavat neuraalilaskennan yleisohjelmistot tarjoavat - joskin aloittelevalie humanistille mahdollisesti turhan monimutkaisia - SOM-moduuleja. Linkit ovat http://www.cis.hut.fi/research/ som_lvq_pak.shtml http://www-ra.informatik.unituebingen.de/snnsi http://www.cnbc.cmu.edulpdp++1 PDP++.html VIITTEET Adriaens, L. M. H. (1991). EinModelldeutscher Intonation. Väitöskirja, Technical University Eindhoven. Anderson, T. (1994). Auditory mode!s with Kohonen SOFM and LVQ for speaker independent phoneme recognition. Teoksessa Proc. ICNN'94, International Conference on Neural Networks, (s. 4466-4469). Piscataway, NJ: IEEE Service Center. Anderson, T. R. & Patterson, R. D. (1994). Speaker recognition with the auditory image mode! and se!f-organizing feature maps: A comparison with traditionai techniques. Teoksessa ESCA Workshop on Automatic Speaker Recognition Identification and Verification, (s. 153-156). Armstrong Lab., Wright Res. & Dev. Center, Wright-Patterson AFB, OH, USA, Martingny, Switzeriand: IDIAP. Benzmiiller, R. & Grice, M. (1997). Trainingsmaterialien zur Etikettierung deutscher Intonation mit GToBI. Phonus, 3, 9-34.
Itseorganisoituvat kartat ja intonaatiotutkimus Callan, D. E., Kent, R. 0., Roy, N. &Tasko, S. M. (1999). Self-organizing map for the classification of normal and disordered female voices. joumal ofspeech, Language, and Hearing Research, 42, 355-366. Chen, O. T. c., Chen, c.-y., Cheng, H.-T., Hsu, E-R., Yang, H.-L. & Lee, Y.-G. (1996). A multi-lingual speech recognition system using a neural network approach. Teoksessa ICNN 96 The 1996 IEEE International Conference on Neural Networks, (s. 1576-1581). New York, NY, USA: IEEE. Cottrell, M., Gaubert, P., Letremy, P. & Rousset, P. (1997). Analyzing and representing multidimensional quantitative and qualitative data: Demographic study of the Rhöne valley. The domestic consumption of the Canadian families. Prepublication du SAMOS79, Universite Paris 1, Paris. Flexer, A. (1999). On the use of self-organizing maps for clustering and visualization. Teoksessa Principles ofdata Mining and Knowledge Discovery, Third European Conference, PKDD '99, Prague, Czech Republic, (s. 80-88). Berlin: Springer. Fujisaki, H. (1997). Modeling the process of fundamentai frequency control of speech for synthesis oftonal features ofvarious languages. Teoksessa Proceeding.r ofthe 1997 China-japan Symposium on Advanced Information Technology, (s. 1-12). Goodacre, R., Pygall, J. & Keli, D. B. (1996). Plant seed classification using pyrolysis mass spectrometry with unsupervised learning: the application of auto-assoeiative and Kohonen arrificial neural networks. Chemometrics and Intelligent Laboratory Systems, 34, 69-83. Honkela, T., Pulldci, V. & Kohonen, T. (1995). Contextual relations ofwords in Grimm tales, analyzed by self-organizing map. Teoksessa E Fogelman-Soulie & P. Gallinari (toim.), Proc. ICANN'95, International Conference on ArtificialNeuralNetworks, (s. 3-7). Nanterre, France: EC2. Kohler, K. J. (1994). Lexica ofthe Kiel PHONDAT Corpus. ReadSpeech. Institut fur Phonetik und digitale Sprachverarbeitung, Universität Kie1. Kohonen, T. (1989). Se/fOrganization andassociative Memory. Berlin: Springer. 161 Kohonen, T. (2001). SelfOrganizing Maps. Springer Series in Information Sciences 30. Berlin: Springer, kolmas painos. Kohonen, T., Hynninen, J., Kangas, J. & Laaksonen, J. (1996). SOM_PAK: The selforganizing map program package. Tekninen Raportti A31, Helsinki University oftechnology, Laboratory ofcomputer and Information Science, Otaniemi. Kohonen, T., Torkkola, K., Shozakai, M., Kangas,J. &Ventä, O. (1987). Implementationof a large vocabulary speech recognizer and phonetic typewriter for Finnish and Japanese. Teoksessa Proceedings ofthe European Conference on Speech Technology, (s. 377-380). Edinburgh, U.K. Lagus, K. (2000). Text Mining with the WEBSOM Acta Polytechnica Scandinavica, Mathematics and Computing Series 110. Espoo: Finnish Academy oftechnology. Miikkulainen, R. (1997). Dyslexic and categoryspecific impairments in a self-organizing feature map model ofthe lexicon. Brain andlanguage, 59, 334-366. Möbius, B. (1993). EinquantitativesModellder deutschen Intonation: Analyse undsynthese von Grundfrequenzverläufen. Linguistische Arbeiten 305. Tiibingen: Niemeyer. Mujunen, R., Leinonen, 1., Kangas,J. & Torkkola, K. (1993). Acoustic pattern recognition of /s/ misarticulation by the self-organizing map. Folia Phoniatrica, 45,135-144. Ramesh, P., Katagiri, S. & Lee, C.-H. (1991).A new connected word recognition algorithm based on HMM/LVQsegmentation and LVQ classification. Teoksessa Proc. ICASSP-91, In- ternational Conference on Acoustics, Speech and Signal Processing, (s. 113-116). Piscataway, NJ: IEEE Service Center. Sammon Jr., J. W (1969). A nonlinear mapping for data structure analysis. IEEE Transactiom on Computers, C-18, 401-409. Silverman, K., Beckman, M. E., Pitrelli, J., Ostendorf, M., Wightman, c., Price, P., Pierrehumbert, J. & Hirschberg, J. (1992). ToBI: a standard for labeling English prosody. Teoksessa Proceedings ofthe Second International Conferenee on Spoken Language Processing, (s. 867870). Banff. 't Hart, J. T., Collier, R. & Cohen, A. (1990). A
162 perceptual study ofintonation: an experimental-phonetic approach to speech melody. Cambridge: Cambridge University Press. Tolba, A. S. & Abu-Rezq, A. N. (1999). Combinedc1assifiers for invariantface recognition. Teoksessa Proceedings 1999 Intemational Conference on Information Intelligence and Systems, (s. 350-359).IEEE Comput.Soc, Los Aiamitos, CA, USA. Ultsch,A. (1993). Sdf-organizedfeature maps for monitoring and knowledge acquisition of a chemical process. Teoksessa S. Giden & B. Kappen (toim.), Proceedingf ofthe Internationai Conference on Artificial Neural Networks (ICANN93), (s. 864-867). London: Springer. Werner, S. (2000). Modelledeutscher Intonation: zu Vergleichbarkeit und empirischer Relevanz von Intonationsbeschreibungen. Publications in the Humanities 24. University ofjoensuu. Xuemin, W,Junshi, c., Jincheng, T. & Jiapin, C. (1997). An identification algorithm for dynamic walking gait ofquadruped walking robot. Joumal ofshanghai Jiaotong University, 31,17-19,23. SELF-ORGANIZING MAPS AS A TOOL IN INTONATION RESEARCH Language Technology, Department of Foreign Languages University of Joensuu Self-organizing maps are a modern methodology that can be used for exploratory data analysis and which is especially useful in settings with a multitude ofnumerical variables. Its applicability to phonetic research is exemplifled through an examination ofacoustic parameters in speech intonation. Keywords: SOM, FO, intonation