ITSEORGANISOITUVAT KARTAT INTONAATIOTUTKIMUKSEN APUVÄLINEENÄ



Samankaltaiset tiedostot
E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Ontologiakirjasto ONKI-Paikka

Intonaation analyysi ja annotointi puhekorpuksissa

Kielitieteellisten aineistojen käsittely

3 9-VUOTIAIDEN LASTEN SUORIUTUMINEN BOSTONIN NIMENTÄTESTISTÄ

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

MONISTE 2 Kirjoittanut Elina Katainen

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

T DATASTA TIETOON

Prognos Julkaisusuunnitelmat

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

SFS/SR315 Tekoäly Tekoälyn standardisointi

5 Akustiikan peruskäsitteitä

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Pianon äänten parametrinen synteesi

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Bioinformatics in Laboratory of Computer and Information Science

805306A Johdatus monimuuttujamenetelmiin, 5 op

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Itseorganisoituvat hermoverkot: Viitekehys mielen ja kielen, aivokuoren ja käsitteiden tarkasteluun

Infrastruktuurin asemoituminen kansalliseen ja kansainväliseen kenttään Outi Ala-Honkola Tiedeasiantuntija

Sovelletun fysiikan laitoksen tutkimus- ja yritysyhteistyö osana yhteiskäyttölaboratoriota

Paretoratkaisujen visualisointi. Optimointiopin seminaari / Kevät 2000 Esitelmä 11 Petteri Kekäläinen 45305L

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Teoreettisia perusteita II

ATLAS-kartan esittely - Peli palveluiden yhteiskehittämisen menetelmistä Päivi Pöyry-Lassila, Aalto-yliopisto

Tehostettu kisällioppiminen tietojenkäsittelytieteen ja matematiikan opetuksessa yliopistossa Thomas Vikberg

Käyttökokemuksen evaluoinnista käyttökokemuksen ohjaamaan suunnitteluun. ecommunication & UX SUMMIT Eija Kaasinen, VTT

punainen lanka - Kehitysjohtaja Mcompetence Oy markokesti.com Työhyvinvoinnin kohtaamispaikka Sykettätyöhön.

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

NBE-E4510 Special Assignment in Biophysics and Biomedical Engineering AND NBE-E4500 Special Assignment in Human. NBE-E4225 Cognitive Neuroscience

Tänään ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus laskarit. Ensi kerralla (11.3.)

Jäsentiedote 4/ Joint Baltic-Nordic Acoustical Meeting 2004 Ahvenanmaalla

Verkko-oppiminen: Teoriasta malleihin ja hyviin käytäntöihin. Marleena Ahonen. TieVie-koulutus Jyväskylän lähiseminaari

1. Tilastollinen malli??

Lyhyesti uusista DI-ohjelmista Isohenkilökoulutus to Opintoasianpäällikkö Mari Knuuttila

RANS0002 P2. Phonetics and Pronunciation (Fonetiikka ja ääntäminen), O, 2 ECTS. RANS0010 P3. Translation Exercise (Käännösharjoitukset) s, O, 3 ECTS

Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu (aihe-esittely)

Sisällönanalyysi. Sisältö

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

Computing Curricula raportin vertailu kolmeen suomalaiseen koulutusohjelmaan

Yksittäisten maatilojen tarkastelu korkeaulotteisessa talousavaruudessa itseorganisoivan kartan avulla

Enterprise Architecture TJTSE Yrityksen kokonaisarkkitehtuuri

Ruma merkitys. Tommi Nieminen. XLII Kielitieteen päivät. Kielitieteen epäilyttävin välttämätön käsite. Itä-Suomen yliopisto ...

Indoor Environment

Students Experiences of Workplace Learning Marja Samppala, Med, doctoral student

5 Yksityiskohtaiset laskentatulokset Aurajoelle

Lataa Legislating the blind spot - Nikolas Sellheim. Lataa

Kohti älykkäitä oppimisympäristöjä? Erkki Sutinen Tietojenkäsittelytieteen laitos Joensuun yliopisto

Simulation model to compare opportunistic maintenance policies

Jäsenyysverkostot ominaisuudet, toimijoiden ja tapahtumien samanaikainen analyysi. Sisältö ja tavoitteet. Osallistujien ja tapahtumien ominaisuudet

Tarvitseeko informaatioteknologia matematiikkaa?

TKK 100 vuotta -merkki

TSSH-HEnet : Kansainvälistyvä opetussuunnitelma. CASE4: International Master s Degree Programme in Information Technology

BDD (behavior-driven development) suunnittelumenetelmän käyttö open source projektissa, case: SpecFlow/.NET.

Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto

GPS Miten opin käyttämään? Mihin käytän?

Asiasanat: itseorganisoiva kartta, ryvästys, maatalous, kannattavuus, kirjanpito. Maataloustieteen Päivät

OPPIMINEN ja SEN TUKEMINEN Supporting learning for understanding

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

Puheenkäsittelyn menetelmät

Julkaisun laji Opinnäytetyö. Sivumäärä 43

Introduction to Machine Learning

Avoimen lähdekoodin kaksitasokielioppikääntäjä

Prosodian havaitsemisesta: suomen lausepaino ja focus

Yrityksen informaatio- ja toimintoprosessien optimointi

Ammatillinen opettajakorkeakoulu

Yksi elämä -hanke. Kuluttajakysely Yksi elämä -hankkeesta Marraskuu 2016

LYTH-CONS CONSISTENCY TRANSMITTER

Laadullisen tutkimuksen piirteitä

Laskennallisen fysiikan esimerkkejä avoimesta tutkimuksesta Esa Räsänen Fysiikan laitos, Tampereen teknillinen yliopisto

Spektrin sonifikaatio

KOLMIULOTTEISEN TILAN AKUSTIIKAN MALLINTAMINEN KAKSIULOTTEISIA AALTOJOHTOVERKKOJA KÄYTTÄEN

Last%update:%September%19,%2015% Publications%follow%the%classification%of%the%Finnish%Ministry%of%Education%and%Culture%in%2010%

digi.kansalliskirjasto.fi

A Plan vs a Roadmap. This is a PLAN. This is a ROADMAP. PRODUCT A Version 1 PRODUCT A Version 2. PRODUCT B Version 1.1. Product concept I.

WP3 Decision Support Technologies

TST Tehtävä ulkomailla TTY:n Amazing Race

2009 Doctor of Technology (Ph.D) defended at 13 th November

Kandidaatintyön esittely: Epätäydellisen preferenssi-informaation huomioon ottavien päätöksenteon tukimenetelmien vertailu

Additions, deletions and changes to courses for the academic year Mitä vanhoja kursseja uusi korvaa / kommentit

Making use of BIM in energy management

Kartografian revanssi. Juha Oksanen , LYNET Datan visualisoinnilla vaikuttavuutta

HAHMONTUNNISTUKSEN PERUSTEET

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

SP 11: METODOLOGIAN TYÖPAJA Kevät Yliopistonlehtori, dosentti Inga Jasinskaja-Lahti

Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä

7.4 Variability management

Koordinaattimuunnospalvelut Reino Ruotsalainen

Kuinka rakentaa globaaleja verkostoja - kommenttipuheenvuoro

OPINTOJAKSOJA KOSKEVAT MUUTOKSET/MATEMATIIKAN JA FYSIIKAN LAITOS/ LUKUVUOSI

Miten maailman paras koulu selviää tulevaisuuden haasteista?

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

HAHMONTUNNISTUKSEN PERUSTEET

Transkriptio:

Puhe ja kieli, 21 :4, 153-162 (2001) 153 ITSEORGANISOITUVAT KARTAT INTONAATIOTUTKIMUKSEN APUVÄLINEENÄ Kieliteknologia, Vieraiden kielten laitos, Joensuun yliopisto stefan.werner@joensuu.fi Itseorganisoituva kartta on nykyaikainen menetelmä, joka soveltuu erityisesti eksploratiivisiin tutkimuksiin monen numeerisen muuttujan asetelmissa. Puheentutkimuksessa itseorganisoituvaa karttaa voidaan käyttää esimerkiksi intonaation akustisten parametrien tutkimiseen. Avainsanat: SOM, FO, intonaatio 1. JOHDANTO 2. ITSEORGANISOITUVA KARTTA Tässä artikkelissa on tarkoitus esitellä lingvistisessä puheentutkimuksessa vielä vähän käytettyjä menetelmiä, joita sovelletaan laajasti muiden alojen empiirisissä tutkimuksissa. Keinotekoisten hermoverkkojen ideaan perustuvia analyysi-, luokittelu-, synteesi- ja mallintamismenetelmiä on nykyisin tarjolla laaja valikoima. Samaan aikaan myös lingvistisessä ja foneettisessa tutkimuksessa on totuttu lisääntyvään kvantitatiivisten menetelmien ja tietokonepohjaisten työvälineiden käyttöön, muttatoistaiseksi vain harvoin turvaudutaan tähän uusien metodien luokkaan, johon itseorganisoituvat kartatkin lukeutuvat. Artikkelin tavoitteena on tutustuttaa tilastollisten menetelmien rajoja kohdanneet puheen- tai kielentutkijat metodiin, jota he voivat hyödyntää analysoidessaan empiiristä aineistoa. 2.1. Teoria Itseorganisoituvien karttojen (self-organizing maps/som) tarkoitus on löytää rakenteita kompleksisesta empiirisestä aineistosta. Jos aineistossa on monta muuttujaa, perinteiset tilastolliset analyysit eivät useimmiten pysty selvittämään, mitkä havainnot ovat samankaltaisia ja voisivat kuulua yhteiseen luokkaan. Itseorganisoituvassa kartassa sen sijaan aineiston monet ulottuvuudet projisoidaan litteälle pinnalle niin, että eri havaintojen samankaltaisuudet ja erilaisuudet näkyvät etäisyyksinä kartan pisteiden välillä. Menetelmän kehittäjän Kohosen (1989: 148) mukaan: "[...] the self-organized mapping does directly what would be hard for clustering methods, namely, to display the overall similarity relations in a metric way, twodimensionally. For this reason the self-or-

154 ganized mappings might be used to visualize topologies and hierarchical structures ofhigh-dimensional pattern spaces." Kohosen (1996: 4) käyttämä analogia selventänee itseorganisoituvan kartan perusajatuksen: tietojen rakenne pyritään säilyttämään samantapaisesti kuin kukka voidaan kuivattaa puristimessa niin, että se näyttää kaksiulotteiselta kuvalta itsestään. Kolmiulotteisen kukan muodon ja rakenteen pystymme tosin tajuamaan myös ulottuvuuksia redusoimatta, mutta neljästä ulottuvuudesta lähtien ihminen tarvitsee hahmottamiseen apuvälineitä, joista yksi hyvin joustava on SOM. Itseorganisoituva kartta, joka kuuluu neuraaliverkkojen perheeseen, oppii ohjaamattomasti kuvaamaan empiirisen havaintoaineiston karttayksiköiden hilana, jossa jokaiseen yksikköön kuuluu tietty parametrivektori sekä etäisyysmitta hilanaapureihin; samaaetäisyysmittaakäytetään myös aineiston ja karttayksiköiden parametrivektoreita vertailtaessa, joten kaikki havainnot voidaan liittää parhaiten sopivaan eli lähimpään yksikköön. Hilalla voi olla joko suorakulmainen (kuvio 1) tai heksagonaalinentopologia, millävoidaanvaikuttaaeri rakenteidenvisuaaliseen esitystapaan. Muista hermoverkkomenetelmistä itseorganisoituvan kartan etottaa ratkaisevasti itsenäinen oppiminen: sitä ei tarvitse opettaa valmiiden oikeiden tulosten avulla, vaan karttaverkko löytää itse vastauksia. Toisin kuin perinteisessä tilastollisessa ryväsanalyysissä SOM-analyysissäei edellytetä tietoa tai arvauksia siitä, montako eri ryvästä tai luokkaa aineistosta on löydettävissä, vaan ohjaamaton oppiminen johtaasellaiseen rakenteen esittämiseen, josta tutkija voi nähdä, mitkä havainnot kuuluvat yhteen, mitkä eivät (ks. yksinkertaistettu esimerkki kuvassa 2). Tämä päättely on hyvin perusteltu siksi, että itseorganisoituvat kartat tuottavat myös luokitteluun tarpeelliset etäisyyden ja tiheyden mitat. Itseorganisoituvia karttoja voidaan käyttää sekä eksploratiiviseen parametriavaruuden visualisointiin että suoraan ryväsanalyysin. Niiden teorian ja toiminnan tarkka formaalinen kuvaus löytyy esim. teoksesta Kohonen (2001). 2.2. Sovellukset Viime vuosikymmenten aikana SOM-menetelmää on käytetty mitä erilaisimpiin käyttötarkoituksiin ja sovelluksiin. Tässä muutama esimerkki: kasvojen tunnistus (Tolba & Abu-Rezq, 1999), kulutustottumusten analyysi (Cottrell et al., 1997), KUVA 1. Kaksiulotteinen karttahila yksiköineen (ympyrät).

Itseorganisoituvat kartat ja intonaatiotutkimus 155 robotin kävelytyylin arviointi (Xuemin et al., 1997), kasvien siementenluokittelu (Goodacre et al., 1996), terveiden ja patologisten äänten erottelu (Callan et al., 1999), dysleksian tutkimus (Miikkulainen, 1997). 3.ITSEORGANISOITUVAT KARTAT PUHEEN- JA KIELENTUTKIMUKSESSA 3.1 "Perinteisiä" sovelluksia Itseorganisoituvien karttojen ensimmäinen laajasti huomiota herättänyt sovellus tapahtui juuri puheentutkimuksessa. Vuonna 1987 Kohosen ryhmä julkaisi "foneemisen kirjoituskoneen" kuvauksen (Kohonen et al., 1987); tutkijat olivat onnistuneet luokittelemaan akustisia parametrivektoreita (jotka sisälsivät lähinnä tietoja spektristä) äännetyypeiksi. Tämän jälkeen on jatkuvasti ilmestynyt uusia puheen- tai kielentutkimukseen liittyviä tutkimuksia, pääasiallisesti kieliteknologian (esim. Honkelaetal., 1995; Lagus, 2000) ja puheen- sekä puhujantunnistuksen (esim. Mujunen et al., 1993; Ramesh et al., 1991; Chen et al., 1996; Anderson, 1994; Anderson & Patterson, 1994) aloilla. Valtaosa näistä julkaisuistaon kuitenkin syntynyt insinööritieteissä eikä fonetiikassa tai kielitieteessä (ks.laaja viitekokoelma osoitteessa http://www.cis.hut.fi/research/som-bibll). (a) (b) (e) (d) KlNA 2. Itseorganisoituva kartta, jolle syöterään ympäröivän kolmion reunapisteiden koordinaarreja eri vaiheissa oppimisprosessia. Yhden operuskierroksen aikana syötetään kerran kaikkien pisteiden kaikki parametrit (eli tässä koordinaatit). (a) 10 opetuskierroksen jälkeen (b) 100 opetuskierroksen jälkeen (e) 1000 opetuskierroksen jälkeen (d) 5000 operuskierroksen jälkeen

156 3.2. UUSI SOVELLUSESIMERKKI: INTONAATIOMALLIT Eri intonaatioteoriat, -mallit, ja -kuvaukset käyttävät kirjavaa joukkoa akustisia ja lingvistisiä kriteereitä sävelkulkuilmiöiden luokitteluun. Empiirisiä tutkimuksia kaikkien näiden kriteereidenvaikutuksista ja keskinäisistä suhteista ei ole paljonkaan tehty, vaikka juuri tällainen selvitys vasta mahdollistaisi eri lähestymistapojen systemaattisia vertailuja. Näin on useimmiten tyydytty yksittäisten esimerkkien kritiikkiin tai taustalla olevan teorian yleiseen arviointiin ja vältetty perusteellisia aineistopohjaisia kontrastiivisia analyysejä vedoten mallien keskinäiseen yhteensopimattomuuteen. Esimerkiksi IPQ-koulukunnanprototyyppisiä FO-kontuureja ('t Hart et al., 1990) ei suoraan voi verratatobi:n (Silverman et al., 1992) kaltaisiin toonipisteisiin tai Fujisakin (1997) fraasi- ja aksenttikomentoihin, koska relevanttien FO-vaihtelujen representaatiot näissä kolmessa äärityypissä ovat liian erilaisia. Seuraavassa hahmottelen, miten itseorganisoituvat kartat voivat toimia tutkimuksen apuvälineenä, joka sittenkin mahdollistaa tällaiset vertailut. Ensimmäinen askel on yhteisen representaation löytäminen kaikkien mallien kategorioille. Koska nämä kategoriat on määritelty suhteessa akustisiin ilmiöihin, joskaan ei yhteismitaliisin suurein, niiden kuvaamisen pitäisi onnistua sopivan laajalla akustisten parametrien joukolla. Vaikka tietty malli ei käytäkään kuin pientä osajoukkoa, johon ei välttämättä edes kuulu yhtään jonkin toisen mallin käyttämää parametria, malleja voidaan kuitenkin vertailla toisiinsa sellaisten havaintojen kautta, joille on tiedossa kaikkien parametrien arvot. Mutta mikä on akustisten mittausten kohde? FO-käyrä pitääeritelläjoiksikindiskreeteiksi yksiköiksi, jotka ovat tarpeeksi pieniä toimiakseen minkä tahansa FO-representaation rakennuspalikkoina. Yksi tämän ehdon täyttäväyksikkö on kahdenvierekkäisen FOkäännekohdan pari. FO-käyrän suoristaminen siinä määrin, että mikroprosodiset vaihtelut (segmentaaliset vaikutukset FO:aan) häviävät, säilyttää kuulohavainnon samanlaisena eli ei muuta intonatorista funktiota. Lisäksi kahden käännekohdan välisistä suorista viivoista voi rakentaa IPO-kontuureja yhtä hyvin kuintobi-pisteitäyhdistäviä suoria tai jopaperseptuaalisesti ekvivalenttejalikimääräistyksiä FujisakinFO-jatkumoista. Kuvassa 3 nähdään, miten joitakin esimerkkiparametreja mitataan FO-käännekohtapareiksi eritellystä käyrästä. Seuraavassa selitän kuvan merkinnät: Suora 1-4: FO-käännekohtien väliset lineaariset approksimaatiot FOK: FO-suoran kesto FOa, FOI: Fo-arvot suoran alussa ja lopussa FOero: FOI-FOa voi: "vowel onset interval": aikaväli vokaa- Iin alusta seuraavan vokaalin alkuun vk: vokaalin kesto tk: tavun kesto sk: sanan kesto ak: "aksenttiryhmän" kesto: aikaväli (iause)painollisen tavun alusta seuraavan painollisen tavun alkuun tafoa: aikaväli tavun alusta FO-suoran alkuun vlfol: aikaväli vokaaiin lopusta FOsuoran loppuun. Parametrisen representaation tarkoitus on siis sisältää vähintään kaikki eri malleissa sovelletut akustiset muuttujat sekä lisäksi kaikki muutkin mitattavat suureet, joilla mahdollisesti on vaikutus intonaatioon. SOM-menetelmän yksi etu on, että tutkijan ei tarvitse jättää huomion ulkopuolelle potentiaalisia tekijöitä esimerkiksi rajallisten

Itseorganisoituvat kartat ja intonaatiotutkimus 157 fi1e=001.sfs speaker=rtd token=ool Time (s) 12494 Hz -8829 300 200 100 fx1oad(fi1e=001.fo.signaix,rate=loo,offset~0) FOa FOI Suora 3 t:---::?5;~ ~- ~-----------------J~:ro ak FX.01 FOK tafoa sk vlfol KlNA 3. FO-käyrän erittely käännekohrapareiksi ja esimerkkejä akustisren parmetrien mitrauksesra. laskentaresurssien takia, vaan karsiminen voi odottaa, kunnes sitä puoltavaa empiiristä näyttöä on saatu. Toinen askel on mallikategorioiden koodaus sopivilla akustisilla parametreillä; mitä laajempaa muuttujaosajoukkoa tähän sovelletaan, sitä tarkempaan vertailutyöhön itseorganisoituva kartta myöhemmin pystyy. Seuraavaksi mitataan ja tallennetaan empiirisen FO-aineiston kaikki aikaisemmin valitut akustiset parametrit. Juuri tämän aineiston kautta vertailu saadaan aikaan: kartassa FO-havainnot ryhmittyvät rypäiksi ja nämä ryppäiden sijainnit voidaan suhteuttaa mallikategorioiden sijoituspaikkoihin. Neljäs ja viimeinen askel on siis itseorganisoituvan kartan'opetus' empiirisel1ä aineistolla ja mallikategorioiden asettaminen samaan karttaan. Silmämääräisesti voi sitten tarkastella aineiston sisäisen rakenteen suhdetta eri mallien saman parametriavaruuden jaotteluun sekä verrata suoraan mallikategorioiden jakaumia keskenään. Havainnol1istavana esimerkkinä voin käyttää kolmen saksan kielen intonaatiomallin vertailua (Werner, 2000). Fujisaki-, ToBI- ja IPO-mallin sovelluksista saksan kieleen tutkittiin seuraavia malleja: Möbius (1993), Benzmiiller & Grice (1997) ja Adriaens (1991). Parametrien koodaus oli IPO- ja ToBI-mallin kohdalla triviaalia, ja myös Fujisaki-säännöstö (Möbius, 1993, 167 170) saatiin muunnettua FO- ja aikaparametreiksi generoimalla säännöstön perusteella prototyyppi-käyriä mittauskohteiksi. Empiiriset parametriarvot saatiin analysoimalla

158 PHONDAT-korpusta (Kohler, 1994). Kuvassa 4 on esitetty kolmen akustisen parametrin 'komponenttitasot' eli yhden erillisen muuttujan arvojen projisoinnit karttaan. Lopullinen kartta yhdistää kaikki komponenttitasot (tässä tapauksessa 32) yhdeksi kaksiulotteiseksi koordinaatistoksi. Komponenttitasoja voidaan pitää eräänlaisena parametrin tilastollisen jakauman visualisointina. Jotta havaintojen sijoittumispaikka ja etäisyys naapureihin saataisiin näkymään samassa kuvassa, käytetään kokonaiskartan esittämiseksi erilaisia graafisia havainnollistamismenetelmiä, jotka hyöydyntävät perspektiiviä tai värejä kolmannen ulottuvuuden esittämiseksi. Useimmiten valitaan joko U-matriisi (Ultsch, 1993), kuten kuvassa 5, tai Sammonin kuvaus (Sammon Jr., 1969), kuten kuvassa 6. Näissä esimerkeissä Möbiuksen Fujisaki-kategorioiden numerot on sijoitettu 12 x 8 -kokoiseen karttaan. Kaikki havainnot voidaan paikallistaa tarkempaa tutkimista varten, mutta jo ensisil- mäyksellä voi huomata mm. seuraavat seikat: kategoria 3 on levinnyt hyvin laajalle, se ei ilmeisesti pysty kovin tarkkaan rajaamaan tai määrittelemään aineiston havaintoja kategoria 2 on huomattavasti selvemmin hahmotettava omaksi ryhmäksi (vaikka kaksi hajahavaintoakin löytyy) muut kategoriat joko puuttuvat kokonaan tai esiintyvät erittäin harvoin, joten voidaan kysyä esimerkiksi, onko määritelmissä puutteita tai onko korpus liian pieni tai ei riittävän edustava. Kun samoihin karttoihin sijoittaa vielä muidenkin mallien kategoriat, pystyy helposti muodostamaan hypoteeseja kunkin mallin heikkouksista ja vahvuuksista sekä mallien välisistä suhteista. Tällaiset visualisoinnin avulla syntyneet hypoteesit on sitten helppo tilastollisesti tarkastaa karttakoordinaattien ja numeeristen etäisyysmittojen analyysillä. KUVA 4. Kolmen parametrin komponenttitasot (30 x 20 karttayksikköä). FO-suoran jyrkkyyden ja loppufrekvenssin (kuviot aja b) tiheysjakaumat muistuttavat toisiaan, mutta tafoa-parametrin (ajallinen etäisyys tavun alusta FO-suoran loppuun, kuvio c) useimmiten esiintyvät arvot sijoittuvat kartassa muualle. (a) jyrkkyys (b) FOI (c) tafoa

Itseorganisoituvat kartat ja intonaatiotutkimus 159 rtd4-12-s.map.moebius-all - Dim: 29, Size: 12*S units, bubble neighborhood KUVA 5. U-matriisi Möbius-mallin kategorioista puhekorpuksen kartassa. Pisteet ja luvut edustavat karrrayksiköitä, harmaasävyt etäisyyksiä (mitä vaaleampi, sitä suurempi välimatka). KUVA 6. Sarnmonin kuvaus Möbius-mallin kategorioista puhekorpuksen kartassa. Karttayksiköiden sijoittaminen kolmiulotteiseen tilaan edustaa niiden välisiä etäisyyksiä (vrt. kuva 1).

160 Itseorganisoituvien karttojen tärkeä anti tässä esimerkissä on ensinnäkin tämä ainutlaatuinen kaikkia parametreja yhdistävä ja toisiinsa suhtautuva analyyttinen esitystapa, joka ratkaisevasti edesauttaa eksploratiivisia tutkimuksia. Toiseksi, nimettyjen havaintojen (tässä mallikategorioiden edustajien) sijoittaminen empiirisen aineiston perusteella luotuun karttaan mahdollistaa ei-yhteismitallisten representaatioiden suoran vertailun. 4. LOPUKSI Itseorganisoituvat kartat ovat varteenotettava menetelmävalintaesimerkin kaltaisissa tapauksissa. Kuten mitä tahansa menetelmää, niitä ei kuitenkaan pidä soveltaa varauksettomasti ja ilman tarkkaa harkintaa. Esimerkiksi kategoriamuuttujien uudelleenkoodaus numeerisiksi, jotta niidenarvotsopisivat kartan opetussyötteiksi, on vain harvoin perusteltavissa eikä todennäköisesti tuota tuloksia, joita ei olisi saatu helpommin perinteisellä tilastomenetelmällä. On myös otettava huomioon, että SOM-menetelmiensoveltuvuus tiettyjen tietorakenteiden pelkkään visualisointiin ei takaa yhtä hyvää samojen tietojen luokittelukykyä ja päinvastoin (ks. Flexer, 1999). Lopuksi annettakoon metodologiasta kiinnostuneille muutama käytännön vihje niitä monia tilanteita varten, joissa itseorganisoituvista kartoista voi olla hyötyä. Edellä mainitun Kohosen teoksen (2001) lisäksi tai rinnalle kelpaavat tiedonlähteinä mm. seuraavat verkkodokumentit, jotkaosittainsisältävät myös interaktiivisia harjoitusesimerkkejä: http://www.cis.hur.filresearch/somresearchlsom.shtml http://www.cis.hut.fi/research/ javasomdemol http://www.cis.hur.fi/~jhimbergldippal node5.html http://davis.wpi.edul ~matticoursesl soms/#introduction Teknillisen Korkeakoulun informaatiotekniikan laboratorion sivuilta löytyy ohjelmistopaketti SOM_PAK, jolla karttojen alustus, opetus ja visualisointi voidaan suorittaa omassa tietokoneessa. Myös vapaasti saatavat neuraalilaskennan yleisohjelmistot tarjoavat - joskin aloittelevalie humanistille mahdollisesti turhan monimutkaisia - SOM-moduuleja. Linkit ovat http://www.cis.hut.fi/research/ som_lvq_pak.shtml http://www-ra.informatik.unituebingen.de/snnsi http://www.cnbc.cmu.edulpdp++1 PDP++.html VIITTEET Adriaens, L. M. H. (1991). EinModelldeutscher Intonation. Väitöskirja, Technical University Eindhoven. Anderson, T. (1994). Auditory mode!s with Kohonen SOFM and LVQ for speaker independent phoneme recognition. Teoksessa Proc. ICNN'94, International Conference on Neural Networks, (s. 4466-4469). Piscataway, NJ: IEEE Service Center. Anderson, T. R. & Patterson, R. D. (1994). Speaker recognition with the auditory image mode! and se!f-organizing feature maps: A comparison with traditionai techniques. Teoksessa ESCA Workshop on Automatic Speaker Recognition Identification and Verification, (s. 153-156). Armstrong Lab., Wright Res. & Dev. Center, Wright-Patterson AFB, OH, USA, Martingny, Switzeriand: IDIAP. Benzmiiller, R. & Grice, M. (1997). Trainingsmaterialien zur Etikettierung deutscher Intonation mit GToBI. Phonus, 3, 9-34.

Itseorganisoituvat kartat ja intonaatiotutkimus Callan, D. E., Kent, R. 0., Roy, N. &Tasko, S. M. (1999). Self-organizing map for the classification of normal and disordered female voices. joumal ofspeech, Language, and Hearing Research, 42, 355-366. Chen, O. T. c., Chen, c.-y., Cheng, H.-T., Hsu, E-R., Yang, H.-L. & Lee, Y.-G. (1996). A multi-lingual speech recognition system using a neural network approach. Teoksessa ICNN 96 The 1996 IEEE International Conference on Neural Networks, (s. 1576-1581). New York, NY, USA: IEEE. Cottrell, M., Gaubert, P., Letremy, P. & Rousset, P. (1997). Analyzing and representing multidimensional quantitative and qualitative data: Demographic study of the Rhöne valley. The domestic consumption of the Canadian families. Prepublication du SAMOS79, Universite Paris 1, Paris. Flexer, A. (1999). On the use of self-organizing maps for clustering and visualization. Teoksessa Principles ofdata Mining and Knowledge Discovery, Third European Conference, PKDD '99, Prague, Czech Republic, (s. 80-88). Berlin: Springer. Fujisaki, H. (1997). Modeling the process of fundamentai frequency control of speech for synthesis oftonal features ofvarious languages. Teoksessa Proceeding.r ofthe 1997 China-japan Symposium on Advanced Information Technology, (s. 1-12). Goodacre, R., Pygall, J. & Keli, D. B. (1996). Plant seed classification using pyrolysis mass spectrometry with unsupervised learning: the application of auto-assoeiative and Kohonen arrificial neural networks. Chemometrics and Intelligent Laboratory Systems, 34, 69-83. Honkela, T., Pulldci, V. & Kohonen, T. (1995). Contextual relations ofwords in Grimm tales, analyzed by self-organizing map. Teoksessa E Fogelman-Soulie & P. Gallinari (toim.), Proc. ICANN'95, International Conference on ArtificialNeuralNetworks, (s. 3-7). Nanterre, France: EC2. Kohler, K. J. (1994). Lexica ofthe Kiel PHONDAT Corpus. ReadSpeech. Institut fur Phonetik und digitale Sprachverarbeitung, Universität Kie1. Kohonen, T. (1989). Se/fOrganization andassociative Memory. Berlin: Springer. 161 Kohonen, T. (2001). SelfOrganizing Maps. Springer Series in Information Sciences 30. Berlin: Springer, kolmas painos. Kohonen, T., Hynninen, J., Kangas, J. & Laaksonen, J. (1996). SOM_PAK: The selforganizing map program package. Tekninen Raportti A31, Helsinki University oftechnology, Laboratory ofcomputer and Information Science, Otaniemi. Kohonen, T., Torkkola, K., Shozakai, M., Kangas,J. &Ventä, O. (1987). Implementationof a large vocabulary speech recognizer and phonetic typewriter for Finnish and Japanese. Teoksessa Proceedings ofthe European Conference on Speech Technology, (s. 377-380). Edinburgh, U.K. Lagus, K. (2000). Text Mining with the WEBSOM Acta Polytechnica Scandinavica, Mathematics and Computing Series 110. Espoo: Finnish Academy oftechnology. Miikkulainen, R. (1997). Dyslexic and categoryspecific impairments in a self-organizing feature map model ofthe lexicon. Brain andlanguage, 59, 334-366. Möbius, B. (1993). EinquantitativesModellder deutschen Intonation: Analyse undsynthese von Grundfrequenzverläufen. Linguistische Arbeiten 305. Tiibingen: Niemeyer. Mujunen, R., Leinonen, 1., Kangas,J. & Torkkola, K. (1993). Acoustic pattern recognition of /s/ misarticulation by the self-organizing map. Folia Phoniatrica, 45,135-144. Ramesh, P., Katagiri, S. & Lee, C.-H. (1991).A new connected word recognition algorithm based on HMM/LVQsegmentation and LVQ classification. Teoksessa Proc. ICASSP-91, In- ternational Conference on Acoustics, Speech and Signal Processing, (s. 113-116). Piscataway, NJ: IEEE Service Center. Sammon Jr., J. W (1969). A nonlinear mapping for data structure analysis. IEEE Transactiom on Computers, C-18, 401-409. Silverman, K., Beckman, M. E., Pitrelli, J., Ostendorf, M., Wightman, c., Price, P., Pierrehumbert, J. & Hirschberg, J. (1992). ToBI: a standard for labeling English prosody. Teoksessa Proceedings ofthe Second International Conferenee on Spoken Language Processing, (s. 867870). Banff. 't Hart, J. T., Collier, R. & Cohen, A. (1990). A

162 perceptual study ofintonation: an experimental-phonetic approach to speech melody. Cambridge: Cambridge University Press. Tolba, A. S. & Abu-Rezq, A. N. (1999). Combinedc1assifiers for invariantface recognition. Teoksessa Proceedings 1999 Intemational Conference on Information Intelligence and Systems, (s. 350-359).IEEE Comput.Soc, Los Aiamitos, CA, USA. Ultsch,A. (1993). Sdf-organizedfeature maps for monitoring and knowledge acquisition of a chemical process. Teoksessa S. Giden & B. Kappen (toim.), Proceedingf ofthe Internationai Conference on Artificial Neural Networks (ICANN93), (s. 864-867). London: Springer. Werner, S. (2000). Modelledeutscher Intonation: zu Vergleichbarkeit und empirischer Relevanz von Intonationsbeschreibungen. Publications in the Humanities 24. University ofjoensuu. Xuemin, W,Junshi, c., Jincheng, T. & Jiapin, C. (1997). An identification algorithm for dynamic walking gait ofquadruped walking robot. Joumal ofshanghai Jiaotong University, 31,17-19,23. SELF-ORGANIZING MAPS AS A TOOL IN INTONATION RESEARCH Language Technology, Department of Foreign Languages University of Joensuu Self-organizing maps are a modern methodology that can be used for exploratory data analysis and which is especially useful in settings with a multitude ofnumerical variables. Its applicability to phonetic research is exemplifled through an examination ofacoustic parameters in speech intonation. Keywords: SOM, FO, intonation