Äänen koodaus automaattisessa puheentunnistuksessa

Koko: px
Aloita esitys sivulta:

Download "Äänen koodaus automaattisessa puheentunnistuksessa"

Transkriptio

1 Äänen koodaus automaattisessa puheentunnistuksessa Roman Kossarev LuK-tutkielma Kuopion yliopisto Tieojenkäsittelytieteen laitos Toukokuu 2003

2 1 Tiivistelmä KUOPION YLIOPISTO, Informaatioteknologian ja kauppatieteiden tiedekunta Tietojenkäsittelytieteen koulutusohjelma Tietojenkäsittelytiede ROMAN KOSSAREV: Äänen koodaus automaattisessa puheentunnistuksessa LuK-tutkielma, 27 s. LuK-tutkielman ohjaaja: assistentti, FM Tarja Lohioja Toukokuu 2003 Avainsanat: puheentunnistus, neuroverkot, SOM Tarkastelun kohteena on puheesta syntyvän ääniaallon koodaus käytetyn kielen foneemeiksi neuroverkkoja, etenkin Kohosen itsejärjestyviä piirrekarttoja (SOM-verkkoja), käyttäen. Foneettinen koodaus on puheentunnistuksen ensimmäisiä vaiheita ja askel kohti puheen automaattista ymmärtämistä. Puheesta on tulossa uusi käyttöliittymä ihmisen ja tietokoneen välille, mutta puheen tunnistus on osoittautunut epätriviaaliksi tehtäväksi, jonka ratkaisu vaatii ei-algoritmisia menetelmiä. Tunnistettava tieto välittyy puheessa jossakin määrin rinnakkain, sen tiedon ominaisuudet eivät ole invariantteja vaan puhuja- ja tilannekohtaisia, ja jokainen puhesegmentti voi saada lukuisat toisistaan hieman poikkeavat ääntämismuodot. SOM-verkot kykenevät ryhmittelemään puhesegmentit luokiksi, jotta puheentunnistusjärjestelmän käyttövaiheessa jokaiselle puhesegmentille löydetään sen äänneluokka eli foneemi. Puheentunnistuksen keskeinen työkalu on spektrogrammi, joka muodostetaan puheen ääniaallosta. Spektrogrammin lyhytkestoiset segmentit eli spektrikehykset toimivat neuroverkon syötteinä, ja tulosteena on spektrikehyksen äänneluokka. Tällä tavalla neuroverkosta tulee äännekartta ja foneettinen kirjoituskone, joka tunnistaa jokaisen lausutun äänteen. SOM-verkot kykenevät tunnistamaan äänteitä hyvällä tarkkuudella ja siksi ovat sopivia täysiveroisen puheentunnistusjärjestelmän rakentamiseen.

3 2 Sisällys 1 JOHDANTO PUHESIGNAALIN OMINAISUUKSIA Akustiikkaa ja signaalikäsittelyä Äänen tuotto Ihmisen puheentunnistusmekanismeista Koartikulaatio, segmentoinnin vaikeus ja invarianttius Äänne ja foneemi Redundanssi Ominaisuuksien tuntemisesta puheen tunnistukseen ITSEJÄRJESTYVÄT PIIRREKARTAT Osa neurolaskentaa Yleinen kuvaus Rakenne ja toimintaperiaate Alustaminen Opettaminen Klusterointi ja vektorikvanttisointi Käytettävyyden arvioiminen ja käyttö FONEETTINEN ÄÄNENKOODAUS Uusi puheentunnistusmenetelmä Äänenkoodausprosessi Foneettinen piirrekartta Segmentointi Foneettinen kirjoituskone Jälkikäsittely ja tunnistustarkkuus POHDINTA...25 LÄHTEET...26

4 3 1 JOHDANTO Sitä mukaa kun tietokoneiden käyttö leviää yhä uusille toiminta-aloille, käyttöliittymän helppokäyttöisyys nousee tärkeäksi tekijäksi tietokonejärjestelmien ja laitteiden arvioimisessa. Puhe on ihmisille luontainen ja helppo viestintätapa. Siksi on pyritty kehittämään menetelmiä, joiden avulla tietokoneet ja muut laitteet tunnistaisivat ja ymmärtäisivät puhetta, eli pystyisivät puheen ohjaamina suorittamaan erilaisia toimintoja. Näitä toimintoja ovat esim. puhelun soittaminen puhelimessa, puhelinlangan toisessa päässä tapahtuva puheen automaattinen ohjaus ja käsittely, lomakkeiden täyttö ja tekstien luonti tietokoneessa sanelemalla. Puhe on ihmisessä kehittynyt viestintäväline ja sen tuotto ja ymmärtäminen on sille luonnollisen helppoa. Ihmisen suuri etu tietokoneeseen nähden on se, että ihminen tuntee paremmin puhumistilanteen, puhujan ja kielen ominaisuudet sekä ymmärtää sanojen ja lauseiden merkityksen. Puheeseen vaikuttavat sellaiset seikat kuin asiayhteys, puhujan tila, henkilökohtaiset puhumistottumukset, puheviat jne. Nämä lisäävät puhesignaaliin tunnistuksen kannalta merkityksetöntä vaihtelua. Tietokoneen pitäisi pystyä päättelemään, mikä on luonnollista ja merkityksetöntä vaihtelua ja mikä taas on oleellista vaihtelua, joka erottaa puhutut sanat toisistaan [Vuo01]. Siksi on tarpeellista tuntea puheen ominaisuudet, joita käsitellään kielitieteissä; myös puhesignaali pitää pystyä tuomaan tietokoneeseen - tämä tutkitaan akustiikan ja signaalikäsittelyn avulla. Vaihteluja on mahdollista tutkia hahmotunnistuksen ja tekoälyn, erityisesti neurolaskennan, keinoin. Tarvitaan siis monen eri tieteenalan tuntemusta. Ensimmäistä puheen ymmärtämisen osaongelmaa kutsutaan puheen tunnistukseksi: tarkoituksena ei ole ymmärtää puheen sisältämää perimmäistä viestiä vaan ainoastaan tunnistaa puhutut sanat [Vuo01]. Automaattiseen puheentunnistukseen (AP) kuuluu viisi vaihetta: puhesignaalin akustinen esikäsittely, puhesignaalin segmentointi äänteiksi, äänteiden tunnistus foneemeiksi, foneemien yhdistelmien tunnistus sanoiksi ja mahdollisesti sanojen yhdistely kieliopillisiksi rakenteiksi kuten lauseiksi. Viimeinen vaihe saatetaan jättää puheen ymmärtämisen tehtäväpiiriin. Puheen ymmärtäminen muodostuu seuraavista tehtävistä: syntaktinen ja kieliopillinen analysointi lauseiden jäsentämiseksi ja tunnistusvirheiden korjaamiseksi, semanttinen tulkinta ja monimerkityksellisten osien selvittäminen, sekä puhutun viestin pragmaattinen tulkinta. Toisin sanoen, sanajonolle on määriteltävä järkevä, tilanteeseen ja asiayhteyteen sopiva, kieliopillinen ja semanttinen tulkinta [Vuo01].

5 4 Äänen koodauksella automaattisessa puheentunnistuksessa tarkoitetaan tässä tutkielmassa äänteiden koodausta foneemeiksi neuroverkkojen, ja tarkemmin Kohosen itsejärjestyvien piirrekarttojen (SOM eli self-organizing map -neuroverkkojen) avulla. Itsejärjestyvä piirrekartta on sellainen neuroverkko, joka pystyy jakamaan syötteet luokkiin ilman ulkopuolista apua (ns. ohjaamattoman opetuksen periaate), siksi nimitys itsejärjestyvä. SOM-verkkoihin johdatetaan luvussa 3. Luvun ymmärtäminen helpottuu, jos neurolaskennan perusteet ovat lukijalle ennestään tutut. Teuvo Kohonen on käyttänyt SOM-verkkoja foneettisessa kirjoituskoneessaan erottamaan suomen kielen foneemeja katkeamattomasta puhevirrasta [Koh88]. Kohosen menetelmä tarkastellaan luvussa 4. Huomio kiinnitetään siihen, miten puhevirrassa esiintyvät äänteet kuvautuvat foneemeiksi. Vaikka sanastolla, esim. homonyymien tunnistuksessa (homonyymit ovat sanoja, joilla on sama kieliasu ja ääntämistapa, mutta eri merkitys), ja myös kieliopilla yleisemmin on tärkeä rooli puheviestissä välitettävän viestin oikein ymmärtämisessä, tässä tutkielmassa tarkastellaan ainoastaan foneemien tunnistusta. Sanojen tunnistus ja muut korkeamman tason tarkastelut jätetään työn ulkopuolelle. Akustiikasta ja signaalikäsittelystä esitetään vain tarvittava peruskäsitteistö.

6 5 2 PUHESIGNAALIN OMINAISUUKSIA 2.1 Akustiikkaa ja signaalikäsittelyä Korva havaitsee äänenä paineenvaihtelut väliaineessa. Äänen korkeutta mittaa värähtelyn taajuus (hertsi Hz = 1/s), äänen voimakkuutta värähtelyn laajuus (amplitudi) tai suhteellinen intensiteetti (desibeli db) ja kestoa aika. Fourier-muunnoksen nojalla mikä tahansa käyrä on ääretön summa sinikäyriä. Äänivärähtelykin on purettavissa summaksi osavärähtelyjä, ääneksiä (ylä-ääniä) [Car01]. Äänesten voimakkuuden eli intensiteetin esitystä ajan funktiona kutsutaan spektrogrammiksi. Sana spektri tarkoittaa värähtelyn taajuusjakaumaa tiettynä ajanhetkenä. taajuudellaan. Näin spektrogrammissa kaikki osavärähtelyt näkyvät selkeästi kukin omalla Kuva 1. Sanan kaksi synkronisoidut taajuustason (spektrogrammi - ylempi kuva) ja aikatason (ääniaalto - alempi kuva) esitykset. [Kar99]

7 6 Kuvassa 1 on kuvattu äänivärähtely, joka syntyy sanaa kaksi lausuttaessa. Äänteet, joista sana kaksi koostuu, ovat pituudeltaan sekuntia. Jokainen äänne koostuu erilaisista osavärähtelyistä, jotka erottuvat paremmin ylemmästä spektrogrammista. Toinen havainto, mikä voidaan tehdä, on se, että osavärähtelyt (äänekset) voimistuvat tietyillä taajuuksilla. Tätä ilmiötä kutsutaan resonanssiksi ja resonanssialuetta formantiksi [Car01]. Formantit näkyvät spektrogrammissa tummina ympäristöstä erotettavina raitoina ja ne numeroidaan alhaalta ylöspäin. Mitä tummempi formantin väri on, sitä voimakkaampi äänisignaali sillä taajuudella on. Puheäänteet erottuvat akustisesti jo muutaman ensimmäisen formantin perusteella. Esim. kuvan 1 spektrogrammin /i/-vokaalia vastaavassa osassa on helposti erotettavissa kolme formanttia. Kuva 2. a) /su/ -tavun ja b) /šu/ -tavun spektrogrammit. [LHM90] Kuvassa 2 englanninkielistä puhujaa pyydettiin ääntämään tavut /su/ ja /šu/, jotka esiintyvät englannin kielen sanoissa soon ja shoe. Kuvasta havaitaan erot äänteiden kestossa ja spektriominaisuuksissa. Esim. /u/- äänteen kolme ylempää formanttia poikkeavat toisistaan kuvissa 2a ja 2b. Äänenkorkeutta kuvaa perustaajuus F0. Karkeasti sanoen ihmisäänen F0 on miehillä 100 Hz, naisilla 200 Hz ja lapsilla 300 Hz. Perustaajuus F0 sijoittaa muut formantit korkeammalle tai matalammalle spektrogrammiin. Perustaajuuden vaihtelevuus puhujasta puhujaan on ihmispuheen perusominaisuuksia. Ihmisen korvan erottelukyky liikkuu hertsiin ja on parhaimmillaan puheäänen alueella ( Hz). Suurin osa

8 7 puheen informaatiosta välittyy jo ensimmäisen 300 hertsin alueella (tätä käytetään hyväksi puhelimessa). [Car01] 2.2 Äänen tuotto Ihmisellä on käytössä monipuolinen puhe-elimistö, joka mahdollistaa kaikkien kielessä käytettyjen äänteiden tuottamisen (kuva 3). Suurin osa puheäänteistä tuotetaan uloshengityksen voimalla. Soinnillisissa äänteissä ilmanpaine saa kurkunpäässä äänihuulet pörisemään. Puheen perustaajuus riippuu äänihuulten koosta ja jännityksestä. [Car01] Ääniväylä (kurkunpää, nielu ja suuontelo) ja nenäväylä (nenäontelo) muokkaavat merkittävästi äänihuulien tuottamaa signaalia ja niiden voidaankin ajatella olevan säätyviä akustisia signaalin suodattimia. Syntyviä ääniä voidaan siis säädellä myös muuttamalla äänikanavan muotoa liikuttelemalla kieltä, hampaita ja huulia (ääntöelimiä). Näiden väylien säätövaikutuksia kutsutaan artikulaatioksi. Kuva 3. Poikkileikkauskuva ihmisen puhe-elimistä. [Kar99]

9 8 Puheentunnistuksen kannalta erotetaan kolme erilaista äänneluokkaa [Koh88]: 1. Soinnilliset (pyörteettömät) äänteet, joihin kuuluvat vokaalit /a/, /o/, /u/, /i/, /e/, /ö/, /ä/, /y/: melko hyvin ihmisen tunnistettavissa spektrogrammeista kahden alimman formantin perusteella [Vuo01]. puolivokaalit /j/, /v/, /w/: tuotettu ääntöelinten lähentymällä [IHH00]. Puolivokaaleissa syntyy resonansseja, mutta ei sanottavasti hälyä [Vuo01]. nasaalit eli nenä-äänteet /m/, /n/, /η/: syntyvät kitapurjeen laskeutuessa alas ja ilmavirran päästessä tällöin ulos nenäväylän kautta suuväylän ollessa samalla suljettuna jostakin kohdasta. Äänteet esiintyvät suomen sanoissa "ramman", "sannan", "rangan" /raηan/ [IHH00]. ja likviidit /l/, /r/: kielen kärki sulkee ääntöväylän keskikohdan hammasvallin kohdalla ilmavirran päästessä ulos laidoilta [IHH00]. 2. Frikatiivit eli hankausäänteet /s/, /š/, /z/ yms. : syntyvät ääntöväylän supistumakohdalla ilmavirran aiheuttamasta hankaushälystä [IHH00]. 3. Eksplosioäänteet /k/, /p/, /t/, /b/, /d/, /g/ yms.: syntyvät, kun täydellisesti sulkeutunut ääniväylä avautuu nopeasti ja ilmavirtauksen paine purkautuu räjähdyksenomaisesti [Vuo01]. Kahden ensimmäisen luokan foneemeilla on melko hyvin spektrogrammeista erottuvat spektrit, sen sijaan eksplosioäänteet ovat tunnistettavissa vain transienttiominaisuuksien perusteella eli ympäröivien äänteiden avulla, joilla on suhteellisen stabiili spektrimuoto. Kuvasta 1 näkyy, että molempien /k/-äänteiden kohdalla spektri on hyvin heikko. 2.3 Ihmisen puheentunnistusmekanismeista Ihmiset eivät kuule foneemeja yms. matalan tason puhe-elementtejä: tämä voidaan todeta kun pyydetään henkilöä kirjoittamaan vieraan kielen äänteet vain puolet äänteistä tunnistetaan oikein [SNP86, s. 24]. Sen sijaan ihminen vertailee aivoihin saapuvaa ärsykettä muistissa oleviin ääntämis- ja muihin tietoihin,

10 9 asiayhteyksiin. Tämä vertailu tapahtuu aivojen monella tasolla rinnakkain, ja ihminen rakentaa ärsykkeen merkityksen käyttäen ärsykkeessä saapuneita tietopalasia. Tätä lähestymistapaa on yritetty soveltaa myös automaattisessa puheentunnistuksessa, esim. sanelukoneissa, jotka tunnistavat tietyn rajoitetun sanaston sanoja, kun niitä lausutaan ääneen mikrofoniin pitäen lyhyet tauot sanojen välissä [Koh88]. Nopeus, jolla foneemit ovat tunnistettavissa jatkuvasta puheesta, on paljon korkeampi kuin korvan kyky tunnistaa kuulijalle erikseen lausuttuja äänipätkiä, jotka ovat yksi yhteen suhteessa foneemeihin (äänipätkät eivät välttämättä muodosta kielen sanoja, vaan ovat mielivaltaisia äänneyhdistelmiä) [SNP86]. Ihminen käyttää tuntemaansa kielen semantiikkaa ja syntaksia, eli foneemeja korkeamman abstraktitason asioita hyväksi tunnistuksessa, ja myös visuaalisella tiedolla on merkitystä, jopa vauvoille [LHM90]. Kuitenkin nykyään tietokoneilta puuttuu maailmankäsitys ja sen tarjoama korkeiden abstraktioiden täydellinen hyväksikäyttö puheentunnistuksessa, vaikka jonkinasteiset semanttisen käsittelyn mahdollisuudet ovat jo olemassa (näissä menetelmissä käytetään myös SOM-verkkoja), ks. [Hon97]. 2.4 Koartikulaatio, segmentoinnin vaikeus ja invarianttius Koartikulaatio on puhetta helpottava ilmiö, jossa samankaltaistumista tapahtuu etenkin peräkkäin esiintyvien äänteiden kesken [IHH00]. Tämä tarkoittaa sitä, että sanassa susi ensimmäisen /s/-äänteen spektrogrammi eroaa toisesta /s/-spektrogrammista sen vuoksi, että ääntöelimet valmistautuvat ääntämään seuraavaa äännettä jo edellistä (/s/-äänettä) ääntäessään. Koartikulaatio on erittäin näkyvä konsonanteissa /b/, /d/, /g/, /p/, /t/ ja /k/ [LHM90, s.7], mikä vastaa Kohosen käsitystä eksplosioäänteiden invarianttien spektriominaisuuksien puuttumisesta [Koh88]. Tietoa foneemista välittyy puheessa siis jossain määrin rinnakkain. Mikä tahansa ääniaallon pätkä sisältää tietoa useasta foneemista, mikä tekee sen segmentoinnin vaikeaksi. Koska akustiset segmentit eivät ole yksi - yhteen lineaarisessa kuvaussuhteessa, tapahtuu ihmisessä monimutkainen uudelleenjärjestämisprosessi puheen tuottovaiheessa ja samoin monimutkainen koodin purkamisprosessi puheen tunnistusvaiheessa [SNP86]. Ääniaallon ominaisuudet, foneemit ja tavut ovat olleet ehdokkaina tunnistusyksiköiksi, mutta yksikön valinta ei poista segmentointi- ja invarianssiongelmaa. Ongelmana ei ole yksikön valinta, vaan sen valinnan vaikutus tunnistusprosessiin [SNP86].

11 10 Koartikulaation olemassaolo ja muut puheen muuttuvat ominaisuudet johtavat tähän johtopäätökseen: ei ole olemassa erillistä invarianttia (muuttumatonta) puhesignaalin ominaispiirrettä, joka vastaisi yksikäsitteisesti annettua kielen foneemia [LHM90, s.73]. Formanteilla ei esim. ole vakioisia taajuuksia, vaan ne riippuvat puheen perustaajuudesta F0 ja ympäröivistä äänteistä. Äänteiden kesto ei ole vakio vaan riippuu puhujan puhumisnopeudesta. Variaatioita syntyy myös painotus- ja murre-eroista, puhujan äänen voimakkuudesta, henkilöllisyydestä, sukupuolesta ja tunnetilasta riippuen. Invarianssit ovat luonteeltaan suhteellisia ja invarianttius on havaittavissa puheessa vain suhteellisina arvoina eli keskinäisten riippuvuuksien vakioarvoina [LHM90, s.10]. 2.5 Äänne ja foneemi Äänne (fooni, engl. phone) on pienin mahdollinen laadullinen puhesegmentti, joka kuulon avulla voidaan erottaa muista segmenteistä. Foneemi (engl. phoneme) on äänteen abstraktio, jolla on erotettavat piirteet muiden foneemien nähden [IHH00]. Variaatioista johtuen tietty kielen foneemi saa eri puhujilla eri akustisen ulkoasun eli äänteen. Toisin sanoen, jokainen ihminen ääntää esimerkiksi /k/-foneemin omalla tavallaan. Näin syntyy foneemien variantteja eli allofooneja (engl. allophone). Puhujaerojen lisäksi koartikulaatio aikaansaa allofooneja, esim. suomen /k/-äänteet sanoissa kili, kala, kylä, kolo, kuli, keli, köli, käly [IHH00]. Näin olleen foneemi on allofoonien muodostama joukko [Vai01]. Foneemi-äänne suhde on verrattavissa luokka-olio suhteeseen: samoin kuin olio on luokan esiintymä, äänne on foneemin toteutus. Ihmiskielessä on kaiken kaikkiaan foneemia. Foneemeja käytetään suoraan tarkekirjoituksessa (transkriptiossa). Tarkekirjoitus on ääntämisohje, jonka useimmiten näkee sanakirjoissa. Suomen kieli on ns. foneemipohjainen kieli [Ful95], jossa foneemin ja sanan kirjaimen (aakkosen) suhde on lähes yksikäsitteinen. 2.6 Redundanssi Puheentunnistus on ihmiselle helppoa, koska puheessa on olemassa paljon redundanssia (liiallisuutta), jota ihminen osaa käyttää hyväksi. Äänteiden ja etenkin isompien syntaksiyksiköiden loppumisesta kertoo yleensä joukko vihjeitä (cues), jotka ovat ääniaallossa havaittavia äänteet toisistaan erottavia muutoksia. Vihjeitä esiintyy spektrissä ja ajassa, esim. äänteen kestossa. Painotetun tavun äänteiden kesto on pidempi painottomien tavujen kestoon nähden. Kuulija käyttää hyväksi myös puheen prosodisia ominaisuuksia -

12 11 intonaatiota, rytmiä, taukoja jotka kertovat puhujan tunnetilasta [SNP86]. Intonaation muutoksia voi havaita spektrogrammista perustaajuuden F0 avulla. Perustaajuus laskee jokaisen ison syntaksiyksikön lopussa ja nousee sen alussa. Redundanssi auttaa ymmärtämistä tilanteissa, jossa puheeseen on sotkeutunut paljon melua, tai puhesignaali on rajoitettu ja vääristynyt (kuten puhelimessa). Silloin yhden vihjeen kadotessa toinen ääniaallosta löytyvä vihje muuttuu dominoivaksi. 2.7 Ominaisuuksien tuntemisesta puheen tunnistukseen Puhesignaali esitetään puheentunnistusjärjestelmissä yleensä aikasarjana, jossa eri ajanjaksoja, aikaikkunoita, kuvataan piirrevektoreiden avulla. Piirteet pyritään valitsemaan siten, että niiden avulla pystytään tunnistamaan hyvin erilaiset foneemit ja huomioimaan niiden ajalliset riippuvuussuhteet. Esitystavan tulisi lisäksi olla invariantti erilaisten puheen variaatioiden suhteen, joilla ei ole oleellista merkitystä tunnistuksen kannalta [Vuo01]. Spektrogrammien lukututkimusten tulokset osoittavat, että on mahdollista oppia äänteiden visuaalisista korrelaatioista niin paljon, että spektrogrammeja lukemalla voi tunnistaa tuntemattomia lauselmia hyvällä tarkkuudella. Spektrogrammien lukemisen asiantuntija Victor Zue pystyy tunnistamaan oikein 90 % foneemeja annetuista spektrogrammeista [SNP86, s.26]. Näin olleen puheen spektriominaisuudet ja niiden ajalliset muutokset toimivat hyvänä tietolähteenä piirrevektoreiden muodostamiselle. Toisin sanoen, piirrevektorit voidaan muodostaa spektrogrammeista.

13 12 3 ITSEJÄRJESTYVÄT PIIRREKARTAT 3.1 Osa neurolaskentaa Neurolaskenta on vaihtoehtoinen tapa ratkaista tietojenkäsittelytieteen ongelmat. Neurolaskennassa tehtävänä on algoritmin keksimisen sijasta sellaisen neuroverkkotyypin löytäminen, joka olisi sopiva ongelmaa kuvaavien tietojen analysointiin. Tällainen tietokeskeinen lähestymistapa mahdollistaa sellaisten ongelmien käsittelyn, joihin ei tunneta algoritmeja tai sääntöjä, ja joihin näiden kehittäminen olisi erittäin työlästä. Tällaisia tehtäviä ovat esimerkiksi erilaiset hahmontunnistukseen liittyvät ongelmat (havaintojen luokittelu ja tunnistus), kuten kuvana tallennetun tekstin tai käsialan tunnistus, (käytös)mallien ja reaalimaailman prosessien mallintaminen ja ennakointi (sääennusteet), aivojen toiminnan (muistin) mallintaminen, tiedon pakkaaminen, päätöksenteko (diagnoosien tekeminen, laadunvalvonta). Eri tehtäville on olemassa eri neuroverkkotyypit, ja lähes kaikki ottavat mallia aivojen toiminnasta. Yksinkertaistettuna aivot koostuvat neuroneista, joista jokainen vastaanottaa tietoa sähköisenä signaalina aistinelimeltä tai toisilta neuroneilta. Se lähettää muunnetun signaalin eteenpäin niille neuroneille, jotka ovat yhteydessä tämän neuronin vievään haarakkeeseen. Tietojenkäsittely tapahtuu eri neuroneissa rinnakkain. Yhteydet neuronien välillä voivat vahvistua tai heikentyä, ja juuri näihin yhteyksiin varastoidaan vastaanotettu ja käsitelty tieto. Neuronit yhteyksineen muodostavat neuroverkon ja neurolaskennassa tarkastellaan erilaisia yhdistelmätyyppejä (neuroverkkotyyppejä), niiden käyttöön liittyvää problematiikkaa ja sovellettavia ongelmia. 3.2 Yleinen kuvaus Helsingin teknillisen korkeakoulun professori Teuvo Kohonen 1980-luvun alkupuolella kehitti itsejärjestyvä piirrekartta eli self-organizing map (SOM) -nimellä tunnetun neuroverkkomallin, joka mahdollistaa epälineaaristen kuvausten luomisen syöte- ja tulostedatan välille. SOM-verkkoa voi pitää ihmisaivojen toiminnan keinotekoisena mallina. SOM-verkko seuraa joitakin perusteellisimpia aivojen toimintaperiaatteita, esim. se kykenee luomaan järjestettyjä piirrekarttoja, joita on kokeellisesti löydetty aivokuoresta [Hon97]. SOM-verkkoa voi myös pitää ohjaamattoman koneoppimisen mallina ja adoptoivana tiedonesityskaaviona [Hon97]. Adoptoiva tarkoittaa kykyä muokkautua verkkoon saapuvan uuden syötetiedon mukaan. Tiedonesityskaavio tarkoittaa samankaltaisten syötteiden ryhmittelyä yhteen järjestämällä neuronien painokertoimet itsenäisesti uudestaan kuvaamaan syötteiden lainalaisuudet.

14 13 SOM-verkko koostuu neuroneista (laskenta-alkioista), jotka on topologisesti järjestetty neliöksi tai suorakulmioksi (kuva 4). Verkon neuronit muodostavat siis yhden ja ainoan neuronikerroksen. Verkko vastaanottaa n-ulotteiset syötevektorit yksi kerrallaan. Sen perusteella, onko verkko oppimis- vai käyttövaiheessa, se joko muokkaa omaa tilaansa juuri syötetyn vektorin huomioon ottamiseksi tai luokittelee syötevektorin johonkin luokkaan kuuluvaksi. Kuva 4. SOM-verkon kaavamainen esitys. Syötevektori kuvaa yhtä tutkimusdatan yksikköä, joka on yleensä luokiteltava tosimaailman kohde. Yksikkönä voi esim. olla yhden potilaan tiedot, jolloin tutkimuksen kohteena on joukko potilaita, jotka halutaan ryhmitellä oireiden perustella eri luokkiin ja tällä tavalla edesauttaa diagnoosin tekemistä. Äänteiden tunnistuksessa esim. etuvokaalit muodostavat yhden ryhmän (ks. kuva 15). Jokainen vektorin ulottuvuus on jokin yksikön ominaisuus tai piirre, esim. potilaan kehon lämpötila. Näin syötevektoria voidaan kutsua myös piirrevektoriksi. Vektorin anto opetusvaiheessa on voittajaneuronin koordinaatit (x,y). Verkko kilpailuttaa neuroninsa syötevektoria vastaan ja etsii tälle parhaiten vastaavan neuronin. Vastaavuus tai yhtäläisyys syötevektorin ja neuronin sekä kahden neuronin välillä määritellään euklidisen etäisyyden avulla. Lisää kilpailutilanteesta ja etäisyyden laskemisesta luvuissa 3.3 ja 3.5. SOM-verkkojen etu on niiden kyky analysoida moniulotteista dataa ja ryhmitellä tutkimusdatan yksiköt luokkiin niin, että erot ja yhtäläisyydet ovat visuaalisesti tarkasteltavissa kaksiulotteisessa tasossa. Tällaista analyysia tarvitaan siksi, että moniulotteinen keskinäisten riippuvuuksien suora tarkastelu on ihmiselle hankala ja työläs tehtävä. Jatkaen potilasesimerkkiä, SOM-verkko pystyy löytämään ryhmän sellaisia potilaita, joilla on epäilty tauti, ja sellaisia potilaita, joiden oireet liittyvät muihin kuin kiinnostuksen kohteena olevaan tautiin. Potilastietoa on helpompi tarkastella piirrekartan avulla kuin 15 parametrin potilastietotaulukkona.

15 14 Huomattakoon, että piirrekartta säilyttää verrannolliset ryhmien koot, ts. jos 1/3 osalla potilaita on epäilty tauti, niin piirrekartan keskittymä, joka kuvaa kyseisiä potilaita, koostuu myös 1/3 osasta kaikkia piirrekartan neuroneja. Foneettisen piirrekartan tapauksessa laskemalla vokaaleille reagoivien neuronien määrä voi päätellä vokaalien osuuden syötetyissä sanoissa ja jopa koko kielessä (otannan ollessa tarpeeksi laaja ja jakauman tasainen). 3.3 Rakenne ja toimintaperiaate a) b) Kuva 5. SOM-verkon a) i:s neuroni ja b) ja neuronikerros katsottuna sivulta. [Koh88] SOM-verkon jokainen neuroni on kuvassa 5a esitettyä muotoa. Neuronit vastaanottavat n-ulotteisen syötteen [ ξ.. ] T x = 1 ξ n, jonka ne näkevät kaikki yhtä aikaa. Neuroni muuttaa tilaansa muokkaamalla painokerroinvektoriaan [ ] T m = µ 1.. µ n. Huomattakoon, että syötevektorin ja painokerroinvektorin ulottuvuuksien määrä on sama. Näin syötevektori ja kukin SOM-verkon neuroni voidaan kuvata pisteeksi n- ulotteisessa euklidisessa avaruudessa. Mitä lähempänä pisteet ovat toisiaan, sitä yhtäläisempiä kohteita niitä vastaavat neuronit/syötevektorit kuvaavat. Euklidinen etäisyys i:nnen ja k:nnen neuronin välille lasketaan kaavan n j= 1 T [( m m ) ( m m )] 2 d ( i, k) = ( µ i1 µ kn) = i k i k, (1) mukaisesti [Räs96], jossam on verkon i:s neuroni, joka koostuu painokertoimista µ.. i m = µ.. µ on verkon k:s neuroni. Vastaavasti [ ] T k k1 kn 1, ts. m [ µ.. µ ] T i µ i n i =. i1 in Jokaiselle syötevektorille SOM-verkko etsii neuroneista voittajan, joka on euklidisessa avaruudessa lähinnä syötevektoria oleva neuroni. Voittajan etsimistä kutsutaan kilpailutilanteeksi neuronien välillä. Voittajaneuroni lasketaan kaavasta

16 15 jossa x on syötevektori, joko 1 (voittajaneuronilla), tai 0. d x, m ) = min{ d( x, m )}, (2) ( c i mc on etsitty voittajaneuroni ja m i on SOM-verkon i:s neuroni. Neuronin anto η on Neuronien välillä on yhteyksiä, ns. takaisinsyöttölinjoja, joiden avulla voittaneen neuronin naapureilla on mahdollisuus päivittyä lähemmäs voittajaneuronia. Kuvassa 5b näkyy takaisinsyöttölinja i:nnen ja k:nnen neuronin välillä w ki. Sädettä, jolla on olemassa yhteydet neuronista ympäröiviin neuroneihin, kutsutaan neuronin naapurustoksi. Yleensä naapurusto pienentyy suurimmasta mahdollisesta arvosta nollaan. Kuvassa 6 naapuruston koko on Alustaminen Kuva 6. Neuronin naapurusto. Musta v oittajaneuroni on kuvattu mustalla ja sen naapurusto harmaalla värillä. SOM-verkon neuronien alustamiseen on olemassa kaksi menetelmää. Neuronien painokerroinvektorit alustetaan pienillä satunnaisarvoilla siten, että vektorialkiot ovat lähellä n-ulotteisen avaruuden 0-pistettä. Vaihtoehtoisesti alkuarvoiksi asetetaan syötevektorijoukosta satunnaisesti poimittuja vektoreita [Räs96]. Opetusvaiheessa verkon neuronit alkavat vähitellen kattaa koko syötevektorijoukon käyttämää n-ulotteista avaruutta (kuva 7). a) b) c) d) Kuva 7. Verkon alustus ja opetuksen aloitus. a) Satunnaisvektorit ovat keskittyneet 0-pisteen lähelle; b) Muutaman syöttökerroksen jälkeen neuronit etääntyvät keskustasta (tai alustettu satunnaisotannalla); c) ja d) neuronit muodostavat tasaisen verkon syötevektoriavaruuden yli.

17 Opettaminen Opetusvaiheessa SOM-verkon neuronit ryhmittyvät keskittymiin. Verkko oppii syöteavaruuden lainalaisuudet täysin itsenäisesti, mikä on ohjaamattoman oppimisen pääpiirre. Verkolle ei siis anneta jokaisen syötteen yhteydessä haettua vastausta (syötteen luokkaa), mikä olisi ohjattua oppimista. Päinvastoin, verkko löytää luokat itse, ja käyttäjän tehtäväksi jää luokkien nimeäminen. Opetuksessa jokaiselle syötevektorille etsitään voittajaneuroni (luvut ). Voittajaneuroni sijaitsee lähempänä syötevektoria kuin mikään muu verkon neuroni, ja sellainen neuroni löytyy aina, myös heti alustuksen jälkeen, kun kaikki neuronit ovat isossa kasassa lähellä nollapistettä. Kun voittajaneuroni on laskettu (kaavat (1)-(2)), käynnistyy sen painokerroinvektorin [ ] T x ξ..ξ 1 2 syötevektoria [ ] T m = µ 1.. µ n päivitys lähemmäksi =. Myös naapuruston neuronit päivitetään lähemmäksi syötevektoria. Tätä painokertoimen adaptiivista muokkausta sanotaan neuroverkon oppimiseksi ja kaavaa m ( t + 1) = m ( t) + α( t) i m ( t + 1) = m ( t), i i i [ x( t) m ( t) ], i jos jos i N ( t); i N ( t); c c (3) Kohosen opetussäännöksi [Räs96]. Tässä kaavassa t ja t+1 ovat peräkkäisiä ajanhetkiä (kaikki kaavan suureet ovat riippuvaisia ajasta), mi on verkon i:nnen neuronin painokerroinvektori,x on syötevektori, Nc on voittajaneuronin naapurusto, ja α on opetuskerroinsarja. Sekä naapurusto että opetuskerroin pienenevät opetuksen edistyessä. Opetus voidaan jakaa kahteen vaiheeseen: karkea ja tarkentava. Karkeassa opettamisessa käytetään suhteellisen vähän opetuskertoja, mutta naapurusto ja opetuskerroin asetetaan suuriksi, jotta muutokset neuronien tiloihin ovat myös suuria. Ensimmäisen vaiheen tarkoituksena on saada karkea klusterointi aikaan. Tarkentavassa opettamisessa opetuskertoja lisätään huomattavasti, mutta samalla opetuskerrointa ja naapuruston suuruutta pienennetään. Tämän vaiheen tavoite on saavuttaa ja selvittää selkeät keskittymien keskipisteinä toimivat neuronit. Teuvo Kohosen mukaan opetussyötteitä tulisi tässä vaiheessa käyttää vähintään 500 kertaa verkon neuronien lukumäärää [Räs96]. Syötevektoreiden syöttöjärjestyksellä ei Kohosen menetelmässä ole merkitystä, sillä neuroverkon rakenne tekee syöttöjärjestyksen vahingossa oppimisen mahdottomaksi.

18 Klusterointi ja vektorikvanttisointi Syötedatan saapuessa verkkoon tietyt neuronit alkavat herkistyä tietyntyyppiselle syötölle. Samanlaisiin syöttöihin reagoivat neuronit alkavat siis ryhmittyä keskittymiin. Keskittymien rajoille syntyy ominaisuuskuiluja ja vierekkäisen keskittymän neuronit kuvaavat jo toisia ominaisuuksia omaavan syötedataosioon. Keskittymien rajat löydetään Voronoi-jaotuksen avulla (kuva 8): jokaisella keskittymällä on olemassa viitevektori, joka on läheisin naapuri saman keskittymän jokaiselle vektorille [Koh88, s.14]. Tällä tavalla tehty vektoriavaruuden ositus (vektorikvanttisointi) läheisesti vastaa Bayesin päätöstasojen muodostusta, joita käytetään virhetodennäköisyyden (engl. probability for misclassification) minimointiin. Kuva 8. Vektoriavaruuden Voronoi-jaotus. Vektoriavaruus jaettiin kahteen luokkaan: ensimmäisen luokan vektorit on merkitty umpinaisilla ja toisen luokan vektorit avonaisilla ympyröillä. 3.7 Käytettävyyden arvioiminen ja käyttö Molemmat edellä kuvatut alustusmenetelmät tuottavat ainutlaatuisia verkkoyksilöitä. Opetuksen onnistuessa verkkoon muodostuu useampi selkeä osumakeskittymä, mutta huonossa tapauksessa verkkoon voi muodostua vain yksi iso keskittymä, ja kaikki syötevektorit kuvautuvat muutamiin lähekkäin sijaitseviin neuroneihin. Tällaisen virheellisen käytöksen aiheuttaa verkon ylioppiminen, kun liiasta opetuskierrosmäärästä johtuen verkko menettää yleistämiskykyä. Toisaalta keskittymät saattavat puuttua kokonaan, jolloin syötevektorit kuvautuvat tasaisesti koko verkon alueelle. Tästä johtuen todellisessa käyttötilanteessa on hyvä alustaa useampi verkko, opettaa ne ja testauksen jälkeen valita tehtävään soveliain yksilö. [Räs96] Oppimisvaiheen jälkeen verkosta on muodostunut järjestetty piirrekartta. Neuronien tila eli vektoriarvot kiinnitetään ja keskittymät selvitetään viitesyötevektoreiden avulla, ellei sitä ole tehty opetusvaiheessa: annetaan syöte, jonka tyyppi/luokka jo tunnetaan, esim. /a/-äänne. Antona oleva piirrekartan neuroni tunnistaa viitesyötteen tyyppiä olevat syötteet, tässä tapauksessa /a/-äänteet /a/-foneemeiksi.

19 18 Vektorin hyvyyden arvioimiseksi käytetään tunnuslukua nimeltä keskimääräinen kvanttisointivirhe. Tunnusluku on kunkin syötevektorin ja sen tunnistavan voittajaneuronin välisten etäisyyksien keskiarvo. Mitä pienempi virhe, sitä tarkemmin piirrekartta vastaa sille annettuihin syötteisiin, eli klusteroi saamansa syötevektorin paremmin. [Räs96] Opetettu SOM-verkko on valmis luokittelemaan ei pelkästään syötteenä ollutta dataa vaan mitä tahansa saman ongelman tutkimusdataa. Neuroverkko oppii siis yleistämään asiat. Näin esimerkiksi neuroverkkoa, joka on tietyn sairaalaan potilastietojen avulla opetettu tunnistamaan umpilisäkkeen tulehdusta, voidaan samassa sairaalassa käyttää jatkossa tekemään diagnoosia uusille potilaille, kunhan kerättävien tietojen tyypit ja mittaustekniikat pysyvät samoina. Ääntä koodatessaan foneettinen piirrekartta pystyy tuottamaan tarkekirjoitukset myös niille sanoille, jotka eivät kuuluneet syötedataan. Neuroverkko pystyy siis toimimaan rajoittamattomalla sanastolla.

20 19 4 FONEETTINEN ÄÄNENKOODAUS 4.1 Uusi puheentunnistusmenetelmä Teuvo Kohonen julkaisi vuonna 1988 Computer-lehdessä The Neural Phonetic Typewriter nimisen artikkelin [Koh88], jossa hän kuvasi puhujan puheeseen mukautuvan automaattisen sanelujärjestelmän. Se perustui SOM-verkkoihin ja pystyi toimimaan rajoittamattomalla sanastolla. Kohosen SOM-verkon käyttöön pohjautuva menetelmä osoittautui 1990-luvulla uudeksi tehokkaaksi lähestymistavaksi AP:n ongelmaan, kun siihen ja muihin tekoälyongelmiin alettiin osoittaa yhä enemmän kiinnostusta. Yleisin AP:ssa käytetty neuroverkkotyyppi 1980-luvulta aina tähän päivään saakka ovat olleet piilomarkovmallit, jotka ovat puhesignaalin kaltaisten aikasarjojen mallintamiseen sovellettuja äärellisiä tilakoneita. Piilomarkovmalleissa foneemien luokittelu suoritetaan niiden esiintymistodennäköisyyksien perusteella. Kun Kohosen opetuksessa syöteaineisto klusteroidaan järjestetyksi piirrekartaksi (luku 3), piilomarkovmalleissa opetusvaihe vastaa mm. esiintymis- todennäköisyyksien laskennasta [Kon00]. Hyvän tunnistustarkkuusasteen aikaansaamiseksi tilastolliset luokittelumenetelmät vaativat huomattavasti isomman joukon viitevektoreita (esim. /a/-äänteiden spektriesimerkkejä) kuin SOM-verkot [Koh88, s.14]. Siksi SOM-verkot sopivat tehokkuussyistä paremmin äänteiden luokitteluun (foneemeiksi koodaukseen) kuin piilomarkovmallit.

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään

Lisätiedot

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen: Puheen anatomiaa ja fysiologiaa Puhesignaalin analyysi Puheen havaitseminen luku 11 Luento: Puhe Mitä puhe on? Ihmisen kehittämä symbolinen kommunikaatiojärjestelmä. Perustuu sovittuihin kielellisiin koodeihin

Lisätiedot

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus

Lisätiedot

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

E. Oja ja H. Mannila Datasta Tietoon: Luku 2 2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi

Lisätiedot

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn

Lisätiedot

Koska HAL ymmärtää mitä puhumme? Puheen automaattinen tunnistus ja ymmärtäminen

Koska HAL ymmärtää mitä puhumme? Puheen automaattinen tunnistus ja ymmärtäminen Koska HAL ymmärtää mitä puhumme? Puheen automaattinen tunnistus ja ymmärtäminen Vuokko Vuori TKK, Informaatiotekniikan laboratorio Vuokko.Vuori@hut.fi Tiivistelmä Tässä työssä pyritään tekemään katsaus

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén

Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén Sonifikaatio Menetelmä Sovelluksia Mahdollisuuksia Ongelmia Sonifikaatiosovellus: NIR-spektroskopia kariesmittauksissa

Lisätiedot

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN » Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN 1 Puhe-elimistä Helsingin Yliopiston sivuilla» Puhe-elimet voidaan jakaa

Lisätiedot

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä

Lisätiedot

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Kompleksiluvut signaalin taajuusjakauman arvioinnissa Kompleksiluvut signaalin taajuusjakauman arvioinnissa Vierailuluento IMA-kurssilla Heikki Huttunen Lehtori, TkT Signaalinkäsittely, TTY heikki.huttunen@tut.fi Department of Signal Processing Fourier-muunnos

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...

Lisätiedot

Organization of (Simultaneous) Spectral Components

Organization of (Simultaneous) Spectral Components Organization of (Simultaneous) Spectral Components ihmiskuulo yrittää ryhmitellä ja yhdistää samasta fyysisestä lähteestä tulevat akustiset komponentit yhdistelyä tapahtuu sekä eri- että samanaikaisille

Lisätiedot

Foneettiset symbolit

Foneettiset symbolit Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

Tee-se-itse -tekoäly

Tee-se-itse -tekoäly Tee-se-itse -tekoäly Avainsanat: koneoppiminen, tekoäly, neuroverkko Luokkataso: 6.-9. luokka, lukio, yliopisto Välineet: kynä, muistilappuja tai kertakäyttömukeja, herneitä tms. pieniä esineitä Kuvaus:

Lisätiedot

Tänään ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus laskarit. Ensi kerralla (11.3.)

Tänään ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus laskarit. Ensi kerralla (11.3.) Tänään ohjelmassa Kognitiivinen mallintaminen Neuraalimallinnus 26.2. Nelli Salminen nelli.salminen@helsinki.fi D433 autoassosiaatio, attraktorin käsite esimerkkitapaus: kolme eri tapaa mallintaa kategorista

Lisätiedot

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004

Lisätiedot

Johdatus tekoälyn taustalla olevaan matematiikkaan

Johdatus tekoälyn taustalla olevaan matematiikkaan Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 3. luento 17.11.2017 Neuroverkon opettaminen (ohjattu oppiminen) Neuroverkkoa opetetaan syöte-tavoite-pareilla

Lisätiedot

5 Akustiikan peruskäsitteitä

5 Akustiikan peruskäsitteitä Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen

Lisätiedot

8003051 Puheenkäsittelyn menetelmät

8003051 Puheenkäsittelyn menetelmät 8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

Kognitiivinen mallintaminen. Nelli Salminen

Kognitiivinen mallintaminen. Nelli Salminen Kognitiivinen mallintaminen Neuraalimallinnus 24.11. Nelli Salminen nelli.salminen@tkk.fi Tällä kerralla ohjelmassa vielä perseptronista ja backpropagationista kilpaileva oppiminen, Kohosen verkko oppimissääntöjen

Lisätiedot

Digitaalinen audio

Digitaalinen audio 8003203 Digitaalinen audio Luennot, kevät 2005 Tuomas Virtanen Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2 Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot, sekä niissä

Lisätiedot

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.

Lisätiedot

Tällä kerralla ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus Kertausta: Perseptronin oppimissääntö

Tällä kerralla ohjelmassa. Kognitiivinen mallintaminen Neuraalimallinnus Kertausta: Perseptronin oppimissääntö Tällä kerralla ohjelmassa Kognitiivinen mallintaminen Neuraalimallinnus 19.2. Nelli Salminen nelli.salminen@helsinki.fi D433 vielä perseptronista ja backpropagationista kilpaileva oppiminen, Kohosen verkko

Lisätiedot

1 Määrittelyjä ja aputuloksia

1 Määrittelyjä ja aputuloksia 1 Määrittelyjä ja aputuloksia 1.1 Supremum ja infimum Aluksi kerrataan pienimmän ylärajan (supremum) ja suurimman alarajan (infimum) perusominaisuuksia ja esitetään muutamia myöhemmissä todistuksissa tarvittavia

Lisätiedot

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA Heini Kallio, tohtorikoulutettava Käyttäytymistieteiden laitos, fonetiikka Helsingin yliopisto heini.h.kallio@helsinki.fi Fonetiikan haasteet kielenopetuksessa

Lisätiedot

Kognitiivinen mallintaminen Neuraalimallinnus, luento 1

Kognitiivinen mallintaminen Neuraalimallinnus, luento 1 Kognitiivinen mallintaminen Neuraalimallinnus, luento 1 Nelli Salminen nelli.salminen@helsinki.fi D433 Neuraalimallinnuksen osuus neljä luentokertaa, muutokset alla olevaan suunnitelmaan todennäköisiä

Lisätiedot

Kerta 2. Kerta 2 Kerta 3 Kerta 4 Kerta 5. 1. Toteuta Pythonilla seuraava ohjelma:

Kerta 2. Kerta 2 Kerta 3 Kerta 4 Kerta 5. 1. Toteuta Pythonilla seuraava ohjelma: Kerta 2 Kerta 3 Kerta 4 Kerta 5 Kerta 2 1. Toteuta Pythonilla seuraava ohjelma: 2. Tulosta Pythonilla seuraavat luvut allekkain a. 0 10 (eli, näyttää tältä: 0 1 2 3 4 5 6 7 8 9 10 b. 0 100 c. 50 100 3.

Lisätiedot

KUN LUKEMINEN ON HANKALAA. Helena Sorsa

KUN LUKEMINEN ON HANKALAA. Helena Sorsa KUN LUKEMINEN ON HANKALAA Helena Sorsa Lukemisen ja kirjoittamisen vaikeudet Lukivaikeus dysleksia fonologinen häiriö: henkilö ei kykene muuttamaan lukemaansa puheeksi näkee sanat, mutta ei löydä äänneasua

Lisätiedot

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat Martti Vainio -- syksy 2006 Artikulaatiotavat Konsonantit voivat siis vaihdella artikulaatipaikan mukaan ja sen mukaan ovatko ne soinnillisia vai eivät

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Tietotekniikan valintakoe

Tietotekniikan valintakoe Jyväskylän yliopisto Tietotekniikan laitos Tietotekniikan valintakoe 2..22 Vastaa kahteen seuraavista kolmesta tehtävästä. Kukin tehtävä arvostellaan kokonaislukuasteikolla - 25. Jos vastaat useampaan

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 2 visuaalinen prosessointi Treismanin FIT Kuva 1. Kuvassa on Treismanin kokeen ensimmäinen osio, jossa piti etsiä vihreätä T kirjainta.

Lisätiedot

Laskut käyvät hermoille

Laskut käyvät hermoille Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011

Lisätiedot

Esimerkkejä vaativuusluokista

Esimerkkejä vaativuusluokista Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään

Lisätiedot

ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS 1 JOHDANTO 2 ESIMERKKIPOHJAINEN PUHEENTUNNISTUS

ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS 1 JOHDANTO 2 ESIMERKKIPOHJAINEN PUHEENTUNNISTUS ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS Antti Hurmalainen, Tuomas Virtanen, Jort Gemmeke, Katariina Mahkonen Signaalinkäsittelyn laitos Tampereen teknillinen yliopisto PL3, 331 Tampere

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30. FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.

Lisätiedot

Matematiikan tukikurssi, kurssikerta 3

Matematiikan tukikurssi, kurssikerta 3 Matematiikan tukikurssi, kurssikerta 3 1 Epäyhtälöitä Aivan aluksi lienee syytä esittää luvun itseisarvon määritelmä: { x kun x 0 x = x kun x < 0 Siispä esimerkiksi 10 = 10 ja 10 = 10. Seuraavaksi listaus

Lisätiedot

Oppimistavoitematriisi

Oppimistavoitematriisi Oppimistavoitematriisi Lineaarialgebra ja matriisilaskenta I Arvosanaan 1 2 riittävät Arvosanaan 5 riittävät Yhtälöryhmät (YR) Osaan ratkaista ensimmäisen asteen yhtälöitä ja yhtälöpareja Osaan muokata

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2 Johdatus diskreettiin matematiikkaan Harjoitus 4, 7.10.2015 1. Olkoot c 0, c 1 R siten, että polynomilla r 2 c 1 r c 0 on kaksinkertainen juuri. Määritä rekursioyhtälön x n+2 = c 1 x n+1 + c 0 x n, n N,

Lisätiedot

Oppimistavoitematriisi

Oppimistavoitematriisi Oppimistavoitematriisi Lineaarialgebra ja matriisilaskenta I Esitiedot Arvosanaan 1 2 riittävät Arvosanaan 3 4 riittävät Arvosanaan 5 riittävät Yhtälöryhmät (YR) Osaan ratkaista ensimmäisen asteen yhtälöitä

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

Kuulohavainnon perusteet

Kuulohavainnon perusteet Kuulohavainnon ärsyke on ääni - mitä ääni on? Kuulohavainnon perusteet - Ääni on ilmanpaineen nopeaa vaihtelua: Tai veden tms. Markku Kilpeläinen Käyttäytymistieteiden laitos, Helsingin yliopisto Värähtelevä

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN

Lisätiedot

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin

Lisätiedot

Luku 8. Aluekyselyt. 8.1 Summataulukko

Luku 8. Aluekyselyt. 8.1 Summataulukko Luku 8 Aluekyselyt Aluekysely on tiettyä taulukon väliä koskeva kysely. Tyypillisiä aluekyselyitä ovat, mikä on taulukon välin lukujen summa tai pienin luku välillä. Esimerkiksi seuraavassa taulukossa

Lisätiedot

Yhtälön oikealla puolella on säteen neliö, joten r. = 5 eli r = ± 5. Koska säde on positiivinen, niin r = 5.

Yhtälön oikealla puolella on säteen neliö, joten r. = 5 eli r = ± 5. Koska säde on positiivinen, niin r = 5. Tekijä Pitkä matematiikka 5 7..017 31 Kirjoitetaan yhtälö keskipistemuotoon ( x x ) + ( y y ) = r. 0 0 a) ( x 4) + ( y 1) = 49 Yhtälön vasemmalta puolelta nähdään, että x 0 = 4 ja y 0 = 1, joten ympyrän

Lisätiedot

Johdatus tekoälyn taustalla olevaan matematiikkaan

Johdatus tekoälyn taustalla olevaan matematiikkaan Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 2. luento 10.11.2017 Keinotekoiset neuroverkot Neuroverkko koostuu syöte- ja ulostulokerroksesta

Lisätiedot

SGN-4200 Digitaalinen Audio Harjoitustyö-info

SGN-4200 Digitaalinen Audio Harjoitustyö-info 1 SGN-4200 Digitaalinen Audio Harjoitustyö-info 04.04.2012 Joonas Nikunen Harjoitystyö - 2 Suorittaminen ja Käytännöt Kurssin pakollinen harjoitustyö: Harjoitellaan audiosignaalinkäsittelyyn tarkoitetun

Lisätiedot

Tekstuurintunnistuksen lyhyt oppimäärä. Ts. pari tapaa erottaa tiiliseinä pensaasta.

Tekstuurintunnistuksen lyhyt oppimäärä. Ts. pari tapaa erottaa tiiliseinä pensaasta. Tekstuurintunnistuksen lyhyt oppimäärä Ts. pari tapaa erottaa tiiliseinä pensaasta. Mitä on tekstuuri? Vaikea määritellä, mutta: Pintakuvio Ornamentti tuntu kuviointi Miksi tämän pitäisi kiinnostaa? (Maantienmerkkausrobotti)

Lisätiedot

Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka monivalinta aihio > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka monivalinta aihio > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%) Oppimisaihion arviointi / Arvioinnin tulos 9 Aineiston arvioinnin tulos arviointialueittain Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka monivalinta aihio > 80 % 80 60 % 60 50 % < 50 % Arviointialue

Lisätiedot

RAKENNUSAKUSTIIKKA - ILMAÄÄNENERISTÄVYYS

RAKENNUSAKUSTIIKKA - ILMAÄÄNENERISTÄVYYS 466111S Rakennusfysiikka, 5 op. RAKENNUSAKUSTIIKKA - ILMAÄÄNENERISTÄVYYS Opettaja: Raimo Hannila Luentomateriaali: Professori Mikko Malaska Oulun yliopisto LÄHDEKIRJALLISUUTTA Suomen rakentamismääräyskokoelma,

Lisätiedot

Pörisevä tietokone. morsetusta äänikortilla ja mikrofonilla

Pörisevä tietokone. morsetusta äänikortilla ja mikrofonilla Pörisevä tietokone morsetusta äänikortilla ja mikrofonilla 1 Tiivistelmä Idea toteuttaa seuraavat vaatimukset: 1. kommunikointi toisen opiskelijan kanssa (morsetus) 2. toisen opiskelijan häirintä (keskittymistä

Lisätiedot

T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä

T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä A2-VENÄJÄ vl.4-6 4.LUOKKA Opetuksen tavoitteet Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen T1 ohjata oppilasta havaitsemaan lähiympäristön ja maailman kielellinen ja kulttuurinen runsaus sekä

Lisätiedot

10. Esitys ja kuvaus

10. Esitys ja kuvaus 10. Esitys ja kuvaus Kun kuva on ensin segmentoitu alueisiin edellisen luvun menetelmin, segmentoidut pikselit kootaan esittämään ja kuvaamaan kohteita muodossa, joka sopii hyvin jatkokäsittelyä varten.

Lisätiedot

Mikrofonien toimintaperiaatteet. Tampereen musiikkiakatemia Studioäänittäminen Klas Granqvist

Mikrofonien toimintaperiaatteet. Tampereen musiikkiakatemia Studioäänittäminen Klas Granqvist Mikrofonien toimintaperiaatteet Tampereen musiikkiakatemia Studioäänittäminen Klas Granqvist Mikrofonien luokittelu Sähköinen toimintaperiaate Akustinen toimintaperiaate Suuntakuvio Herkkyys Taajuusvaste

Lisätiedot

Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja

Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja 581336 Laskennan teoria (kevät 2006) Harjoitus 3, ratkaisuja 1. S! axc X! axc X! by c Y! by c Y! " 2. (a) Tehtävänä on konstruoida rajoittamaton kielioppi, joka tuottaa kielen f0 n 1 n jn 1g. Vaihe1: alkutilanteen

Lisätiedot

Opetusmateriaalin visuaalinen suunnittelu. Kirsi Nousiainen 27.5.2005

Opetusmateriaalin visuaalinen suunnittelu. Kirsi Nousiainen 27.5.2005 Opetusmateriaalin visuaalinen suunnittelu Kirsi Nousiainen 27.5.2005 Visuaalinen suunnittelu Ei ole koristelua Visuaalinen ilme vaikuttaa vastaanottokykyyn rauhallista jaksaa katsoa pitempään ja keskittyä

Lisätiedot

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5. 2. MS-A4/A6 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 5.9.25 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x + x 2

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS NEUROVERKOT TURINGIN KONE (TAI TAVALLINEN OHJELMOINTI) VAIN YKSI LASKENNAN MALLI ELÄINTEN HERMOSTOSSA LASKENTA ERILAISTA: - RINNAKKAISUUS - STOKASTISUUS (SATUNNAISUUS) - MASSIIVINEN

Lisätiedot

Suomen virtuaaliammattikorkeakoulu Business in The EU v. 0.5 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Suomen virtuaaliammattikorkeakoulu Business in The EU v. 0.5 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%) Oppimisaihion arviointi / Arvioinnin tulos 9 Aineiston arvioinnin tulos arviointialueittain Suomen virtuaaliammattikorkeakoulu Business in The EU v. 0.5 > 80 % 80 60 % 60 50 % < 50 % Arviointialue Ominaisuuksien

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN

RYHMÄKERROIN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN ÄÄNILÄHDERYHMÄN SUUNTAAVUUDEN ARVIOINNISSA Seppo Uosukainen, Jukka Tanttari, Heikki Isomoisio, Esa Nousiainen, Ville Veijanen, Virpi Hankaniemi VTT PL, 44 VTT etunimi.sukunimi@vtt.fi Wärtsilä Finland Oy

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN

Lisätiedot

Puhutun ja kirjoitetun rajalla

Puhutun ja kirjoitetun rajalla Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic

Lisätiedot

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ

ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ ÄÄNEKKÄÄMMÄN KANTELEEN MALLINTAMINEN ELEMENTTIME- NETELMÄLLÄ Henna Tahvanainen 1, Jyrki Pölkki 2, Henri Penttinen 1, Vesa Välimäki 1 1 Signaalinkäsittelyn ja akustiikan laitos Aalto-yliopiston sähkötekniikan

Lisätiedot

Automaattinen semanttinen annotointi

Automaattinen semanttinen annotointi Automaattinen semanttinen annotointi Matias Frosterus, Reetta Sinkkilä, Katariina Nyberg Semantic Computing Research Group (SeCo) School of Science and Technology, Department of Media Technology and University

Lisätiedot

Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria

Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria Lectio praecursoria Signal Processing Methods for Drum Transcription and Music Structure Analysis (Signaalinkäsittelymenetelmiä rumpujen nuotintamiseen ja musiikin muotoanalyysiin) Jouni Paulus 8.1.2010

Lisätiedot

Suomen virtuaaliammattikorkeakoulu Boolen operaattorit v. 0.5 > 80 % 80 60 % 60 50 % < 50 % Suhteellinen osuus maksimiarvosta (%)

Suomen virtuaaliammattikorkeakoulu Boolen operaattorit v. 0.5 > 80 % 80 60 % 60 50 % < 50 % Suhteellinen osuus maksimiarvosta (%) Oppimisaihion arviointi / Arvioinnin tulos 9 Aineiston arvioinnin tulos arviointialueittain Suomen virtuaaliammattikorkeakoulu Boolen operaattorit v. 0.5 > 80 % 80 60 % 60 50 % < 50 % Arviointialue Ominaisuuksien

Lisätiedot

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on 13 Pistetulo Avaruuksissa R 2 ja R 3 on totuttu puhumaan vektorien pituuksista ja vektoreiden välisistä kulmista. Kuten tavallista, näiden käsitteiden yleistäminen korkeampiulotteisiin avaruuksiin ei onnistu

Lisätiedot

SGN-4200 Digitaalinen audio

SGN-4200 Digitaalinen audio SGN-4200 Digitaalinen audio Luennot, kevät 2013, periodi 4 Anssi Klapuri Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2! Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot,

Lisätiedot

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.

Lisätiedot

Johdatus tekoälyn taustalla olevaan matematiikkaan

Johdatus tekoälyn taustalla olevaan matematiikkaan Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 3.11.2017 Mitä tekoäly on? Wikipedia: Tekoäly on tietokone tai tietokoneohjelma, joka kykenee älykkäiksi

Lisätiedot

havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä

havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä FYSP0 / K3 DOPPLERIN ILMIÖ Työn tavoitteita havainnollistaa Dopplerin ilmiötä ja interferenssin aiheuttamaa huojuntailmiötä harjoitella mittausarvojen poimimista Capstonen kuvaajalta sekä kerrata maksimiminimi

Lisätiedot

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients

THE audio feature: MFCC. Mel Frequency Cepstral Coefficients THE audio feature: MFCC Mel Frequency Cepstral Coefficients Ihmiskuulo MFCC- kertoimien tarkoituksena on mallintaa ihmiskorvan toimintaa yleisellä tasolla. Näin on todettu myös tapahtuvan, sillä MFCC:t

Lisätiedot

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla. Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti

Lisätiedot

1 Kannat ja kannanvaihto

1 Kannat ja kannanvaihto 1 Kannat ja kannanvaihto 1.1 Koordinaattivektori Oletetaan, että V on K-vektoriavaruus, jolla on kanta S = (v 1, v 2,..., v n ). Avaruuden V vektori v voidaan kirjoittaa kannan vektorien lineaarikombinaationa:

Lisätiedot

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A) Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 017 Insinöörivalinnan matematiikan koe 30..017, Ratkaisut (Sarja A) 1. a) Lukujen 9, 0, 3 ja x keskiarvo on. Määritä x. (1 p.) b) Mitkä reaaliluvut

Lisätiedot

Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka: Voima ja sen komponentit > 80 % % % < 50 %

Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka: Voima ja sen komponentit > 80 % % % < 50 % Oppimisaihion arviointi / Arvioinnin tulos 9 Aineiston arvioinnin tulos arviointialueittain Suomen virtuaaliammattikorkeakoulu Teknillinen mekaniikka: Voima ja sen komponentit > 80 % 80 60 % 60 50 %

Lisätiedot

Avainsanojen poimiminen Eeva Ahonen

Avainsanojen poimiminen Eeva Ahonen Avainsanojen poimiminen 5.10.2004 Eeva Ahonen Sisältö Avainsanat Menetelmät C4.5 päätöspuut GenEx algoritmi Bayes malli Testit Tulokset Avainsanat Tiivistä tietoa dokumentin sisällöstä ihmislukijalle hakukoneelle

Lisätiedot

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi Tilastotiedettä Tilastotieteessä kerätään tietoja yksittäisistä asioista, ominaisuuksista tai tapahtumista. Näin saatua tietoa käsitellään tilastotieteen menetelmin ja saatuja tuloksia voidaan käyttää

Lisätiedot

ImageRecognition toteutus

ImageRecognition toteutus ImageRecognition toteutus Simo Korkolainen 27 kesäkuuta 2016 Projektin tarkoituksena on tehdä ohjelma, joka opettaa neuroverkon tunnistamaan kuvia backpropagation-algoritmin avulla Neuroverkon opetuksessa

Lisätiedot

Mediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin

Mediaanisuodattimet. Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että. niiden ominaisuudet tunnetaan hyvin Mediaanisuodattimet Tähän asti käsitellyt suodattimet ovat olleet lineaarisia. Niille on tyypillistä, että niiden ominaisuudet tunnetaan hyvin niiden analysointiin on olemassa vakiintuneita menetelmiä

Lisätiedot

JUHTA ja VAHTI juhlatilaisuus, Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta. Timo Honkela.

JUHTA ja VAHTI juhlatilaisuus, Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta. Timo Honkela. JUHTA ja VAHTI juhlatilaisuus, 2017 Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta Timo Honkela timo.honkela@helsinki.fi 31. lokakuuta 2017 Ihmisestä ja ihmisyhteisöistä Kuva:/skylgroup.com/communities--socities/

Lisätiedot

Kaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat

Kaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat 1 Tukivektoriluokittelija Tukivektorikoneeseen (support vector machine) perustuva luoikittelija on tilastollisen koneoppimisen teoriaan perustuva lineaarinen luokittelija. Perusajatus on sovittaa kahden

Lisätiedot

Vaikeavammaisen asiakkaan kanssa työskentely

Vaikeavammaisen asiakkaan kanssa työskentely Vaikeavammaisen asiakkaan kanssa työskentely Lähtökohtia Tavoitteena asiakkaan osallisuuden lisääminen. Asiakkaan kokemusmaailmaa tulee rikastuttaa tarjoamalla riittävästi elämyksiä ja kokemuksia. Konkreettisten

Lisätiedot

Digitaalinen signaalinkäsittely Kuvankäsittely

Digitaalinen signaalinkäsittely Kuvankäsittely Digitaalinen signaalinkäsittely Kuvankäsittely Teemu Saarelainen, teemu.saarelainen@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Signal Processing: A Practical Approach H.Huttunen, Signaalinkäsittelyn menetelmät,

Lisätiedot

Suomen virtuaaliammattikoulu Kaasutustekniikka v. 0.5 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%)

Suomen virtuaaliammattikoulu Kaasutustekniikka v. 0.5 > 80 % % % < 50 % Suhteellinen osuus maksimiarvosta (%) Oppimisaihion arviointi / Arvioinnin tulos 9 Aineiston arvioinnin tulos arviointialueittain Suomen virtuaaliammattikoulu Kaasutustekniikka v. 0.5 > 80 % 80 60 % 60 50 % < 50 % Arviointialue Ominaisuuksien

Lisätiedot

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/

Lisätiedot

Suomen virtuaaliammattikorkeakoulu Villan keritseminen, karstaus ja kehrääminen v.0.5 > 80 % % % < 50 %

Suomen virtuaaliammattikorkeakoulu Villan keritseminen, karstaus ja kehrääminen v.0.5 > 80 % % % < 50 % Oppimisaihion arviointi / Arvioinnin tulos 9 Aineiston arvioinnin tulos arviointialueittain Suomen virtuaaliammattikorkeakoulu Villan keritseminen, karstaus ja kehrääminen v.0.5 > 80 % 80 60 % 60 50 %

Lisätiedot

Mitä on konvoluutio? Tutustu kuvankäsittelyyn

Mitä on konvoluutio? Tutustu kuvankäsittelyyn Mitä on konvoluutio? Tutustu kuvankäsittelyyn Tieteenpäivät 2015, Työohje Sami Varjo Johdanto Digitaalinen signaalienkäsittely on tullut osaksi arkipäiväämme niin, ettemme yleensä edes huomaa sen olemassa

Lisätiedot