Puheentunnistus. 1 Johdanto. Mikko Kurimo Teknillinen korkeakoulu Informaatiotekniikan laboratorio
|
|
- Matti Mäki
- 9 vuotta sitten
- Katselukertoja:
Transkriptio
1 Puheentunnistus Mikko Kurimo Teknillinen korkeakoulu Informaatiotekniikan laboratorio 1 Johdanto 1.1 Puheentunnistuksen merkitys Puhetta ymmärtävää konetta on pidetty tärkeänä askeleena ihmisen arkielämää helpottamaan kehitetyn teknologian kehityksessä. Sen avulla monet muut tekniikan saavutukset saadaan käyttöön ilman käsin tai muuten tapahtuvaa yksityiskohtaista ohjausta, ikäänkuin inhimillisen palvelijan avulla, joka viisaasti täyttää herransa toiveet. Monessa tapauksessa on kuitenkin osoittautunut kätevämmäksi ohjata koneiden toimintaa käsin, useimmiten niin että ihminen opettelee jonkin uuden taidon kuten autolla ajon tai tietokoneen ohjelmoinnin. Tästä huolimatta puheella ohjattavaa konetta pidetään teknologian saavutuksena aivan erityisessä arvossa. Usein tällainen kone kuvitellaan jollain tavalla tavallista älykkäämmäksi ja pystyvämmäksi suorittamaan vaativia tehtäviä joita käyttäjän ei tarvitse tai hän ei osaa yksityiskohtaisesti määritellä. Suuri merkitys puheella ohjattavalla koneella on myös vammautuneiden tai muiden sellaisten ihmisten käytössä, joilla on vaikeuksia selvitä joistakin tavallisista nykyelämän tehtävistä. Juuri tämä ajatus ihmisen ja koneen välisen vuorovaikutuksen mahdollisesta helpottumisesta selittää automaattisen puheentunnistuksen saavuttamaa erityisasemaa teknologian kehittämisessä. Lisäksi asemaa korostaa se, ettei puheentunnistusongelmaan ole toistaiseksi saavutettu tyydyttävää ratkaisua, mittavista yrityksistä huolimatta. 1.2 Puheentunnistuksen vaikeudet Mikä sitten tekee puheesta niin vaikeaa automaattisesti tunnistettavaksi ja herkkää erilaisille häiriöille ja puheen ja olosuhteiden muutoksille? Ensinnäkin puhesignaali on luonteeltaan jatkuvaa eikä ole itsestäänselvää, miten siitä eroitellaan yksittäiset sanat, lauseet ja puheenvuorot. Aina ei ole edes automaattisesti helppoa erottaa puhetta musiikista ja muista äänistä vaikkeivät ne olisikaan signaalissa päällekäin. Luonnollinen puhe sisältää myös runsaasti erilaisia muita tuotettuja ääniä, joita ei ole tarkoitus muuttaa tekstiksi, mutta niiden automaattinen erottaminen puheesta tuottaa vaikeuksia. Puheessa esiintyy lisäksi paljon vaihtelevuutta puhenopeuden ja ääntämisen suhteen eri puhujilla ja yhdelläkin puhujilla eri sanoissa ja konteksteissa. Kielessä ongelmia tuottavat sanat jotka kuulostavat lähes samoilta tai jopa täsmälleen samoilta ja tunnistimelle opetetun sanaston ulkopuoliset sanat, kuten erisnimet ja vieraskieliset sanat. Akustisissa olosuhteissa automaattiseen tunnistukseen vaikuttavat melun lisäksi tallennuslaitteiston, kuten mikrofonin ja välityskanavien ominaisuudet ja huoneen tai ulkotilan akustiikka. Yhteenvetona näistä kaikista ongelmista voi todeta että ihmiskorva ja aivojen kuuloalue ja informaation käsittely ovat ilmeisesti aina olleet ihmisen selviämiselle niin tärkeitä että niiden toiminta on 1
2 kehittynyt erittäin robustiksi eri olosuhteisiin. Siksi myös automaattiselle tunnistuksellekin helposti asetetaan erittäin korkeita toimintavaatimuksia verrattuna muihin teknisiin apuvälineisiin. 2 Puheentunnistusongelman matemaattinen mallinnus Automaattisen puheentunnistuksen lähestymistapa on tyypillinen hahmontunnistusongelma. Aiemmin tallennetuista signaalinäytteistä on oppivilla ja tilastollisilla menetelmillä estimoitu malleja, joihin uutta mitattua signaalia verrataan. Tunnistustulokseksi valitaan sitten teksti, joka vastaa sitä puhuttua viestiä jonka signaalia vastaavat mallit olisivat suurimmalla todennäköisyydellä tuottaneet. Matemaattisesti tehtävää kuvataan usein Bayesin kaavan avulla: Pr(W X, M) = Pr(X W, M) Pr(W M) Pr(X M), (1) jossa W symboloi puheen avulla välitettyä viestiä, X mitattua signaalia ja M estimoitujen mallien joukkoa. Tunnistustulokseksi valitaan siis maksimitodennäköisyyttä vastaava teksti W. Kaavassa 1 todennäköisyys Pr(X W, M) lasketaan sovittamalla mittaussignaalia malleihin ja vaihtoehtoisiin viestihypoteeseihin. Todennäköisyys Pr(W M) sensijaan sisältää viestihypoteesin apriori todennäköisyyden ns. kielimallin avulla, siis riippumatta mitatusta puhesignaalista. Mittaussignaalin kokonaistodennäköisyyden Pr(X M) laskemista ei välttämättä tarvita haettaessa vain tulosta W, joka maksimoi todennäköisyyden Pr(W X, M). 2.1 Ongelman hierarkkinen osittaminen Puheentunnistuksen vaikeus tulee esiin rakennettaessa kaavaan (1) sopivia matemaattisia malleja (M). Äänenä havaittavien fysikaalisten paineaaltojen ja siinä välittyvän kielellisen viestin yhteyttä on toistaiseksi mahdotonta formuloida matemaattisesti, sillä kaikkia siinä olevia riippuvuuksia ja siihen vaikuttavia ilmiöitä ei tarkoin tunneta. Yleisesti käytössä oleva hierarkkinen ajattelutapa jakaa viestin sanoiksi, sanat edelleen foneemeiksi ja foneemit esimerkiksi prosesseiksi, jolla ihmisen ääntöväylä niitä tuottaa. Tarkempi tutkimus on kuitenkin osoittanut että nämä välivaiheet ovat vain ilmiöiden karkeita yksinkertaistuksia eikä tällä tavoin irrallisista osista rakennetuilla malleilla voida saavuttaa täydellistä tunnistustulosta. Puheentunnistuksen tekee erityisen mielenkiintoiseksi se että on olemassa biologinen systeemi joka kuitenkin kykenee tunnistamaan puhetta erittäin hyvin monenlaisista häiriötekijöistä huolimatta. Automaattisten puheentunnistusmenetelmien kehityksessä tämä malli on otettu jo varhain huomioon ja pyritty etsimään laskentamalleja, jotka käyttäisivät hyväkseen joitakin samoja periaatteita mitä ihmisaivotkin noudattavat tietojenkäsittelyssään. Niinpä puheentunnistus on pitkään ollut erilaisten uusimpien älykkäiden laskentamenetelmien, kuten neuraalilaskennan algoritmien, testipenkkinä ja näitä onkin menestyksellä käytetty monessakin eri puheentunnistusprosessin osavaiheessa, joissa tavanomaiset matemaattiset laskenta- ja mallinnusmenetelmät ovat osoittautuneet tehottomiksi. 2
3 Vaikka on tunnettua ettei puheen hierarkkinen jako sanojen ja foneemien malleiksi tuottaisikaan tarkastiottaen parasta mahdollista lopputulosta, tämä tehtävän ja mallien pilkkominen osiinsa on kuitenkin hyväksytty lähtökohdaksi automaattiselle puheentunnistukselle. Syy on yksinkertaisesti se että tämänkaltaiselle rakenteelle on löydettävissä tehokkaita matemaattisia ratkaisumenetelmiä, jotka mallin likimääräisyydestä huolimatta voivat joissakin tapauksissa tuottaa tyydyttävän tunnistustuloksen. 2.2 N-gram -malli Yksinkertainen matemaattinen malli puheviestin välityksessä käytetylle kielelle on ns. sana-n-gram, jossa jokaisella sanayhdistelmällä on tietty todennäköisyys. Tämän mallin avulla kunkin sanasekvenssissä esiintyvän sanan w k todennäköisyys on laskettavissa riippuen n 1 edellisestä sanasta w k 1,...,w k n+1 : Pr(w k w k 1, w k 2,..., w 1 ) = Pr(w k w k 1,...,w k n+1 ). (2) Koko sanasekvenssin W = w 1, w 2,...,w T todennäköisyydeksi muodostuu sitten, esimerkiksi puheentunnistuksessa tavallisen 3-grammin (trigrammin) avulla T Pr(W) = Pr(w 1 ) Pr(w 2 w 1 ) Pr(w k w k 1, w k 2 ). (3) k=3 Luonnollisesti kaikille harvinaisille sana-n-grammeille ei voida, eikä ole järkevääkään, estimoida omia todennäköisyyksiään vaan niiden kohdalla sovelletaan n 1, ja tarvittaessa n 2 jne., todennäköisyyksiä. Käytännössä n-grammitodennäköisyydet on muutenkin järkevää tasoittaa vastaavien 1, 2,..., n 1 -grammien painotetulla summalla, jossa painot estimoidaan opetusaineiston kattavuuden perusteella [4]. Rajoittavina oletuksina tässä matemaattisessa mallissa on ettei n:ää sanaa kauemmas kantavia riippuvuuksia huomioida ja että sanasekvenssien todennäköisyydet ovat yksikäsitteisesti määrättävissä koko kielen sovellusalueella. 2.3 Gaussian mixture- ja kätketty Markov-malli Sanojen ääntymisen yksinkertaisin malli on kuvata sanat foneemijonoina, joissa sanan akustinen todennäköisyys tietylle signaalille saadaan suoraan foneemijonon todennäköisyydestä. Foneemit esiintyvät äänteinä, joiden akustisille havainnoille käytetty matemaattinen malli on ns. kätketty Markov-malli (HMM). Siinä äänteitä tuottavan systeemin oletetaan koostuvan tiloista, joissa syntyy tilastollisilta ominaisuuksiltaan tiettyä stationääristä todennäköisyysjakaumaa noudattavaa signaalia. Todennäköisyys, jolla tila i tuottaa signaalia kuvaavan piirrevektorin x, saadaan esimerkiksi ns. Gaussian mixture -mallista (GMM): J b i (x) = c ij b ij (x), (4) j=1 jossa mikstuurin painot täyttävät ehdot: c ij 0 ja J j=1 c ij = 1. Mikstuurikomponentit ovat tavallisesti moniulotteisia normaalijakaumia b ij (x) N(µ ij, Σ ij ). 3
4 Systeemin tilojen vaihtumista säätelee toinen stokastinen prosessi, jossa kaikille mahdollisille tilasiirtymille on estimoitu oma siirtymätodennäköisyytensä. Tämä jälkimmäinen prosessi on kätketty ulkopuolisilta havaitsijoilta, sillä tilasiirtymiä ei voi suoraan havaita vaan ne näkyvät ulospäin ainoastaan tuotetun signaalin tilastollisten ominaisuuksien muutoksina. Karkeastiottaen tällaista tilaa voidaan verrata esimerkiksi ihmisen ääntöväylän tiettyyn asentoon, joka ei ole ulospäin näkyvissä, mutta joka kuullaan tietynlaisena tuotettuna äänenä. Näistä peräkkäisistä äänteistä koostuvat sitten foneemit ja peräkkäisistä foneemeista sanoja vastaavat foneemijonot. Yhteistodennäköisyys, jolla malli M tuottaa tilajonon Q = q 0,..., q T ja sillä havaintosekvenssin X = x 1,...,x T, on laskettavissa kaavasta T Pr(X, q M) = π q0 a qt 1 q t b qt (x t ). (5) Koska havainnot generoiva tilajono on tuntematon, havaintosekvenssin todennäköisyys mallille M on summa kaikkien mahdollisten tilajonojen yli Pr(X M) = q t=1 T π q0 a qt 1 q t b qt (x t ). (6) t=1 Käytännössä (6) lasketaan ns. forward-backward -menetelmällä [3]. Rajoittavina oletuksina tässä matemaattisessa mallissa on että systeemi voi olla vain yhdessä tilassa kerrallaan ja että siirtymistodennäköisyys seuraavaan tilaan riippuu vain edellisestä tilasta. Lisäksi sanojen koostuminen foneemijonoista ja foneemien tilajonoista on oltava yksikäsitteisesti määritettävissä. 3 Hahmontunnistusongelma ja sen ratkaisu 3.1 Mallin rakenne Tyypillinen state-of-art puheentunnistusjärjestelmä koostuu seuraavista yhteennivoutuvista malleista: 1. Kielimalli antaa todennäköisyydet sanoille ja sanayhdistelmille perustuen yleensä suureen kieliaineistoon, jossa tehtävään liittyvä sanasto ja sanontatavat esiintyvät oikeissa tilastollisissa suhteissa. Joissakin suppean sanaston erityissovelluksia nämä todennäköisyydet voidaan olettaa myös tehtävän yhteydessä määrätyiksi. Tavallinen laajan sanaston tunnistuksessa käytetty malli on edellämainittu n-gram (kaava 3), jossa periaatteessa kullekin n:n sanan yhdistelmälle on estimoitu oma esiintymistodennäköisyytensä. Käytännössä riittävän opetusaineiston järjestäminen mallin parametrien estimoimiseen on yleensä mahdotonta, joten älykkäiden oppimismenetelmien käyttö hyvien mallien saamiseksi on välttämätöntä. 2. Sanastomalli (leksikko) kertoo mitä sanoja on olemassa ja mistä foneemeista ne koostuvat. Joillakin sanoilla voi myös olla useita mahdollisia ääntämistapoja, jolloin niille on estimoitava esiintymistodennäköisyydet. Suomenkielessä sanat voidaan muuttaa foneemijonoiksi melko yksikäsitteisten sääntöjen avulla, mutta esimerkiksi englannissa, ja suomen vierasperäisten sanojen kohdalla, ääntämistavat on yleensä määritettävä käsin. 4
5 3. Foneemimallin avulla voidaan laskea todennäköisyydet, joilla puheesta erotettu signaalisegmentti olisi peräisin tietystä foneemista. Yhden foneemin malli koostuu yleensä peräkkäisistä tiloista, joissa tuotetun signaalin tietyt ominaisuudet oletetaan stationäärisiksi ja näille ns. akustisille piirteille voidaan estimoida tiheysfunktiomallit. Tyypillinen tällainen malli, jossa on erikseen mallinnettu piirteiden tiheysfunktiot systeemin eri tiloissa ja tilojen välisten siirtymien todennäköisyydet on edellä mainittu HMM (kaava 6). 3.2 Tyypillisen tunnistusprosessin vaiheet Puheentunnistus automaattisen järjestelmän avulla etenee yleensä seuraavasti: 1. Esikäsittely. Mikrofonilla tallennettu signaali digitoidaan, jaetaan lyhyisiin noin kymmenen millisekunnin pituisiin ikkunoihin ja kullekin signaali-ikkunalle erikseen tehdään spektrianalyysi taajuustason informaation havaitsemiseksi. Piirteiden laskentaan on erilaisia hyväksihavaittuja algoritmeja, joille on yhteistä tiettyjen taajuuskaistojen tehojen mittaus ja tehopiikkien jaksollisuus. Tavallisin menetelmä on laskea tehospektristä diskreetti kosinimuunnos ja käyttää ihmiskorvan taajuusherkkyydestä johdettua MEL-asteikkoa tunnistuksen kannalta mielenkiintoisimpien kaistojen valintaan. 2. Havaintojen kuvaaminen piirrevektorilla. Foneemimallien syötteeksi valitaan kutakin aikajaksoa kohti piirrevektori (x, kaavassa 4), joka spektrianalyysistä johdettujen kertoimien lisäksi sisältää jonkin verran tietoa naapuriikkunoista, esimerkiksi kertoimien muutosta kuvaavia tunnuslukuja. Piirrevektorin dimensio on tyypillisesti Todennäköisyyksien laskeminen. Vertaamalla foneemimalleihin liittyviä piirteiden tiheysfunktiomalleja havaittuihin piirrevektorisekvensseihin lasketaan kullekin foneemille (itseasiassa sen tiloille i) todennäköisyyssekvenssi, joka kuvaa todennäköisyyttä (b i (x), kaavassa 4) kullakin ajanhetkellä. 4. Puheen dekoodaus. Haetaan todennäköisin puheen sisältöä vastaava sanasekvenssi yhdistämällä dekooderin avulla havaitut foneemitodennäköisyydet sekä kielimallin antamat sanojen ja sanasekvenssien todennäköisyydet. Tuloksen käyttötarkoituksesta riippuen dekooderilla voidaan yhden tuloksen lisäksi laskea myös järjestetty listan muista todennäköisistä tulovsaihtoehdoista. 4 Nykyisten puheentunnistimien suorituskyky 4.1 Evaluointitehtävien luokittelu Puheentunnistustehtävien laajasta vaihtelusta johtuen toiminnan tarkkuutta vertailtaessa on tärkeää korostaa tehtävän laatua ja sen rajoituksia. Tehtävät jaetaan usein puhujien määrän, puhetavan eli sanojen välisen tauotuksen ja puheen luonnollisuuden suhteen erilaisiin luokkiin. Käytettävissä olevaan kielen vaikeuden luokitusperusteita ovat sanaston koko ja kielen syntaksin rajoittavuus. Myös akustisten olosuhteiden perusteella tehtävät jaoitellan luokkiin kohinan, häiriöiden ja olosuhteiden stabiilisuuden mukaan. 5
6 Puhe Akustinen prosessointi Mel-kepstrin laskeminen Akustiset foneemi- todennäköisyydet Piirrevektorin muodostaminen Ääntämissanakirja Dekooderi Tunnistettu Kielimalli teksti Kuva 1: Puheentunnistusjärjestelmän toimintakaavio. 4.2 Laajan sanaston tunnistimien suorituskyvystä Parhaiden nykyisten (englanninkielisten) puheentunnistimien tunnistustarkkuudeksi on mitattu esimerkiksi tavallisille radion ja television uutislähetyksille, keskimäärin 20 % sanavirheitä [2]. Sanavirheet tarkoittavat koko puhelähetyksen tunnistustuloksen sovitusta todelliseen tekstiin niin että virheiksi lasketaan hävinneet, ylimääräiset ja vaihtuneet sanat. Virheprosentti on virheiden määrä suhteessa todellisen tekstin sanamäärään. Tunnistuloksessa on tyypillistä että monet puheosuudet ovat lähes täysin virheettömiä, mutta joissakin hankalissa kohdissa tunnistusvirheiden määrä on suuri. Tunnistustulos on käyttökelpoinen esimerkiksi puhelähetysten indeksoinnissa, jonka avulla lähetyksistä voidaan etsiä sisällön perusteella kiinnostavia osia tai käyttää ääniaineistoa tiedonhaussa tekstiaineiston tapaan. Tämäntyyppisiä sovelluksia on käytössä muunmuassa tiedonhaussa uutisaineistoista, audio- ja videotallenteiden annotoinnissa ja suurien audioaineistojen indeksoinnissa. Täysin vapaaseen saneluun virhemäärä sen sijaan on usein liian suuri, mutta kun järjestelmän annetaan adaptoitua tietylle puhujalle ja tietyntyyppisille teksteille, tulos on verrattavissa tottumattomaan konekirjoittajaan, esimerkiksi sanaa minuutissa sisältäen virheiden korjaukset [1]. 4.3 Suppean sanaston tunnistimien suorituskyvystä Rajoitetuissa erikoistehtävissä puheentunnistimien tarkkuus on yleensä huomattavasti parempi. Tehtävän rajoittaessa tilannekohtaisten sanavaihtoehtojen joukon pieneksi vaihtoehtojen akustiset erot ovat usein selkeitä ja tunnistin toimii lähes virheettömästi. Tunnistin voi suoriutua tehtävästään riittävän hyvin jopa lievästi häiriöalttiissa olosuhteissa ja suurelle joukolle eri puhujia. Näitä ominaisuuksia on menestyksellisesti hyödynnetty useissa (etupäässä englanninkielisissä) sovelluksissa, 6
7 joissa yksinkertaisia puhelinpalveluita on automatisoitu, esimerkiksi aikatauluneuvontaa, paikallisia säätiedotuksia, urheilutulosten välitystä ja joitakin pankkipalveluita. Avainasemassa on älykäs käyttöliittymä, joka sopivalla tavalla ohjaa käyttäjää saamaan haluamansa tiedot niin että puheentunnistustehtävät jäävät helpoiksi palvelun ollessa silti riittävän joustavaa ja tehokasta. Muita vastaavia tehtäviä jotka joissakin tapauksissa sopivat hyvin puheen avulla ohjattaviksi ovat mm. vammaisten apuvälineet, handsfree-puhelimet ja erilaiset pienet vaatteissa kannettavat laitteet kuten audio- (ja video-) tallentimet ja soittimet ja mittalaitteet. Ongelmia tunnistuksessa aiheuttavat meluisat käyttötilanteet ja epäselvästi tai poikkeavasti puhuvat käyttäjät. Manuaalinen käyttö sopii puheentunnistusta paremmin myös kriittisiin sovelluksiin joissa edellytetään 100 %:sta toimintavarmuutta kaikissa tilanteissa. 5 Alan tutkimus Suomessa 5.1 Poimintoja tutkimuksen historiasta ja nykytilanteesta Informaatiotekniikan laboratoriossa 1970-luvun lopussa rakennettu muutaman tuhannen sanan käsittävä automaattinen puheentunnistin lienee ensimmäinen suomenkielinen puheentunnistusjärjestelmä. Tunnistin perustui oppivaan aliavaruusmenetelmään ja redundanttiin hash-osoitukseen. Tämän jälkeen puheentunnistus on ollut laboratorion eräs tärkeimmistä uusien hahmontunnistusalgoritmien testipenkeistä, joilla algoritmien soveltuvuutta hankalan mittausdatan analyysissä on voitu mitata ja verrata state-of-art -menetelmiin. Samalla saavutetut hyvät tulokset ovat jopa maailmanlaajuisesti vaikuttaneet sekä puheentunnistuksen että itse algoritmien kehityssuuntiin. Tunnetuimpia puheentunnistukseen vaikuttaneita laboratoriossa akateemikko Teuvo Kohosen johdolla kehitettyjä algoritmeja ovat olleet itseorganisoiva kartta (1981) [5] ja oppiva vektorikvantisaatio (1986) [6]. Puheentunnistuksen merkkipaaluja laboratoriossa puolestaan ovat olleet mm. foneettinen kirjoituskone (1988) [7] ja diskreetteihin kätkettyihin Markov malleihin (HMM) perustuva rajattoman sanaston tunnistin (1991) [9]. Nykyään hahmontunnistustutkimusta Suomessa tehdään puheentunnistuksen piirissä monella tasolla. Opetusministeriö teetti vastikään (2001) [8] esiselvityksen puheentutkimuksen resursseista Suomessa, jolla pyrittiin selvittämään puheentutkimuksen nykytilaa ja toimia tutkimusedellytysten parantamiseksi. Puheentutkimukseen liittyy paljon muitakin tutkimuskohteita kuin puheentunnistus, mutta puheentunnistus on kuitenkin tärkeällä sijalla, sekä itsenäisenä tutkimusalana että monen muun alan tarvitsemana työkaluna. Lisäksi puheentunnistus merkittävänä hahmontunnistusongelmana on noussut maailmanlaajuisesti tärkeäksi hahmontunnistusalgoritmien benchmark-testausvälineeksi, jolla monien uusia algoritmien suorituskykyä voidaan evaluoida state-of-art -menetelmiin. 5.2 Puheen signaalinkäsittely Piirteiden irroitus puhesignaalista on kaikissa state-of-art puheentunnistusjärjestelmissä melko samanlainen. Kuitenkin kun tällaista lyhyestä aikaikkunasta laskettuihin spektrogrammeihin pohjautuvaa menetelmää verrataan esimerkiksi ihmisen puheentunnistusmekanismin kykyyn löytää invariantteja piirteitä eri ihmisten pu- 7
8 heesta erilaisissa olosuhteissa, on selvää että parantamisen varaa on huomattavasti. Uudenlaisia piirreirroitusmenetelmiä puheentunnistukseen tutkitaan tällä hetkellä aktiivisesti mm. TKK:n akustiikan laboratoriossa. 5.3 Kohinansieto, monikielisyys Automaattisten menetelmien soveltuvuus käytännön puhetilanteisiin, joissa esiintyy monenlaisia akustisia häiriöitä ja kohinaa on viimeaikoina herättänyt yhä enemmän huomiota puheentunnistustutkimuksessa. Erityisesti mm. Nokian tutkimuskeskuksessa kehitetään robustia puheteknologiaa, jolla puhutut komennot voidaan tunnistaa ja ymmärtää oikein. Tämäntyyppiset puheentunnistustehtävät ovat suhteellisen kieliriippumattomia, jopa niin että voidaan kehittää myös monikielisiä tunnistusjärjestelmiä. TTKK:n digitaalisen median instituutissa tutkitaan mm. akustisia malleja, jotka sopivat puhelinkaistaan ja monikieliseen puheentunnistukseen. 5.4 Puhekäyttöliittymät Puhtaasti puheen avulla toimiva käyttöliittymä on eräs puheteknologian mielenkiintoisimmista haasteista. Vuorovaikutus puheen avulla poikkeaa kuitenkin niin paljon perinteisistä kojetauluista, säätimistä ja näppäimistöistä, että järjestelmien käytettävyystutkimus muodostaa aivan oman tieteenalansa. Puhekäyttöliittymiä tutkitaan erityisesti Tampereen yliopiston TAUCHI-tutkimusryhmässä. 5.5 Kielimallit Puheentunnistuksen laajempi käyttö tiedonvälityksessä edellyttää yksittäisiä sanoja tai komentolauseita laajempien kokonaisuuksien tunnistamista. Näissä tunnistustehtävissä korostuu kielen mallinnus eli morfologisten, syntaktisten ja semanttisten riippuvuuksien huomionti, koska sanat usein esiintyvät eri muodoissaan ja ovat riippuvaisia kontekstista. Lisäksi osia puheesta joudutaan usein arvailemaan sillä epäselvästi lausutut kohdat ovat automaattiselle tunnistimelle vaikeimpia. Kielimallit jäljittelevät osittain inhimillistä tapaa ratkaista tämä ongelma eli kontekstin mallin perusteella voidaan esittää todennäköisempiä hypoteesejä puheen sisällöstä, joita sitten verrataan mitattuun puhesignaaliin. TKK:n neuroverkkojen tutkimusyksikössä laskennallisesti tehokkaiden ja suuria opetusaineistoja hyödyntävien, adaptiivisten kielimallien kehitys liittyy läheisesti laajan sanaston jatkuvan puheentunnistuksen tutkimukseen. Tutkimusaiheisiin kuuluu myös näiden kielimallien avulla tapahtuva puheenaiheen karakterisointi ja tämän tiedon käyttö puheeseen sisältyvän viestin ymmärtämiseen puhedialogeissa. 5.6 Puheen mallien generointi ja adaptointi Foneemien ja foneemisekvenssien tilastollisena mallina nykyään laajalti käytössä oleva HMM-malli on monessakin mielessä varsin epäsopiva näin vaativaan tehtävään. Malli on kuitenkin matemaattisesti erittäin kätevä ja sopivien laajennusten avulla se on saatu toimimaan kohtuullisen hyvin ja riittävän tehokkaasti monessa puheentunnistussovelluksessa. Siksi HMM:n laajennukset, tehostukset ja nopea adaptaatio, mm. neuraalilaskennan sovelluksena, on tutkimuskohteena TKK:n neuroverkkojen 8
9 tutkimusyksikössä. Nykyään tutkimuskohteena on myös yleisemmät dynaamiset tilamallit aikasarjoille, joiden avulla HMM:n rajoituksista voidaan päästä eroon. 5.7 Puheen havaitseminen Puhe on myös visuaalinen ilmiö ja ihmisen kyky integroida kuultu ja nähty puhe liittyy puheentunnistustutkimukseen. Visuaalinen puhe korostuu erityisesti tilanteissa, joissa esiintyy voimakkaita akustisia häiriöitä tai kuuloaistimus on muuten viallinen. TKK:n laskennallisen tekniikan laboratoriossa tutkitaan visuaalisen puheen havaitsemista ja käsittelyä. Kognitiivisia ihmiseen liittyviä tekijöitä auditiivisen puheteknologian puolella tutkitaan mm. TKK:n akustiikan laboratoriossa. 5.8 Kaupalliset puheentunnistustuotteet Puheentunnistusteknologiaa on jo Suomessakin tuotu kaupallisten sovellusten avulla osaksi tavallisten ihmisten arkipäivää. Tästä on esimerkkejä mm. Nokian matkapuhelimissa, Philipsin puheentunnistusohjelmassa PC:lle ja Soneran ja Elisan kehittämissä automaattisissa puhelinpalveluissa. Myös pienemmissä yrityksissä on panostettu voimakkaasti suomenkielisten puheentunnistustuotteiden kehittämiseen (mm. Lingsoft). 5.9 Puheen indeksointi ja haku Laajojen puheaineistojen tunnistustuloksia voidaan myös menestyksellisesti käyttää aineistojen indeksointiin ja siihen perustuvaan tiedonhakuun. Tästä on hyvinä esimerkkeinä amerikkalaiset SpeechBot- ja SpeechFind -järjestelmät, joilla internetin välityksellä voidaan hakea kiinnostava puheäänite valtavista arkistoista, jotka sisältävät jopa kymmeniä tuhansia tunteja materiaalia, esimerkiksi useampien vuosien radio-ohjelmat tai nauhoitetut julkiset puheet sadan vuoden ajalta. Tiedonhaku puheentunnistustulosten perusteella on käyttökelpoinen tapa myös audiovisuaalisen signaalin (esimerkiksi videon) käsittelyssä. Suomessa puheentunnistuksen avulla tapahtuva suurten aineistojen indeksointi on kiinnostuksen kohteena mm. Oulun yliopiston MediaTeamissa ja TKK:n neuroverkkojen tutkimusyksikössä. Viitteet [1] PC Magazine. December [2] Proceedings of DARPA Broadcast News Workshop. NIST, [3] L.E. Baum. An inequality and associated maximization technique in statistical estimation of probabilistic functions of Markov processes. Inequalities, 3:1 8, [4] F. Jelinek and R.L. Mercer. Interpolated estimation of Markov source parameters from sparse data. In Proceedings of an International Workshop on Pattern Recognition in Practice, Amsterdam, The Netherlands, North-Holland. [5] Teuvo Kohonen. Automatic formation of topological maps of patterns in a selforganizing system. In Erkki Oja and Olli Simula, editors, Proc. 2SCIA, Scand. Conf. on Image Analysis, pages , Helsinki, Finland, Suomen Hahmontunnistustutkimuksen Seura r.y. 9
10 [6] Teuvo Kohonen. Learning vector quantization for pattern recognition. Report TKK- F-A601, Helsinki University of Technology, Espoo, Finland, [7] Teuvo Kohonen. The neural phonetic typewriter. Computer, 21(3):11 22, [8] Juhani Toivanen and Manne Miettinen. Puheentutkimuksen resurssit Suomessa. CSC - Tieteellinen laskenta Oy, Finland, (in Finnish). [9] Kari Torkkola, Jari Kangas, Pekka Utela, Sami Kaski, Mikko Kokkonen, Mikko Kurimo, and Teuvo Kohonen. Status report of the Finnish phonetic typewriter project. In T. Kohonen, K. Mäkisara, O. Simula, and J. Kangas, editors, Artificial Neural Networks, volume I, pages , Amsterdam, Netherlands, North-Holland. 10
Puhe ja kieli, 28:2, 73 83 (2008) 73
Puhe ja kieli, 28:2, 73 83 (2008) 73 PUHEENTUNNISTUS Mikko Kurimo, Teknillinen korkeakoulu, Tietojenkäsittelytieteen laitos, Adaptiivisen Informatiikan tutkimusyksikkö Automaattinen puheentunnistus on
Puheentunnistus Mikko Kurimo
Puheentunnistus Mikko Kurimo Mitä automaattinen puheentunnistus on? Automaattinen puheentunnistin on laite, joka määrittää ja tulostaa sanan tai tekstin, joka parhaiten vastaa äänitettyä puhesignaalia.
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn
Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting
Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS 1 JOHDANTO 2 ESIMERKKIPOHJAINEN PUHEENTUNNISTUS
ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS Antti Hurmalainen, Tuomas Virtanen, Jort Gemmeke, Katariina Mahkonen Signaalinkäsittelyn laitos Tampereen teknillinen yliopisto PL3, 331 Tampere
Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla Nykykielten laitos FIN-CLARIN-seminaarissa 4. marraskuuta 2010 Sanaluokkajäsennys Mr. Gelbert also has fun with language. NNP NNP RB VBZ NN IN NN. Sanaluokkajäsennin
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Jatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
T Luonnollisen kielen tilastollinen käsittely Vastaukset 5, ti , 8:30-10:00 N-grammikielimallit, Versio 1.1
T-6.28 Luonnollisen kielen tilastollinen käsittely Vastaukset 5, ti 24.2.2004, 8:30-0:00 N-grammikielimallit, Versio.. Alla on erään henkilön ja tilaston estimaatit sille, miten todennäköistä on, että
AUTOMAATTINEN PUHEENTUNNISTUS
AUTOMAATTINEN PUHEENTUNNISTUS Teemu Salminen Opinnäytetyö Syyskuu 2015 Tietotekniikka Sulautetut järjestelmät ja elektroniikka TAMPEREEN AMMATTIKORKEAKOULU Tampere University of Applied Sciences TIIVISTELMÄ
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
T DATASTA TIETOON
TKK / Informaatiotekniikan laboratorio Syyslukukausi, periodi II, 2007 Erkki Oja, professori, ja Heikki Mannila, akatemiaprofessori: T-61.2010 DATASTA TIETOON TKK, Informaatiotekniikan laboratorio 1 JOHDANTO:
E. Oja ja H. Mannila Datasta Tietoon: Luku 2
2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto
Tilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1
T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)
JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.
Tilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?
1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö
pitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
Liikenneteorian tehtävä
J. Virtamo 38.3141Teleliikenneteoria / Johdanto 1 Liikenneteorian tehtävä Määrää kolmen eri tekijän väliset riippuvuudet palvelun laatu järjestelmä liikenne Millainen käyttäjän kokema palvelun laatu on
JOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ
S-114.2720 Havaitseminen ja toiminta
S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 2 visuaalinen prosessointi Treismanin FIT Kuva 1. Kuvassa on Treismanin kokeen ensimmäinen osio, jossa piti etsiä vihreätä T kirjainta.
Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat
Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet
THE audio feature: MFCC. Mel Frequency Cepstral Coefficients
THE audio feature: MFCC Mel Frequency Cepstral Coefficients Ihmiskuulo MFCC- kertoimien tarkoituksena on mallintaa ihmiskorvan toimintaa yleisellä tasolla. Näin on todettu myös tapahtuvan, sillä MFCC:t
T Luonnollisten kielten tilastollinen käsittely Vastaukset 5, ti , 16:15-18:00 N-grammikielimallit, Versio 1.0
T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 5, ti 25.2.2003, 16:15-18:00 N-grammikielimallit, Versio 1.0 1. Alla on erään henkilön ja tilaston estimaatit sille, miten todennäköistä
Dynaamiset regressiomallit
MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen
Numeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33
Numeeriset menetelmät TIEA381 Luento 12 Kirsi Valjus Jyväskylän yliopisto Luento 12 () Numeeriset menetelmät 25.4.2013 1 / 33 Luennon 2 sisältö Tavallisten differentiaaliyhtälöiden numeriikasta Rungen
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
Puhutun ja kirjoitetun rajalla
Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic
Estimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
Äännemallien vertailua jatkuvassa suuren sanaston puheentunnistuksessa
Äännemallien vertailua jatkuvassa suuren sanaston puheentunnistuksessa Vesa Siivola, Teemu Hirsimäki ja Mikko Kurimo Teknillinen korkeakoulu Informaatiotekniikan laboratorio Vesa.Siivola@hut.fi, Teemu.Hirsimaki@hut.fi,
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
Mitä on konvoluutio? Tutustu kuvankäsittelyyn
Mitä on konvoluutio? Tutustu kuvankäsittelyyn Tieteenpäivät 2015, Työohje Sami Varjo Johdanto Digitaalinen signaalienkäsittely on tullut osaksi arkipäiväämme niin, ettemme yleensä edes huomaa sen olemassa
Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.
Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes 11.06.2012 Ohjaaja: TkT Arto Klami Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla
1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.
Algoritmien DP ja MF vertaileminen tapahtuu suoraviivaisesti kirjoittamalla kummankin leskimääräinen kustannus eksplisiittisesti todennäköisyyksien avulla. Lause T MF ave = 1 + 2 1 i
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
Tilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
9. Tila-avaruusmallit
9. Tila-avaruusmallit Aikasarjan stokastinen malli ja aikasarjasta tehdyt havainnot voidaan esittää joustavassa ja monipuolisessa muodossa ns. tila-avaruusmallina. Useat aikasarjat edustavat dynaamisia
Esimerkki: Tietoliikennekytkin
Esimerkki: Tietoliikennekytkin Tämä Mathematica - notebook sisältää luennolla 2A (2..26) käsitellyn esimerkin laskut. Esimerkin kuvailu Tarkastellaan yksinkertaista mallia tietoliikennekytkimelle. Kytkimeen
Korkean resoluution ja suuren kuva-alueen SAR
Korkean resoluution ja suuren kuva-alueen SAR MATINE tutkimusseminaari 17.11.2016 Risto Vehmas, Juha Jylhä, Minna Väilä, Ari Visa Tampereen teknillinen yliopisto Signaalinkäsittelyn laitos Hankkeelle myönnetty
Tarvitseeko informaatioteknologia matematiikkaa?
Tarvitseeko informaatioteknologia matematiikkaa? Oulun yliopisto Matemaattisten tieteiden laitos 1 Kyllä kai IT matematiikkaa tarvitsee!? IT ja muu korkea teknologia on nimenomaan matemaattista teknologiaa.
pitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
8003051 Puheenkäsittelyn menetelmät
8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme
11. laskuharjoituskierros, vko 15, ratkaisut
11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa
Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto
Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on
T Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ke , 12:15 14:00 Puheentunnistus ja kielimallien evaluointi Versio 1.
T-61.020 Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ke 18.4.2007, 12:1 14:00 Puheentunnistus ja kielimallien evaluointi Versio 1.0 1. Käytämme siis jälleen viterbi-algoritmia todennäköisimmän
Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén
Projektisuunnitelma ja johdanto AS-0.3200 Automaatio- ja systeemitekniikan projektityöt Paula Sirén Sonifikaatio Menetelmä Sovelluksia Mahdollisuuksia Ongelmia Sonifikaatiosovellus: NIR-spektroskopia kariesmittauksissa
Ei välttämättä, se voi olla esimerkiksi Reuleaux n kolmio:
Inversio-ongelmista Craig, Brown: Inverse problems in astronomy, Adam Hilger 1986. Havaitaan oppositiossa olevaa asteroidia. Pyörimisestä huolimatta sen kirkkaus ei muutu. Projisoitu pinta-ala pysyy ilmeisesti
klusteroi data haluttuun määrään klustereita tee n-gram -mallit klustereista (tasoitus) estimoi sekoitteiden painokertoimet λ k
/DXU6HWVRH /DXU6HWVRH#KXWI 5XP0,\HUDG0DU2VWHGRUI0RGHJ/RJ'VWDH'HHGHH /DJXDJH7R0[WXUHV9HUVXV'\DP&DKH0RGHV,7UDV VHHKDGDXGRURHVVJ-DXDU\ $KHVHRWHPDGHD.l\WlW l.rhhvdwxrvd
Esimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
Laskut käyvät hermoille
Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor
T-1.81 Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ti 8.4., 1:1-18: Klusterointi, Konekääntäminen. Versio 1. 1. Kuvaan 1 on piirretty klusteroinnit käyttäen annettuja algoritmeja. Sanojen
T Luonnollisten kielten tilastollinen käsittely
T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 3, ti 11.2.2003, 16:15-18:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
KONENÄÖN MAHDOLLISUUDET KATUJEN JA TEIDEN OMAISUUDEN HALLINTAAN
KONENÄÖN MAHDOLLISUUDET KATUJEN JA TEIDEN OMAISUUDEN HALLINTAAN Petri Hienonen * * Lappeenranta University of Technology (LUT) Laboratory of Machine Vision and Pattern Recognition (MVPR) Kuntatekniikkapäivät
Väliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
MONISTE 2 Kirjoittanut Elina Katainen
MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi
Tilastollisia peruskäsitteitä ja Monte Carlo
Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia
Koska HAL ymmärtää mitä puhumme? Puheen automaattinen tunnistus ja ymmärtäminen
Koska HAL ymmärtää mitä puhumme? Puheen automaattinen tunnistus ja ymmärtäminen Vuokko Vuori TKK, Informaatiotekniikan laboratorio Vuokko.Vuori@hut.fi Tiivistelmä Tässä työssä pyritään tekemään katsaus
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
Mittaushavaintojen täsmällinen käsittelymenenetelmä
Tasoituslaskun periaate Kun mittauksia on tehty enemmän kuin on toisistaan teoreettisesti riippumattomia suureita, niin tasoituslaskun tehtävänä ja päätarkoituksena on johtaa tuntemattomille sellaiset
5.6.3 Matematiikan lyhyt oppimäärä
5.6.3 Matematiikan lyhyt oppimäärä Matematiikan lyhyen oppimäärän opetuksen tehtävänä on tarjota valmiuksia hankkia, käsitellä ja ymmärtää matemaattista tietoa ja käyttää matematiikkaa elämän eri tilanteissa
χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut
Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,
Verkko-oppiminen: Teoriasta malleihin ja hyviin käytäntöihin. Marleena Ahonen. TieVie-koulutus Jyväskylän lähiseminaari
Verkko-oppiminen: Teoriasta malleihin ja hyviin käytäntöihin Marleena Ahonen TieVie-koulutus Jyväskylän lähiseminaari Virtuaaliyliopistohankkeen taustaa: - Tavoitteena koota verkko-oppimisen alueen ajankohtaista
Kokemuksia ja näkemyksiä teollisuusmatematiikan koulutuksen kehittämisestä
Kokemuksia ja näkemyksiä teollisuusmatematiikan koulutuksen kehittämisestä Erkki Heikkola, Pasi Tarvainen Numerola Oy, Jyväskylä Teollisuusmatematiikan päivä 15.10.2009, Helsingin yliopisto Numerola Oy
Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?
Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? 2012-2013 Lasse Lensu 2 Ongelma 2: Voidaanko dataa tai informaatiota tallettaa tiiviimpään tilaan koodaamalla se uudelleen? 2012-2013 Lasse
JOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
Puheentunnistus ja synteettinen puhe
Puheentunnistus ja synteettinen puhe S-114.1100 Laskennallinen tiede, syksy 2005 (kuva: viite 5) Heikki Hyyti 60451P 1. Sisällysluettelo 1. Sisällysluettelo... 2 2. Tiivistelmä...3 3. Yleistä... 3 4. Kieli
ROVANIEMEN KAATOPAIKAN GEOFYSIKAALISTEN JA GEOKEMIALLISTEN HAVAINTOJEN YHTEISISTA PIIRTEISTA
- - - Q/19/3612/94/1 GEOLOGIAN TUTKIMUSKESKUS Erkki Lanne Pohjois-Suomen aluetoimisto 10.11.1994 TUTKIMUSRAPORTTI ROVANIEMEN KAATOPAIKAN GEOFYSIKAALISTEN JA GEOKEMIALLISTEN HAVAINTOJEN YHTEISISTA PIIRTEISTA
Testit järjestysasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
Mylly: Uusi tapa ka sitella teksti- ja puheaineistoa helposti ja tehokkaasti. Mietta Lennes ja Jussi Piitulainen FIN-CLARIN, Helsingin yliopisto
Mylly: Uusi tapa ka sitella teksti- ja puheaineistoa helposti ja tehokkaasti Mietta Lennes ja Jussi Piitulainen FIN-CLARIN, Helsingin yliopisto www.kielipankki.fi Kuinka aineistojen käsittelyä voitaisiin
Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
Tommi Saari Tekstieditorin puheohjaus. Diplomityö
Tommi Saari Tekstieditorin puheohjaus Diplomityö Tarkastajat: yliopistotutkija Ossi Nykänen tutkija Anne-Maritta Tervakari Tarkastaja ja aihe hyväksytty luonnontieteiden tiedekuntaneuvoston kokouksessa
Harjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
Kaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat
1 Tukivektoriluokittelija Tukivektorikoneeseen (support vector machine) perustuva luoikittelija on tilastollisen koneoppimisen teoriaan perustuva lineaarinen luokittelija. Perusajatus on sovittaa kahden
OT2 Puheteknologian opintokokonaisuuden suunnittelu 14.4.2009 Kalle Palomäki
OT2 Puheteknologian opintokokonaisuuden suunnittelu 14.4.2009 Kalle Palomäki 1. Johdanto Puheteknologia on perinteisesti jaettu kolmeen tai neljään osa-alueeseen: puheen siirto, puhesynteesi, puheanalyysi
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
Puheteknologia Informaa2oteknologian perusteet. Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos
Puheteknologia Informaa2oteknologian perusteet Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos Määritelmä: Puhekäy8ölii8ymä Kone8a ohjataan ja käytetään puhumalla Kone voi olla hardwarea, sobaa,
Monimutkaisten järjestelmien toimintavarmuuden parantaminen Jussi Kangaspunta ja Ahti Salo
Monimutkaisten järjestelmien toimintavarmuuden parantaminen 22..202 Jussi Kangaspunta ja Ahti Salo Taustaa Yhteiskunnan turvallisuusstrategia ja elintärkeiden toimintojen turvaaminen Esim. myrskyjen aiheuttamat
Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Kertymäfunktio TKK (c) Ilkka Mellin (2005) 1 Kertymäfunktio Kertymäfunktio: Määritelmä Diskreettien jakaumien kertymäfunktiot Jatkuvien jakaumien kertymäfunktiot TKK (c)
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
KUN LUKEMINEN ON HANKALAA. Helena Sorsa
KUN LUKEMINEN ON HANKALAA Helena Sorsa Lukemisen ja kirjoittamisen vaikeudet Lukivaikeus dysleksia fonologinen häiriö: henkilö ei kykene muuttamaan lukemaansa puheeksi näkee sanat, mutta ei löydä äänneasua
Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin
ohjelman arkkitehtuurista.
1 Legacy-järjestelmällä tarkoitetaan (mahdollisesti) vanhaa, olemassa olevaa ja käyttökelpoista ohjelmistoa, joka on toteutettu käyttäen vanhoja menetelmiä ja/tai ohjelmointikieliä, joiden tuntemus yrityksessä
Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto
Kojemeteorologia Sami Haapanala syksy 2013 Fysiikan laitos, Ilmakehätieteiden osasto Mittalaitteiden staattiset ominaisuudet Mittalaitteita kuvaavat tunnusluvut voidaan jakaa kahteen luokkaan Staattisiin
Tulevaisuuden radio. Puheenvuoro Radiovuosi 2010 tilaisuudessa 21.1.2010 Tuija Aalto YLE Uudet palvelut Tulevaisuus Lab
Tulevaisuuden radio Puheenvuoro Radiovuosi 2010 tilaisuudessa 21.1.2010 Tulevaisuus Lab Mediakäytön muutoksien ennakointi Avoin innovaatio ja tuotekehitys Toimintatapana verkostoituminen ja yhteistyö
Avainsanojen poimiminen Eeva Ahonen
Avainsanojen poimiminen 5.10.2004 Eeva Ahonen Sisältö Avainsanat Menetelmät C4.5 päätöspuut GenEx algoritmi Bayes malli Testit Tulokset Avainsanat Tiivistä tietoa dokumentin sisällöstä ihmislukijalle hakukoneelle
tään painetussa ja käsin kirjoitetussa materiaalissa usein pienillä kreikkalaisilla
2.5. YDIN-HASKELL 19 tään painetussa ja käsin kirjoitetussa materiaalissa usein pienillä kreikkalaisilla kirjaimilla. Jos Γ ja ovat tyyppilausekkeita, niin Γ on tyyppilauseke. Nuoli kirjoitetaan koneella
ARVO - verkkomateriaalien arviointiin
ARVO - verkkomateriaalien arviointiin Arvioitava kohde: Jenni Rikala: Aloittavan yrityksen suunnittelu, Arvioija: Heli Viinikainen, Arviointipäivämäärä: 12.3.2010 Osa-alue 1/8: Informaation esitystapa
Mallipohjainen klusterointi
Mallipohjainen klusterointi Marko Salmenkivi Johdatus koneoppimiseen, syksy 2008 Luentorunko perjantaille 5.12.2008 Johdattelua mallipohjaiseen klusterointiin, erityisesti gaussisiin sekoitemalleihin Uskottavuusfunktio
1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI
1. TODENNÄKÖISYYSJAKAUMIEN ESTIMOINTI Edellä esitelty Bayesiläinen luokittelusääntö ( Bayes Decision Theory ) on optimaalinen tapa suorittaa luokittelu, kun luokkien tnjakaumat tunnetaan Käytännössä tnjakaumia
Suomenkielinen puhehaku. Inger Ekman
Suomenkielinen puhehaku Inger Ekman Tampereen yliopisto Tietojenkäsittelytieteiden laitos Pro gradu -tutkielma, tietojenkäsittelyoppi Huhtikuu 2003 Tampereen yliopisto Tietojenkäsittelytieteiden laitos
Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly
Bayesin pelit Kalle Siukola MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly 12.10.2016 Toistetun pelin esittäminen automaatin avulla Ekstensiivisen muodon puu on tehoton esitystapa, jos peliä