Puheentunnistus Mikko Kurimo
|
|
- Pekka Ahonen
- 9 vuotta sitten
- Katselukertoja:
Transkriptio
1 Puheentunnistus Mikko Kurimo Mitä automaattinen puheentunnistus on? Automaattinen puheentunnistin on laite, joka määrittää ja tulostaa sanan tai tekstin, joka parhaiten vastaa äänitettyä puhesignaalia. Tunnistus perustuu siihen, että ensin äänisignaalista lasketaan puheen äänteitä kuvaavat ominaispiirteet, ja sitten verrataan niitä suuresta puheaineistosta laskettuihin äänteiden tilastollisiin malleihin. Lisäksi tunnistin käyttää suuresta tekstiaineistosta opetettuja tilastollisia sanasto- ja kielimalleja valitakseen tasavahvoista vaihtoehdoista sellaisia sanoja ja tekstejä, joita kielessä todennäköisimmin esiintyy. Tunnistustarkkuutta voidaan usein merkittävästi parantaa rajoittamalla käytettävä sanasto sovelluksen mukaan, esimerkiksi puhelimen äänivalinnassa. Muita puheenkäsittelyn aloja, joita usein virheellisesti sanotaan puheentunnistukseksi, ovat puhujantunnistus, puheen ymmärtäminen, puheen erottaminen muista tallennetuista äänistä ja puhesynteesi. Niissä on kyllä mahdollista käyttää samankaltaisia tilastollisia menetelmiä, ja niitä myös usein yhdistetään puheentunnistuksen kanssa samoihin sovelluksiin, mutta tehtävä on yleensä jokin muu kuin puheen muuntaminen tekstiksi. Automaattinen puheentunnistus tai lyhyemmin puheentunnistus, ja usein lyhyesti ASR (engl. Automatic Speech Recognition) on tärkeä informaatiotekniikan tutkimus- ja sovellusala. Tämä monitieteinen tutkimusala vaatii asiantuntemusta tietojenkäsittelytieteestä, signaalinkäsittelystä, akustiikasta, fonetiikasta ja kielitieteestä. Sovelluksia löytyy arkipäiväisestä elämästä kuten tiedonhaku automatisoiduista puhelinpalveluista ja tekstin sanelu puhelimelle tai tietokoneelle. Myös kuulo-, näkö- ja liikuntavammaisille on useita palveluja, joissa puhe muutetaan tekstiksi tai komennoiksi, ja joilla voidaan ohjata erilaisia laitteita. Puheen äänittäminen ja käsittely tunnistusta varten Puheentunnistuksessa ensimmäinen tehtävä on il - massa aaltoliikkeenä etenevän äänen tallennus ja muokkaaminen digitaaliseen muotoon. Haasteena on erottaa tutkittava puhe muista ympäristön äänistä kuten tuulettimien ja auton moottorin hurinasta, liikkumisesta syntyvistä äänistä, muista suun tuottamista äänistä ja varsinkin taustalla kuuluvasta toisten ihmisten puheesta. Ihmisaivot ja -korvat ovat olosuhteiden pakosta kehittyneet niin taitaviksi, että tehtävän vaikeutta voi olla hankala edes ymmärtää varsinkin kun ihminen kykenee ymmärtämään puhetta jopa varsin heikkolaatuisista tallenteista. 336
2 ääniaalto TALLENNUS mikrofoni diskreetit digitaaliset näytteet sattuvat puheen kannalta oleellisimmille taajuuskaistoille. Tavoitteena on poimia kustakin ikkunasta puheen eri äänteitä parhaiten kuvaavat piirteet niin, että kaikki tunnistuksen kannalta ylimääräinen informaatio, kuten puhujan äänenkorkeus, painotukset ja ympäristön äänet, karsiutuu pois. Puhesignaalin kuvaaminen ja mallintaminen kompaktina piirrevektorina NÄYTE PUHEEN AALTOMUODOSTA 0,4 0,2 0 0,2 0 0,5 1 1,5 2 2,5 x 10 4 Kuva 1. Puhesignaalin käsittely tunnistusta varten. Tallennuksen ongelmana on se, ettei tallennusta voida rajata yleisesti käytettävillä mikrofoneilla haluttuun puheeseen juuri muuten kuin sijoittamalla mikrofoni mahdollisimman lähelle puhujaa ja soveltamalla vain joitakin hyvin yksinkertaisia ja yleispäteviä menetelmiä taustakohinan vaimennukseen. Puheentunnistimessa mikrofonilla talletettu ja digitoitu puhe jaetaan tarkempaa analysointia varten ensin hyvin lyhyiksi osittain limittäisiksi paloiksi, joiden pituus on tyypillisesti vain kymmenkunta millisekuntia. Sitten jokaisesta palasta eli ikkunasta lasketaan taajuusspektri. Tarkoitus on, että ikkuna on toisaalta niin lyhyt, että sen aikana puheen taajuussisältö ei ehdi muuttua, mutta toisaalta niin pitkä, että spektri voidaan silti luotettavasti laskea. Tarkemmassa analyysissä tutkitaan sitten spektrin tunnistuksen kannalta tärkeimpiä osia eli niitä tehospektrin huippuja, jotka Puheen piirteiden analyysin tuloksena muodostetaan jokaisesta analysoidusta puheen palasesta eli ikkunoidusta signaalin pätkästä yksi piirrevektori. Piirrevektori sisältää parikymmentä lukuarvoa, jotka on valittu kuvaamaan ikkunassa esiintyvä puheentunnistuksen kannalta merkittävä sisältö mahdollisimman kompaktissa muodossa. Kompakti esitysmuoto on tärkeää sekä jatkossa seuraavan laskentatyön että tilastollisten mallien parametrien määrän ja dimension minimoimiseksi. Hyvä piirre-esitys puhesignaalista erottelee äänteet toisistaan karsii pois ympäristön häiriöäänet on nopea laskea on mahdollisimman kompakti. Tilastollinen malli äänteille muodostetaan määrittämällä kullekin äänteelle todennäköisyysjakauma, joka kuvaa piirrevektorien esiintymistä äännettä vastaavassa tallenteen osassa. Tavallisesti jakauma mallinnetaan moniulotteisella normaalijakaumalla, jossa jokaiselle piirrevektorin alkiolle on suuren puheaineiston perusteella estimoitu keskiarvo ja keskihajonta. Tätä yhdelle äänteelle laskettua todennäköisyysjakaumaa voidaan sitten käyttää laskemaan se todennäköisyys, millä puheesta laskettu piirrevektori voisi olla peräisin tästä jakaumasta. Käytännössä jakaumat ovat niin monimutkaisia, että tarkempaan mallintamiseen 337 Puheentunnistus
3 käytetään usein usean normaalijakauman painotettua summaa. Tällaista jakaumamallia kutsutaan Gaussin mikstuurimalliksi (GMM eli Gaussian Mixture Model). Äänteiden tilastollinen mallintaminen GMM-HMM JÄRJESTELMÄ Jokainen tila tuottaa ääniä GMM-mallinsa (Gaussian Mixture Model b(o)) mukaan. Tätä generoivaa mallia voidaan käyttää myös tekstin muuttamiseen puheeksi. Mitä korkeampi a ii, sitä pidempi kesto. Puheen rakenneosien eli äänteiden mallintamisessa puheentunnistusta varten ensimmäinen tehtävä on luonnollisesti selvittää, mitä äänteitä puheessa käytetään. Yksi vaihtoehto on valita äänteet puheentutkijoiden kullekin kielelle määrittelemän foneemijoukon eli pienimpien itsenäisten puheen rakenneosien perusteella. Useimmissa kielissä on kuitenkin esitetty vaihtoehtoisia ja erikokoisia foneemijoukkoja. Puheentunnistuksessa on lisäksi huomattu, että monet foneemit voivat esiintyä kontekstista riippuen niin erilaisina variantteina, että niille kannattaa kontekstin perusteella tehdä useampia eri malleja. Muutenkaan parhaan tunnistustuloksen saavuttamiseksi ei ole välttämätöntä noudattaa foneetikkojen esittämää foneemijakoa, vaan esimerkiksi hyvin harvinaiset foneemit kannattaa yhdistää suuremmiksi malleiksi. Niille ei harvinaisuuden vuoksi ole aina määritettävissä riittävän luotettavaa tilastollista mallia. Koska yhtä mallinnettavaa äännettä vastaavan tallennetun äänisignaalin osan piirteet ovat usein erilaisia äänteen alussa, keskivaiheilla ja lopussa, on tämä otettava huomioon myös äänteille rakennettavassa piirteiden tilastollisessa jakaumamallissa. Äännemalli rakennetaankin tavallisesti useammasta, esimerkiksi kolmesta, peräkkäisestä tilasta, joilla jokaisella on oma jakaumamallinsa ja kestomallinsa. Tällaisen äännemallin etu on joustavuus, koska tilamalli voidaan automaattisesti sovittaa ääninäytteisiin ja laskea kukin jakaumamalli opetusaineistosta tämän sovituksen mukaan. Äännemallia voidaan havainnollistaa ajattelemalla sitä laitteena, jolla on muutama erilainen toimintatila, jotka voidaan erottaa toisistaan epäsuorasti analysoimalla laitteen synnyttämän äänen muutoksia. Tällaista tilamallia a 00 a 11 a 22 a 01 a 12 S 0 S 1 S 2 b 0 (o t ) b 1 (o t ) b 2 (o t ) Kuva 2. Tilamalli ja jakaumamalli kutsutaan kätketyksi Markov-malliksi (HMM eli Hidden Markov Model). Nimi kuvaa sitä, että tilan vaihtuminen ei ole suoraan havaittavissa (ts. se on kätketty) ja tilan ominaisuudet, kuten jakaumamalli ja kesto, oletetaan riippumattomiksi aiemmista ja seuraavista tiloista (ns. Markov-oletus). Yllä kuvatun tilastollisen tilamallin (HMM) ja sen sisältämien jakauma- ja äännekestomallien perusteella voidaan sovittaa äännenäytteitä tekstiin ja mikä vielä hyödyllisempää tunnistaa kokonaisia uusia sanoja ja lauseita. Liittämällä eri äänteiden tilamalleja peräkkäin pitkäksi tilaketjuksi tilastollinen malli voidaan esittää mistä hyvänsä sanasta tai sanajonosta. Vertailemalla tilaketjun mallia uudesta puhenäytteestä laskettujen peräkkäisten piirrevektoreiden jonoon voidaan laskea todennäköisyys, jolla malli voisi generoida tämän näytteen. Lisäksi vertailemalla eri mallien todennäköisyyksiä voidaan määrittää todennäköisin malli ja 338 Mikko Kurimo
4 sen avulla muuntaa äänisignaali tekstiksi. Suuresta puhenäytteiden kokoelmasta voidaan lisäksi opettaa tähän kokoelmaan parhaiten sopivat uudet mallit. Tarkempi kuvaus tähän kehitettyjen laskennallisten algoritmien toiminnasta on viitteessä [1]. Kielen mallintaminen ääntämissanakirjana ja tilastollisina kielimalleina Vaikka pelkkien äännemallienkin avulla voitaisiin teoriassa tunnistaa puhetta muuttamalla äänisignaali äännejonoksi ja jälkikäsittelemällä äännejono edelleen sanoiksi, tämä on kuitenkin osoittautunut käytännössä huonoksi ja äärimmäisen virheherkäksi lähestymistavaksi. Järkevämpää onkin tehdä oletus, että puhe sisältää merkityksellisiä sanoja ja lauseita jollain kielellä. Sen jälkeen laaditaan tästä kielestä suurten tekstiaineistojen perusteella tilastollinen malli ja otetaan se huomioon jo siinä vaiheessa kun signaalia sovitetaan äännemalleihin. Koska kieli koostuu sanoista, voidaan tilastollisen kielimallin rakennus aloittaa laatimalla sanasto eli leksikko ja määrittämällä kunkin sanan esiintymistodennäköisyys ja todennäköisin ääntämismalli edellisessä luvussa rakennettujen äännemallien jonona. Mikäli joillakin sanoilla on useita tavallisia ääntämistapoja, ääntämissanakirjassa niiden yhteyteen voidaan lisätä kunkin ääntämistavan todennäköisyys. Koska ääntämissanakirjan koko lisää kuitenkin virhetunnistusten määrää, kannattaa useimmiten kuitenkin valita vain yleisin ääntämistapa varsinkin jos ääntämistavat ovat melko samanlaisia. On huomattava, että kielessä on usein myös sanoja, joita vastaava äännejono on täsmälleen sama, vaikka kirjoitusasu voi olla erilainenkin. Tällaisten sanojen tunnistus on mahdollista vain ympäröivien sanojen eli kontekstin perusteella. Monissa kielissä puheentunnistuksen tarvitsema sanasto voi olla hyvin suuri, koska on otettava huomioon kaikki mahdolliset taivutusmuodot. Erityisen ongelmallisia tässä suhteessa ovat muun muassa suomensukuiset kielet, joissa taivutusmuodot, yhdyssanat ja erilaiset päätteet ja etuliitteet esiintyvät yleisesti muodostaen usein pitkiä sanoja. Koska pitkät sanat rakentuvat yleensä pienemmistä merkityksellisistä yksiköistä eli morfeemeista, on kuitenkin mahdollista rakentaa leksikko ja kielimalli näiden perusteella. Silloin tarvittavien rakenneosien määrä pysyy järkevän kokoisena. Koska sanat ja morfeemit eivät kielessä koskaan esiinny satunnaisessa järjestyksessä, voidaan tunnistimen tehtävää merkittävästi helpottaa opettamalla saatavissa olevien tekstiaineistojen perusteella tilastollinen malli sanojen välisistä riippuvuuksista. Käyttämällä tämän kielimallin eri sanajonoille antamia prioritodennäköisyyksiä voidaan tunnistuksessa ratkaisevasti pienentää läpikäytävien vaihtoehtojen määrää ja erotella toisistaan ns. homonyymit eli samalta kuulostavat sanat ja sanayhdistelmät. Rajoittamattomassa sanelussa tyypillisin kielimalli on ns. n-gram-malli, jossa kaikkien sanajonojen todennäköisyydet voidaan laskea yhdistämällä toisiinsa mallin tuntemat lyhyemmät sanajonot ja niiden esiintymistodennäköisyydet. Tarkempi kuvaus n-grammeista ja muiden vastaavien kielimallien toiminnasta on esimerkiksi viitteessä [2]. Puheen muuttaminen tekstiksi äänne- ja kielimallien perusteella Puheentunnistustehtävä voidaan matemaattisesti määritellä siten, että on löydettävä todennäköisin sanajono puhesignaalin ja käytettävissä olevien äänne- ja kielimallien perusteella. Tästä on edelleen johdettavissa tilamallien hakutehtävä, jonka tulos on paras mahdollinen tilajono äännemallien läpi. Tilajonoa vastaavan sana- tai morfeemijonon prioritodennäköisyys voidaan ottaa haussa huomioon kielimallin avulla. Vaikka käytössä on tehokkaita hakualgoritmeja, niin suora haku on silti jatkuvan puheen tunnistuksessa käytännössä mahdotonta. Sanavälejä ei voida riittävän luotettavasti erottaa esikäsittelyllä, vaan haun täytyy tut- Puheentunnistus 339
5 kia joka kohdassa signaalia mahdollisuus uuden sanan alkamiseen. Tämä seikka yhdessä suuren sanaston kanssa johtaa helposti hakuavaruuden räjähtämiseen. Puheentunnistus on kuitenkin mahdollista jopa reaaliajassa, jos käytetään älykkäitä hakualgoritmeja, jotka osaavat mahdollisimman aikaisessa vaiheessa poistaa kaikki epätodennäköiset sanahypoteesit ja välttävät tehokkaasti kaikkea turhaa laskentaa. Samalla kun tunnistin etsii parhaan tunnistushypoteesin, voidaan vähällä lisävaivalla tuottaa myös lista seuraavaksi parhaista hypoteeseista (N-best list) tai kompakti sanakaavio (word lattice) josta on helposti erotettavissa suuri joukko parhaita hypoteeseja. Puheentunnistuksen sovellusten lisäksi nämä laajennetut hakutulokset ovat hyödyksi silloin, kun on olemassa tarkempia akustisia ja kielimalleja, joiden käyttäminen alkuperäisessä täydessä haussa on niiden koon takia mahdotonta. Sen sijaan laajennettujen hakutulosten perusteella voidaan parhaat hypoteesit järjestää erittäin nopeasti uudelleen vaikka mallit olisivat suuriakin. Tällöin on mahdollisuus saada tarkennettu tunnistustulos. Puheentunnistuksen hakualgoritmeja ja dekooderiratkaisuja on esitelty tarkemmin viitteessä [3]. Puheentunnistuksen sovellukset, suorituskyky ja haasteet Sovelluksista yleisesti Puheentunnistuksen sovelluksista ensimmäisenä tulee monelle mieleen muiden teknisten laitteiden ohjaaminen ilman käsin tapahtuvaa yksityiskohtaista nappien painelua. Tähän liittyy usein myös se taustatoive, ettei ihmisen tarvitsisi tarkalleen kuvata haluttua toimintaa, kuten mitä nappeja painetaan ja miten vipuja käännetään, vaan kone osaisi samalla älykkäästi päätellä, mitä ihminen oikeastaan haluaa ja toimia sen mukaan. Usein on kuitenkin tuloksen kannalta parempi, että sivuutetaan puheohjaus ja ihmisen toiveiden arvailu ja ohjataan laitetta suoraan, esimerkiksi käyttämällä itse tietokonetta tai ohjaamalla autoa. Puheohjaus on kuitenkin jo nykyään hyödyllinen sovellus silloin, kun on suoritettava melko yksinkertaisia tehtäviä ilman käsien apua tai esimerkiksi puhelimen välityksellä. Erityisesti kuulo-, näkö- ja liikuntavammaisten toimintaa helpottavat palvelut, joissa puhe muutetaan tekstiksi tai komennoiksi, joilla voidaan ohjata erilaisia laitteita. Puheentunnistimen käyttöön liittyy helposti varsin epärealistisia odotuksia. Jos laitteelle voidaan puhua kuten ihmiselle, oletetaan helposti, että se on muullakin tavoin älykäs ja kykenee suorittamaan vaativia tehtäviä ikään kuin palvelija, jolle ei tarvitse yksityiskohtaisesti määritellä mitä tehdään. Koska ihminen on kehittynyt erittäin taitavaksi erottamaan toisen ihmisen puheen muista häiriöäänistä ja jopa usean päällekkäisen puhujan joukosta, toivotaan, että koneellinenkin puheentunnistus kykenee samaan. Samoin on laita myös tunnistuksen virheettömyydessä puhetapaa, -tyyliä ja -nopeutta muunneltaessa sekä eri puhujien välisten erojen huomioinnissa. Vaikka nykyaikainen puheentunnistin kykeneekin tunnistamaan sen äänne- ja kielimalleille opetettua aineistoa vastaavaa selkeää puhetta jopa hämmästyttävän hyvin, voi puhetilanteen ja -tavan muuttuminen johtaa tunnistustarkkuuden romahtamiseen. Lisäksi on huomattava, että tunnistimen signaalista käyttämä informaatio vain äänteiden erotteluun optimoidut lyhytaikaisen spektrin piirteet kattaa hyvin pienen osan siitä kaikesta oheisinformaatiosta, jota ihminen usein huomaamattaankin käyttää epäselvän puheen ymmärtämiseksi. Tämä oheisinformaatio liittyy äänensävyyn, puhujan muihin ominaisuuksiin, puheenaiheeseen, kuulijan aiempiin kokemuksiin ja monenlaiseen näköaistin välityksellä tilanteesta saatavaan tietoon. Puhekäyttöliittymät Puheentunnistuksen sovellukset on tuloksille asetettavien vaatimusten perusteella jaettavissa kolmeen pääryhmään: käyttöliittymät, sanelu ja 340 Mikko Kurimo
6 tiedonhaku. Käyttöliittymissä tunnistetaan puhuttuja komentoja ja tuloksena on joko visuaalinen tai synteettinen vaste tai suoraan ohjattavan laitteen toiminta (ks. s. XX XX Turunen). Esimerkkejä laitteista, joissa puheentunnistusta voidaan käyttää käyttöliittymänä, ovat matkapuhelin, tietokone, auton oheislaitteet (kuten navigaattori) ja automatisoidut tietopalvelut (kuten numerotiedustelu, paikallissää ja erilaiset varauspalvelut). Visuaalinen vaste varmistaa tunnistustuloksen näyttämällä valitun komennon laitteen näytöllä ja synteettinen vaste toistaa sen laitteen omalla äänellä. Yleensä tunnistustarkkuuden komentojen osalta on oltava lähes täydellistä, tai muuten käyttäjä joutuu antamaan komennon uudelleen. Tunnistusta helpottaa merkittävästi se, että kussakin käyttötilanteessa on yleensä varsin rajallinen määrä toimintavaihtoehtoja esimerkiksi soitettaessa puhelimella vain muistissa olevat nimet. Tunnistukselle haasteita asettavat käyttötilanteessa kuuluvat taustaäänet ja se, että käyttäjäryhmä voi olla suuri eivätkä kaikki ole välttämättä kovin harjaantuneita käyttöliittymän toimintaan. Sanelu Sanelussa tunnistetaan jatkuvaa puhetta. Sen tuloksena on tunnistettu puhe tekstinä, yleensä näytöllä esitettynä siten, että käyttäjä voi tarvittaessa korjata virheelliset sanat. Tavallisia esimerkkejä sanelusta ovat erilaiset raportit, kuten lääkärin muistiinpanot, sähköpostit ja tekstiviestit. Samantyyppisellä puheentunnistimella voidaan jälkikäteen käsitellä myös erilaisia tallennettuja puheäänitteitä kuten haastatteluja, kokoustilanteita ja puhelimeen jätettyjä ääniviestejä. Kun puhetta muunnetaan tekstiksi, tavoitteena on tarkkuus ja joissakin tapauksissa myös nopeus. Puhetta tallennettaessa tämä tavoite on yleensä tiedossa, joten puhuja voi vaikuttaa siihen puhumalla rauhallisesti ja selkeästi. Lisäksi hän voi hakeutua rauhalliseen ja hiljaiseen ympäristöön ja pitää mikrofonia huolellisesti suunsa edessä. Sanelun tapainen sovellus on myös puheen kääntäminen toiselle kielelle. Siinä tunnistettu teksti käännetään automaattisilla kielenkäännöstyökaluilla ja lopuksi joko tallennetaan vieraskielisenä tekstinä tai soitetaan puhesyntetisaattorin avulla vieraskielisenä puheena. Koska koneellinen kääntäminen on vähintään yhtä haastava tehtävä kuin puheentunnistus ja hyvin herkkä tunnistusvirheille, sovelluksen aihepiiri on yleensä tiukasti rajattu, esimerkiksi vain tavallisten matkailuun liittyvien fraasien kääntäminen. Tiedonhaku Kolmas pääryhmä sovelluksia on tiedonhaku. Siinä tunnistuksen tavoitteena on ns. raakatekstin tuottaminen luokiteltavaksi tai indeksoitavaksi edelleen sisällön perusteella tiedonhakua varten. Tyypillisiä tehtäviä ovat puheiden haku tietyistä aiheista, äänitteiden indeksointi ja selailu sekä yhteenvetojen laatiminen. Tunnistusta helpottaa se, ettei raakatekstin tarvitse olla virheetöntä, vaan relevanssin määrittäminen sisällön kannalta voi toimia riittävän hyvin, vaikka jopa puolet sanoista sisältäisi virheitä. Tunnistuksen haasteena taas on se, että käsiteltävissä äänitteissä puhuja on yleensä suunnannut puheensa koneen sijasta toisille ihmisille. Puhe voi myös olla nopeaa ja epäselvää eikä äänitysympäristön ja mikrofonin sijoittelun huomiointi välttämättä ole tunnistuksen kannalta optimaalinen. Äänitteet voivat olla televisio-ohjelmia, videokuvauksia tai pöytämikrofonilla äänitettyjä haastatteluja tai kokouksia. Käytännön ongelmia ja ratkaisuja Opetusaineisto Koska automaattinen puheentunnistus perustuu puhe- ja tekstiaineistoista opetettuihin tilastollisiin malleihin, on tunnistimen suorituskyky suuresti riippuvainen käytetyn aineiston kattavuudesta ja sopivuudesta. Tyypillisesti puhujariippumatto- Puheentunnistus 341
7 maan tunnistukseen tarvitaan ääninäytteet usealta sadalta eri ihmiseltä. Tekstiaineiston koko on sanastosta ja aiheesta riippumattomassa sanelussa oltava kymmeniä tai jopa satoja miljoonia sanoja. Koska tilastolliset mallit kuvaavat opetusaineiston keskimääräisiä piirteitä, voi normaalista poikkeava puhetapa tai puheenaihe tuottaa ylipääsemättömiä ongelmia. Tyypillisiä esimerkkejä ovat pienen lapsen puhe tai lyhenteitä vilisevä teknillisen erityisalan puhe. Aineiston annotoinniksi riittää yleensä lausetaso eli puhetta vastaava teksti. Tarkempi annotointi sanojen, äänteiden ja tilamallin tilojen alkamis- ja päättymishetkistä saadaan riittävällä tarkkuudella tehtyä puheentunnistimella. Tämä tekstiä vastaavan puheen segmentointi äänteisiin onkin yksi muiden puheentutkijoiden paljon käyttämä puheentunnistuksen sovellus ja sivutuote. Lisäksi on myös mahdollista opettaa tilastollisia malleja eteenpäin niin, että tekstin sijasta käytetään puheentunnistustuloksia. Äänne- ja kielimallien adaptointi Puhujariippumatonta tunnistusta parempaan tulokseen päästään, jos kullekin puhujalle voidaan opettaa oma henkilökohtainen malli. Tähän tarvitaan useampi tunti annotoitua puhetta. Toinen vaihtoehto on käyttää puhuja-adaptaatiota puhujariippumattoman mallin muokkaamiseksi. Tulos ei ole yhtä tarkka, mutta jo muutamalla kymmenellä lauseella päästään selvästi yleismallia parempiin tuloksiin. Puhuja-adaptaation laskemiseen on kaksi eri tapaa. Joko tilastollisen mallin kutakin parametria muokataan adaptointidataan paremmin sopivaksi tai sitten estimoidaan puheen piirteille yleinen muunnosmatriisi, jolla kaikki tilastolliset mallit saadaan paremmin sopimaan adaptointidataan. Jälkimmäisellä tavalla päästään tulosparannuksiin huomattavasti nopeammin, mutta se ei ota yhtä tarkasti huomioon eri äänteissä tapahtuvia erilaisia puhujakohtaisia korjauksia, koska muunnosmatriiseja ei voida pienellä datamäärällä estimoida äännekohtaisesti. Puhuja-adaptaatio korjaa melko hyvin myös varsinaisesta opetusaineistosta poikkeavia äänitysolosuhteita ja yksinkertaista jatkuvaa taustaääntä kuten moottorin hurinaa. Jos puheenaihe tai puhetyyli on tiedossa, voidaan tilastollisia kielimalleja adaptoida paremman tunnistustuloksen saavuttamiseksi. Tämä vaatii kuitenkin melko paljon uuteen aiheeseen liittyvää tekstiaineistoa (vähintään sadasta tuhannesta miljoonaan sanaa), ellei samalla voida rajoittaa myös kielen rakennetta. Tämä on kuitenkin käytännössä usein hankalaa. Kielimallien adaptaatiossa opetetaan kullekin puheenaiheelle tai puhetyylille oma tilastollinen mallinsa ja sitten tunnistettavan puheen perusteella laaditaan sopiva kombinaatio yleiskielimallin ja valitun aihemallin välillä. Yleiskielimallin käyttö on usein hyödyllistä koska aihemallin yleistämiskyky on pienemmän opetusaineiston takia heikompi. Myös murteita tai puhekieltä voidaan puheentunnistimen kannalta pitää erilaisina puhetyyleinä. Adaptointi on kuitenkin vaikeaa, koska yleiskielimallista ei välttämättä ole hyötyä, vaan sekä sanastolle että sanojen välisille riippuvuuksille on opetettava uudet mallit. Myös sanojen ääntäminen voi olla niin erilaista, että tarvitaan uusi ääntämissanakirjakin. Lisäksi riittävän laajan kirjallisen opetusaineiston kerääminen vain puhuttuna esiintyvälle kielelle on työlästä ja usein jopa mahdotonta. Puheentunnistus meluisassa ympäristössä Jos puheentunnistusta joudutaan käyttämään huonoissa äänitysoloissa ja meluisassa ympäristössä, voidaan tunnistusta tehostaa joko opettamalla uudet tilanteeseen sopivat mallit tai mallintamalla melu erikseen omalla mallillaan. Huonot äänitysolosuhteet voivat johtua yksinkertaisesti siitä, että mikrofoni ei ole suun lähellä, vaan jossain kauempana. Uudet mallit opetetaan joko keräämällä uutta opetusdataa puheesta kohdeympäristössä, esimerkiksi liikkeellä olevassa autossa, tai muut- 342 Mikko Kurimo
8 tamalla tilastollisten mallien käyttämiä puheen piirteitä sellaisiksi, että melu suodattuu niistä pois. Erityisen vaikeasti suodatettavaa melua on taustalla kuuluva puhe, koska siinä esiintyy samanlaisia äänteitä kuin tunnistettavassa puheessa. Tunnistimen on vaikea erottaa niitä toisistaan ja tietää, mitä pitäisi tunnistaa ja mitä ei. Mikäli taustamelu on sopivan kaavamaista ja siitä on riittävästi näytteitä, jotta sille voidaan opettaa oma tilastollinen mallinsa, on mahdollista yhdistää se suoraan puheentunnistusprosessiin. Tällöin tunnistin käyttää yhtäaikaisesti sekä puheen että melun malleja löytääkseen parhaiten niihin molempiin sopivan tunnistustuloksen. Tämä on kuitenkin laskennallisesti erittäin raskasta ja vaatii kaikille erilaisille melutyypeille omat mallinsa. Puheentunnistus eri kielillä Toistaiseksi automaattisia puheentunnistimia on kehitelty vain pienelle osalle maailman kielistä. Koska painopiste on ollut valtakielissä (erityisesti englanti), monet puheentunnistimissa käytetyt ratkaisut on kehitetty nimenomaan niitä varten. Viime aikoina on kuitenkin kiinnitetty yhä enemmän huomiota sellaisiin menetelmiin, jotka ovat helposti siirrettävissä uusiin kieliin ilman suurta manuaalista kehitystyötä. Hankalimmat ongelmat, joita erilaiset kielet aiheuttavat, eivät välttämättä liity erilaisiin äänteisiin, vaan siihen, miten sanat ja lauseet rakentuvat eri tavoin ja erilaisista osista. Nämä ongelmat vaikeuttavat erityisesti sanasto- ja kielimallien kehittämistä. Luonnollisesti suurimmat ongelmat koskevat kieliä, joille ei ole kehittynyt edes vakiintunutta kirjoitustapaa tai joilla tapa kirjoittaa ja puhua kieltä poikkeavat paljon toisistaan. Kirjallisuus [1] LAWRENCE R. RABINER (1989). A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE, 77 (2), [2] JOSHUA T. GOODMAN (2001). A bit of progress in language modeling. Computer Speech & Language, 15 (4), [3] XAVIER L. AUBERT (2002). An overview of decoding techniques for large vocabulary continuous speech recognition. Computer Speech & Language, 16 (1), Puheentunnistus 343
Puhe ja kieli, 28:2, 73 83 (2008) 73
Puhe ja kieli, 28:2, 73 83 (2008) 73 PUHEENTUNNISTUS Mikko Kurimo, Teknillinen korkeakoulu, Tietojenkäsittelytieteen laitos, Adaptiivisen Informatiikan tutkimusyksikkö Automaattinen puheentunnistus on
Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting
Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus
Puheentunnistus. 1 Johdanto. Mikko Kurimo Teknillinen korkeakoulu Informaatiotekniikan laboratorio
Puheentunnistus Mikko Kurimo Teknillinen korkeakoulu Informaatiotekniikan laboratorio 1 Johdanto 1.1 Puheentunnistuksen merkitys Puhetta ymmärtävää konetta on pidetty tärkeänä askeleena ihmisen arkielämää
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla Nykykielten laitos FIN-CLARIN-seminaarissa 4. marraskuuta 2010 Sanaluokkajäsennys Mr. Gelbert also has fun with language. NNP NNP RB VBZ NN IN NN. Sanaluokkajäsennin
<e.g. must, essential, conditional>
Käyttötapaukset Kurssin malli käyttötapauksille: Tila < List of users and the other systems that interacts directly with a system>
ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS 1 JOHDANTO 2 ESIMERKKIPOHJAINEN PUHEENTUNNISTUS
ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS Antti Hurmalainen, Tuomas Virtanen, Jort Gemmeke, Katariina Mahkonen Signaalinkäsittelyn laitos Tampereen teknillinen yliopisto PL3, 331 Tampere
TIEDONHAKU INTERNETISTÄ
TIEDONHAKU INTERNETISTÄ Internetistä löytyy hyvin paljon tietoa. Tietoa ei ole mitenkään järjestetty, joten tiedonhaku voi olla hankalaa. Tieto myös muuttuu jatkuvasti. Tänään tehty tiedonhaku ei anna
8003051 Puheenkäsittelyn menetelmät
8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme
AUTOMAATTINEN PUHEENTUNNISTUS
AUTOMAATTINEN PUHEENTUNNISTUS Teemu Salminen Opinnäytetyö Syyskuu 2015 Tietotekniikka Sulautetut järjestelmät ja elektroniikka TAMPEREEN AMMATTIKORKEAKOULU Tampere University of Applied Sciences TIIVISTELMÄ
Kuva 1. Jokaisen tavallisen kuvan tasotyökalussa näkyy vain yksi taso, tässä nimellä tausta.
Gimp alkeet XII 9 luokan ATK-työt/HaJa Sivu 1 / 6 GIMP:in tasotyökalu Lue ensin nämä ohjeet! Harjoitus lopussa! GIMP:in tasotyökalu on nimensä mukaisesti työkalu, jolla hallitaan tasoja, niiden läpinäkyvyyttä,
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn
Puheteknologia Informaa2oteknologian perusteet. Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos
Puheteknologia Informaa2oteknologian perusteet Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos Määritelmä: Puhekäy8ölii8ymä Kone8a ohjataan ja käytetään puhumalla Kone voi olla hardwarea, sobaa,
Puheentunnistus radiologiassa
Puheentunnistus radiologiassa Tomi Kauppinen HUS-Röntgen PL 750 00029 Helsinki, FINLAND tomi.kauppinen@hus.fi -1- Sisält ltö Puheentunnistus Yhteistyöprojekti Radiologinen palveluketju HUS-Röntgenin kokemuksia
+ 3 2 5 } {{ } + 2 2 2 5 2. 2 kertaa jotain
Jaollisuustestejä (matematiikan mestariluokka, 7.11.2009, ohjattujen harjoitusten lopputuloslappu) Huom! Nämä eivät tietenkään ole ainoita jaollisuussääntöjä; ovatpahan vain hyödyllisiä ja ainakin osittain
DIGITAALISEN TARINAN TUOTTAMINEN MICROSOFT PHOTO STORY 3- OHJELMAN AVULLA VAIHEINEEN
OMAN ALAN ESITELMÄ DIGITAALISENA TARINANA Laaditaan digitarina jostakin oman alan aiheesta (ks. lista aiheista). Edetään seuraavasti: 1. Valitse listalta aihe. Voit myös ehdottaa omaa aihetta. 2. Mieti,
4.1. Sovitusopas. Sisällysluettelo. Maaliskuu 2015. Tässä oppaassa on yksityiskohtaiset ohjeet kuulokojeen sovittamiseen Phonak Target -ohjelmalla.
4.1 Maaliskuu 2015 Sovitusopas Tässä oppaassa on yksityiskohtaiset ohjeet kuulokojeen sovittamiseen Phonak Target -ohjelmalla. Katso myös Phonak Target -aloitusnäytön kohta [Uutisia]. Sisällysluettelo
Tommi Saari Tekstieditorin puheohjaus. Diplomityö
Tommi Saari Tekstieditorin puheohjaus Diplomityö Tarkastajat: yliopistotutkija Ossi Nykänen tutkija Anne-Maritta Tervakari Tarkastaja ja aihe hyväksytty luonnontieteiden tiedekuntaneuvoston kokouksessa
Luku 6. Dynaaminen ohjelmointi. 6.1 Funktion muisti
Luku 6 Dynaaminen ohjelmointi Dynaamisessa ohjelmoinnissa on ideana jakaa ongelman ratkaisu pienempiin osaongelmiin, jotka voidaan ratkaista toisistaan riippumattomasti. Jokaisen osaongelman ratkaisu tallennetaan
Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto
Kojemeteorologia Sami Haapanala syksy 2013 Fysiikan laitos, Ilmakehätieteiden osasto Kojemeteorologia, 3 op 9 luentoa, 3 laskuharjoitukset ja vierailu mittausasemalle Tentti Oppikirjana Rinne & Haapanala:
Ohjelmointi 1. Kumppanit
Ohjelmointi 1 Kumppanit November 20, 2012 2 Contents 1 Mitä ohjelmointi on 7 2 Ensimmäinen C#-ohjelma 9 2.1 Ohjelman kirjoittaminen......................... 9 A Liite 11 3 4 CONTENTS Esipuhe Esipuhe 5
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn
Predictable 5 Uudet ominaisuudet
Predictable 5 Uudet ominaisuudet Sisällys 1. Sisäänkirjautuminen ja varmuuskopiointi... 3 2. Lauseiden etsiminen... 3 3. ios-äänet... 4 4. 10-näppäiminen näppäimistö... 4 5. Apple & näppäimistön laajennukset...
Käyttöohje HERE Maps. 1.0. painos FI
Käyttöohje HERE Maps 1.0. painos FI HERE Maps HERE Maps näyttää lähellä olevat kohteet ja opastaa sinut perille. Voit etsiä kaupunkeja, katuja ja palveluja löytää perille tarkkojen reittiohjeiden avulla
Suomenkielinen puhehaku. Inger Ekman
Suomenkielinen puhehaku Inger Ekman Tampereen yliopisto Tietojenkäsittelytieteiden laitos Pro gradu -tutkielma, tietojenkäsittelyoppi Huhtikuu 2003 Tampereen yliopisto Tietojenkäsittelytieteiden laitos
E. Oja ja H. Mannila Datasta Tietoon: Luku 2
2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto
Kirjoita oma versio funktioista strcpy ja strcat, jotka saavat parametrinaan kaksi merkkiosoitinta.
Tehtävä 63. Kirjoita oma versio funktiosta strcmp(),joka saa parametrinaan kaksi merkkiosoitinta. Tee ohjelma, jossa luetaan kaksi merkkijonoa, joita sitten verrataan ko. funktiolla. Tehtävä 64. Kirjoita
Tietotekniikan valintakoe
Jyväskylän yliopisto Tietotekniikan laitos Tietotekniikan valintakoe 2..22 Vastaa kahteen seuraavista kolmesta tehtävästä. Kukin tehtävä arvostellaan kokonaislukuasteikolla - 25. Jos vastaat useampaan
Jatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1
T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
Mylly: Uusi tapa ka sitella teksti- ja puheaineistoa helposti ja tehokkaasti. Mietta Lennes ja Jussi Piitulainen FIN-CLARIN, Helsingin yliopisto
Mylly: Uusi tapa ka sitella teksti- ja puheaineistoa helposti ja tehokkaasti Mietta Lennes ja Jussi Piitulainen FIN-CLARIN, Helsingin yliopisto www.kielipankki.fi Kuinka aineistojen käsittelyä voitaisiin
Opetustapahtumien hakeminen (Hae - Opetustapahtuma)
Helsingin yliopisto WinOodi 1 (5) Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Opetustapahtumien hakua tarvitaan sekä opetustapahtumien käsittelyssä että raporttien tulostamisessa. Ohjeessa käsitellään
Äännemallien vertailua jatkuvassa suuren sanaston puheentunnistuksessa
Äännemallien vertailua jatkuvassa suuren sanaston puheentunnistuksessa Vesa Siivola, Teemu Hirsimäki ja Mikko Kurimo Teknillinen korkeakoulu Informaatiotekniikan laboratorio Vesa.Siivola@hut.fi, Teemu.Hirsimaki@hut.fi,
PUHUJARIIPPUMATON AUTOMAATTINEN PUHEENTUNNISTUSJÄRJESTELMÄ MATLAB- OHJELMALLA
L Ä Ä K E T I E T E E L L I N E N T I E D E K U N T A L ä ä k e t i e t e e n t e k n i i k k a PUHUJARIIPPUMATON AUTOMAATTINEN PUHEENTUNNISTUSJÄRJESTELMÄ MATLAB- OHJELMALLA Ossi Kumpula Kandidaatin tutkielma
Digitaalinen audio
8003203 Digitaalinen audio Luennot, kevät 2005 Tuomas Virtanen Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2 Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot, sekä niissä
KÄYTTÖOHJE. Servia. S solutions
KÄYTTÖOHJE Servia S solutions Versio 1.0 Servia S solutions Servia Finland Oy PL 1188 (Microkatu 1) 70211 KUOPIO puh. (017) 441 2780 info@servia.fi www.servia.fi 2001 2004 Servia Finland Oy. Kaikki oikeudet
Signaalien generointi
Signaalinkäsittelyssä joudutaan usein generoimaan erilaisia signaaleja keinotekoisesti. Tyypillisimpiä generoitavia aaltomuotoja ovat eritaajuiset sinimuotoiset signaalit (modulointi) sekä normaalijakautunut
Koska HAL ymmärtää mitä puhumme? Puheen automaattinen tunnistus ja ymmärtäminen
Koska HAL ymmärtää mitä puhumme? Puheen automaattinen tunnistus ja ymmärtäminen Vuokko Vuori TKK, Informaatiotekniikan laboratorio Vuokko.Vuori@hut.fi Tiivistelmä Tässä työssä pyritään tekemään katsaus
Puheentunnistus ja synteettinen puhe
Puheentunnistus ja synteettinen puhe S-114.1100 Laskennallinen tiede, syksy 2005 (kuva: viite 5) Heikki Hyyti 60451P 1. Sisällysluettelo 1. Sisällysluettelo... 2 2. Tiivistelmä...3 3. Yleistä... 3 4. Kieli
Kuva liikennemerkistä 1. Aleksanteri Numminen. aleksanteri.numminen@gmail.com ITKP101
Kuva liikennemerkistä 1 Aleksanteri Numminen aleksanteri.numminen@gmail.com ITKP101 31.1.2016 1. Asiakirjan kieleen liittyvät työkalut... 1 1.1. Tyylien kielen valinta... 1 1.2. Oikeinkirjoituksen tarkastaminen...
ELOKUVATYÖKALUN KÄYTTÖ ANIMAATION LEIKKAAMISESSA. Kun aloitetaan uusi projekti, on se ensimmäisenä syytä tallentaa.
ELOKUVATYÖKALUN KÄYTTÖ ANIMAATION LEIKKAAMISESSA Kun aloitetaan uusi projekti, on se ensimmäisenä syytä tallentaa. Projekti kannattaa tallentaa muutenkin aina sillöin tällöin, jos käy niin ikävästi että
1. HARJOITUS harjoitus3_korjaus.doc
Word - harjoitus 1 1. HARJOITUS harjoitus3_korjaus.doc Kopioi itsellesi harjoitus3_korjaus.doc niminen tiedosto Avaa näyttöön kopioimasi harjoitus. Harjoitus on kirjoitettu WordPerfet 5.1 (DOS) versiolla
Tekstinlouhinnan mahdollisuudet Digin historiallisessa sanomalehtiaineistossa. Kimmo Kettunen Dimiko (Digra-projekti)
Tekstinlouhinnan mahdollisuudet Digin historiallisessa sanomalehtiaineistossa Kimmo Kettunen Dimiko (Digra-projekti) Tekstinlouhinta Tekstinlouhinnassa pyritään saamaan tekstimassoista automaattisesti
Algoritmit. Ohjelman tekemisen hahmottamisessa käytetään
Ohjelmointi Ohjelmoinnissa koneelle annetaan tarkkoja käskyjä siitä, mitä koneen tulisi tehdä. Ohjelmointikieliä on olemassa useita satoja. Ohjelmoinnissa on oleellista asioiden hyvä suunnittelu etukäteen.
Opetustapahtumien hakeminen (Hae - Opetustapahtuma)
Helsingin yliopisto WinOodi Sivu 1/5 Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Opetustapahtumien hakua tarvitaan sekä opetustapahtumien käsittelyssä että raporttien tulostamisessa. Ohjeessa käsitellään
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.
Virhearviointi Fysiikassa on tärkeää tietää tulosten tarkkuus. Virhelajit A. Tilastolliset virheet= satunnaisvirheet, joita voi arvioida tilastollisin menetelmin B. Systemaattiset virheet = virheet, joita
KUVANKÄSITTELY THE GIMP FOR WINDOWS OHJELMASSA
KUVANKÄSITTELY THE GIMP FOR WINDOWS OHJELMASSA Ohjeistuksessa käydään läpi kuvan koon ja kuvan kankaan koon muuntaminen esimerkin avulla. Ohjeistus on laadittu auttamaan kuvien muokkaamista kuvakommunikaatiota
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
Siemens kuulokojeet ja. BestSound teknologia
Siemens kuulokojeet ja BestSound teknologia s 2010 1878 2008 1910 1949 2006 1959 1966 1987 1997 2002 2004 2005 Siemens kuulokojeiden teknologian kehitys 1878 Phonophor, Siemens kehittää ensimmäisen teknisen
Automaattinen regressiotestaus ilman testitapauksia. Pekka Aho, VTT Matias Suarez, F-Secure
Automaattinen regressiotestaus ilman testitapauksia Pekka Aho, VTT Matias Suarez, F-Secure 2 Mitä on regressiotestaus ja miksi sitä tehdään? Kun ohjelmistoon tehdään muutoksia kehityksen tai ylläpidon
S-108.3020 Elektroniikan häiriökysymykset. Laboratoriotyö, kevät 2010
1/7 S-108.3020 Elektroniikan häiriökysymykset Laboratoriotyö, kevät 2010 Häiriöiden kytkeytyminen yhteisen impedanssin kautta lämpötilasäätimessä Viimeksi päivitetty 25.2.2010 / MO 2/7 Johdanto Sähköisiä
r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
Integrointialgoritmit molekyylidynamiikassa
Integrointialgoritmit molekyylidynamiikassa Markus Ovaska 28.11.2008 Esitelmän kulku MD-simulaatiot yleisesti Integrointialgoritmit: mitä integroidaan ja miten? Esimerkkejä eri algoritmeista Hyvän algoritmin
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin
STS Uuden Tapahtuma-dokumentin teko
STS Uuden Tapahtuma-dokumentin teko Valitse vasemmasta reunasta kohta Sisällöt. Sisällöt-näkymä Valitse painike Lisää uusi Tapahtuma 1 Valitse kieleksi Suomi Välilehti 1. Perustiedot Musta reunus kieliversioneliön
Harjoitustehtävät ja ratkaisut viikolle 48
Harjoitustehtävät ja ratkaisut viikolle 48 1. Tehtävä on jatkoa aiemmalle tehtävälle viikolta 42, missä piti suunnitella älykodin arkkitehtuuri käyttäen vain ennalta annettua joukkoa ratkaisuja. Tämäkin
ENNAKKOTEHTÄVÄ 2016: Maisterivaiheen haku, tuotantotalous
Tampereen teknillinen yliopisto 1 (5) ENNAKKOTEHTÄVÄ 2016: Maisterivaiheen haku, tuotantotalous Yleiset valintaperusteet Tuotantotalouden hakukohteessa kaikkien hakijoiden tulee palauttaa ennakkotehtävä.
TAITAJA 2007 ELEKTRONIIKKAFINAALI 31.01-02.02.07 KILPAILIJAN TEHTÄVÄT. Kilpailijan nimi / Nro:
KILPAILIJAN TEHTÄVÄT Kilpailijan nimi / Nro: Tehtävän laatinut: Hannu Laurikainen, Deltabit Oy Kilpailutehtävä Kilpailijalle annetaan tehtävässä tarvittavat ohjelmakoodit. Tämä ohjelma on tehty laitteen
GSRELE ohjeet. Yleistä
GSRELE ohjeet Yleistä GSM rele ohjaa Nokia 3310 puhelimen avulla releitä, mittaa lämpötilaa, tekee etähälytyksiä GSM-verkon avulla. Kauko-ohjauspuhelin voi olla mikä malli tahansa tai tavallinen lankapuhelin.
Puhesynteesin perusteet Luento 5: unit selection -synteesi
Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen
etunimi, sukunimi ja opiskelijanumero ja näillä
Sisällys 1. Algoritmi Algoritmin määritelmä. Aiheen pariin johdatteleva esimerkki. ja operaatiot (sijoitus, aritmetiikka ja vertailu). Algoritmista ohjelmaksi. 1.1 1.2 Algoritmin määritelmä Ohjelmointi
OT2 Puheteknologian opintokokonaisuuden suunnittelu 14.4.2009 Kalle Palomäki
OT2 Puheteknologian opintokokonaisuuden suunnittelu 14.4.2009 Kalle Palomäki 1. Johdanto Puheteknologia on perinteisesti jaettu kolmeen tai neljään osa-alueeseen: puheen siirto, puhesynteesi, puheanalyysi
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
HUOLTAJAN OHJE TIETOJEN PÄIVITTÄMINEN HUOLTAJAKSI ILMOITTAUTUMINEN REKISTERÖITYMINEN
3.2.2016 vj Oikeudet: huoltaja HUOLTAJAN OHJE Tämä ohje on tarkoitettu partiolaisen huoltajalle. Ohjeesta selviää kuinka huoltaja voi toimia huollettavansa partiojäsenyyteen liittyvissä asioissa. Huoltajalla,
Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat
Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet
Otoskoko 107 kpl. a) 27 b) 2654
1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää
T Luonnollisen kielen tilastollinen käsittely Vastaukset 5, ti , 8:30-10:00 N-grammikielimallit, Versio 1.1
T-6.28 Luonnollisen kielen tilastollinen käsittely Vastaukset 5, ti 24.2.2004, 8:30-0:00 N-grammikielimallit, Versio.. Alla on erään henkilön ja tilaston estimaatit sille, miten todennäköistä on, että
MONISTE 2 Kirjoittanut Elina Katainen
MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi
Ohjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 16.2.2010 T-106.1208 Ohjelmoinnin perusteet Y 16.2.2010 1 / 41 Kännykkäpalautetteen antajia kaivataan edelleen! Ilmoittaudu mukaan lähettämällä ilmainen tekstiviesti
Elisa Kassa - Kassa käyttöliittymä
Elisa Kassa - Kassa käyttöliittymä Elisa Kassa sovelluksen päänäkymä voidaan jakaa kolmeen osaan. 1. Osuus käsittää asiakasta, tuotetta ja työntekijää koskevan tiedon. a. Asiakaskentästä voidaan etsiä
Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria
Lectio praecursoria Signal Processing Methods for Drum Transcription and Music Structure Analysis (Signaalinkäsittelymenetelmiä rumpujen nuotintamiseen ja musiikin muotoanalyysiin) Jouni Paulus 8.1.2010
OHJELMOINTILAITE 10/50
OHJELMOINTILAITE 10/50 1 2 3 4 5 6 17 16 15 7 14 8 13 12 11 10 9 1) Näyttö 1 taivutuksen nro. 2) Näyttö 2 kulma 3) LED merkkivalo MANUAALI 4) OFF-SET. 5) Taivutussuunta. 6) Palautus 7) Käynnistys ja resetointi.
Puhutun ja kirjoitetun rajalla
Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic
Opetustapahtumien hakeminen (Hae - Opetustapahtuma)
Helsingin yliopisto WinOodi 1 (5) Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Opetustapahtumien hakua tarvitaan sekä opetustapahtumien käsittelyssä että raporttien tulostamisessa. Ohjeessa käsitellään
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
Lue ohjeet huolellisesti ennen laitteen käyttöä.
1 Digitointi LP-levyltä CD-levylle (Ion CD Direct) Lue ohjeet huolellisesti ennen laitteen käyttöä. Soittimessa voi käyttää CD-R, CD+R, uudelleen kirjoitettavia CD-RW ja CD+RW levyjä. Yhdelle levylle voi
Tilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
DNA Netti. Sisältö. DNA Netti - Käyttöohje v.0.1
DNA Netti DNA Netti on Mokkuloiden yhteysohjelma. Ohjelman avulla voit hallita Mokkulan asetuksia sekä luoda yhteyden internetiin Mokkulan, WLANin tai Ethernet -yhteyden avulla. Sisältö DNA Netti - Testaa
Mittausjärjestelmän kalibrointi ja mittausepävarmuus
Mittausjärjestelmän kalibrointi ja mittausepävarmuus Kalibrointi kalibroinnin merkitys kansainvälinen ja kansallinen mittanormaalijärjestelmä kalibroinnin määritelmä mittausjärjestelmän kalibrointivaihtoehdot
RATKI 1.0 Käyttäjän ohje
RATKI RATKI 1.0 Käyttäjän ohje Ohje 0.5 Luottamuksellinen Vastuuhenkilö Petri Ahola Sisällysluettelo 1. Yleistä... 3 1.1. Kuvaus... 3 1.2. Esitiedot... 3 1.3. RATKIn käyttöoikeuksien hankinta... 3 1.4.
Nopea, hiljainen ja erittäin taloudellinen ilmanpoisto
Your reliable partner Nopea, hiljainen ja erittäin taloudellinen ilmanpoisto Vacumat Eco tehokas joka tavalla Veden laatu vaikuttaa tehokkuuteen Veden laatu vaikuttaa jäähdytys- ja lämmitysjärjestelmien
1. Skannaus ja tekstintunnistus (OCR) verkkoskannerilta
M-Files OCR M-Files OCR:n avulla voidaan skannattavalle paperidokumentille tehdä tekstintunnistus skannerista riippumatta. Tällöin tekstiä sisältävät kuvat tunnistetaan varsinaisiksi tekstimerkeiksi, jonka
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
Ohjeita uuden Sikavan käyttöön lääkekirjanpidossa
Ohjeita uuden Sikavan käyttöön lääkekirjanpidossa Taustaa Lääkelainsäädännön eläinlääkintään liittyvät lait ja asetukset muuttuivat vuonna 2014. Eläinlääkärillä on mahdollisuus luovuttaa lääkkeitä varalle
MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
9.5. Turingin kone. Turingin koneen ohjeet. Turingin kone on järjestetty seitsikko
9.5. Turingin kone Turingin kone on järjestetty seitsikko TM = (S, I, Γ, O, B, s 0, H), missä S on tilojen joukko, I on syöttöaakkosto, Γ on nauha-aakkosto, I Γ, O on äärellinen ohjeiden joukko, O S Γ
Ohjelmistojen mallintaminen, mallintaminen ja UML
582104 Ohjelmistojen mallintaminen, mallintaminen ja UML 1 Mallintaminen ja UML Ohjelmistojen mallintamisesta ja kuvaamisesta Oliomallinnus ja UML Käyttötapauskaaviot Luokkakaaviot Sekvenssikaaviot 2 Yleisesti
Suomen kielen Osaamispyörä -työkalu
Suomen kielen Osaamispyörä -työkalu Tavoitteet Kohderyhmät Käyttö Suomen kielen Osaamispyörän tavoitteena on tehdä näkyväksi maahanmuuttajataustaisten työntekijöiden suomen kielen osaamista. Osaamispyörä
Testejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen
Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä
Resusci Anne Skills Station
MicroSim Frequently Asked Questions 1 Resusci Anne Skills Station Resusci_anne_skills-station_tuning_parameters_sp7012_SF.indd 1 24/01/08 12:52:28 Tässä luvussa käsitellään määritysparametreja, jotka ovat
TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,
Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin
JOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ
TIEDEPOSTERI. - Viestinnän välineenä. Marisa Rakennuskoski
TIEDEPOSTERI - Viestinnän välineenä Marisa Rakennuskoski POSTERILAJIT Mainosposteri(pääpaino kuvilla ja visuaalisuudella) Ammatillinenposteri(vapaamuotoinen, esim. jonkin projektin tapahtumia kuvaava,
Seminaarityö. Puhujantunnistus Gaussian Mixture malleilla
Lappeenrannan teknillinen yliopisto Teknillistaloudellinen tiedekunta Tietotekniikan koulutusohjelma Seminaarityö Puhujantunnistus Gaussian Mixture malleilla Seminaaripaperin ohjaajana toimii TkT Leena
Algoritmit 2. Luento 3 Ti Timo Männikkö
Algoritmit 2 Luento 3 Ti 20.3.2018 Timo Männikkö Luento 3 Järjestäminen eli lajittelu Kekorakenne Kekolajittelu Hajautus Yhteentörmäysten käsittely Ketjutus Algoritmit 2 Kevät 2018 Luento 3 Ti 20.3.2018
Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4
Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...
9. Tila-avaruusmallit
9. Tila-avaruusmallit Aikasarjan stokastinen malli ja aikasarjasta tehdyt havainnot voidaan esittää joustavassa ja monipuolisessa muodossa ns. tila-avaruusmallina. Useat aikasarjat edustavat dynaamisia