Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

Samankaltaiset tiedostot
Tekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi

Puheenkäsittelyn menetelmät

JOHDATUS TEKOÄLYYN TEEMU ROOS

Puheentunnistus Mikko Kurimo

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Muuttaako tekoäly maailmaa - ja miten? Kansainvälinen Telepäivä

Tapaustutkimus big data -analytiikkakoulutuksen suunnittelusta

Digitalisaatio oppimisen maailmassa. Tommi Lehmusto Digital Advisor Microsoft Services

TST Tehtävä ulkomailla TTY:n Amazing Race

Tekoäly muuttaa arvoketjuja

LUONNOLLINEN KIELI JA TEKOÄLYN KOGNITIO

IoT-platformien vertailu ja valinta erilaisiin sovelluksiin / Jarkko Paavola

Puheentunnistus ja synteettinen puhe

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Data-analyysi tieteenalana Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto

Amazon Web Services (AWS) on varmaankin maailman suosituin IaaS-tarjoaja. Lisäksi se tarjoaa erilaisia PaaS-kategoriaan kuuluvia palveluita.

Logistiikkapalvelujen digitalisaatio kuljetusyrittäjän näkökulmasta

Asiakaskohtaisesta varmistuspalvelusta pilvivarmistamiseen. Pasi Haatanen

OT2 Puheteknologian opintokokonaisuuden suunnittelu Kalle Palomäki

Johdatus tekoälyn taustalla olevaan matematiikkaan

Tee-se-itse -tekoäly

ESIMERKKIPOHJAINEN MELUISAN PUHEEN AUTOMAATTINEN TUNNISTUS 1 JOHDANTO 2 ESIMERKKIPOHJAINEN PUHEENTUNNISTUS

Tekoäly tukiäly. Eija Kalliala, Marjatta Ikkala

ACCOUNTOR ICT Digitaalinen työympäristö Markkinatutkimus joulukuu 2018

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Semantic Web käytännön sovelluksissa. TkT Janne Saarela Profium Oy

Ohjelmistopohjainen puhelinviestintä. Ari Auvinen Senior PTS

Tekstien ääniä. Tommi Nieminen Itä-Suomen yliopisto

Kielen ymmärtäminen kieliteknologian näkökulmasta. Kimmo Koskenniemi täysinpalvellut kieliteknologian professori Helsingin yliopisto

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN

KYMENLAAKSON AMMATTIKORKEAKOULU Tietotekniikan koulutusohjelma / Tietoverkkotekniikka

ERILAINEN OPPIMINEN Susanna Maijanen, Erilaisten oppijoiden liitto ry

The OWL-S are not what they seem

IoT-järjestelmän ja ulkovalaistuksen ohjauksen hankinta -markkinavuoropuhelutilaisuus

ANVIA PILVI. kotimaisia pilvipalveluita yrityksille 24/7

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Mitä uutta ConfigMgr 2012 SP2 ja 2016? Panu Saukko ProTrainIT Oy

Luento 12: XML ja metatieto

Tekoäly liiketoiminnassa. Tuomas Ritola CEO, selko.io

Loikkaa turvallisesti pilveen

Johdatus vuorovaikutteiseen teknologiaan

ADOBE CONNECT PRON GUEST KÄYTTÖOHJE Mari Jokiniemi. Sisällysluettelo

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

Digitaalinen audio

Myynnin robotisaatio Kokemuksia protojen toteuttamisesta

Järjestelmäarkkitehtuuri (TK081702) Avoimet web-rajapinnat

Johdatus vuorovaikutteiseen teknologiaan TAUCHI Tampere Unit for Computer-Human Interaction

Johdatus vuorovaikutteiseen teknologiaan

Tekoäly ja tietoturva Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto

Kuulokoje, joka avaa maailmasi

TkK-tutkielmat

ICT:n sosiaalinen käytettävyys

Tilaisuus alkaa klo 9 ( ). #digibarometri Wi-Fi: FinlandiaHall

Radio R 4.0 IntelliLink Usein kysytyt kysymykset

Copyright Observis Oy All rights reserved. Observis Oy Ville Kanerva, CTO Heikki Isotalus, COO Datasta tietoa

Pilivipalavelut Cloud Business 2012 Parempaa paikallista pilveä

Edtech kestää aikaa!

KOHTI TIETOISIA ROBOTTEJA

Erikoiskirjastot somessa. Päivikki Karhula, johtava tietoasiantuntija Eduskunnan kirjasto

Tekoälyn perusteita ja sovelluksia (TIEP1000)

JOHDATUS TEKOÄLYYN TEEMU ROOS

KEINOÄLY PROJEKTIKOKEMUKS IA

Interaktiivisten järjestelmien arkkitehtuuriratkaisu, jolla käyttöliittymä erotetaan sovelluslogiikasta.

Oulu D.C. kapasiteettipalveluita oululaiseen ekosysteemiin

pilvipalvelu tarkoittaa?

PLAY. TP1 Mobiili musiikkikasvatusteknologia MEDIAT Kuvan ja äänen tallentaminen, muokkaaminen ja jakaminen (v1.1)

Sopimusten Verkkopankki

Mennäänkö pilveen? Klo 08-10

Automaatio mahdollistaa Software as a Service - arkkitehtuurin

Tommi Saari Tekstieditorin puheohjaus. Diplomityö

Tekoäly tänään , Vadim Kulikov (Helsingin Yliopisto)

Tiedon suojaaminen ja hallinta. Sytyke seminaari

TIETOJÄRJESTELMIEN AMMATILLISET ERIKOISTUMISOPINNOT (30 op)

Tarjotusta tallennusjärjestelmästä pitää olla mahdollista siirtää kapasiteettia hybrid cloud -ympäristöön ilman erillisiä lisähankintoja.

Pilvi mitä, miksi ja miten

Johdatus vuorovaikutteiseen teknologiaan TAUCHI Tampere Unit for Computer-Human Interaction

Sonera sovelluspalomuurin muutoshallintaohjeistus

Teollisuusmatematiikka. Samuli Siltanen Matematiikan ja tilastotieteen laitos Helsingin yliopisto Tieteen päivät

Älykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach

JHS 179 Kokonaisarkkitehtuurin suunnittelu ja kehittäminen Liite 9. Virtualisointi ja pilvipalvelut teknologia-arkkitehtuurin suunnittelussa

Tuotannon laitteiden käyttöasteen seuranta

Tekoäly ja data science mistä on kyse? Data Scientist Jukka Kärkimaa, Tilastokeskus

Yhteisöllisen tuotekehyksen avoin verkkolaboratorio. Asta Bäck

AuroraAI: Työpaketti 4

ArcGISSM. Online. Paikkatietoalusta organisaatiollesi

EDC TYÖMAAJÄRJESTELMÄ

Tech Conference Office 365 tietoturvan heikoin #TechConfFI

Laitteessa tulee olla ohjelmisto tai uudempi, tarvittaessa päivitä laite

Ennakoiva analytiikka liiketoiminnassa

Tarjous sidonnaisuuspalvelusta

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

Tekoäly ja sen soveltaminen yrityksissä. Mika Rantonen

Tietohallintopäällikkö Ari Apilo

LAULUMUSIIKIN PÄÄAINE I

Viestinvälitysarkkitehtuurit

Verkkosivujen analytiikkapalvelut -kilpailutus

JAANA KORPELA KÄSINKIRJOITETTUJEN NUMEROIDEN TUNNISTUS NEU- ROVERKKOJEN AVULLA. Kandidaatintyö

Miten ja milloin ohjelmistorobotiikka ja tekoäly tulevat yrityksiin ja mitä IT-johdon tulisi tehdä asialle

PELEILLÄ KETTERYYTTÄ TERVEYDENHUOLTOON

Transkriptio:

Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018

Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex

Puheentunnistus Yleisesti

Puheentunnistus Yleisesti Puheentunnistus on automatisoitua puheen muuttamista tekstiksi tai semanttiseksi tiedoksi. Poikkitieteellinen ala kielitieteiden ja tietojenkäsittelyn välillä. Nykyään toteutetaan useimmiten neuroverkoilla. Käytössä useissa arkipäivän toimissa sekä töissä. Tämän jatkeeksi voidaan tehdä esimerkiksi chattibotteja.

Käyttökohteita Puheentunnistusta käytetään yleisimmin: Henkilökohtaisissa assistenteissa: Siri, Cortana, Alexa, Google Assistant Puhelinboteissa asiakkaille Diktatoinnissa, transkriptoinnissa: Youtube transcript Ajoneuvoissa (autot, lentokoneet) Invalidien apuna Kielten kääntämisessä Pilot / WT2 kieltenkääntäjät

Cortana Useat tietokoneohjelmat käytössä puhekomennoilla, ts. korvaa näppäimistön. Toimii assistenttina joka ymmärtää kalenteria, viestejä sekä toimii viihdykkeenä. Tukee useita kieliä. Yhdistettiin Alexan kanssa hetki sitten. 1 1 https://www.microsoft.com/en-us/cortana

Google Voice Yksi alan perusteellisimmista tuotteista. Puhelinpalvelu jossa puheentunnistin käytössä esim., voicemailin transkriptiossa. 2 2 https://ai.googleblog.com/2015/09/google-voice-search-faster-andmore.html

WT2 Kuuloke joka toimii tulkkina yli kymmenelle kielelle. Reaaliaikainen. 3 3 https://www.wt2.co/

Chattibotin Luonti

Chattibotin Luonti Tarvitaan puheentunnistin, ASR (Automatic Speech Recognition), mikä muuntaa äänen tekstiksi. NLP-järjestelmä (Natural Language Processing) joka tunnistaa tekstistä elementtejä (sanoja, merkityksiä). Järjestelmä joka päättää mitä vastata elementtien perusteella. Vastaukset mahdollisia tekstinä tai puhesynteesinä. 4 4 https://technologyadvice.com/blog/marketing/chatbots-consumers-wantexpect/

Puheentunnistimen Luonti Hyviä tuloksia Recurrent Neural Networkeilla (RNN). Tarvitaan opetusdataa (akustisia näytteitä) ja oikeita vastauksia (foneemeja, sanoja) annetusta aihealueesta ja kielestä. Opetetaan neuroverkkoa kunnes tulokset kelpaavat. Oletuksia tekstin semantiikasta jo täällä, sillä pitää tarvittaessa arvata mitä sanottiin. 5 5 https://www.slideshare.net/aifrontiers/jeff-dean-trends-anddevelopments-in-deep-learning-research

Neuroverkoista Kuvassa RNN-arkkitehtuuri. Data (X) syötetään alhaalta, josta muodostetaan hypoteesi (h) datan merkityksestä. Neuroni (A) muistaa edeltävän ajan tilan syöttämällä tiedon itseensä. 6 6 http://colah.github.io/posts/2015-08-understanding-lstms/img/rnnunrolled.png

Reagointi Sääntöpohjainen tapa: Toimii joka kerta kuten suunniteltu, helppo toteuttaa. Jokainen tapaus pitää vain erikseen määritellä itse. Koneopittu tapa: Oppii joustavamman tavan tunnistaa ja reagoida eri skenaarioihin. Opettaminen vaatii paljon vaivaa, ja välillä voi olla arvaamaton.

Puhesynteesi Neuroverkoilla voidaan toteuttaa myös puhesynteesiä. Teksti muutetaan puheääneksi, joka kuulostaa inhimilliseltä intonaatioiden kera. WaveNet 7 7 https://deepmind.com/blog/wavenet-generative-model-raw-audio/

Esimerkkinä - Amazon Lex

Amazon Lex AWS:ssä toimiva alusta puheentunnistusjärjestelmien ja chattibottien luomiseen. Pohjautuu Alexan teknologiaan. 8 8 https://aws.amazon.com/lex/

Amazon Lex Kykenee tunnistamaan homonyymejä ja keskustelun kontekstin. Vastaukset tulevat millisekunneissa. 9 9 https://aws.amazon.com/lex/

Amazon Transcribe Muuntaa äänen tekstiksi. Tunnistaa useammat puhujat ja homonyymit. Tuki useanlaiselle käyttötarkoitukselle. Sanoja voi lisätä. 10 10 https://aws.amazon.com/transcribe/

Testausta Google Cloud Speech-to-Text Dictation.io Amazon Lex

Lähteitä Pilvipalveluissa valmiita sovelluksia, sekä kehitysympäristöjä: Amazon Web Service (AWS) ja Microsoftin Azure. Githubista löytyy useita valmiita ratkaisuja, vaatii koodausta käyttöönottoon. https://aws.amazon.com/lex/ https://cloud.google.com/speech-to-text/ https://dictation.io/ https://github.com/lucko515/speech-recognition-neuralnetwork