Johdatus vuorovaikutteiseen teknologiaan 28.9.2011

Samankaltaiset tiedostot
Johdatus vuorovaikutteiseen teknologiaan TAUCHI Tampere Unit for Computer-Human Interaction

Kuuloaisti. Tavoitteena tänään

Johdatus vuorovaikutteiseen teknologiaan TAUCHI Tampere Unit for Computer-Human Interaction

Johdatus vuorovaikutteiseen teknologiaan

Johdatus vuorovaikutteiseen teknologiaan

Lue ohjeet huolellisesti ennen laitteen käyttöä.

KÄYTTÖOHJE FLSNIF KÄYTTÖÖNOTTO V2.2 ( ) 1 (5)

Markkinoiden helpoin ja käytännöllisin IP Kamera

Huomaathan, että ohjeessa olevat näytöistä otetut kuvat voivat poiketa sinun koulutuksesi vastaavien sivujen kuvista.

LaCRIS-ohjeet tiedekuntien ja yksiköiden henkilöstöhallinnolle Liisa Hallikainen

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

Windows Live SkyDrive - esittely

Lapsen osallisuus prosessissa Lasten ja edunvalvojien kokemuksia edunvalvojasta lastensuojelussa ja rikosprosessissa

TW- EAV510: WDS- TOIMINTO KAHDEN TW- EAV510 LAITTEEN VÄLILLÄ

Ulkoiset mediakortit Käyttöopas

Meneekö viesti perille?

SKYPE-RYHMÄN LUOMINEN

AIKA JA OPPIMINEN ASKO KARJALAINEN 2007 OULUN YLIOPISTO OPPIMISYHTEISÖT AJASSA SEMINAARI KUOPION YLIOPISTOSSA

Mielestämme hyvä kannustus ja mukava ilmapiiri on opiskelijalle todella tärkeää.

Väli- ja loppuraportointi

Puheenkäsittelyn menetelmät

Massaeditorikoulutus KANSALLISKIRJASTO - Kirjastoverkkopalvelut

Suomi toisena kielenä -ylioppilaskoe. FT Leena Nissilä Opetusneuvos, yksikön päällikkö OPETUSHALLITUS

Lomakkeiden suunnittelu. Aiheina

Learning cafen yhteenveto. Helsinki

Työtapaturman ilmoittaminen 2016-> Uusi sähköinen lomake, täyttäminen esimies ja palkkahallinto

LAPSEN VARHAISKASVATUSSUUNNITELMA

Kuulohavainnon perusteet

Hyvä vesihuoltohanke, suunnittelijan näkökulma

Kalenterimerkintöjen siirtäminen Notesista

Sähköpostiohjeet. Tehokas ja huoleton sähköposti

Yleistä. Digitaalisen äänenkäsittelyn perusteet. Tentit. Kurssin hyväksytty suoritus = Harjoitustyö 2(2) Harjoitustyö 1(2)

Asenna myös mikroskopian lisäpala (MBF ImageJ for Microscopy Collection by Tony Collins)

L2TP LAN to LAN - yhteys kahden laitteen välille

IV-kuntotutkimushanke_tutkijat

Käyttöohje. Energent MagiCAD plugin

Kirkas äly. Kultaiset kädet. Kuuma sydän

Punaisen Ristin valokuvaetsintä

TVT maasto-opetuksessa

Moodle HOPS-työskentelyn tukena

Yhteenveto. Aiheita lopuksi

MUUTOS 14! - Sosiaaliset kriteerit julkisissa hankinnoissa!

Skype for Business pikaohje

OUTI-verkkokirjaston opastus

Sisällysluettelo. HUOM! Muista lukea tämä opas huolellisesti ennen käyttöönottoa.

String-vertailusta ja Scannerin käytöstä (1/2) String-vertailusta ja Scannerin käytöstä (2/2) Luentoesimerkki 4.1

Johanna Björkell Mullista luokkahuoneesi ipadilla

HE 226/2008 vp. Esityksessä ehdotetaan muutettavaksi työttömyysturvalakia

Asenna myös mikroskopian lisäpala (MBF ImageJ for Microscopy Collection by Tony Collins)

Avoindata.fi. Palvelu julkishallinnon avoimen datan ja yhteentoimivuutta edistävien ohjeiden jakamiseen

PIKAOPAS Microsoft Surface Hub

Perusopetuksen aamu- ja iltapäivätoiminnan laadun arviointi 2016 Västankvarns skola/ Tukiyhdistys Almus ry.

Tapahtumapohjainen ohjelmointi

ABT 2000kg Haarukkavaunun käyttöohje

Puheentunnistuksesta potkua toimistotyöhön. Digikuntakokeilun verkostotapaaminen , Helsinki

1. Perusteita Äänen fysiikkaa. Ääniaalto. Aallonpituus ja amplitudi. Taajuus (frequency) Äänen nopeus

AJOK/KEAJ/IAJOK. Koetallennus

Racket ohjelmointia II. Tiina Partanen 2015

Teen koko ajan aktiivista mainontaa Googlessa. Tavoite on olla etusivulla, kun haetaan henkisiä tapahtumia, kursseja, yrittäjiä.

Isännän Ääni- Seuraseminaari. Kokkola SJK - juniorit

Suomen Lions-liitto ry Käyttäjätunnus ja sisäänkirjautuminen MyLCI - Käyttäjäohje Versio

Message Broadcasting. Käyttöympäristö. Message Broadcasting -laajennuksen asentaminen. Viestien luominen

ZA4727. Flash Eurobarometer 194 (Urban Audit Perception Survey) Country Specific Questionnaire Finland

Kuuloaisti. Korva ja ääni. Melu

2.2 Täydellinen yhtälö. Ratkaisukaava

Johdatus vuorovaikutteiseen teknologiaan TAUCHI Tampere Unit for Computer-Human Interaction

Tutkimusdatanhallinnan suunnittelu ja DMPTuuli-työkalu

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Raportointi hankkeen tulosten kuvaajana ja toteutuksen tukena

Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä

Palvelut nyt ja tulevaisuudessa

Matematiikan tukikurssi

Epsonin kokousratkaisut INTERAKTIIVISTEN PROJEKTORIEN PIKAOPAS

Asumisneuvonnan ja opastuksen tarpeet maahanmuttaja- /pakolaisväestön asumisessa Asumisneuvontakoulutus Helsinki

Mihin kotityöpalvelu perustuu asiakkaan kanssa tehtyyn sopimukseen

1 / 11. Digitaalisen arkkitehtuurin yksikkö Aalto-yliopisto. Pikaopas Maxwelliin. ARK-A2500 DA-alkeet Elina Haapaluoma, Heidi Silvennoinen Syksy 2015

II- luento. Etiikan määritelmiä. Eettisen ajattelu ja käytänteet. 1 Etiikka on oikean ja väärän tutkimusta

HP Mobile -kaukosäädin (vain tietyt mallit) Käyttöopas

Lupapiste-palvelua koskeva Yritystilisopimus

.tutkii yksilön FYYSISTÄ, PSYKOSOSIAALISTA ja KOGNITIIVISTA kehitystä syntymästä kuolemaan.

Yleinen osa - Kuntoutuksessa tukena,

Kokemusasiantuntijan tarina. Kasvamista kokemusasiantuntijaksi

Matkahuolto lisäosa WooCommerce alustalle (c) Webbisivut.org

2.2 Ääni aaltoliikkeenä

Linkkitekstit. Kaikkein vanhin WWW-suunnitteluohje:

Lausuntopyyntö STM 2015

Puheentunnistus Mikko Kurimo

Lastensuojelun edunvalvonnan kuntakartoitus Pilvikki Harju Sosiaalityön opiskelija

YLIOPISTOJEN YHTEISHAKU JA SÄHKÖINEN HAKUJÄRJESTELMÄ

SOUNDGATE. Yhteydessä maailmaan SoundGaten avulla

Veto-visualisointityökalu

9 Multimedian elementtejä: ääni Webissä

Paikallissivuston kumppanin starttipaketti

TILASTOLLINEN LAADUNVALVONTA

Kauppa osana monikanavaista verkostoa. Case Kesko Minna Kurunsaari

Tutustu merkintöihin! Tärkeää tietoa siitä, miten varmistat pesu- ja puhdistusaineiden käytön turvallisuuden kotona

L U PA T E H D Ä F I K S U M M I N. #Työ2.0

YKSINKERTAINEN NISSANCONNECT EV -PIKAOPAS

Me-säätiö. Vauhtia vaikuttavuusinvestoimiseen. Ulla Nord me. säätiö Me-säätiö

Katoavia virusinfektioita MPR-taudit. Labquality-päivät Irja Davidkin

Transkriptio:

Aiheina Kuuloaisti Saila Ovaska*) Informaatiotieteiden yksikkö, Tampereen yliopisto *) Osan luentokalvoista on laatinut Jenni Anttonen syksyllä 2009. Ihmisen kuuloaisti Äänet vs. melu Erot näköaistin avulla havaitsemiseen Erityisryhmien apuvälineitä Ääni ja puhe vuorovaikutuksessa tietokoneen kanssa Ääntä ja puhetta tietokoneen tulosteena Puhe syötteenä tietokoneelle Puhekomennot Puheentunnistus (esim. saneltaessa) Aihetta voi syventää kurssilla VTEKS301 Design and Development of Speech Interfaces Mitä äänellä voi tehdä? Ääntä käytetään hyväksi normaalissa työskentelyssä Esim. uuden henkilön tulo huoneeseen, puhelimeen vastaaminen, auton vikojen paikantaminen... Prosessinvalvonta, lennonohjaus Jopa tietokoneen kanssa työskennellessä: kovalevyn rapina, kirjoittimen rätinä Ääni antaa tärkeän ulottuvuuden kokemukseen Äänimaisema Ambient sound Tunnelman luojana esim. teatterissa Hiljaisuus ääni - melu Tavanomaisia väitteitä äänekkäitä käyttöliittymiä vastaan: Eikö työympäristö ole jo riittävän äänekäs? Eikö äänten lisääminen haittaisi työskentelyä? Eikö ajatus kulje parhaiten hijaisuudessa? Hiljaisuus Tavoiteltavaa? Tuskin mikään paikka enää hiljainen (ei edes kirjasto) Melu On ääntä, joka ei välitä informaatiota Äänisuunnittelun tavoitteena vähentää melun osuutta ja lisätä informaatiota välittävän äänen osuutta Miksi ääntä? Ääni täydentää näköhavaintoja Esim. tutkimukset videopelien pelaajista: ilman ääntä tulokset huononivat merkitsevästi Lisätty todellisuus Esimerkki: Listen Reader Syöttö Ääntä käyttöliittymissä Muu kuin puheääni (non-speech audio) tietokoneelle naksuttelu, viheltäminen, huutaminen... Puheääni (speech) äänikommentointi puheviestit (ääniposti)... järjestelmän ohjaus puhekomennoilla vapaa sanelu, puheentunnistus S. Joy Mountford, William W. Gaver, Talking and Listening to Computers. In The Art of Human-Computer Tulostus tiedon tai tapahtuman havainnollistus äänen avulla Ruudunlukija Apuvälineohjelma Puhetulostus Nauhoite tai synteettinen puhe Interaction, Brenda Laurel (ed.), Addison-Wesley, 1990, 319-334. Saila.Ovaska@cs.uta.fi 1

Korvan rakenne KUULOAISTI Ääni on ilman ainesosien liikettä. Ääni saapuu korvaan ulkokorvan ohjaamana. Tärykalvon värähtely etenee kuuloluiden kautta sisäkorvaan, jossa on kuulemiseen tarvittavia soluja. Risto Ilmoniemi, Ihmisaivojen rakenne ja toiminta. http://www.biomag.hus.fi/braincourse/l7.html Äänen ominaisuudet Äänien kuuleminen ääniaallon aallonpituus ääniaallon frekvenssi (taajuus aikayksikössä) tuottaa aistimuksen korkeasta tai matalasta äänestä (pitch) ääniaallon amplitudi (korkeus) tuottaa voimakkuusvaikutelman aika Ääniaallon ominaisuudet ovat fysikaalisia suureita Ihmisen aistiman äänen ominaisuudet Äänen voimakkuus (loudness) Äänen korkeus (pitch) Äänen sointi, äänenväri (timbre) Äänen kesto (duration) Hyvin matalat ja korkeat äänet jäävät kuulematta Harmaalla puheen ymmärtämisen alue Ikä vaikuttaa kuuloalueeseen Erityisesti korkeiden äänien kuuleminen heikkenee Lähde: http://www.biomag.hus.fi/braincourse/l7.html ERITYISRYHMIEN APUVÄLINEITÄ Ääni näkövammaisen apuvälineenä Ruudunlukija Windows Microsoft Narrator osana käyttöjärjestelmää kaupallisia esim. Jaws for Windows Jaws myös suomenkielinen puhesynteesi saatavilla Verkkosivujen esitys näkövammaista varten Aural Style Sheets osana verkkosivuja http://www.w3.org/tr/css2/aural.html Selainohjelmissa ei vielä toteutettu tukea esim. Fire Vox selainlaajennos Mukanakannettava laitteisto Esim. näkövammaisen tutka (voice, http://www.artificialvision.com/) http://www.youtube.com/watch?v=emjrhib6tda Saila.Ovaska@cs.uta.fi 2

Synteettinen ääni halvaantuneen apuvälineenä The Audeo puhetta ilman ääntä http://www.theaudeo.com/ Videoita: ALS-potilaan apuna http://www.youtube.com/watch?v=-bz_kivrdqo Kenelle tahansa(?): mobiilikäyttöliittymä http://www.youtube.com/watch?v=xyn4viz21n0 ÄÄNI TULOSTEENA - äänipalautteet (non-speech audio) ja puhe(synteesi) Kuvat: http://www.popsci.com/scitech/article/2009-05/electronic-voice-box Palautteena käyttäjälle ääntä vai kuvaa? Windows-äänimaailmaa Ääni Käyttäjän ei tarvitse olla näköyhteydessä Samanaikaisten viestien määrä on rajoitettu Aikaan sidottu: käytettävissä vain hetkellisesti Sopii muuttuvien tapahtumien esittämiseen Vertaa: liikkuva kuva, animaatiot Kuva (viestiruutu näytöllä) Paikkaan sidottu: käyttäjän on oltava näköyhteydessä Useiden samanaikaisten viestien mahdollisuus Ajasta riippumaton: voidaan lukea myöhemminkin Sopii vain staattisten asioiden esittämiseen Default sound Information Notification Warning Error Hardware insert Recycle http://www.guidebookgallery.org/sounds Tiedon tai tapahtuman havainnollistus Käyttöliittymissä voi käyttää apuna keksittyjä, abstrakteja ääniä viestimään käyttäjälle jostakin kohteesta, operaatiosta tai vuorovaikutuksesta Auditory icons Havainnollisia, luonnollisia ääniä, intuitiivinen linkki äänen ja tapahtuman välillä Earcons Abstrakteja, synteettisiä ääniä, jotka muodostavat auditiivisesti koodatun viestin Käyttäjän on opittava äänen merkitys Gaver, W. (1986). Auditory Icons: Using sound in computer interfaces. Human Computer Interaction, 2(2), pp. 167-177 http://www.dcs.gla.ac.uk/~stephen/generalearcons/generalearcons1.shtml Earcon-esimerkki Hierarchical earcons Jokaisella valikolla oma sointi (eri soitin) Valikon valinnoilla erilainen rytmi, sointi ja korkeus Valikko 1 Valikko 2 Open Close Edit Yhdistelmä-ääni: Copy Move Undo An example of an earcon hierarchy showing sounds that could be used to represent errors. http://www.dcs.gla.ac.uk/~stephen/earcon_guidelines.shtml Saila.Ovaska@cs.uta.fi 3

Milloin ääntä? Puheen tallennus tietokoneessa Käytä käyttäjälle annettavan sanoman ilmaisemiseen ääntä (puhetta tai muuta ääntä) jos Sanoma on yksinkertainen ja lyhyt Sanomaan ei viitata myöhemmin Sanomalla on aikayhteys Sanoma vaatii välitöntä toimenpidettä Visuaalinen järjestelmä on ylikuormitettu Valaistusolot ovat huonot Vastaanottaja liikkuu ympäriinsä (koneen lähellä) jatkuvasti Laite on kannettava mukana Autolla ajettaessa - silmät tiessä, ei näytössä Digitoitu puhe Nauhoite Luonnollista Vaatii kuitenkin puhujan! Esimerkiksi sanakirjan lausuntaohjeet Synteettinen puhe Puheen tuottamista synteettisesti Luonnolliselta kuulostava puhe on teknisesti haastavaa tuottaa Vie vähän tilaa koneen muistista (tallennetaan tekstinä) Tietokone tuottaa synteettistä puhetta Puhekäyttöliittymällä kasvot? TTS = Text to Speech Synthesis Suomenkielinen puhesynteesi esimerkiksi Mikropuhe: demo http://www.mikropuhe.com/live/ Suopuhe (Hgin yliopisto) Bitlips: demo http://www.bitlips.fi/tts/demo.cgi Loquendo: demo http://tts.loquendo.com/ttsdemo/default.asp Yhdistettynä ns. puhuvaan päähän http://www.bitlips.fi/kimmo/ Persoonallista puhetta? Äänen avulla muodostetaan mielikuva puhujasta Milloin tietokoneen avulla tuotettu puhe voisi olla persoonallista? ÄÄNI SYÖTTEENÄ - ääniohjaus ja puheentunnistus Saila.Ovaska@cs.uta.fi 4

Ääni ja puhe syötteenä Ääntä ja puhetta voi käyttää syötteenä tietokoneelle Ääntä (non-speech) on käytetty jonkin verran syötteenä koneelle esimerkiksi peleissä (esimerkiksi Kukakumman kiljahdukset) Myös erilaisia taputuksia ja sormien napsautuksia on käytetty komentoina Luonnollisen puheen käyttö syötteenä tietokoneelle on haastavaa sekä puheen tuottaminen ihmiselle että puheentunnistus hahmontunnistustehtävänä tietokoneelle Puhe vaatii kognitiivista prosessointia Puheen tuottaminen ja kuuntelu kuluttaa samaa kognitiivista kapasiteettia kuin tehtävän ratkaisukin Hiiren käytössä tarvittava käden ja silmän koordinaatio ei kuluta samalla tavoin kognitiivisia resursseja Ben Shneiderman, The limits of speech recognition. Comm. ACM 43:9, September 2000, 63-65. Puheentunnistus Puheentunnistus Puheen avulla voi antaa järjestelmän ohjaamisessa mahdollisia komentoja Vrt. Aibo-koira, stand up, sit! Suomenkielinen esimerkki: Fonecta puheohjattava numerohaku sano kyllä tai ei Kummalla on aloite keskustelussa, tietokoneella vai ihmisellä? Kai-Fu Lee, Fundamentals of speech recognition -video Puheentunnistuksen edut Luonnollisuus Nopeus komentojen annossa Voi olla yhtenä samanaikaisena modaliteettina käytössä (esim. hiiri & näppäimistö ja puhekomennot) Puhe ei sido käsiä eikä vaadi sitä, että katsottaisiin näyttöä Puheentunnistuksen haasteita Puheentunnistuksen haasteet (Kai-Fu Lee) Puhekäyttöliittymissä tarvittava puheentunnistus on vaikeata Miksi? Foneemien tunnistus äänisyötteestä Jatkuva puhe vs. yksittäiset sanat Puhuja- ja ympäristökohtaiset erot Puheen merkityksen ymmärtäminen Puheentunnistuksen kehityskulkua: tunnistusvirheiden suhteellinen osuus > 10% Saila.Ovaska@cs.uta.fi 5

Puheentunnistuksen haasteet Puhekäyttöliittymissä tarvittava puheentunnistus on yhä vieläkin virhealtista Väärin tunnistettuja sanoja vieläkin paljon (esim. Vistassa) MUTTA: Boyce, Natural spoken dialogue systems for telephony applications Comm. ACM 43:9, Sept. 2000. Mistä soittaja tietää, että puhuu koneelle? Tutkimus: tietokoneen alkurepliikki palvelussa soittajan käyttämä sanamäärä Dialogin suunnittelu? Boyce, Comm. ACM 43:9, Sept. 2000. Puhekäyttöliittymä Esimerkki: Ravintolahaku ei sovellu kaikkiin käyttötilanteisiin ei toimi samalla tavalla kuin ihmisten välinen vuorovaikutustilanne Tunnistusongelmaa yritetään helpottaa: sallitaan sanoa vain yksi sana kerrallaan tajataan järjestelmän sanavarasto; sanat on tunnettava rajataan puhekomennon sallittuja muotoja (missä järjestyksessä komennon osat annetaan) lisätään tunnistukseen avuksi tietoa siitä, mitkä sanat ovat mahdollisia tässä yhteydessä koulutetaan puheentunnistinta tunnistamaan käyttäjän ääni Miten puheentunnistusta on tehty helpommaksi seuraavassa esimerkissä? Miten käyttäjää avustetaan? Speechworks Foodline Ravintolahaku Käytössä New Yorkissa n. v. 2000 Yhteenveto: ääni voi olla taustalla Vaikuttaa käyttäjäkokemukseen vrt. elokuvat olennainen osa järjestelmän antamaa palautetta jos käyttäjän tulee reagoida tapahtumaan, ääni herättää huomion Huomaa: ihmisen kuuloaistia voisi hyödyntää nykyistä enemmänkin annettaessa palautetta esim. University of Glasgow: Shoogle http://www.dcs.gla.ac.uk/~rod/videos.html Yhteenvetoa: puhekäyttöliittymät Puhekäyttöliittymät ovat yleistymässä esimerkkejä mm. http://www.nuance.com/talk/ ja http://www.nuance.com/speech/demos/ ja http://www.puheentunnistus.fi Saila.Ovaska@cs.uta.fi 6

Soittajan apuna? Millerin 7+-2 sääntö! Toteutuskieli VoiceXML (vuorovaikutteisille puhelinsovelluksille) Google video Vaatii erityistä ohjelmistotukea, monta eri valmistajaa Yhteenvetoa: puheentunnistus yhtenä modaaliteettina Puheena annetut syötteet voivat olla yksi modaliteetti järjestelmää ohjattaessa esim. Windows Vista Puhekomennot nopeampaa antaa kuin näppäimistö + hiiri Puhe vapauttaa käyttäjän liikkumaan... ja kädet irti hiirestä Usein käytössä yhdessä muiden modaliteettien kanssa Esim. puhelimessa: vaihtoehtoiset syötteenantotavat hyväksytään joko puheella tai kosketusnäytöltä tai näppäimistöltä annetut komennot tuo lisää kanavia käyttäjän ja koneen välille luonnollisempi (?) vuorovaikutustilanne Puheentunnistus osana multimodaalista järjestelmää Puheentunnistus tärkeä kun halutaan tarjota vaihtoehtoisia modaliteetteja niille, joilta puuttuu kyky tai mahdollisuus operoida peruskäyttöliittymän parissa näkövammaiset kirjoitustaidottomat, lapset autoilijan (tai kadulla kävelijän) hands free Joskus käytössä samanaikaiset, toisiaan täydentävät kanavat Jos puheentunnistuksessa tulee virhe, ehkä muista syötevirroista (esim. katse) saadaan tietoa, josta käyttäjän tavoite voidaan päätellä Kehityssuunta: jokapaikan tietotekniikka Saila.Ovaska@cs.uta.fi 7