Vfo254: Puhekorpusten käyttö

Koko: px
Aloita esitys sivulta:

Download "Vfo254: Puhekorpusten käyttö"

Transkriptio

1 Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan keräys Puheen annotointi Korpusten käyttö tutkimuksessa Ja käytännön harjoituksiin, joissa opitaan suunnittelemaan, tallentamaan ja annotoimaan puhekorpuksia. Kurssin harjoitustyönä tehdään pieni foneettinen tutkimus aikaansaadulla korpuksella. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 1 Aikataulu ja kurssin sisältö Puhekorpukset ja puhetietokannat Torstai Perjantai Esittely 8.3. Puheen segmentointi Puhekorpusten suunnittelu Puheen segmentointi Puheen annotointi Äänitysten teko (TKK?) Prosodian annotointi (Werner, JOY) 5.4. Äänitysten segmentointi QuickSig (Altosaar, TKK) Haut ja analyysit Korpusten käyttö Haut ja analyysit Puhekorpus Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen lueattavassa muodossa ja on annotoitu sekä dokumentoitu siten, että sitä voi käyttää yhä uudelleen organisaation sisällä (in-house) tai sen ulkopuolella. Näin ollen, esim. yleisradioiden tallenteet jäävät määritelmän ulkopuolelle. Määritelmä koskee siis, esim. joukkoa puhesignaali-, laryngografi- ja EMG-signaaleja, sillä ehdolla, että ne on sopivasti annotoituja ja dokumentoituja. Tavallisen äänisignaalin lisäksi voimme siis sisällyttää korpukseen kaikenlaisia muitakin, joko tallennettuja tai alkuperäisestä signaalista analysoituja, signaaleja. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 2 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 3

2 Puhekorpukset ja puhetietokannat Puhekorpukset ja puhetietokannat Puhekorpus sisältää siis puhesignaalin lisäksi: Annotaatiot Tiedot puhujasta: ikä sukupuoli äidinkieli murretausta yms. Mahdollisimman paljon tietoa itse äänityksestä: Äänityspaikan sijainti ja laatu Mikrofoni ja tallennintyyppi Äänitysaika yms. Yllä oleva informaatio ei ehkä vaikuta kiinnostavalta, mutta se voi olla hyvinkin tärkeätä jossain myöhemmässä vaiheessa! Tyypillisesti puhekorpukset sisältävät seuraavia asioita: Digitoidut signaalit: akustinen puhesignaali, laryngografin signaali, röntgen data. Analyysien tulokset: FFT data, LPC data, perustaajuus- ja äänekkyysdata, formantit. Markkerit: äänihuuliperiodit, vokaalien alut. Kuvailut: puhujien kuvailut, äänitysolosuhteet. Annotaatiot: (engl. annotations/labels), ortografiset, foneemiset, foneettiset, prosodiset transkriptiot. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 4 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 5 Puhekorpukset ja puhetietokannat Puhekorpuksen käyttöön saattaminen koostuu kolmesta vaiheesta: 1. Vaihe ennen äänityksiä = suunnittelu 2. Äänitysvaihe 3. Jälkikäsittelyvaihe = annotointi, analyysit Vaihe, ennen äänitystä sisältää seuraavat askeleet: 1. Korpuksen tarkoituksen määrittely 2. Korpuksen lingvistisen sisällön määrittely 3. Puhujien tyypin ja lukumäärän määrittely Puhekorpukset eroavat tekstikorpuksista ainakin kahdeksalla tavalla, jotka riippuvat seuraavista asioista: 1. puhe on katoavaista, teksti pysyvää, 2. puheen ja tekstin tuottoon kuluva aika ei ole sama, 3. virheiden rooli on erilainen, 4. kirjoitetut ja puhutut sanat eroavat toisistaan, 5. erilaiset tietorakenteet: ASCII vs. näytteistetty data, 6. syyt, jotka johtavat korpusten erilaisiin kokoihin, 7. kirjoitetun ja puhutan materiaalin laillisen statuksen erot, ja 8. kirjoitettu kieli on symbolista ja puhe fyysisesti mitattavaa jatkuvaa signaalia ajassa! Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 6 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 7

3 1. Puhe on transienttia Puhe katoaa heti kun se on tuotettu: kirjoitus säilyy! Puhe on siis erikseen tallennettava sen kerääminen ei ole triviaali asia, kuten on (yleensä) laita kirjoitetun tekstin kanssa. 2. Puheentuottoon käytetty aika on vähäistä Puheentuottoon kulunut aika on yleensä puhumiseen kulunut aika. Puhe tuotetaan keskimäärin tavua minuutissa. Kirjoittamiseen käytetään yleensä huomattavasti enemmän aikaa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 8 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 9 3. Puhe on täynnä virheitä Spontaanissa puheessa puhujan editointi on kuuluvaa ja jää mukaan tallenteeseen. Keskeytykset, hesitaatiot, toistot ja korjaukset ovat olennainen osa puhetta ja tulee säilyttää (spontaanin puheen) korpuksissa. Tekstikorpuksissa kirjoittajan suorittamat korjaukset ovat jo editoidut pois. Puhekorpuksissa suuntaus on kohti spontaania puhetta luettu laboratoriopuhe on väistymässä. 4. Sanat vaihtelevat foneettisesti Puhutut versiot ortografisesti identtisistä sanoista osoittavat yleensä suurta foneettista variaatiota sekä segmentaalisesti että prosodisesti. Sanat saattavat jopa kokonaan kadota tai jäädä vain jonkin segmentaalisen tai prosodisen vihjeen varaan: onko sinulla se onksuse. Erillään lausutut sanat ovat jatkuvaan puheeseen verrattuna hyvinkin erilaiset: kanoninen tai sitaatiomuoto. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 10 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 11

4 Näin ollen on tärkeää, että korpukseen tallennetaan ainakin kahden, mieluummin kolmen tasoista, symbolista kuvausta, joilla kaikilla on suhde akustiseen signaaliin: 1. Puhutut sanat erotetaan leksikaalisesti ortografisella tasolla. 2. Sanat tulisi esittää myös karkealla foneettisella kirjoituksella ns. sitaatiomuodoissaan, jotka voidaan tuottaa esim. automaattisella grafeemi-foneemi -konversiolla. 3. Todelliset foneettiset kuvaukset tulee tehdä ns. kapealla tarkekirjoituksella, jonka symbolit suhteutetaan ajallisesti signaaliin, joko manuaalisesti tai automaattisesti. 5. Tallennettu puhe on vain aikafunktiota Puhtaana datana, kirjoitetut tekstit koostuvat lähinnä merkeistä, jotka voidaan koodata joko 7, 8 tai 16 bittisinä ASCII- tai Unikoodimerkkeinä. Koodatut merkkijonot sisältävät jo sellaista informaatiorakennetta, joka ei ole läsnä puhesignaalissa. Puhesignaali ei sisällä eksplisiittisiä sanarajoja, pilkkuja, pisteitä, huutomerkkejä jne. Tallennettu puhesignaali on primäärisesti vain digitalisoituja aikafunktioita. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 12 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo Puhe vaatii paljon tilaa Tallennettu puhe vie huomattavasti enemmän tilaa kuin vastaava ASCII-muotoinen data. Kolmikirjaimen sana vie vain kolme tavua (byte) tilaa kun vastaava digitoitu, puhuttu sana vie huomattavasti enemmän. Kolme äännettä: 0.5 s, 16 bittisellä kvantisoinnilla ja 48 khz:n näyttenottotaajuudella kirjoitutun ja puhutun tallenteen suhteeksi tulee 1/16000! Toisaalta puhuttujen muotojen erilaisuus vaatii jokaisen sanan tallentamista useaan kertaan riippuen puhujasta, puhetyylistä. Näin ei kuitenkaan kovin usein tehdä. 7. Puhe tuo lisää laillisia ongelmia Yleensä kirjoitetut tekstit on jo julkaistu, jolloin niiden käyttö määräytyy olemassaolevien lakien ja säännöstöjen mukaan: lait voivat mutkistaa tai estää korpusten jakamisen käyttäjille. Puheen kannalta tilanne voi olla vieläkin mutkikkaampi: valmiiksi äänitetty materiaali voi tuottaa ylitsepääsemättömiä ongelmia, joista itse äänitettävällä materiaalilla selviää tekemällä puhujan kanssa sopimuksen ennen äänittämistä. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 14 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 15

5 8. Puhe on jatkuvaa! Digitoitu signaali ei itsessään sisällä minkäänlaisia kategorioita kuten on laita kirjoitetun ASCII-datan kanssa. Nykyisillä tekniikoilla ei ole periaatteessa edes mahdollista (varmasti) sanoa, onko jokin signaali puhetta vai ei: puhedatan kategorioiminen annotaatioiksi vaatii aina manuaalista käsittelyä ja inhimillistä tulkintaa. Toisaalta puhesingnaali sisältää relevanttia prosodista ja paralingvististä informaatiota, jota teksti ei sisällä. Foneettinen tutkimus Foneettiseen tutkimukseen kuuluvat kaikki puheeseen liittyvät tekijät: usein tutkimus vaatii tarkasti kontrolloitua ja systemaattista dataa jonka tutkijat joutuvat keräämään erikseen. Kiinnostus spontaania ja vähemmän kontrolloitua puhetta kohtaan on kuitenkin antanut foneetikoillekin mahdollisuuden käyttää jo valmiita korpuksia. Spontaanin puheen tilastollinen kuvaus vaatii kaiken lisäksi suuria määriä dataa, jonka keräämiseen ja annotointiin yksittäisellä tutkijalle ei ole mahdollisuuksia. Tämä lisää edelleen spontaanin puheen korpusten arvoa foneettisessa tutkimuksessa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 16 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 17 Sosiolingvistinen tutkimus Sosiolingvistinen puheentutkimus on yleensä pohjautunut kolmella tavalla hankittuun dataan: 1. Kirjoitettujen kyselyiden avulla: esim. miten vastaajat mielestään lausuvat tietyn sanan. 2. Tutkijan observaatioiden pohjalta: esim. Labovin tutkimukset /r/:n ellipsiksestä New Yorkilaisilla puhujilla. Labov yksinkertaisesti kirjasi, onko puhujalla kyseistä äännettä tietyissä sanoissa. 3. Keräämällä puhekorpuksia: perkeptuaalista analyysiä on tuettu keräämällä korpuksia. Psykolingvistinen tutkimus Psykolingvistinen tutkimus on hyvin laajaa: se vaihtelee lapsen kielen oppimisen tutkimisesta aikuisten kielen ymmärtämisen liittyvien mentaalisten prosessien tutkimukseen aina kielen häiriöiden tutkimukseen. Yksi alue, jossa psykolingvistit ovat käyttäneet puhekorpuksia on ns. lipsahdusten tutkimus. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 18 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 19

6 Lapsen kielen kehitys Lapsen kielen kehitystä tutkitaan monilla eri tieteen aloilla, tutkimus voi olla: lingvististä sosiolingvististä psykolingvististä foneettista Kaikki osa-alueet hyötyvät puhekorpuksista, mutta toistaiseksi korpukset koostuvat lähinnä transkriptioista (CHILDES). Vieraan kielen oppiminen Vieraan kielen oppimista on jonkin verran tutkittu myös puhekorpuspohjaisesti, mutta toistaiseksi tutkimus on perustunut lähinnä transkriptioihin. Korpuksia voidaan käyttää esim. opetusmateriaalin tekemiseen. Kunnollisen spontaanin puheen elisitoiminen lapsilta on vaikeaa, mutta puhetta voidaan saada helposti esim. pelien avulla. Lapsen kielen kehittymistä kuvaavien korpusten on hyvä olla longitudinaalisia; ts. saman henkilön puhetta tulee tallentaa eri kielen kehityksen vaiheissa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 20 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 21 Kielitieteellinen tutkimus Chomskylainen mentalistinen kielitieteellinen tutkimus, joka koskee lähinnä kompetenssia ei introspektiivisen luonteensa vuoksi hyödy korpuksista. Kielen lopullinen teoria vaatii kuitenkin kompetenssin ja performanssin integrointia. Performanssin tutkiminen on luonnostaan dataan perustuvaa, joten puhtaasti kielitieteellinenkin tutkimuksen tulee osaltaa perustua mm. puhekorpuksiin. Puhekorpukset yhdistävät siis aukon kompetenssiin perustuvan kieliopin ja todellisen kielenkäytön välillä. Diskurssianalyysi on yksi kielitieteellinen suuntaus, joka selkeästi hyötyy korpuksista. Audiologia Audiologia on kuuloa tutkiva tiede, jota puheen havaitseminen koskee vain epäsuorasti. Audiologit ovat kuitenkin käyttäneet puhetta ja puhekorpuksia kuulon mittaamiseen jo kauan. Kuulon mittaamiseen käytetyt korpukset ovat tarkasti kalibroituja akustisten muuttujien ja normaalikuuloisten vastaanoton suhteen. Yleensä ne sisältävät erillisiä äänteitä, nonsense sanoja, todellisia sanoja ja jatkuvaa puhetta. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 22 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 23

7 Puhekorpusten käyttötarkoitukset: teknologiset sovellukset Patologinen puhe Patologisen puheen tutkimus liittyy monenlaisiin häiriöihin käheästä puheesta afasiaan. Puhekorpusten rooli patologisen puheen suhteen liittyy esim. automaattisen diagnostiikan kehittämiseen. Patologisen puheen korpuksia käytetään myös kieli- ja puhehäiriöiden aiheuttavien prosessien tutkimukseen. Sovellustyypit Teknologiset sovellukset, jotka tarvitsevat kehitykseensä puhekorpuksia, voidaan karkeasti jakaa neljään luokkaan: 1. puhesynteesi 2. puheentunnistus 3. puhejärjestelmät (esim. dialogijärjestelmät) 4. puhujan tunnistus/verifiointi Sovellusten tekemiseen tarvittavat korpukset vaihtelevat suuresti niin sisältönsä kuin kokonsakin suhteen! Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 24 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 25 Puhekorpusten käyttötarkoitukset: teknologiset sovellukset Puhesynteesi Artikulatorinen synteesi vaatii artikulatorista dataa: puhesignaalin lisäksi tarvitaan mm. erilaisten kuvantamismenetelmien tuottamaa dataa (esim. MRI). Konkatenaatiojärjestelmät tarvitsevat hyvinkin erilaisia korpuksia difonikonkatenaatio vs. yleinen unit selection. Konkatenaatiodata voi olla edelleen parametrisoitu (esim. LPC) ja siihen voidaan liittää esim. tieto äänihuuliperioideista (engl. pitch marks). Periaatteessa kaikki mallintaminen synteesijärjestelmissä vaatii korpuksia pohjakseen ja toisaalta jokainen malli on puhujakohtainen ja esim. eri sukupuolten äänien tuottaminen vaatii omat korpuksensa. Erilaiset tunnistusjärjestelmät Yleisesti puheentunnistusjärjestelmät voidaan jakaa kolmeen pääluokkaan perustuen siihen, 1. minkälaista tunnistustrategiaa niissä käytetään 2. minkälaisten puhujien puhetta niissä tunnistetaan, ja 3. minkälaista puhetta ne tunnistavat. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 26 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 27

8 Puhujasta riippuvaiset ja riippumattomat järjestelmät Tietoon perustuvat vs. stokastiset järjestelmät Nykyiset järjestelmät ovat kaikki ns. stokastisia. Ne ovat siis oppivia järjestelmiä ja vaativat suuria määriä opetusdataa, joka on yleisesti ollut suhteellisen köyhästi annotoitua. Uusimmissa järjestelmissä on alettu hyödyntää myös morfologista ja fonologista tietämystä tämä ei kuitenkaan paljonkaan muuta datan tarvetta; ortografinen transkriptio riittää annotoinniksi. Järjestelmien sisältämät kielimallit kuitenkin vaativat puhedatan lisäksi suuria tekstikorpuksia. Riippuen siitä, onko järjestelmän tarkoitettu tunnistaa vain yhden ihmisen puhetta vaiko useamman, on niiden opetuskorpusten tarve hyvinkin erilainen ainakin kokonsa suhteen. Puhujasta riippumattomat järjestelmät vaativat luonnollisesti dataa mahdollisimman monelta puhujalta siitä huolimatta ne usein opetetaan tunnistamaan jonkin alaryhmän puhetta; esim. miehet vs. naiset. Jotkin järjestelmät ovat adaptiivisia, mutta erilliset opetussessiot ovat yleensä interaktiivisia eivätkä vaadi erillisiä korpuksia tällaisten järjestelmien tutkiminen ja kehittäminen toisaalta vaativat niitä. Järjestelmät ovat myös sensitiivisiä datan tallennusympäristön suhteen ja tarvitaan eri korpukset esim. autoissa vs. puhelimessa tehtävään tunnistamiseen. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 28 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 29 Erilliset sanat vs. jatkuva puhe Tunnistusjärjestelmät voidaan rakentaa tunnistamaan joko erikseen lausuttuja sanoja tai jatkuvaa puhetta. Jatkuvassa puheessa täytyy tunnistaa sanarajat, joka monimutkaistaa prosessin oleellisesti. Luonnollisesti tällaisten järjestelmien opetusdatat eroavat suuresti toisistaan. Yksi muoto erillisten sanojen tunnistamisesta on ns. word spotting, jossa tunnistetaan tiettyjä sanoja vaikkapa hyvinkin häiriöisissä olosuhteissa. Puheentunnistuksen tutkimus Yleisesti puheentunnistuksen tutkimus vaatii aina kahden korpuksen olemassaoloa: ns. opetus- ja testikorpukset. Aina testaamiseen ei riitä, että yksi korpus jaetaan kahteen osaan. Korpusten lopullinen muoto ja sisältä riippuvat myös täysin siitä, minkälaiseen tarkoitukseen tunnistinta tehdään: esim. numeroiden tunnistamiseen on kerätty useita suuria korpuksia. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 30 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 31

9 Puhujan tunnistus ja verifikaatio Spoken Language Systems Dialogijärjestelmien täytyy tunnistusvaiheessa saada jonkinlainen käsitys myös tunnistetun puheen merkityksestä. Järjestelmien synteesi- ja tunnistusosien tekemiseen vaadittavien korpusten lisäksi tarvitaan spontaanin puheen oleellisten piirteiden mallintamista tukevia korpuksia sekä dialogin rakenteen mallintamista tukevia korpuksia. Puhujan tunnistus (identifoiminen) voidaa yleisesti jakaa kahteen kategoriaan: suljetun ja avoimen joukon tunnistamiseen. Suljetussa joukossa tunnistetaan joku joukon jäsen ja avoimen joukon tunnistuksessa päätellään kuuluuko joku puhuja tiettyyn joukkoon. Tunnistus voi olla tekstistä riippuvaa tai riippumatonta. Puhujantunnistusta varten luotavissa korpuksissa olellista on, että ne sisältävät useita äänityksiä samalta puhujalta erilaisissa olosuhteissa. Olesuhteet voivat olla kategorisoitu esim. kanavan tilan tai puhujan fysiologisen sekä psykologisen tilan mukaan. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 32 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 33

Vfo254: Puhekorpusten käyttö

Vfo254: Puhekorpusten käyttö Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan

Lisätiedot

Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio

Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio Puhekorpukset ja puhetietokannat Puhekorpus Puhekorpukset Martti Vainio Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen luettavassa

Lisätiedot

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus Symbolinen representaatio Vfo 254: Puhekorpusten käsittely: Puhekorpusten lingvistinen representaatio Martti Vainio Puhekorpuksen tutkimininen on mahdollista vain symbolisen representaation kautta näytteistettyä

Lisätiedot

Suomen prosodian variaation tutkimuksesta

Suomen prosodian variaation tutkimuksesta Suomen prosodian variaation tutkimuksesta Tommi Nieminen Itä-Suomen yliopisto Tommi Kurki Turun yliopisto Prosodian käsitteestä prosodia käsittää kaikki ne puheen ilmiöt, jotka eivät ole segmentoitavissa

Lisätiedot

Mitä suomen intonaatiosta tiedetään

Mitä suomen intonaatiosta tiedetään Mitä suomen intonaatiosta tiedetään ja mitä ehkä tulisi tietää? Tommi Nieminen Itä-Suomen yliopisto AFinLAn syyssymposium Helsinki 13. 14. 11. 2015 Johdanto Jäsennys 1 Johdanto 2 Mitä intonaatiosta tiedetään?

Lisätiedot

8003051 Puheenkäsittelyn menetelmät

8003051 Puheenkäsittelyn menetelmät 8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

Puhesynteesin perusteet Luento 4: difonikonkatenaatio Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä

Lisätiedot

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA Heini Kallio, tohtorikoulutettava Käyttäytymistieteiden laitos, fonetiikka Helsingin yliopisto heini.h.kallio@helsinki.fi Fonetiikan haasteet kielenopetuksessa

Lisätiedot

Puhutun ja kirjoitetun rajalla

Puhutun ja kirjoitetun rajalla Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic

Lisätiedot

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin

Lisätiedot

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn

Lisätiedot

Prosodian havaitsemisesta: suomen lausepaino ja focus

Prosodian havaitsemisesta: suomen lausepaino ja focus Prosodian havaitsemisesta: suomen lausepaino ja focus Martti Vainio Helsingin yliopisto, Fonetiikan laitos; Kieliteknologia Juhani Järvikivi, Turun yliopisto, Psykologia; University of Dundee Yleistä Lingvistisen

Lisätiedot

Foneettiset symbolit

Foneettiset symbolit Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003 Puhesynteesi Signaalin generointi Martti Vainio mailto:martti.vainio@helsinki.fi 11. huhtikuuta 2003 Signaalin generointi puhesynteesissä Kuinka tuottaa foneettisesta symbolisesta tiedosta jatkuvaa signaalia

Lisätiedot

Yhdyssana suomen kielessä ja puheessa

Yhdyssana suomen kielessä ja puheessa Yhdyssana suomen kielessä ja puheessa Tommi Nieminen Jyväskylän yliopisto Anna Lantee Tampereen yliopisto 37. Kielitieteen päivät Helsingissä 20. 22.5.2010 Yhdyssanan ortografian historia yhdyssanan käsite

Lisätiedot

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla Mietta Lennes FIN-CLARIN / Helsingin yliopisto Johdanto Kun puhetta ja kieltä tutkitaan kvantitatiivisesti, on

Lisätiedot

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:

Lisätiedot

Johdatus rakenteisiin dokumentteihin

Johdatus rakenteisiin dokumentteihin -RKGDWXVUDNHQWHLVLLQGRNXPHQWWHLKLQ 5DNHQWHLQHQGRNXPHQWWL= rakenteellinen dokumentti dokumentti, jossa erotetaan toisistaan dokumentin 1)VLVlOW, 2) UDNHQQHja 3) XONRDVX(tai esitystapa) jotakin systemaattista

Lisätiedot

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus

Lisätiedot

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38 Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.

Lisätiedot

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla

Lisätiedot

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat Martti Vainio -- syksy 2006 Artikulaatiotavat Konsonantit voivat siis vaihdella artikulaatipaikan mukaan ja sen mukaan ovatko ne soinnillisia vai eivät

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla

Lisätiedot

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38 Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.

Lisätiedot

Puhesynteesin perusteet Luento 5: unit selection -synteesi

Puhesynteesin perusteet Luento 5: unit selection -synteesi Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen

Lisätiedot

Puheentunnistus Mikko Kurimo

Puheentunnistus Mikko Kurimo Puheentunnistus Mikko Kurimo Mitä automaattinen puheentunnistus on? Automaattinen puheentunnistin on laite, joka määrittää ja tulostaa sanan tai tekstin, joka parhaiten vastaa äänitettyä puhesignaalia.

Lisätiedot

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla. Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti

Lisätiedot

Puheteknologia Informaa2oteknologian perusteet. Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos

Puheteknologia Informaa2oteknologian perusteet. Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos Puheteknologia Informaa2oteknologian perusteet Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos Määritelmä: Puhekäy8ölii8ymä Kone8a ohjataan ja käytetään puhumalla Kone voi olla hardwarea, sobaa,

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Kielellisen datan käsittely ja analyysi tutkimuksessa

Kielellisen datan käsittely ja analyysi tutkimuksessa Kielellisen datan käsittely ja analyysi tutkimuksessa Kimmo Koskenniemi 4.4.2007 Yleisen kielitieteen laitos Humanistinen tiedekunta Kielidataa on monenlaista Tekstiä erilaisista lähteistä kirjoista, lehdistä,

Lisätiedot

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004

Lisätiedot

Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011

Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosoni on ainoa hiukkasfysiikan standardimallin (SM) ennustama hiukkanen, jota ei ole vielä löydetty

Lisätiedot

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas Tiedonhallinnan perusteet Viikko 1 Jukka Lähetkangas Kurssilla käytävät asiat Tietokantojen toimintafilosofian ja -tekniikan perusteet Tiedonsäilönnän vaihtoehdot Tietokantojen suunnitteleminen internetiä

Lisätiedot

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet

Lisätiedot

LAADULLISESTA SISÄLLÖNANALYYSISTÄ

LAADULLISESTA SISÄLLÖNANALYYSISTÄ LAADULLISESTA SISÄLLÖNANALYYSISTÄ Aineiston ja teorian suhde INDUKTIIVINEN ANALYYSI Tulokset/teoria muodostetaan aineiston perusteella Tutkimuskysymykset muotoutuvat analyysin edetessä ABDUKTIIVINEN ANALYYSI

Lisätiedot

5 Akustiikan peruskäsitteitä

5 Akustiikan peruskäsitteitä Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen

Lisätiedot

Tietotekniikan laitoksen uusi linja

Tietotekniikan laitoksen uusi linja Tietotekniikan laitoksen uusi linja Tietotekniikan laitos 2011- Yhteisen rungon ympärille liittyvät oksina Tietotekniikan laitoksen perinteiset ja uudet linjat Haluatko harrastuksiisi liittyvän ammatin?

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi

Lisätiedot

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn

Lisätiedot

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot Laajennettu tiedonkäsitys ja tiedon erilaiset muodot Totuudesta väitellään Perinteinen käsitys Tutkimuksella tavoitellaan a. On kuitenkin erilaisia käsityksiä. Klassinen tiedon määritelmä esitetään Platonin

Lisätiedot

Varhainen leikki ja sen arviointi

Varhainen leikki ja sen arviointi Varhainen leikki ja sen arviointi Paula Lyytinen Jyväskylän yliopisto Psykologian laitos Hyvä Alku messut 2.9.2004 Leikin sisällöt eri ikävaiheissa Esine- ja toimintaleikit (0-3 v) Eksploratiiviset Funktionaalis-relationaaliset

Lisätiedot

Luonnollisella kielellä keskustelevat järjestelmät

Luonnollisella kielellä keskustelevat järjestelmät Luonnollisella kielellä keskustelevat järjestelmät Jussi Lepistö (jussi.lepisto@cs.helsinki.fi) Helsingin Yliopisto Tieteellisen kirjoittamisen kurssi Johdanto Esittelen luonnollisella kielellä keskustelevien

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15 Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/15 Lisää säännöllisistä lausekkeista Aikaisemmin esityt * ja + yrittävät osua mahdollisimman pitkään merkkijonoon

Lisätiedot

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...

Lisätiedot

Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs

Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs Esitys koulutuksessa: Maahanmuuttajien ammatillinen koulutus, 20.3.2009 Opetushallitus Esityksen sisältö Lähestymistapoja kulttuuriin ja

Lisätiedot

Puhe ja kommunikaatio

Puhe ja kommunikaatio Puhe ja kommunikaatio Puhe on ihmisen kehittämistä kommunikoinnin muodoista hienostunein ja monimutkaisin -- siihen on kerrostunut useanlaista informaatiota, joiden määrittelyyn tarvitaan jonkinlainen

Lisätiedot

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Suomen kielen variaatio 1 Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Puhuttu ja kirjoitettu kieli Puhuttu kieli on ensisijaista. Lapsi oppii (omaksuu) puhutun kielen luonnollisesti siinä ympäristössä,

Lisätiedot

VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen

VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen Vaihe 1: Asenna VHOPE PC:hen täytyy asentaa VHOPE-sovellus, ennen kuin USB-muistitikun esitysaineistoa voidaan ryhtyä käyttämään. VCN (Volvo Corporate

Lisätiedot

Tähtitieteen käytännön menetelmiä Kevät 2009

Tähtitieteen käytännön menetelmiä Kevät 2009 Tähtitieteen käytännön menetelmiä Kevät 2009 2009-01-12 Yleistä Luennot Luennoija hannu.p.parviainen@helsinki.fi Aikataulu Observatoriolla Maanantaisin 10.00-12.00 Ohjattua harjoittelua maanantaisin 9.00-10.00

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 2 visuaalinen prosessointi Treismanin FIT Kuva 1. Kuvassa on Treismanin kokeen ensimmäinen osio, jossa piti etsiä vihreätä T kirjainta.

Lisätiedot

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi Tiivistelmä CHERMUG-projekti on kansainvälinen konsortio, jossa on kumppaneita usealta eri alalta. Yksi tärkeimmistä asioista on luoda yhteinen lähtökohta, jotta voimme kommunikoida ja auttaa projektin

Lisätiedot

Taulukot. Jukka Harju, Jukka Juslin 2006 1

Taulukot. Jukka Harju, Jukka Juslin 2006 1 Taulukot Jukka Harju, Jukka Juslin 2006 1 Taulukot Taulukot ovat olioita, jotka auttavat organisoimaan suuria määriä tietoa. Käsittelylistalla on: Taulukon tekeminen ja käyttö Rajojen tarkastus ja kapasiteetti

Lisätiedot

11.4. Context-free kielet 1 / 17

11.4. Context-free kielet 1 / 17 11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä

Lisätiedot

Intonaation analyysi ja annotointi puhekorpuksissa

Intonaation analyysi ja annotointi puhekorpuksissa Intonaation analyysi ja annotointi puhekorpuksissa 4.4.2002/HY:n fonetiikan laitos Stefan Werner stefan.werner@joensuu.fi Kieliteknologia/JoY Intonaation analyysi/annotointi HY 4.4.2002 p.1/43 Intonaation

Lisätiedot

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 8. maaliskuuta 2012

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 8. maaliskuuta 2012 TIEA241 Automaatit ja kieliopit, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 8. maaliskuuta 2012 Sisällys Ongelma-analyysiä Sisällys Ongelma-analyysiä Hypoteettinen ongelma The Elite Bugbusters

Lisätiedot

Tiedon arvottaminen osana arkistointia

Tiedon arvottaminen osana arkistointia Tiedon arvottaminen osana arkistointia Pirkko Kortekangas VSSHP, VS atj kehittämispäällikkö Tiedon arvotus koskee dataa, josta ei ole lainsäädäntöä Nykyinen Asetus potilasasiakirjojen laatimisesta ja säilyttämisestä

Lisätiedot

Kiinan kursseilla 1 2 painotetaan suullista kielitaitoa ja kurssista 3 alkaen lisätään vähitellen myös merkkien lukemista ja kirjoittamista.

Kiinan kursseilla 1 2 painotetaan suullista kielitaitoa ja kurssista 3 alkaen lisätään vähitellen myös merkkien lukemista ja kirjoittamista. Kiina, B3kielen opetussuunnitelma (lukiossa alkava oppimäärä) Kiinan kursseilla tutustutaan kiinankielisen alueen elämään, arkeen, juhlaan, historiaan ja nykyisyyteen. Opiskelun ohessa saatu kielen ja

Lisätiedot

Puhumaan oppii vain puhumalla.

Puhumaan oppii vain puhumalla. Puhumaan oppii vain puhumalla. Maisa Martin Jyväskylän yliopisto suomenkielisanootervetuloa.fi Toisto-menetelmän periaatteet ja selkopuhe oppijoiden tukena Luetaan yhdessä -verkoston syysseminaari Paasitorni

Lisätiedot

EuroTraffic Language Training

EuroTraffic Language Training EuroTraffic Language Training Käyttäjän opas Sisällysluettelo Kurssin aloittaminen... 3 Rekisteröityminen... 4 Sisäänkirjautuminen... 6 Tehtävien aloittaminen... 7 Sanasto... 9 Yhdistä ääni ja kuva...

Lisätiedot

Laskut käyvät hermoille

Laskut käyvät hermoille Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011

Lisätiedot

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO 8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet

Lisätiedot

Opettajan pedagogiset opinnot 2017 Ainedidaktiikan opetusjakso syyskuun viikolla 36 (15.8./JS)

Opettajan pedagogiset opinnot 2017 Ainedidaktiikan opetusjakso syyskuun viikolla 36 (15.8./JS) Opettajan pedagogiset opinnot 2017 Ainedidaktiikan opetusjakso syyskuun viikolla 36 (15.8./JS) Jakson tavoitteena on kielididaktiikan perusteisiin sekä tunnin suunnittelun perusperiaatteisiin tutustuminen.

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

Työkalujen merkitys mittaamisessa

Työkalujen merkitys mittaamisessa Työkalujen merkitys mittaamisessa Mittaaminen ja Ohjelmistotuotanto -seminaari Toni Sandelin 18.4.2001, VTT Elektroniikka, Oulu 1 Sisältö Mihin työkalutukea tarvitaan? Työkalut & metriikat: luokitus Mittausohjelmien

Lisätiedot

Aivotutkimus kielenoppimisen edistäjänä

Aivotutkimus kielenoppimisen edistäjänä Aivotutkimus kielenoppimisen edistäjänä 15.3.2018 Kaisa Lohvansuu, FT JYU. Since 1863. 1 -Kieli ja aivot -Aivotutkimus: Mitä tutkitaan ja miksi? -Mitä hyötyä aivotutkimuksesta on? JYU. Since 1863. 2 Aivotutkimuksen

Lisätiedot

T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä

T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä A2-VENÄJÄ vl.4-6 4.LUOKKA Opetuksen tavoitteet Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen T1 ohjata oppilasta havaitsemaan lähiympäristön ja maailman kielellinen ja kulttuurinen runsaus sekä

Lisätiedot

Valttikortit 100 -ohjelman sanasto on peruskoulun opetussuunnitelman ytimestä.

Valttikortit 100 -ohjelman sanasto on peruskoulun opetussuunnitelman ytimestä. Valttikortit 100 on uusi avaus sanaston ja kuullunymmärtämisen oppimiseen. Digitaaliset oppimateriaalit ovat aiemminkin lisänneet yksilöllistä työskentelyä ja välittömiä palautteita harjoitteluun, mutta

Lisätiedot

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ] Johdatus tekoälyyn Luento 6.10.2011: Koneoppiminen Patrik Hoyer [ Kysykää ja kommentoikaa luennon aikana! ] Koneoppiminen? Määritelmä: kone = tietokone, tietokoneohjelma oppiminen = ongelmanratkaisukyvyn

Lisätiedot

Suomen kielen oppija opetusryhmässäni OPH

Suomen kielen oppija opetusryhmässäni OPH Suomen kielen oppija opetusryhmässäni OPH 2017-2018 Opettajankoulutuslaitoksen Sat@Oppi järjestää yhteistyössä opettajankoulutuslaitoksen Rauman ja Turun yksiköiden kanssa perusopetuksen ja varhaiskasvatuksen

Lisätiedot

Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria

Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria Lectio praecursoria Signal Processing Methods for Drum Transcription and Music Structure Analysis (Signaalinkäsittelymenetelmiä rumpujen nuotintamiseen ja musiikin muotoanalyysiin) Jouni Paulus 8.1.2010

Lisätiedot

Marantz PMD661. Äänittäminen

Marantz PMD661. Äänittäminen 1 2 3 4 Marantz PMD661 Äänittäminen Laite on valmis äänittämään muutaman sekunnin kuluttua virran päälle kytkemisestä (right side 2). Äänitys käynnistyy Rec-painikkeella (top 8) ja loppuu Stop-painikkeella

Lisätiedot

MALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA

MALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA MALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA Hannu Poutiainen, FT PUHDAS VESI JA YMPÄRISTÖ TUTKIMUSAVAUKSIA MAMKISSA Mikpoli 8.12.2016 Mitä mallit ovat? Malli on arvioitu kuvaus todellisuudesta joka on rakennettu

Lisätiedot

Palvelukuvaus Omakannan Omatietovaranto

Palvelukuvaus Omakannan Omatietovaranto Palvelukuvaus Omakannan Omatietovaranto 24.10.2018 Kela, Kanta-palvelut Muutoshistoria Versio Muutos Tekijä PVM 1.0 Ensimmäinen julkaistava versio pilotointivaihetta varten 1.1 Päivitetty sisältöä vastaamaan

Lisätiedot

Kuvaruudun striimaus tai nauhoitus. Open Broadcaster Software V.20. Tero Keso, Atso Arat & Niina Järvinen (muokattu )

Kuvaruudun striimaus tai nauhoitus. Open Broadcaster Software V.20. Tero Keso, Atso Arat & Niina Järvinen (muokattu ) Kuvaruudun striimaus tai nauhoitus Open Broadcaster Software V.20 Tero Keso, Atso Arat & Niina Järvinen (muokattu 28.11.2017) OBS 1 (12) Sisällysluettelo Mikä on OBS... 2 Ohjelman perusasetukset... 2 Tarvittavat

Lisätiedot

17/20: Keittokirja IV

17/20: Keittokirja IV Ohjelmointi 1 / syksy 2007 17/20: Keittokirja IV Paavo Nieminen nieminen@jyu.fi Tietotekniikan laitos Informaatioteknologian tiedekunta Jyväskylän yliopisto Ohjelmointi 1 / syksy 2007 p.1/10 Tavoitteita

Lisätiedot

Esimerkkejä vaativuusluokista

Esimerkkejä vaativuusluokista Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään

Lisätiedot

Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet

Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 24. toukokuuta 2013 Sisällys Formaalit kielet On tapana sanoa, että merkkijonojen joukko on (formaali) kieli. Hieman

Lisätiedot

HELSINGIN YLIOPISTO TIEDEKASVATUS. helsinki.fi/tiedekasvatus v 1.2

HELSINGIN YLIOPISTO TIEDEKASVATUS. helsinki.fi/tiedekasvatus v 1.2 Tässä harjoituksessa opit laatimaan luokitellun teemakartan maastossa aiemmin keräämästäsi aineistosta. Käytämme Esrin ArcGis-palvelun ilmaisia ominaisuuksia. Kartan tekoa voi harjoitella kokonaan ilman

Lisätiedot

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.

Lisätiedot

Digitaaliset tarinat

Digitaaliset tarinat Future School research Ist Wave-hanke 2009-2011 Digitaaliset tarinat Esi- ja alkuopetusryhmissä Marja Hytönen KM, Tutkija Literacy in the 21st Century- Uusi luku ja kirjoitustaito Digitarina>

Lisätiedot

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM Puheenkoodaus Olivatpa kerran iloiset serkukset PCM, DPCM ja ADPCM PCM eli pulssikoodimodulaatio Koodaa jokaisen signaalinäytteen binääriseksi (eli vain ykkösiä ja nollia sisältäväksi) luvuksi kvantisointitasolle,

Lisätiedot

Korpusten käsittely clt131, P Luento 1

Korpusten käsittely clt131, P Luento 1 Korpusten käsittely clt131, P2 2006 Luento 1 Nicholas Volk 3.11.2006 Humanistinen tiedekunta CLT131 Korpusten käsittely (syksy 2006) Luennoitsija FM Nicholas Volk Kurssiassistentti

Lisätiedot

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015 TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 30. marraskuuta 2015 Sisällys t Väitöstilaisuus 4.12.2015 kello 12 vanhassa juhlasalissa S212 saa tulla 2 demoruksia

Lisätiedot

Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto

Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto Kojemeteorologia Sami Haapanala syksy 2013 Fysiikan laitos, Ilmakehätieteiden osasto Kojemeteorologia, 3 op 9 luentoa, 3 laskuharjoitukset ja vierailu mittausasemalle Tentti Oppikirjana Rinne & Haapanala:

Lisätiedot

Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä. FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi

Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä. FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi Kuka Elina Tergujeff? englannin ja ruotsin opettaja filosofian tohtori, soveltava

Lisätiedot

F-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella

F-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella F-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella 1 F-Secure KEY F-Secure KEY on palvelu, joka tallentaa turvallisesti kaikki henkilökohtaiset tunnistetiedot, kuten salasanat ja maksukorttitiedot,

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ

Lisätiedot

IDL - proseduurit. ATK tähtitieteessä. IDL - proseduurit

IDL - proseduurit. ATK tähtitieteessä. IDL - proseduurit IDL - proseduurit 25. huhtikuuta 2017 Viimeksi käsiteltiin IDL:n interaktiivista käyttöä, mutta tämä on hyvin kömpelöä monimutkaisempia asioita tehtäessä. IDL:llä on mahdollista tehdä ns. proseduuri-tiedostoja,

Lisätiedot

Projektisuunnitelma. Projektin tavoitteet

Projektisuunnitelma. Projektin tavoitteet Projektisuunnitelma Projektin tavoitteet Projektin tarkoituksena on tunnistaa erilaisia esineitä Kinect-kameran avulla. Kinect-kamera on kytkettynä tietokoneeseen, johon projektissa tehdään tunnistuksen

Lisätiedot

4. Lausekielinen ohjelmointi 4.1

4. Lausekielinen ohjelmointi 4.1 4. Lausekielinen ohjelmointi 4.1 Sisällys Konekieli, symbolinen konekieli ja lausekieli. Lausekielestä konekieleksi: - Lähdekoodi, tekstitiedosto ja tekstieditorit. - Kääntäminen ja tulkinta. - Kääntäminen,

Lisätiedot

Käyttöohje HERE Maps. 1.0. painos FI

Käyttöohje HERE Maps. 1.0. painos FI Käyttöohje HERE Maps 1.0. painos FI HERE Maps HERE Maps näyttää lähellä olevat kohteet ja opastaa sinut perille. Voit etsiä kaupunkeja, katuja ja palveluja löytää perille tarkkojen reittiohjeiden avulla

Lisätiedot

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä olevilla komponenteilla? Voisiko jollakin ohjelmointikielellä

Lisätiedot

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen: Puheen anatomiaa ja fysiologiaa Puhesignaalin analyysi Puheen havaitseminen luku 11 Luento: Puhe Mitä puhe on? Ihmisen kehittämä symbolinen kommunikaatiojärjestelmä. Perustuu sovittuihin kielellisiin koodeihin

Lisätiedot

ATK tähtitieteessä. Osa 3 - IDL proseduurit ja rakenteet. 18. syyskuuta 2014

ATK tähtitieteessä. Osa 3 - IDL proseduurit ja rakenteet. 18. syyskuuta 2014 18. syyskuuta 2014 IDL - proseduurit Viimeksi käsiteltiin IDL:n interaktiivista käyttöä, mutta tämä on hyvin kömpelöä monimutkaisempia asioita tehtäessä. IDL:llä on mahdollista tehdä ns. proseduuri-tiedostoja,

Lisätiedot

YSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä

YSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä YSILUOKKA Tasa-arvo yhteiskunnassa ja työelämässä Sisältö ja toteutus Tunnin tavoitteena on, että oppilaat ymmärtävät mitä sukupuolten välinen tasaarvo tarkoittaa Suomessa, mitä tasa-arvoon liittyviä haasteita

Lisätiedot

ESIOPETUS-1-2 LUOKKA OMA OPPIMISPOLKU

ESIOPETUS-1-2 LUOKKA OMA OPPIMISPOLKU Väritä yhdessä aikuisen kanssa: ESIOPETUS-- LUOKKA OMA OPPIMISPOLKU nimi: kun harjoittelet tietoa tai taitoa kun osaat tiedon tai taidon kun osaat tiedon tai taidon ja voisit opettaa sen toisille. MATEMATIIKKA

Lisätiedot

AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA

AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA Tietosuojavastaava Jarkko Reittu 13.11.2018 Aineiston jakamisen myyteistä ja haasteista/jarkko Reittu 1 ESITYKSEN KOHDE Kuinka tietosuojalainsäädäntö rajoittaa

Lisätiedot