Vfo254: Puhekorpusten käyttö

Koko: px
Aloita esitys sivulta:

Download "Vfo254: Puhekorpusten käyttö"

Transkriptio

1 Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan keräys Puheen annotointi Korpusten käyttö tutkimuksessa Ja käytännön harjoituksiin, joissa opitaan suunnittelemaan, tallentamaan ja annotoimaan puhekorpuksia. Kurssin harjoitustyönä tehdään pieni foneettinen tutkimus aikaansaadulla korpuksella. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 1 Puhekorpukset ja puhetietokannat Puhekorpukset ja puhetietokannat Puhekorpus Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen luettavassa muodossa ja on annotoitu sekä dokumentoitu siten, että sitä voi käyttää yhä uudelleen organisaation sisällä (in-house) tai sen ulkopuolella. Näin ollen, esim. yleisradioiden tallenteet jäävät määritelmän ulkopuolelle. Määritelmä koskee siis, esim. joukkoa puhesignaali-, laryngografi- ja EMG-signaaleja, sillä ehdolla, että ne on sopivasti annotoituja ja dokumentoituja. Tavallisen äänisignaalin lisäksi voimme siis sisällyttää korpukseen kaikenlaisia muitakin, joko tallennettuja tai alkuperäisestä signaalista analysoituja, signaaleja: esim. video, aikakoodi, perustaajuuskäyrät jne. Puhekorpus sisältää siis puhesignaalin lisäksi: Annotaatiot Tiedot puhujasta: ikä sukupuoli äidinkieli murretausta yms. Mahdollisimman paljon tietoa itse äänityksestä: Äänityspaikan sijainti ja laatu Mikrofoni ja tallennintyyppi Äänitysaika yms. Yllä oleva informaatio ei ehkä vaikuta kiinnostavalta, mutta se voi olla hyvinkin tärkeätä jossain myöhemmässä vaiheessa! Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 2 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 3

2 Puhekorpukset ja puhetietokannat Puhekorpukset ja puhetietokannat Tyypillisesti puhekorpukset sisältävät seuraavia asioita: Digitoidut signaalit: akustinen puhesignaali, laryngografin signaali, röntgen data. Analyysien tulokset: FFT data, LPC data, perustaajuus- ja äänekkyysdata, formantit. Markkerit: äänihuuliperiodit, vokaalien alut. Kuvailut: puhujien kuvailut, äänitysolosuhteet. Annotaatiot: (engl. annotations/labels), ortografiset, foneemiset, foneettiset, prosodiset transkriptiot, puheenvuorot, topiikit... Puhekorpuksen käyttöön saattaminen koostuu kolmesta vaiheesta: 1. Vaihe ennen äänityksiä = suunnittelu 2. Äänitysvaihe 3. Jälkikäsittelyvaihe = annotointi, analyysit Vaihe, ennen äänitystä sisältää seuraavat askeleet: 1. Korpuksen tarkoituksen määrittely 2. Korpuksen lingvistisen sisällön määrittely 3. Puhujien tyypin ja lukumäärän määrittely Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 4 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 5 Puhekorpukset eroavat tekstikorpuksista ainakin kahdeksalla tavalla, jotka riippuvat seuraavista asioista: 1. puhe on katoavaista, teksti pysyvää, 2. puheen ja tekstin tuottoon kuluva aika ei ole sama, 3. virheiden rooli on erilainen, 4. kirjoitetut ja puhutut sanat eroavat toisistaan, 5. erilaiset tietorakenteet: ASCII vs. näytteistetty data, 6. syyt, jotka johtavat korpusten erilaisiin kokoihin, 1. Puhe on transienttia Puhe katoaa heti kun se on tuotettu: kirjoitus säilyy! Puhe on siis erikseen tallennettava sen kerääminen ei ole triviaali asia, kuten on (yleensä) laita kirjoitetun tekstin kanssa. 7. kirjoitetun ja puhutan materiaalin laillisen statuksen erot, ja 8. kirjoitettu kieli on symbolista ja puhe fyysisesti mitattavaa jatkuvaa signaalia ajassa! Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 6 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 7

3 3. Puhe on täynnä virheitä 2. Puheentuottoon käytetty aika on vähäistä Puheentuottoon kulunut aika on yleensä puhumiseen kulunut aika. Puhe tuotetaan keskimäärin tavua minuutissa. Kirjoittamiseen käytetään yleensä huomattavasti enemmän aikaa. Spontaanissa puheessa puhujan editointi on kuuluvaa ja jää mukaan tallenteeseen. Keskeytykset, hesitaatiot, toistot ja korjaukset ovat olennainen osa puhetta ja tulee säilyttää (spontaanin puheen) korpuksissa. Tekstikorpuksissa kirjoittajan suorittamat korjaukset ovat jo editoidut pois. Puhekorpuksissa suuntaus on kohti spontaania puhetta luettu laboratoriopuhe on väistymässä. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 8 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 9 4. Sanat vaihtelevat foneettisesti Puhutut versiot ortografisesti identtisistä sanoista osoittavat yleensä suurta foneettista variaatiota sekä segmentaalisesti että prosodisesti. Sanat saattavat jopa kokonaan kadota tai jäädä vain jonkin segmentaalisen tai prosodisen vihjeen varaan: onko sinulla se onksuse. Erillään lausutut sanat ovat jatkuvaan puheeseen verrattuna hyvinkin erilaiset: kanoninen tai sitaatiomuoto. Näin ollen on tärkeää, että korpukseen tallennetaan ainakin kahden, mieluummin kolmen tasoista, symbolista kuvausta, joilla kaikilla on suhde akustiseen signaaliin: 1. Puhutut sanat erotetaan leksikaalisesti ortografisella tasolla. 2. Sanat tulisi esittää myös karkealla foneettisella kirjoituksella ns. sitaatiomuodoissaan, jotka voidaan tuottaa esim. automaattisella grafeemi-foneemi -konversiolla. 3. Todelliset foneettiset kuvaukset tulee tehdä ns. kapealla tarkekirjoituksella, jonka symbolit suhteutetaan ajallisesti signaaliin, joko manuaalisesti tai automaattisesti. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 10 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 11

4 6. Puhe vaatii paljon tilaa 5. Tallennettu puhe on vain aikafunktioita Puhtaana datana, kirjoitetut tekstit koostuvat lähinnä merkeistä, jotka voidaan koodata joko 7, 8 tai 16 bittisinä ASCII- tai Unikoodimerkkeinä. Koodatut merkkijonot sisältävät jo sellaista informaatiorakennetta, joka ei ole läsnä puhesignaalissa. Puhesignaali ei sisällä eksplisiittisiä sanarajoja, pilkkuja, pisteitä, huutomerkkejä jne. Tallennettu puhesignaali on primäärisesti vain digitalisoituja aikafunktioita. Tallennettu puhe vie huomattavasti enemmän tilaa kuin vastaava ASCII-muotoinen data. Kolmikirjaimen sana vie vain kolme tavua (byte) tilaa kun vastaava digitoitu, puhuttu sana vie huomattavasti enemmän. Kolme äännettä: 0.5 s, 16 bittisellä kvantisoinnilla ja 48 khz:n näyttenottotaajuudella kirjoitutun ja puhutun tallenteen suhteeksi tulee 1/16000! Toisaalta puhuttujen muotojen erilaisuus vaatii jokaisen sanan tallentamista useaan kertaan riippuen puhujasta, puhetyylistä. Näin ei kuitenkaan kovin usein tehdä. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 12 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo Puhe tuo lisää laillisia ongelmia Yleensä kirjoitetut tekstit on jo julkaistu, jolloin niiden käyttö määräytyy olemassaolevien lakien ja säännöstöjen mukaan: lait voivat mutkistaa tai estää korpusten jakamisen käyttäjille. Puheen kannalta tilanne voi olla vieläkin mutkikkaampi: valmiiksi äänitetty materiaali voi tuottaa ylitsepääsemättömiä ongelmia, joista itse äänitettävällä materiaalilla selviää tekemällä puhujan kanssa sopimuksen ennen äänittämistä. 8. Puhe on jatkuvaa! Digitoitu signaali ei itsessään sisällä minkäänlaisia kategorioita kuten on laita kirjoitetun ASCII-datan kanssa. Nykyisillä tekniikoilla ei ole periaatteessa edes mahdollista (varmasti) sanoa, onko jokin signaali puhetta vai ei: puhedatan kategorioiminen annotaatioiksi vaatii aina manuaalista käsittelyä ja inhimillistä tulkintaa. Toisaalta puhesingnaali sisältää relevanttia prosodista ja paralingvististä informaatiota, jota teksti ei sisällä. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 14 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 15

5 Foneettinen tutkimus Foneettiseen tutkimukseen kuuluvat kaikki puheeseen liittyvät tekijät: usein tutkimus vaatii tarkasti kontrolloitua ja systemaattista dataa jonka tutkijat joutuvat keräämään erikseen. Kiinnostus spontaania ja vähemmän kontrolloitua puhetta kohtaan on kuitenkin antanut foneetikoillekin mahdollisuuden käyttää jo valmiita korpuksia. Spontaanin puheen tilastollinen kuvaus vaatii kaiken lisäksi suuria määriä dataa, jonka keräämiseen ja annotointiin yksittäisellä tutkijalle ei ole mahdollisuuksia. Tämä lisää edelleen spontaanin puheen korpusten arvoa foneettisessa tutkimuksessa. Sosiolingvistinen tutkimus Sosiolingvistinen puheentutkimus on yleensä pohjautunut kolmella tavalla hankittuun dataan: 1. Kirjoitettujen kyselyiden avulla: esim. miten vastaajat mielestään lausuvat tietyn sanan. 2. Tutkijan observaatioiden pohjalta: esim. Labovin tutkimukset /r/:n ellipsiksestä New Yorkilaisilla puhujilla. Labov yksinkertaisesti kirjasi, onko puhujalla kyseistä äännettä tietyissä sanoissa. 3. Keräämällä puhekorpuksia: perkeptuaalista analyysiä on tuettu keräämällä korpuksia. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 16 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 17 Lapsen kielen kehitys Psykolingvistinen tutkimus Psykolingvistinen tutkimus on hyvin laajaa: se vaihtelee lapsen kielen oppimisen tutkimisesta aikuisten kielen ymmärtämisen liittyvien mentaalisten prosessien tutkimukseen aina kielen häiriöiden tutkimukseen. Yksi alue, jossa psykolingvistit ovat käyttäneet puhekorpuksia on ns. lipsahdusten tutkimus. Lapsen kielen kehitystä tutkitaan monilla eri tieteen aloilla, tutkimus voi olla: lingvististä sosiolingvististä psykolingvististä foneettista Kaikki osa-alueet hyötyvät puhekorpuksista, mutta toistaiseksi korpukset koostuvat lähinnä transkriptioista (CHILDES). Kunnollisen spontaanin puheen elisitoiminen lapsilta on vaikeaa, mutta puhetta voidaan saada helposti esim. pelien avulla. Lapsen kielen kehittymistä kuvaavien korpusten on hyvä olla longitudinaalisia; ts. saman henkilön puhetta tulee tallentaa eri kielen kehityksen vaiheissa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 18 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 19

6 Kielitieteellinen tutkimus Vieraan kielen oppiminen Vieraan kielen oppimista on jonkin verran tutkittu myös puhekorpuspohjaisesti, mutta toistaiseksi tutkimus on perustunut lähinnä transkriptioihin. Korpuksia voidaan käyttää esim. opetusmateriaalin tekemiseen. Chomskylainen mentalistinen kielitieteellinen tutkimus, joka koskee lähinnä kompetenssia ei introspektiivisen luonteensa vuoksi hyödy korpuksista. Kielen lopullinen teoria vaatii kuitenkin kompetenssin ja performanssin integrointia. Performanssin tutkiminen on luonnostaan dataan perustuvaa, joten puhtaasti kielitieteellinenkin tutkimuksen tulee osaltaa perustua mm. puhekorpuksiin. Puhekorpukset yhdistävät siis aukon kompetenssiin perustuvan kieliopin ja todellisen kielenkäytön välillä. Diskurssianalyysi on yksi kielitieteellinen suuntaus, joka selkeästi hyötyy korpuksista. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 20 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 21 Audiologia Audiologia on kuuloa tutkiva tiede, jota puheen havaitseminen koskee vain epäsuorasti. Audiologit ovat kuitenkin käyttäneet puhetta ja puhekorpuksia kuulon mittaamiseen jo kauan. Kuulon mittaamiseen käytetyt korpukset ovat tarkasti kalibroituja akustisten muuttujien ja normaalikuuloisten vastaanoton suhteen. Yleensä ne sisältävät erillisiä äänteitä, nonsense sanoja, todellisia sanoja ja jatkuvaa puhetta. Patologinen puhe Patologisen puheen tutkimus liittyy monenlaisiin häiriöihin käheästä puheesta afasiaan. Puhekorpusten rooli patologisen puheen suhteen liittyy esim. automaattisen diagnostiikan kehittämiseen. Patologisen puheen korpuksia käytetään myös kieli- ja puhehäiriöiden aiheuttavien prosessien tutkimukseen. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 22 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 23

7 Puhekorpusten käyttötarkoitukset: teknologiset sovellukset Puhekorpusten käyttötarkoitukset: teknologiset sovellukset Sovellustyypit Teknologiset sovellukset, jotka tarvitsevat kehitykseensä puhekorpuksia, voidaan karkeasti jakaa neljään luokkaan: 1. puhesynteesi 2. puheentunnistus 3. puhejärjestelmät (esim. dialogijärjestelmät) 4. puhujan tunnistus/verifiointi Sovellusten tekemiseen tarvittavat korpukset vaihtelevat suuresti niin sisältönsä kuin kokonsakin suhteen! Puhesynteesi Artikulatorinen synteesi vaatii artikulatorista dataa: puhesignaalin lisäksi tarvitaan mm. erilaisten kuvantamismenetelmien tuottamaa dataa (esim. MRI). Konkatenaatiojärjestelmät tarvitsevat hyvinkin erilaisia korpuksia difonikonkatenaatio vs. yleinen unit selection. Konkatenaatiodata voi olla edelleen parametrisoitu (esim. LPC) ja siihen voidaan liittää esim. tieto äänihuuliperioideista (engl. pitch marks). Periaatteessa kaikki mallintaminen synteesijärjestelmissä vaatii korpuksia pohjakseen ja toisaalta jokainen malli on puhujakohtainen ja esim. eri sukupuolten äänien tuottaminen vaatii omat korpuksensa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 24 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 25 Tietoon perustuvat vs. stokastiset järjestelmät Erilaiset tunnistusjärjestelmät Yleisesti puheentunnistusjärjestelmät voidaan jakaa kolmeen pääluokkaan perustuen siihen, 1. minkälaista tunnistustrategiaa niissä käytetään 2. minkälaisten puhujien puhetta niissä tunnistetaan, ja 3. minkälaista puhetta ne tunnistavat. Nykyiset järjestelmät ovat kaikki ns. stokastisia. Ne ovat siis oppivia järjestelmiä ja vaativat suuria määriä opetusdataa, joka on yleisesti ollut suhteellisen köyhästi annotoitua. Uusimmissa järjestelmissä on alettu hyödyntää myös morfologista ja fonologista tietämystä tämä ei kuitenkaan paljonkaan muuta datan tarvetta; ortografinen transkriptio riittää annotoinniksi. Järjestelmien sisältämät kielimallit kuitenkin vaativat puhedatan lisäksi suuria tekstikorpuksia. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 26 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 27

8 Puhujasta riippuvaiset ja riippumattomat järjestelmät Riippuen siitä, onko järjestelmän tarkoitettu tunnistaa vain yhden ihmisen puhetta vaiko useamman, on niiden opetuskorpusten tarve hyvinkin erilainen ainakin kokonsa suhteen. Puhujasta riippumattomat järjestelmät vaativat luonnollisesti dataa mahdollisimman monelta puhujalta siitä huolimatta ne usein opetetaan tunnistamaan jonkin alaryhmän puhetta; esim. miehet vs. naiset. Jotkin järjestelmät ovat adaptiivisia, mutta erilliset opetussessiot ovat yleensä interaktiivisia eivätkä vaadi erillisiä korpuksia tällaisten järjestelmien tutkiminen ja kehittäminen toisaalta vaativat niitä. Järjestelmät ovat myös sensitiivisiä datan tallennusympäristön suhteen ja tarvitaan eri korpukset esim. autoissa vs. puhelimessa tehtävään tunnistamiseen. Erilliset sanat vs. jatkuva puhe Tunnistusjärjestelmät voidaan rakentaa tunnistamaan joko erikseen lausuttuja sanoja tai jatkuvaa puhetta. Jatkuvassa puheessa täytyy tunnistaa sanarajat, joka monimutkaistaa prosessin oleellisesti. Luonnollisesti tällaisten järjestelmien opetusdatat eroavat suuresti toisistaan. Yksi muoto erillisten sanojen tunnistamisesta on ns. word spotting, jossa tunnistetaan tiettyjä sanoja vaikkapa hyvinkin häiriöisissä olosuhteissa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 28 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 29 Puheentunnistuksen tutkimus Yleisesti puheentunnistuksen tutkimus vaatii aina kahden korpuksen olemassaoloa: ns. opetus- ja testikorpukset. Aina testaamiseen ei riitä, että yksi korpus jaetaan kahteen osaan. Korpusten lopullinen muoto ja sisältä riippuvat myös täysin siitä, minkälaiseen tarkoitukseen tunnistinta tehdään: esim. numeroiden tunnistamiseen on kerätty useita suuria korpuksia. Spoken Language Systems Dialogijärjestelmien täytyy tunnistusvaiheessa saada jonkinlainen käsitys myös tunnistetun puheen merkityksestä. Järjestelmien synteesi- ja tunnistusosien tekemiseen vaadittavien korpusten lisäksi tarvitaan spontaanin puheen oleellisten piirteiden mallintamista tukevia korpuksia sekä dialogin rakenteen mallintamista tukevia korpuksia. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 30 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 31

9 Puhujan tunnistus ja verifikaatio Puhujan tunnistus (identifoiminen) voidaa yleisesti jakaa kahteen kategoriaan: suljetun ja avoimen joukon tunnistamiseen. Suljetussa joukossa tunnistetaan joku joukon jäsen ja avoimen joukon tunnistuksessa päätellään kuuluuko joku puhuja tiettyyn joukkoon. Tunnistus voi olla tekstistä riippuvaa tai riippumatonta. Puhujantunnistusta varten luotavissa korpuksissa olellista on, että ne sisältävät useita äänityksiä samalta puhujalta erilaisissa olosuhteissa. Olesuhteet voivat olla kategorisoitu esim. kanavan tilan tai puhujan fysiologisen sekä psykologisen tilan mukaan. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 32

Vfo254: Puhekorpusten käyttö

Vfo254: Puhekorpusten käyttö Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan

Lisätiedot

Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio

Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio Puhekorpukset ja puhetietokannat Puhekorpus Puhekorpukset Martti Vainio Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen luettavassa

Lisätiedot

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus Symbolinen representaatio Vfo 254: Puhekorpusten käsittely: Puhekorpusten lingvistinen representaatio Martti Vainio Puhekorpuksen tutkimininen on mahdollista vain symbolisen representaation kautta näytteistettyä

Lisätiedot

Mitä suomen intonaatiosta tiedetään

Mitä suomen intonaatiosta tiedetään Mitä suomen intonaatiosta tiedetään ja mitä ehkä tulisi tietää? Tommi Nieminen Itä-Suomen yliopisto AFinLAn syyssymposium Helsinki 13. 14. 11. 2015 Johdanto Jäsennys 1 Johdanto 2 Mitä intonaatiosta tiedetään?

Lisätiedot

Suomen prosodian variaation tutkimuksesta

Suomen prosodian variaation tutkimuksesta Suomen prosodian variaation tutkimuksesta Tommi Nieminen Itä-Suomen yliopisto Tommi Kurki Turun yliopisto Prosodian käsitteestä prosodia käsittää kaikki ne puheen ilmiöt, jotka eivät ole segmentoitavissa

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

8003051 Puheenkäsittelyn menetelmät

8003051 Puheenkäsittelyn menetelmät 8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme

Lisätiedot

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

Puhesynteesin perusteet Luento 4: difonikonkatenaatio Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä

Lisätiedot

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA Heini Kallio, tohtorikoulutettava Käyttäytymistieteiden laitos, fonetiikka Helsingin yliopisto heini.h.kallio@helsinki.fi Fonetiikan haasteet kielenopetuksessa

Lisätiedot

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin

Lisätiedot

Puhutun ja kirjoitetun rajalla

Puhutun ja kirjoitetun rajalla Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic

Lisätiedot

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn

Lisätiedot

Foneettiset symbolit

Foneettiset symbolit Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

Prosodian havaitsemisesta: suomen lausepaino ja focus

Prosodian havaitsemisesta: suomen lausepaino ja focus Prosodian havaitsemisesta: suomen lausepaino ja focus Martti Vainio Helsingin yliopisto, Fonetiikan laitos; Kieliteknologia Juhani Järvikivi, Turun yliopisto, Psykologia; University of Dundee Yleistä Lingvistisen

Lisätiedot

Yhdyssana suomen kielessä ja puheessa

Yhdyssana suomen kielessä ja puheessa Yhdyssana suomen kielessä ja puheessa Tommi Nieminen Jyväskylän yliopisto Anna Lantee Tampereen yliopisto 37. Kielitieteen päivät Helsingissä 20. 22.5.2010 Yhdyssanan ortografian historia yhdyssanan käsite

Lisätiedot

Johdatus rakenteisiin dokumentteihin

Johdatus rakenteisiin dokumentteihin -RKGDWXVUDNHQWHLVLLQGRNXPHQWWHLKLQ 5DNHQWHLQHQGRNXPHQWWL= rakenteellinen dokumentti dokumentti, jossa erotetaan toisistaan dokumentin 1)VLVlOW, 2) UDNHQQHja 3) XONRDVX(tai esitystapa) jotakin systemaattista

Lisätiedot

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003 Puhesynteesi Signaalin generointi Martti Vainio mailto:martti.vainio@helsinki.fi 11. huhtikuuta 2003 Signaalin generointi puhesynteesissä Kuinka tuottaa foneettisesta symbolisesta tiedosta jatkuvaa signaalia

Lisätiedot

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla Mietta Lennes FIN-CLARIN / Helsingin yliopisto Johdanto Kun puhetta ja kieltä tutkitaan kvantitatiivisesti, on

Lisätiedot

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus

Lisätiedot

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:

Lisätiedot

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat Martti Vainio -- syksy 2006 Artikulaatiotavat Konsonantit voivat siis vaihdella artikulaatipaikan mukaan ja sen mukaan ovatko ne soinnillisia vai eivät

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Puhesynteesin perusteet Luento 5: unit selection -synteesi

Puhesynteesin perusteet Luento 5: unit selection -synteesi Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen

Lisätiedot

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla. Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti

Lisätiedot

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas Tiedonhallinnan perusteet Viikko 1 Jukka Lähetkangas Kurssilla käytävät asiat Tietokantojen toimintafilosofian ja -tekniikan perusteet Tiedonsäilönnän vaihtoehdot Tietokantojen suunnitteleminen internetiä

Lisätiedot

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38 Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.

Lisätiedot

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla

Lisätiedot

Puheteknologia Informaa2oteknologian perusteet. Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos

Puheteknologia Informaa2oteknologian perusteet. Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos Puheteknologia Informaa2oteknologian perusteet Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos Määritelmä: Puhekäy8ölii8ymä Kone8a ohjataan ja käytetään puhumalla Kone voi olla hardwarea, sobaa,

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Kielellisen datan käsittely ja analyysi tutkimuksessa

Kielellisen datan käsittely ja analyysi tutkimuksessa Kielellisen datan käsittely ja analyysi tutkimuksessa Kimmo Koskenniemi 4.4.2007 Yleisen kielitieteen laitos Humanistinen tiedekunta Kielidataa on monenlaista Tekstiä erilaisista lähteistä kirjoista, lehdistä,

Lisätiedot

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla

Lisätiedot

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38 Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.

Lisätiedot

Puheentunnistus Mikko Kurimo

Puheentunnistus Mikko Kurimo Puheentunnistus Mikko Kurimo Mitä automaattinen puheentunnistus on? Automaattinen puheentunnistin on laite, joka määrittää ja tulostaa sanan tai tekstin, joka parhaiten vastaa äänitettyä puhesignaalia.

Lisätiedot

Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011

Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosoni on ainoa hiukkasfysiikan standardimallin (SM) ennustama hiukkanen, jota ei ole vielä löydetty

Lisätiedot

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet

Lisätiedot

LAADULLISESTA SISÄLLÖNANALYYSISTÄ

LAADULLISESTA SISÄLLÖNANALYYSISTÄ LAADULLISESTA SISÄLLÖNANALYYSISTÄ Aineiston ja teorian suhde INDUKTIIVINEN ANALYYSI Tulokset/teoria muodostetaan aineiston perusteella Tutkimuskysymykset muotoutuvat analyysin edetessä ABDUKTIIVINEN ANALYYSI

Lisätiedot

5 Akustiikan peruskäsitteitä

5 Akustiikan peruskäsitteitä Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen

Lisätiedot

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15 Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/15 Lisää säännöllisistä lausekkeista Aikaisemmin esityt * ja + yrittävät osua mahdollisimman pitkään merkkijonoon

Lisätiedot

Tietotekniikan laitoksen uusi linja

Tietotekniikan laitoksen uusi linja Tietotekniikan laitoksen uusi linja Tietotekniikan laitos 2011- Yhteisen rungon ympärille liittyvät oksina Tietotekniikan laitoksen perinteiset ja uudet linjat Haluatko harrastuksiisi liittyvän ammatin?

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi

Lisätiedot

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn

Lisätiedot

Varhainen leikki ja sen arviointi

Varhainen leikki ja sen arviointi Varhainen leikki ja sen arviointi Paula Lyytinen Jyväskylän yliopisto Psykologian laitos Hyvä Alku messut 2.9.2004 Leikin sisällöt eri ikävaiheissa Esine- ja toimintaleikit (0-3 v) Eksploratiiviset Funktionaalis-relationaaliset

Lisätiedot

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Suomen kielen variaatio 1 Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Puhuttu ja kirjoitettu kieli Puhuttu kieli on ensisijaista. Lapsi oppii (omaksuu) puhutun kielen luonnollisesti siinä ympäristössä,

Lisätiedot

Luonnollisella kielellä keskustelevat järjestelmät

Luonnollisella kielellä keskustelevat järjestelmät Luonnollisella kielellä keskustelevat järjestelmät Jussi Lepistö (jussi.lepisto@cs.helsinki.fi) Helsingin Yliopisto Tieteellisen kirjoittamisen kurssi Johdanto Esittelen luonnollisella kielellä keskustelevien

Lisätiedot

Teknillinen korkeakoulu T-76.115 Tietojenkäsittelyopin ohjelmatyö. Testitapaukset - Koordinaattieditori

Teknillinen korkeakoulu T-76.115 Tietojenkäsittelyopin ohjelmatyö. Testitapaukset - Koordinaattieditori Testitapaukset - Koordinaattieditori Sisällysluettelo 1. Johdanto...3 2. Testattava järjestelmä...4 3. Toiminnallisuuden testitapaukset...5 3.1 Uuden projektin avaaminen...5 3.2 vaa olemassaoleva projekti...6

Lisätiedot

Taulukot. Jukka Harju, Jukka Juslin 2006 1

Taulukot. Jukka Harju, Jukka Juslin 2006 1 Taulukot Jukka Harju, Jukka Juslin 2006 1 Taulukot Taulukot ovat olioita, jotka auttavat organisoimaan suuria määriä tietoa. Käsittelylistalla on: Taulukon tekeminen ja käyttö Rajojen tarkastus ja kapasiteetti

Lisätiedot

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...

Lisätiedot

Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs

Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs Esitys koulutuksessa: Maahanmuuttajien ammatillinen koulutus, 20.3.2009 Opetushallitus Esityksen sisältö Lähestymistapoja kulttuuriin ja

Lisätiedot

Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä. FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi

Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä. FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi Kuka Elina Tergujeff? englannin ja ruotsin opettaja filosofian tohtori, soveltava

Lisätiedot

Puhe ja kommunikaatio

Puhe ja kommunikaatio Puhe ja kommunikaatio Puhe on ihmisen kehittämistä kommunikoinnin muodoista hienostunein ja monimutkaisin -- siihen on kerrostunut useanlaista informaatiota, joiden määrittelyyn tarvitaan jonkinlainen

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

Kuvaruudun striimaus tai nauhoitus. Open Broadcaster Software V.20. Tero Keso, Atso Arat & Niina Järvinen (muokattu )

Kuvaruudun striimaus tai nauhoitus. Open Broadcaster Software V.20. Tero Keso, Atso Arat & Niina Järvinen (muokattu ) Kuvaruudun striimaus tai nauhoitus Open Broadcaster Software V.20 Tero Keso, Atso Arat & Niina Järvinen (muokattu 28.11.2017) OBS 1 (12) Sisällysluettelo Mikä on OBS... 2 Ohjelman perusasetukset... 2 Tarvittavat

Lisätiedot

VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen

VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen Vaihe 1: Asenna VHOPE PC:hen täytyy asentaa VHOPE-sovellus, ennen kuin USB-muistitikun esitysaineistoa voidaan ryhtyä käyttämään. VCN (Volvo Corporate

Lisätiedot

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ] Johdatus tekoälyyn Luento 6.10.2011: Koneoppiminen Patrik Hoyer [ Kysykää ja kommentoikaa luennon aikana! ] Koneoppiminen? Määritelmä: kone = tietokone, tietokoneohjelma oppiminen = ongelmanratkaisukyvyn

Lisätiedot

Tähtitieteen käytännön menetelmiä Kevät 2009

Tähtitieteen käytännön menetelmiä Kevät 2009 Tähtitieteen käytännön menetelmiä Kevät 2009 2009-01-12 Yleistä Luennot Luennoija hannu.p.parviainen@helsinki.fi Aikataulu Observatoriolla Maanantaisin 10.00-12.00 Ohjattua harjoittelua maanantaisin 9.00-10.00

Lisätiedot

YSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä

YSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä YSILUOKKA Tasa-arvo yhteiskunnassa ja työelämässä Sisältö ja toteutus Tunnin tavoitteena on, että oppilaat ymmärtävät mitä sukupuolten välinen tasaarvo tarkoittaa Suomessa, mitä tasa-arvoon liittyviä haasteita

Lisätiedot

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi

CHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi Tiivistelmä CHERMUG-projekti on kansainvälinen konsortio, jossa on kumppaneita usealta eri alalta. Yksi tärkeimmistä asioista on luoda yhteinen lähtökohta, jotta voimme kommunikoida ja auttaa projektin

Lisätiedot

11.4. Context-free kielet 1 / 17

11.4. Context-free kielet 1 / 17 11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä

Lisätiedot

Tiedon arvottaminen osana arkistointia

Tiedon arvottaminen osana arkistointia Tiedon arvottaminen osana arkistointia Pirkko Kortekangas VSSHP, VS atj kehittämispäällikkö Tiedon arvotus koskee dataa, josta ei ole lainsäädäntöä Nykyinen Asetus potilasasiakirjojen laatimisesta ja säilyttämisestä

Lisätiedot

Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto

Kojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto Kojemeteorologia Sami Haapanala syksy 2013 Fysiikan laitos, Ilmakehätieteiden osasto Kojemeteorologia, 3 op 9 luentoa, 3 laskuharjoitukset ja vierailu mittausasemalle Tentti Oppikirjana Rinne & Haapanala:

Lisätiedot

Digitaaliset tarinat

Digitaaliset tarinat Future School research Ist Wave-hanke 2009-2011 Digitaaliset tarinat Esi- ja alkuopetusryhmissä Marja Hytönen KM, Tutkija Literacy in the 21st Century- Uusi luku ja kirjoitustaito Digitarina>

Lisätiedot

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 8. maaliskuuta 2012

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 8. maaliskuuta 2012 TIEA241 Automaatit ja kieliopit, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 8. maaliskuuta 2012 Sisällys Ongelma-analyysiä Sisällys Ongelma-analyysiä Hypoteettinen ongelma The Elite Bugbusters

Lisätiedot

Puhumaan oppii vain puhumalla.

Puhumaan oppii vain puhumalla. Puhumaan oppii vain puhumalla. Maisa Martin Jyväskylän yliopisto suomenkielisanootervetuloa.fi Toisto-menetelmän periaatteet ja selkopuhe oppijoiden tukena Luetaan yhdessä -verkoston syysseminaari Paasitorni

Lisätiedot

Kiinan kursseilla 1 2 painotetaan suullista kielitaitoa ja kurssista 3 alkaen lisätään vähitellen myös merkkien lukemista ja kirjoittamista.

Kiinan kursseilla 1 2 painotetaan suullista kielitaitoa ja kurssista 3 alkaen lisätään vähitellen myös merkkien lukemista ja kirjoittamista. Kiina, B3kielen opetussuunnitelma (lukiossa alkava oppimäärä) Kiinan kursseilla tutustutaan kiinankielisen alueen elämään, arkeen, juhlaan, historiaan ja nykyisyyteen. Opiskelun ohessa saatu kielen ja

Lisätiedot

Laskut käyvät hermoille

Laskut käyvät hermoille Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011

Lisätiedot

KUULON HARJOITTELU DYSFASIALAPSELLA, HOIDON SEURANTA HERÄTEVASTETUTKIMUKSIN

KUULON HARJOITTELU DYSFASIALAPSELLA, HOIDON SEURANTA HERÄTEVASTETUTKIMUKSIN KUULON HARJOITTELU DYSFASIALAPSELLA, HOIDON SEURANTA HERÄTEVASTETUTKIMUKSIN Suur-Helsingin Sensomotorinen Keskus Puh: 09-484644 2 TUTKIMUS Esittelemme seuraavassa yhteenvedon tutkimuksesta, joka on tehty

Lisätiedot

Työkalujen merkitys mittaamisessa

Työkalujen merkitys mittaamisessa Työkalujen merkitys mittaamisessa Mittaaminen ja Ohjelmistotuotanto -seminaari Toni Sandelin 18.4.2001, VTT Elektroniikka, Oulu 1 Sisältö Mihin työkalutukea tarvitaan? Työkalut & metriikat: luokitus Mittausohjelmien

Lisätiedot

Aivotutkimus kielenoppimisen edistäjänä

Aivotutkimus kielenoppimisen edistäjänä Aivotutkimus kielenoppimisen edistäjänä 15.3.2018 Kaisa Lohvansuu, FT JYU. Since 1863. 1 -Kieli ja aivot -Aivotutkimus: Mitä tutkitaan ja miksi? -Mitä hyötyä aivotutkimuksesta on? JYU. Since 1863. 2 Aivotutkimuksen

Lisätiedot

T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä

T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä A2-VENÄJÄ vl.4-6 4.LUOKKA Opetuksen tavoitteet Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen T1 ohjata oppilasta havaitsemaan lähiympäristön ja maailman kielellinen ja kulttuurinen runsaus sekä

Lisätiedot

Valttikortit 100 -ohjelman sanasto on peruskoulun opetussuunnitelman ytimestä.

Valttikortit 100 -ohjelman sanasto on peruskoulun opetussuunnitelman ytimestä. Valttikortit 100 on uusi avaus sanaston ja kuullunymmärtämisen oppimiseen. Digitaaliset oppimateriaalit ovat aiemminkin lisänneet yksilöllistä työskentelyä ja välittömiä palautteita harjoitteluun, mutta

Lisätiedot

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot Laajennettu tiedonkäsitys ja tiedon erilaiset muodot Totuudesta väitellään Perinteinen käsitys Tutkimuksella tavoitellaan a. On kuitenkin erilaisia käsityksiä. Klassinen tiedon määritelmä esitetään Platonin

Lisätiedot

Ohjelmointi 1. Kumppanit

Ohjelmointi 1. Kumppanit Ohjelmointi 1 Kumppanit November 20, 2012 2 Contents 1 Mitä ohjelmointi on 7 2 Ensimmäinen C#-ohjelma 9 2.1 Ohjelman kirjoittaminen......................... 9 A Liite 11 3 4 CONTENTS Esipuhe Esipuhe 5

Lisätiedot

MALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA

MALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA MALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA Hannu Poutiainen, FT PUHDAS VESI JA YMPÄRISTÖ TUTKIMUSAVAUKSIA MAMKISSA Mikpoli 8.12.2016 Mitä mallit ovat? Malli on arvioitu kuvaus todellisuudesta joka on rakennettu

Lisätiedot

Palvelukuvaus Omakannan Omatietovaranto

Palvelukuvaus Omakannan Omatietovaranto Palvelukuvaus Omakannan Omatietovaranto 24.10.2018 Kela, Kanta-palvelut Muutoshistoria Versio Muutos Tekijä PVM 1.0 Ensimmäinen julkaistava versio pilotointivaihetta varten 1.1 Päivitetty sisältöä vastaamaan

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 2 visuaalinen prosessointi Treismanin FIT Kuva 1. Kuvassa on Treismanin kokeen ensimmäinen osio, jossa piti etsiä vihreätä T kirjainta.

Lisätiedot

17/20: Keittokirja IV

17/20: Keittokirja IV Ohjelmointi 1 / syksy 2007 17/20: Keittokirja IV Paavo Nieminen nieminen@jyu.fi Tietotekniikan laitos Informaatioteknologian tiedekunta Jyväskylän yliopisto Ohjelmointi 1 / syksy 2007 p.1/10 Tavoitteita

Lisätiedot

Esimerkkejä vaativuusluokista

Esimerkkejä vaativuusluokista Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään

Lisätiedot

Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet

Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 24. toukokuuta 2013 Sisällys Formaalit kielet On tapana sanoa, että merkkijonojen joukko on (formaali) kieli. Hieman

Lisätiedot

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.

Lisätiedot

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM

Puheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM Puheenkoodaus Olivatpa kerran iloiset serkukset PCM, DPCM ja ADPCM PCM eli pulssikoodimodulaatio Koodaa jokaisen signaalinäytteen binääriseksi (eli vain ykkösiä ja nollia sisältäväksi) luvuksi kvantisointitasolle,

Lisätiedot

Savonlinnan ammatti- ja aikuisopiston vieraiden kielten opetusta verkossa ja integroituna ammattiaineisiin. Johanna Venäläinen

Savonlinnan ammatti- ja aikuisopiston vieraiden kielten opetusta verkossa ja integroituna ammattiaineisiin. Johanna Venäläinen Savonlinnan ammatti- ja aikuisopiston vieraiden kielten opetusta verkossa ja integroituna ammattiaineisiin Johanna Venäläinen Kenelle ja miksi? Lähtökohtana ja tavoitteena on - tarjota opiskelijoille vaihtoehtoinen

Lisätiedot

Korpusten käsittely clt131, P Luento 1

Korpusten käsittely clt131, P Luento 1 Korpusten käsittely clt131, P2 2006 Luento 1 Nicholas Volk 3.11.2006 Humanistinen tiedekunta CLT131 Korpusten käsittely (syksy 2006) Luennoitsija FM Nicholas Volk Kurssiassistentti

Lisätiedot

Lahjakkuutta ja erityisvahvuuksia tukeva opetus äidinkielen näkökulma

Lahjakkuutta ja erityisvahvuuksia tukeva opetus äidinkielen näkökulma Lahjakkuutta ja erityisvahvuuksia tukeva opetus äidinkielen näkökulma Ulkomailla toimivien peruskoulujen ja Suomi-koulujen opettajat 4.8.2011 Pirjo Sinko, opetusneuvos Millainen on kielellisesti lahjakas

Lisätiedot

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015 TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 30. marraskuuta 2015 Sisällys t Väitöstilaisuus 4.12.2015 kello 12 vanhassa juhlasalissa S212 saa tulla 2 demoruksia

Lisätiedot

F-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella

F-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella F-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella 1 F-Secure KEY F-Secure KEY on palvelu, joka tallentaa turvallisesti kaikki henkilökohtaiset tunnistetiedot, kuten salasanat ja maksukorttitiedot,

Lisätiedot

Projektisuunnitelma. Projektin tavoitteet

Projektisuunnitelma. Projektin tavoitteet Projektisuunnitelma Projektin tavoitteet Projektin tarkoituksena on tunnistaa erilaisia esineitä Kinect-kameran avulla. Kinect-kamera on kytkettynä tietokoneeseen, johon projektissa tehdään tunnistuksen

Lisätiedot

Käyttöohje HERE Maps. 1.0. painos FI

Käyttöohje HERE Maps. 1.0. painos FI Käyttöohje HERE Maps 1.0. painos FI HERE Maps HERE Maps näyttää lähellä olevat kohteet ja opastaa sinut perille. Voit etsiä kaupunkeja, katuja ja palveluja löytää perille tarkkojen reittiohjeiden avulla

Lisätiedot

Intonaation analyysi ja annotointi puhekorpuksissa

Intonaation analyysi ja annotointi puhekorpuksissa Intonaation analyysi ja annotointi puhekorpuksissa 4.4.2002/HY:n fonetiikan laitos Stefan Werner stefan.werner@joensuu.fi Kieliteknologia/JoY Intonaation analyysi/annotointi HY 4.4.2002 p.1/43 Intonaation

Lisätiedot

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä olevilla komponenteilla? Voisiko jollakin ohjelmointikielellä

Lisätiedot

ESIOPETUS-1-2 LUOKKA OMA OPPIMISPOLKU

ESIOPETUS-1-2 LUOKKA OMA OPPIMISPOLKU Väritä yhdessä aikuisen kanssa: ESIOPETUS-- LUOKKA OMA OPPIMISPOLKU nimi: kun harjoittelet tietoa tai taitoa kun osaat tiedon tai taidon kun osaat tiedon tai taidon ja voisit opettaa sen toisille. MATEMATIIKKA

Lisätiedot

AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA

AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA Tietosuojavastaava Jarkko Reittu 13.11.2018 Aineiston jakamisen myyteistä ja haasteista/jarkko Reittu 1 ESITYKSEN KOHDE Kuinka tietosuojalainsäädäntö rajoittaa

Lisätiedot

Sisällys. Sisällys. Esipuhe...13. 1 Äänteellisen kehityksen peruskäsitteet...17. I Äänteellisen kehityksen edellytykset

Sisällys. Sisällys. Esipuhe...13. 1 Äänteellisen kehityksen peruskäsitteet...17. I Äänteellisen kehityksen edellytykset Sisällys Esipuhe...13 1 Äänteellisen kehityksen peruskäsitteet...17 1.1 Äänteiden tuotto...17 1.1.1 Vokaalit...18 1.1.2 Konsonantit...19 1.2 Fonologia...22 1.3 Foneettinen kirjoitus...23 I Äänteellisen

Lisätiedot

Muodolliset kieliopit

Muodolliset kieliopit Muodolliset kieliopit Luonnollisen kielen lauseenmuodostuksessa esiintyy luonnollisia säännönmukaisuuksia. Esimerkiksi, on jokseenkin mielekästä väittää, että luonnollisen kielen lauseet koostuvat nk.

Lisätiedot

Opetuskielen vaikutuksesta oppimiseen: Kuvailevaa evidenssiä opiskelijoiden näkemyksistä

Opetuskielen vaikutuksesta oppimiseen: Kuvailevaa evidenssiä opiskelijoiden näkemyksistä Harri J. Seppänen Opetuskielen vaikutuksesta oppimiseen: Kuvailevaa evidenssiä opiskelijoiden näkemyksistä 1. Johdanto Onko opetus kielellä vaikutusta opiskelijoiden oppimiseen? Tämä on tärkeä kysymys

Lisätiedot

Historian ja etnologian laitos

Historian ja etnologian laitos Historian ja etnologian laitos JYU. Since 1863. 15.11.2018 1 Historia JYU. Since 1863. 15.11.2018 2 Historian oppiaineen sisältöjä Historiassa ei opiskella vain tosiasioita tai faktoja, vaan opetellaan

Lisätiedot

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset 815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 2 vastaukset Harjoituksen aiheena on BNF-merkinnän käyttö ja yhteys rekursiivisesti etenevään jäsentäjään. Tehtävä 1. Mitkä ilmaukset seuraava

Lisätiedot

EuroTraffic Language Training

EuroTraffic Language Training EuroTraffic Language Training Käyttäjän opas Sisällysluettelo Kurssin aloittaminen... 3 Rekisteröityminen... 4 Sisäänkirjautuminen... 6 Tehtävien aloittaminen... 7 Sanasto... 9 Yhdistä ääni ja kuva...

Lisätiedot

811312A Tietorakenteet ja algoritmit 2015-2016. I Johdanto

811312A Tietorakenteet ja algoritmit 2015-2016. I Johdanto 811312A Tietorakenteet ja algoritmit 2015-2016 I Johdanto Sisältö 1. Algoritmeista ja tietorakenteista 2. Algoritmien analyysistä 811312A TRA, Johdanto 2 I.1. Algoritmeista ja tietorakenteista I.1.1. Algoritmien

Lisätiedot