Vfo254: Puhekorpusten käyttö
|
|
- Esa-Pekka Mäki
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan keräys Puheen annotointi Korpusten käyttö tutkimuksessa Ja käytännön harjoituksiin, joissa opitaan suunnittelemaan, tallentamaan ja annotoimaan puhekorpuksia. Kurssin harjoitustyönä tehdään pieni foneettinen tutkimus aikaansaadulla korpuksella. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 1 Puhekorpukset ja puhetietokannat Puhekorpukset ja puhetietokannat Puhekorpus Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen luettavassa muodossa ja on annotoitu sekä dokumentoitu siten, että sitä voi käyttää yhä uudelleen organisaation sisällä (in-house) tai sen ulkopuolella. Näin ollen, esim. yleisradioiden tallenteet jäävät määritelmän ulkopuolelle. Määritelmä koskee siis, esim. joukkoa puhesignaali-, laryngografi- ja EMG-signaaleja, sillä ehdolla, että ne on sopivasti annotoituja ja dokumentoituja. Tavallisen äänisignaalin lisäksi voimme siis sisällyttää korpukseen kaikenlaisia muitakin, joko tallennettuja tai alkuperäisestä signaalista analysoituja, signaaleja: esim. video, aikakoodi, perustaajuuskäyrät jne. Puhekorpus sisältää siis puhesignaalin lisäksi: Annotaatiot Tiedot puhujasta: ikä sukupuoli äidinkieli murretausta yms. Mahdollisimman paljon tietoa itse äänityksestä: Äänityspaikan sijainti ja laatu Mikrofoni ja tallennintyyppi Äänitysaika yms. Yllä oleva informaatio ei ehkä vaikuta kiinnostavalta, mutta se voi olla hyvinkin tärkeätä jossain myöhemmässä vaiheessa! Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 2 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 3
2 Puhekorpukset ja puhetietokannat Puhekorpukset ja puhetietokannat Tyypillisesti puhekorpukset sisältävät seuraavia asioita: Digitoidut signaalit: akustinen puhesignaali, laryngografin signaali, röntgen data. Analyysien tulokset: FFT data, LPC data, perustaajuus- ja äänekkyysdata, formantit. Markkerit: äänihuuliperiodit, vokaalien alut. Kuvailut: puhujien kuvailut, äänitysolosuhteet. Annotaatiot: (engl. annotations/labels), ortografiset, foneemiset, foneettiset, prosodiset transkriptiot, puheenvuorot, topiikit... Puhekorpuksen käyttöön saattaminen koostuu kolmesta vaiheesta: 1. Vaihe ennen äänityksiä = suunnittelu 2. Äänitysvaihe 3. Jälkikäsittelyvaihe = annotointi, analyysit Vaihe, ennen äänitystä sisältää seuraavat askeleet: 1. Korpuksen tarkoituksen määrittely 2. Korpuksen lingvistisen sisällön määrittely 3. Puhujien tyypin ja lukumäärän määrittely Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 4 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 5 Puhekorpukset eroavat tekstikorpuksista ainakin kahdeksalla tavalla, jotka riippuvat seuraavista asioista: 1. puhe on katoavaista, teksti pysyvää, 2. puheen ja tekstin tuottoon kuluva aika ei ole sama, 3. virheiden rooli on erilainen, 4. kirjoitetut ja puhutut sanat eroavat toisistaan, 5. erilaiset tietorakenteet: ASCII vs. näytteistetty data, 6. syyt, jotka johtavat korpusten erilaisiin kokoihin, 1. Puhe on transienttia Puhe katoaa heti kun se on tuotettu: kirjoitus säilyy! Puhe on siis erikseen tallennettava sen kerääminen ei ole triviaali asia, kuten on (yleensä) laita kirjoitetun tekstin kanssa. 7. kirjoitetun ja puhutan materiaalin laillisen statuksen erot, ja 8. kirjoitettu kieli on symbolista ja puhe fyysisesti mitattavaa jatkuvaa signaalia ajassa! Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 6 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 7
3 3. Puhe on täynnä virheitä 2. Puheentuottoon käytetty aika on vähäistä Puheentuottoon kulunut aika on yleensä puhumiseen kulunut aika. Puhe tuotetaan keskimäärin tavua minuutissa. Kirjoittamiseen käytetään yleensä huomattavasti enemmän aikaa. Spontaanissa puheessa puhujan editointi on kuuluvaa ja jää mukaan tallenteeseen. Keskeytykset, hesitaatiot, toistot ja korjaukset ovat olennainen osa puhetta ja tulee säilyttää (spontaanin puheen) korpuksissa. Tekstikorpuksissa kirjoittajan suorittamat korjaukset ovat jo editoidut pois. Puhekorpuksissa suuntaus on kohti spontaania puhetta luettu laboratoriopuhe on väistymässä. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 8 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 9 4. Sanat vaihtelevat foneettisesti Puhutut versiot ortografisesti identtisistä sanoista osoittavat yleensä suurta foneettista variaatiota sekä segmentaalisesti että prosodisesti. Sanat saattavat jopa kokonaan kadota tai jäädä vain jonkin segmentaalisen tai prosodisen vihjeen varaan: onko sinulla se onksuse. Erillään lausutut sanat ovat jatkuvaan puheeseen verrattuna hyvinkin erilaiset: kanoninen tai sitaatiomuoto. Näin ollen on tärkeää, että korpukseen tallennetaan ainakin kahden, mieluummin kolmen tasoista, symbolista kuvausta, joilla kaikilla on suhde akustiseen signaaliin: 1. Puhutut sanat erotetaan leksikaalisesti ortografisella tasolla. 2. Sanat tulisi esittää myös karkealla foneettisella kirjoituksella ns. sitaatiomuodoissaan, jotka voidaan tuottaa esim. automaattisella grafeemi-foneemi -konversiolla. 3. Todelliset foneettiset kuvaukset tulee tehdä ns. kapealla tarkekirjoituksella, jonka symbolit suhteutetaan ajallisesti signaaliin, joko manuaalisesti tai automaattisesti. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 10 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 11
4 6. Puhe vaatii paljon tilaa 5. Tallennettu puhe on vain aikafunktioita Puhtaana datana, kirjoitetut tekstit koostuvat lähinnä merkeistä, jotka voidaan koodata joko 7, 8 tai 16 bittisinä ASCII- tai Unikoodimerkkeinä. Koodatut merkkijonot sisältävät jo sellaista informaatiorakennetta, joka ei ole läsnä puhesignaalissa. Puhesignaali ei sisällä eksplisiittisiä sanarajoja, pilkkuja, pisteitä, huutomerkkejä jne. Tallennettu puhesignaali on primäärisesti vain digitalisoituja aikafunktioita. Tallennettu puhe vie huomattavasti enemmän tilaa kuin vastaava ASCII-muotoinen data. Kolmikirjaimen sana vie vain kolme tavua (byte) tilaa kun vastaava digitoitu, puhuttu sana vie huomattavasti enemmän. Kolme äännettä: 0.5 s, 16 bittisellä kvantisoinnilla ja 48 khz:n näyttenottotaajuudella kirjoitutun ja puhutun tallenteen suhteeksi tulee 1/16000! Toisaalta puhuttujen muotojen erilaisuus vaatii jokaisen sanan tallentamista useaan kertaan riippuen puhujasta, puhetyylistä. Näin ei kuitenkaan kovin usein tehdä. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 12 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo Puhe tuo lisää laillisia ongelmia Yleensä kirjoitetut tekstit on jo julkaistu, jolloin niiden käyttö määräytyy olemassaolevien lakien ja säännöstöjen mukaan: lait voivat mutkistaa tai estää korpusten jakamisen käyttäjille. Puheen kannalta tilanne voi olla vieläkin mutkikkaampi: valmiiksi äänitetty materiaali voi tuottaa ylitsepääsemättömiä ongelmia, joista itse äänitettävällä materiaalilla selviää tekemällä puhujan kanssa sopimuksen ennen äänittämistä. 8. Puhe on jatkuvaa! Digitoitu signaali ei itsessään sisällä minkäänlaisia kategorioita kuten on laita kirjoitetun ASCII-datan kanssa. Nykyisillä tekniikoilla ei ole periaatteessa edes mahdollista (varmasti) sanoa, onko jokin signaali puhetta vai ei: puhedatan kategorioiminen annotaatioiksi vaatii aina manuaalista käsittelyä ja inhimillistä tulkintaa. Toisaalta puhesingnaali sisältää relevanttia prosodista ja paralingvististä informaatiota, jota teksti ei sisällä. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 14 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 15
5 Foneettinen tutkimus Foneettiseen tutkimukseen kuuluvat kaikki puheeseen liittyvät tekijät: usein tutkimus vaatii tarkasti kontrolloitua ja systemaattista dataa jonka tutkijat joutuvat keräämään erikseen. Kiinnostus spontaania ja vähemmän kontrolloitua puhetta kohtaan on kuitenkin antanut foneetikoillekin mahdollisuuden käyttää jo valmiita korpuksia. Spontaanin puheen tilastollinen kuvaus vaatii kaiken lisäksi suuria määriä dataa, jonka keräämiseen ja annotointiin yksittäisellä tutkijalle ei ole mahdollisuuksia. Tämä lisää edelleen spontaanin puheen korpusten arvoa foneettisessa tutkimuksessa. Sosiolingvistinen tutkimus Sosiolingvistinen puheentutkimus on yleensä pohjautunut kolmella tavalla hankittuun dataan: 1. Kirjoitettujen kyselyiden avulla: esim. miten vastaajat mielestään lausuvat tietyn sanan. 2. Tutkijan observaatioiden pohjalta: esim. Labovin tutkimukset /r/:n ellipsiksestä New Yorkilaisilla puhujilla. Labov yksinkertaisesti kirjasi, onko puhujalla kyseistä äännettä tietyissä sanoissa. 3. Keräämällä puhekorpuksia: perkeptuaalista analyysiä on tuettu keräämällä korpuksia. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 16 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 17 Lapsen kielen kehitys Psykolingvistinen tutkimus Psykolingvistinen tutkimus on hyvin laajaa: se vaihtelee lapsen kielen oppimisen tutkimisesta aikuisten kielen ymmärtämisen liittyvien mentaalisten prosessien tutkimukseen aina kielen häiriöiden tutkimukseen. Yksi alue, jossa psykolingvistit ovat käyttäneet puhekorpuksia on ns. lipsahdusten tutkimus. Lapsen kielen kehitystä tutkitaan monilla eri tieteen aloilla, tutkimus voi olla: lingvististä sosiolingvististä psykolingvististä foneettista Kaikki osa-alueet hyötyvät puhekorpuksista, mutta toistaiseksi korpukset koostuvat lähinnä transkriptioista (CHILDES). Kunnollisen spontaanin puheen elisitoiminen lapsilta on vaikeaa, mutta puhetta voidaan saada helposti esim. pelien avulla. Lapsen kielen kehittymistä kuvaavien korpusten on hyvä olla longitudinaalisia; ts. saman henkilön puhetta tulee tallentaa eri kielen kehityksen vaiheissa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 18 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 19
6 Kielitieteellinen tutkimus Vieraan kielen oppiminen Vieraan kielen oppimista on jonkin verran tutkittu myös puhekorpuspohjaisesti, mutta toistaiseksi tutkimus on perustunut lähinnä transkriptioihin. Korpuksia voidaan käyttää esim. opetusmateriaalin tekemiseen. Chomskylainen mentalistinen kielitieteellinen tutkimus, joka koskee lähinnä kompetenssia ei introspektiivisen luonteensa vuoksi hyödy korpuksista. Kielen lopullinen teoria vaatii kuitenkin kompetenssin ja performanssin integrointia. Performanssin tutkiminen on luonnostaan dataan perustuvaa, joten puhtaasti kielitieteellinenkin tutkimuksen tulee osaltaa perustua mm. puhekorpuksiin. Puhekorpukset yhdistävät siis aukon kompetenssiin perustuvan kieliopin ja todellisen kielenkäytön välillä. Diskurssianalyysi on yksi kielitieteellinen suuntaus, joka selkeästi hyötyy korpuksista. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 20 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 21 Audiologia Audiologia on kuuloa tutkiva tiede, jota puheen havaitseminen koskee vain epäsuorasti. Audiologit ovat kuitenkin käyttäneet puhetta ja puhekorpuksia kuulon mittaamiseen jo kauan. Kuulon mittaamiseen käytetyt korpukset ovat tarkasti kalibroituja akustisten muuttujien ja normaalikuuloisten vastaanoton suhteen. Yleensä ne sisältävät erillisiä äänteitä, nonsense sanoja, todellisia sanoja ja jatkuvaa puhetta. Patologinen puhe Patologisen puheen tutkimus liittyy monenlaisiin häiriöihin käheästä puheesta afasiaan. Puhekorpusten rooli patologisen puheen suhteen liittyy esim. automaattisen diagnostiikan kehittämiseen. Patologisen puheen korpuksia käytetään myös kieli- ja puhehäiriöiden aiheuttavien prosessien tutkimukseen. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 22 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 23
7 Puhekorpusten käyttötarkoitukset: teknologiset sovellukset Puhekorpusten käyttötarkoitukset: teknologiset sovellukset Sovellustyypit Teknologiset sovellukset, jotka tarvitsevat kehitykseensä puhekorpuksia, voidaan karkeasti jakaa neljään luokkaan: 1. puhesynteesi 2. puheentunnistus 3. puhejärjestelmät (esim. dialogijärjestelmät) 4. puhujan tunnistus/verifiointi Sovellusten tekemiseen tarvittavat korpukset vaihtelevat suuresti niin sisältönsä kuin kokonsakin suhteen! Puhesynteesi Artikulatorinen synteesi vaatii artikulatorista dataa: puhesignaalin lisäksi tarvitaan mm. erilaisten kuvantamismenetelmien tuottamaa dataa (esim. MRI). Konkatenaatiojärjestelmät tarvitsevat hyvinkin erilaisia korpuksia difonikonkatenaatio vs. yleinen unit selection. Konkatenaatiodata voi olla edelleen parametrisoitu (esim. LPC) ja siihen voidaan liittää esim. tieto äänihuuliperioideista (engl. pitch marks). Periaatteessa kaikki mallintaminen synteesijärjestelmissä vaatii korpuksia pohjakseen ja toisaalta jokainen malli on puhujakohtainen ja esim. eri sukupuolten äänien tuottaminen vaatii omat korpuksensa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 24 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 25 Tietoon perustuvat vs. stokastiset järjestelmät Erilaiset tunnistusjärjestelmät Yleisesti puheentunnistusjärjestelmät voidaan jakaa kolmeen pääluokkaan perustuen siihen, 1. minkälaista tunnistustrategiaa niissä käytetään 2. minkälaisten puhujien puhetta niissä tunnistetaan, ja 3. minkälaista puhetta ne tunnistavat. Nykyiset järjestelmät ovat kaikki ns. stokastisia. Ne ovat siis oppivia järjestelmiä ja vaativat suuria määriä opetusdataa, joka on yleisesti ollut suhteellisen köyhästi annotoitua. Uusimmissa järjestelmissä on alettu hyödyntää myös morfologista ja fonologista tietämystä tämä ei kuitenkaan paljonkaan muuta datan tarvetta; ortografinen transkriptio riittää annotoinniksi. Järjestelmien sisältämät kielimallit kuitenkin vaativat puhedatan lisäksi suuria tekstikorpuksia. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 26 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 27
8 Puhujasta riippuvaiset ja riippumattomat järjestelmät Riippuen siitä, onko järjestelmän tarkoitettu tunnistaa vain yhden ihmisen puhetta vaiko useamman, on niiden opetuskorpusten tarve hyvinkin erilainen ainakin kokonsa suhteen. Puhujasta riippumattomat järjestelmät vaativat luonnollisesti dataa mahdollisimman monelta puhujalta siitä huolimatta ne usein opetetaan tunnistamaan jonkin alaryhmän puhetta; esim. miehet vs. naiset. Jotkin järjestelmät ovat adaptiivisia, mutta erilliset opetussessiot ovat yleensä interaktiivisia eivätkä vaadi erillisiä korpuksia tällaisten järjestelmien tutkiminen ja kehittäminen toisaalta vaativat niitä. Järjestelmät ovat myös sensitiivisiä datan tallennusympäristön suhteen ja tarvitaan eri korpukset esim. autoissa vs. puhelimessa tehtävään tunnistamiseen. Erilliset sanat vs. jatkuva puhe Tunnistusjärjestelmät voidaan rakentaa tunnistamaan joko erikseen lausuttuja sanoja tai jatkuvaa puhetta. Jatkuvassa puheessa täytyy tunnistaa sanarajat, joka monimutkaistaa prosessin oleellisesti. Luonnollisesti tällaisten järjestelmien opetusdatat eroavat suuresti toisistaan. Yksi muoto erillisten sanojen tunnistamisesta on ns. word spotting, jossa tunnistetaan tiettyjä sanoja vaikkapa hyvinkin häiriöisissä olosuhteissa. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 28 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 29 Puheentunnistuksen tutkimus Yleisesti puheentunnistuksen tutkimus vaatii aina kahden korpuksen olemassaoloa: ns. opetus- ja testikorpukset. Aina testaamiseen ei riitä, että yksi korpus jaetaan kahteen osaan. Korpusten lopullinen muoto ja sisältä riippuvat myös täysin siitä, minkälaiseen tarkoitukseen tunnistinta tehdään: esim. numeroiden tunnistamiseen on kerätty useita suuria korpuksia. Spoken Language Systems Dialogijärjestelmien täytyy tunnistusvaiheessa saada jonkinlainen käsitys myös tunnistetun puheen merkityksestä. Järjestelmien synteesi- ja tunnistusosien tekemiseen vaadittavien korpusten lisäksi tarvitaan spontaanin puheen oleellisten piirteiden mallintamista tukevia korpuksia sekä dialogin rakenteen mallintamista tukevia korpuksia. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 30 Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 31
9 Puhujan tunnistus ja verifikaatio Puhujan tunnistus (identifoiminen) voidaa yleisesti jakaa kahteen kategoriaan: suljetun ja avoimen joukon tunnistamiseen. Suljetussa joukossa tunnistetaan joku joukon jäsen ja avoimen joukon tunnistuksessa päätellään kuuluuko joku puhuja tiettyyn joukkoon. Tunnistus voi olla tekstistä riippuvaa tai riippumatonta. Puhujantunnistusta varten luotavissa korpuksissa olellista on, että ne sisältävät useita äänityksiä samalta puhujalta erilaisissa olosuhteissa. Olesuhteet voivat olla kategorisoitu esim. kanavan tilan tai puhujan fysiologisen sekä psykologisen tilan mukaan. Vfo254: Puhekorpusten käyttö HY - Fonetiikan laitos Kalvo 32
Vfo254: Puhekorpusten käyttö
Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan
LisätiedotPuhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio
Puhekorpukset ja puhetietokannat Puhekorpus Puhekorpukset Martti Vainio Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen luettavassa
LisätiedotVfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus
Symbolinen representaatio Vfo 254: Puhekorpusten käsittely: Puhekorpusten lingvistinen representaatio Martti Vainio Puhekorpuksen tutkimininen on mahdollista vain symbolisen representaation kautta näytteistettyä
LisätiedotMitä suomen intonaatiosta tiedetään
Mitä suomen intonaatiosta tiedetään ja mitä ehkä tulisi tietää? Tommi Nieminen Itä-Suomen yliopisto AFinLAn syyssymposium Helsinki 13. 14. 11. 2015 Johdanto Jäsennys 1 Johdanto 2 Mitä intonaatiosta tiedetään?
LisätiedotSuomen prosodian variaation tutkimuksesta
Suomen prosodian variaation tutkimuksesta Tommi Nieminen Itä-Suomen yliopisto Tommi Kurki Turun yliopisto Prosodian käsitteestä prosodia käsittää kaikki ne puheen ilmiöt, jotka eivät ole segmentoitavissa
LisätiedotÅbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto
Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on
Lisätiedot8003051 Puheenkäsittelyn menetelmät
8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme
LisätiedotPuhesynteesin perusteet Luento 4: difonikonkatenaatio
Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä
LisätiedotFONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA
FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA Heini Kallio, tohtorikoulutettava Käyttäytymistieteiden laitos, fonetiikka Helsingin yliopisto heini.h.kallio@helsinki.fi Fonetiikan haasteet kielenopetuksessa
LisätiedotTTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,
Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin
LisätiedotPuhutun ja kirjoitetun rajalla
Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic
LisätiedotSay it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn
LisätiedotFoneettiset symbolit
Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-
LisätiedotProsodian havaitsemisesta: suomen lausepaino ja focus
Prosodian havaitsemisesta: suomen lausepaino ja focus Martti Vainio Helsingin yliopisto, Fonetiikan laitos; Kieliteknologia Juhani Järvikivi, Turun yliopisto, Psykologia; University of Dundee Yleistä Lingvistisen
LisätiedotYhdyssana suomen kielessä ja puheessa
Yhdyssana suomen kielessä ja puheessa Tommi Nieminen Jyväskylän yliopisto Anna Lantee Tampereen yliopisto 37. Kielitieteen päivät Helsingissä 20. 22.5.2010 Yhdyssanan ortografian historia yhdyssanan käsite
LisätiedotJohdatus rakenteisiin dokumentteihin
-RKGDWXVUDNHQWHLVLLQGRNXPHQWWHLKLQ 5DNHQWHLQHQGRNXPHQWWL= rakenteellinen dokumentti dokumentti, jossa erotetaan toisistaan dokumentin 1)VLVlOW, 2) UDNHQQHja 3) XONRDVX(tai esitystapa) jotakin systemaattista
LisätiedotPuhesynteesi. Martti Vainio. 11. huhtikuuta 2003
Puhesynteesi Signaalin generointi Martti Vainio mailto:martti.vainio@helsinki.fi 11. huhtikuuta 2003 Signaalin generointi puhesynteesissä Kuinka tuottaa foneettisesta symbolisesta tiedosta jatkuvaa signaalia
LisätiedotPuhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto
Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla Mietta Lennes FIN-CLARIN / Helsingin yliopisto Johdanto Kun puhetta ja kieltä tutkitaan kvantitatiivisesti, on
LisätiedotPuheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting
Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus
LisätiedotAineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin
Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:
LisätiedotFP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat
FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat Martti Vainio -- syksy 2006 Artikulaatiotavat Konsonantit voivat siis vaihdella artikulaatipaikan mukaan ja sen mukaan ovatko ne soinnillisia vai eivät
LisätiedotTilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
LisätiedotPuhesynteesin perusteet Luento 5: unit selection -synteesi
Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen
LisätiedotEdistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.
Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti
LisätiedotTiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas
Tiedonhallinnan perusteet Viikko 1 Jukka Lähetkangas Kurssilla käytävät asiat Tietokantojen toimintafilosofian ja -tekniikan perusteet Tiedonsäilönnän vaihtoehdot Tietokantojen suunnitteleminen internetiä
LisätiedotPuhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38
Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.
LisätiedotPuhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein
Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla
LisätiedotPuheteknologia Informaa2oteknologian perusteet. Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos
Puheteknologia Informaa2oteknologian perusteet Kalle Palomäki Signaalinkäsi8elyn ja akus2ikan laitos Määritelmä: Puhekäy8ölii8ymä Kone8a ohjataan ja käytetään puhumalla Kone voi olla hardwarea, sobaa,
LisätiedotTilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
LisätiedotKielellisen datan käsittely ja analyysi tutkimuksessa
Kielellisen datan käsittely ja analyysi tutkimuksessa Kimmo Koskenniemi 4.4.2007 Yleisen kielitieteen laitos Humanistinen tiedekunta Kielidataa on monenlaista Tekstiä erilaisista lähteistä kirjoista, lehdistä,
LisätiedotPuhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein
Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla
LisätiedotPuhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38
Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.
LisätiedotPuheentunnistus Mikko Kurimo
Puheentunnistus Mikko Kurimo Mitä automaattinen puheentunnistus on? Automaattinen puheentunnistin on laite, joka määrittää ja tulostaa sanan tai tekstin, joka parhaiten vastaa äänitettyä puhesignaalia.
LisätiedotHiggsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011
Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosoni on ainoa hiukkasfysiikan standardimallin (SM) ennustama hiukkanen, jota ei ole vielä löydetty
LisätiedotKieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat
Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet
LisätiedotLAADULLISESTA SISÄLLÖNANALYYSISTÄ
LAADULLISESTA SISÄLLÖNANALYYSISTÄ Aineiston ja teorian suhde INDUKTIIVINEN ANALYYSI Tulokset/teoria muodostetaan aineiston perusteella Tutkimuskysymykset muotoutuvat analyysin edetessä ABDUKTIIVINEN ANALYYSI
Lisätiedot5 Akustiikan peruskäsitteitä
Puheen tuottaminen, havaitseminen ja akustiikka / Reijo Aulanko / 2016 2017 14 5 Akustiikan peruskäsitteitä ääni = ilmapartikkelien edestakaista liikettä, "tihentymien ja harventumien" vuorottelua, ilmanpaineen
LisätiedotSanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa
Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004
LisätiedotCtl160 Tekstikorpusten tietojenkäsittely p.1/15
Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/15 Lisää säännöllisistä lausekkeista Aikaisemmin esityt * ja + yrittävät osua mahdollisimman pitkään merkkijonoon
LisätiedotTietotekniikan laitoksen uusi linja
Tietotekniikan laitoksen uusi linja Tietotekniikan laitos 2011- Yhteisen rungon ympärille liittyvät oksina Tietotekniikan laitoksen perinteiset ja uudet linjat Haluatko harrastuksiisi liittyvän ammatin?
LisätiedotS-114.2720 Havaitseminen ja toiminta
S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi
LisätiedotSay it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa
Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn
LisätiedotVarhainen leikki ja sen arviointi
Varhainen leikki ja sen arviointi Paula Lyytinen Jyväskylän yliopisto Psykologian laitos Hyvä Alku messut 2.9.2004 Leikin sisällöt eri ikävaiheissa Esine- ja toimintaleikit (0-3 v) Eksploratiiviset Funktionaalis-relationaaliset
LisätiedotSuomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu
Suomen kielen variaatio 1 Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Puhuttu ja kirjoitettu kieli Puhuttu kieli on ensisijaista. Lapsi oppii (omaksuu) puhutun kielen luonnollisesti siinä ympäristössä,
LisätiedotLuonnollisella kielellä keskustelevat järjestelmät
Luonnollisella kielellä keskustelevat järjestelmät Jussi Lepistö (jussi.lepisto@cs.helsinki.fi) Helsingin Yliopisto Tieteellisen kirjoittamisen kurssi Johdanto Esittelen luonnollisella kielellä keskustelevien
LisätiedotTeknillinen korkeakoulu T-76.115 Tietojenkäsittelyopin ohjelmatyö. Testitapaukset - Koordinaattieditori
Testitapaukset - Koordinaattieditori Sisällysluettelo 1. Johdanto...3 2. Testattava järjestelmä...4 3. Toiminnallisuuden testitapaukset...5 3.1 Uuden projektin avaaminen...5 3.2 vaa olemassaoleva projekti...6
LisätiedotTaulukot. Jukka Harju, Jukka Juslin 2006 1
Taulukot Jukka Harju, Jukka Juslin 2006 1 Taulukot Taulukot ovat olioita, jotka auttavat organisoimaan suuria määriä tietoa. Käsittelylistalla on: Taulukon tekeminen ja käyttö Rajojen tarkastus ja kapasiteetti
LisätiedotSGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja
SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.
LisätiedotPuheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä
Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...
LisätiedotKulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs
Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs Esitys koulutuksessa: Maahanmuuttajien ammatillinen koulutus, 20.3.2009 Opetushallitus Esityksen sisältö Lähestymistapoja kulttuuriin ja
LisätiedotTreffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä. FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi
Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi Kuka Elina Tergujeff? englannin ja ruotsin opettaja filosofian tohtori, soveltava
LisätiedotPuhe ja kommunikaatio
Puhe ja kommunikaatio Puhe on ihmisen kehittämistä kommunikoinnin muodoista hienostunein ja monimutkaisin -- siihen on kerrostunut useanlaista informaatiota, joiden määrittelyyn tarvitaan jonkinlainen
LisätiedotLuku 2. Datasta tietoon: mitä dataa? mitä tietoa?
1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö
LisätiedotKuvaruudun striimaus tai nauhoitus. Open Broadcaster Software V.20. Tero Keso, Atso Arat & Niina Järvinen (muokattu )
Kuvaruudun striimaus tai nauhoitus Open Broadcaster Software V.20 Tero Keso, Atso Arat & Niina Järvinen (muokattu 28.11.2017) OBS 1 (12) Sisällysluettelo Mikä on OBS... 2 Ohjelman perusasetukset... 2 Tarvittavat
LisätiedotVHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen
VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen Vaihe 1: Asenna VHOPE PC:hen täytyy asentaa VHOPE-sovellus, ennen kuin USB-muistitikun esitysaineistoa voidaan ryhtyä käyttämään. VCN (Volvo Corporate
LisätiedotJohdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]
Johdatus tekoälyyn Luento 6.10.2011: Koneoppiminen Patrik Hoyer [ Kysykää ja kommentoikaa luennon aikana! ] Koneoppiminen? Määritelmä: kone = tietokone, tietokoneohjelma oppiminen = ongelmanratkaisukyvyn
LisätiedotTähtitieteen käytännön menetelmiä Kevät 2009
Tähtitieteen käytännön menetelmiä Kevät 2009 2009-01-12 Yleistä Luennot Luennoija hannu.p.parviainen@helsinki.fi Aikataulu Observatoriolla Maanantaisin 10.00-12.00 Ohjattua harjoittelua maanantaisin 9.00-10.00
LisätiedotYSILUOKKA. Tasa-arvo yhteiskunnassa ja työelämässä
YSILUOKKA Tasa-arvo yhteiskunnassa ja työelämässä Sisältö ja toteutus Tunnin tavoitteena on, että oppilaat ymmärtävät mitä sukupuolten välinen tasaarvo tarkoittaa Suomessa, mitä tasa-arvoon liittyviä haasteita
LisätiedotCHERMUG-pelien käyttö opiskelijoiden keskuudessa vaihtoehtoisen tutkimustavan oppimiseksi
Tiivistelmä CHERMUG-projekti on kansainvälinen konsortio, jossa on kumppaneita usealta eri alalta. Yksi tärkeimmistä asioista on luoda yhteinen lähtökohta, jotta voimme kommunikoida ja auttaa projektin
Lisätiedot11.4. Context-free kielet 1 / 17
11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä
LisätiedotTiedon arvottaminen osana arkistointia
Tiedon arvottaminen osana arkistointia Pirkko Kortekangas VSSHP, VS atj kehittämispäällikkö Tiedon arvotus koskee dataa, josta ei ole lainsäädäntöä Nykyinen Asetus potilasasiakirjojen laatimisesta ja säilyttämisestä
LisätiedotKojemeteorologia. Sami Haapanala syksy 2013. Fysiikan laitos, Ilmakehätieteiden osasto
Kojemeteorologia Sami Haapanala syksy 2013 Fysiikan laitos, Ilmakehätieteiden osasto Kojemeteorologia, 3 op 9 luentoa, 3 laskuharjoitukset ja vierailu mittausasemalle Tentti Oppikirjana Rinne & Haapanala:
LisätiedotDigitaaliset tarinat
Future School research Ist Wave-hanke 2009-2011 Digitaaliset tarinat Esi- ja alkuopetusryhmissä Marja Hytönen KM, Tutkija Literacy in the 21st Century- Uusi luku ja kirjoitustaito Digitarina>
LisätiedotTIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 8. maaliskuuta 2012
TIEA241 Automaatit ja kieliopit, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 8. maaliskuuta 2012 Sisällys Ongelma-analyysiä Sisällys Ongelma-analyysiä Hypoteettinen ongelma The Elite Bugbusters
LisätiedotPuhumaan oppii vain puhumalla.
Puhumaan oppii vain puhumalla. Maisa Martin Jyväskylän yliopisto suomenkielisanootervetuloa.fi Toisto-menetelmän periaatteet ja selkopuhe oppijoiden tukena Luetaan yhdessä -verkoston syysseminaari Paasitorni
LisätiedotKiinan kursseilla 1 2 painotetaan suullista kielitaitoa ja kurssista 3 alkaen lisätään vähitellen myös merkkien lukemista ja kirjoittamista.
Kiina, B3kielen opetussuunnitelma (lukiossa alkava oppimäärä) Kiinan kursseilla tutustutaan kiinankielisen alueen elämään, arkeen, juhlaan, historiaan ja nykyisyyteen. Opiskelun ohessa saatu kielen ja
LisätiedotLaskut käyvät hermoille
Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011
LisätiedotKUULON HARJOITTELU DYSFASIALAPSELLA, HOIDON SEURANTA HERÄTEVASTETUTKIMUKSIN
KUULON HARJOITTELU DYSFASIALAPSELLA, HOIDON SEURANTA HERÄTEVASTETUTKIMUKSIN Suur-Helsingin Sensomotorinen Keskus Puh: 09-484644 2 TUTKIMUS Esittelemme seuraavassa yhteenvedon tutkimuksesta, joka on tehty
LisätiedotTyökalujen merkitys mittaamisessa
Työkalujen merkitys mittaamisessa Mittaaminen ja Ohjelmistotuotanto -seminaari Toni Sandelin 18.4.2001, VTT Elektroniikka, Oulu 1 Sisältö Mihin työkalutukea tarvitaan? Työkalut & metriikat: luokitus Mittausohjelmien
LisätiedotAivotutkimus kielenoppimisen edistäjänä
Aivotutkimus kielenoppimisen edistäjänä 15.3.2018 Kaisa Lohvansuu, FT JYU. Since 1863. 1 -Kieli ja aivot -Aivotutkimus: Mitä tutkitaan ja miksi? -Mitä hyötyä aivotutkimuksesta on? JYU. Since 1863. 2 Aivotutkimuksen
LisätiedotT3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä
A2-VENÄJÄ vl.4-6 4.LUOKKA Opetuksen tavoitteet Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen T1 ohjata oppilasta havaitsemaan lähiympäristön ja maailman kielellinen ja kulttuurinen runsaus sekä
LisätiedotValttikortit 100 -ohjelman sanasto on peruskoulun opetussuunnitelman ytimestä.
Valttikortit 100 on uusi avaus sanaston ja kuullunymmärtämisen oppimiseen. Digitaaliset oppimateriaalit ovat aiemminkin lisänneet yksilöllistä työskentelyä ja välittömiä palautteita harjoitteluun, mutta
LisätiedotLaajennettu tiedonkäsitys ja tiedon erilaiset muodot
Laajennettu tiedonkäsitys ja tiedon erilaiset muodot Totuudesta väitellään Perinteinen käsitys Tutkimuksella tavoitellaan a. On kuitenkin erilaisia käsityksiä. Klassinen tiedon määritelmä esitetään Platonin
LisätiedotOhjelmointi 1. Kumppanit
Ohjelmointi 1 Kumppanit November 20, 2012 2 Contents 1 Mitä ohjelmointi on 7 2 Ensimmäinen C#-ohjelma 9 2.1 Ohjelman kirjoittaminen......................... 9 A Liite 11 3 4 CONTENTS Esipuhe Esipuhe 5
LisätiedotMALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA
MALLIT VESIJÄRJESTELMIEN TUTKIMUKSESSA Hannu Poutiainen, FT PUHDAS VESI JA YMPÄRISTÖ TUTKIMUSAVAUKSIA MAMKISSA Mikpoli 8.12.2016 Mitä mallit ovat? Malli on arvioitu kuvaus todellisuudesta joka on rakennettu
LisätiedotPalvelukuvaus Omakannan Omatietovaranto
Palvelukuvaus Omakannan Omatietovaranto 24.10.2018 Kela, Kanta-palvelut Muutoshistoria Versio Muutos Tekijä PVM 1.0 Ensimmäinen julkaistava versio pilotointivaihetta varten 1.1 Päivitetty sisältöä vastaamaan
LisätiedotS-114.2720 Havaitseminen ja toiminta
S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 2 visuaalinen prosessointi Treismanin FIT Kuva 1. Kuvassa on Treismanin kokeen ensimmäinen osio, jossa piti etsiä vihreätä T kirjainta.
Lisätiedot17/20: Keittokirja IV
Ohjelmointi 1 / syksy 2007 17/20: Keittokirja IV Paavo Nieminen nieminen@jyu.fi Tietotekniikan laitos Informaatioteknologian tiedekunta Jyväskylän yliopisto Ohjelmointi 1 / syksy 2007 p.1/10 Tavoitteita
LisätiedotEsimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
LisätiedotSäännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet
TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 24. toukokuuta 2013 Sisällys Formaalit kielet On tapana sanoa, että merkkijonojen joukko on (formaali) kieli. Hieman
LisätiedotTEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)
JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.
LisätiedotPuheenkoodaus. Olivatpa kerran iloiset serkukset. PCM, DPCM ja ADPCM
Puheenkoodaus Olivatpa kerran iloiset serkukset PCM, DPCM ja ADPCM PCM eli pulssikoodimodulaatio Koodaa jokaisen signaalinäytteen binääriseksi (eli vain ykkösiä ja nollia sisältäväksi) luvuksi kvantisointitasolle,
LisätiedotSavonlinnan ammatti- ja aikuisopiston vieraiden kielten opetusta verkossa ja integroituna ammattiaineisiin. Johanna Venäläinen
Savonlinnan ammatti- ja aikuisopiston vieraiden kielten opetusta verkossa ja integroituna ammattiaineisiin Johanna Venäläinen Kenelle ja miksi? Lähtökohtana ja tavoitteena on - tarjota opiskelijoille vaihtoehtoinen
LisätiedotKorpusten käsittely clt131, P Luento 1
Korpusten käsittely clt131, P2 2006 Luento 1 Nicholas Volk 3.11.2006 Humanistinen tiedekunta CLT131 Korpusten käsittely (syksy 2006) Luennoitsija FM Nicholas Volk Kurssiassistentti
LisätiedotLahjakkuutta ja erityisvahvuuksia tukeva opetus äidinkielen näkökulma
Lahjakkuutta ja erityisvahvuuksia tukeva opetus äidinkielen näkökulma Ulkomailla toimivien peruskoulujen ja Suomi-koulujen opettajat 4.8.2011 Pirjo Sinko, opetusneuvos Millainen on kielellisesti lahjakas
LisätiedotTIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015
TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 30. marraskuuta 2015 Sisällys t Väitöstilaisuus 4.12.2015 kello 12 vanhassa juhlasalissa S212 saa tulla 2 demoruksia
LisätiedotF-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella
F-Secure KEY salasanojenhallintaohjelman käyttöönotto PC -laitteella 1 F-Secure KEY F-Secure KEY on palvelu, joka tallentaa turvallisesti kaikki henkilökohtaiset tunnistetiedot, kuten salasanat ja maksukorttitiedot,
LisätiedotProjektisuunnitelma. Projektin tavoitteet
Projektisuunnitelma Projektin tavoitteet Projektin tarkoituksena on tunnistaa erilaisia esineitä Kinect-kameran avulla. Kinect-kamera on kytkettynä tietokoneeseen, johon projektissa tehdään tunnistuksen
LisätiedotKäyttöohje HERE Maps. 1.0. painos FI
Käyttöohje HERE Maps 1.0. painos FI HERE Maps HERE Maps näyttää lähellä olevat kohteet ja opastaa sinut perille. Voit etsiä kaupunkeja, katuja ja palveluja löytää perille tarkkojen reittiohjeiden avulla
LisätiedotIntonaation analyysi ja annotointi puhekorpuksissa
Intonaation analyysi ja annotointi puhekorpuksissa 4.4.2002/HY:n fonetiikan laitos Stefan Werner stefan.werner@joensuu.fi Kieliteknologia/JoY Intonaation analyysi/annotointi HY 4.4.2002 p.1/43 Intonaation
LisätiedotOngelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä
Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä olevilla komponenteilla? Voisiko jollakin ohjelmointikielellä
LisätiedotESIOPETUS-1-2 LUOKKA OMA OPPIMISPOLKU
Väritä yhdessä aikuisen kanssa: ESIOPETUS-- LUOKKA OMA OPPIMISPOLKU nimi: kun harjoittelet tietoa tai taitoa kun osaat tiedon tai taidon kun osaat tiedon tai taidon ja voisit opettaa sen toisille. MATEMATIIKKA
LisätiedotAINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA
AINEISTOJEN JAKAMISEN MYYTEISTÄ JA HAASTEISTA Tietosuojavastaava Jarkko Reittu 13.11.2018 Aineiston jakamisen myyteistä ja haasteista/jarkko Reittu 1 ESITYKSEN KOHDE Kuinka tietosuojalainsäädäntö rajoittaa
LisätiedotSisällys. Sisällys. Esipuhe...13. 1 Äänteellisen kehityksen peruskäsitteet...17. I Äänteellisen kehityksen edellytykset
Sisällys Esipuhe...13 1 Äänteellisen kehityksen peruskäsitteet...17 1.1 Äänteiden tuotto...17 1.1.1 Vokaalit...18 1.1.2 Konsonantit...19 1.2 Fonologia...22 1.3 Foneettinen kirjoitus...23 I Äänteellisen
LisätiedotMuodolliset kieliopit
Muodolliset kieliopit Luonnollisen kielen lauseenmuodostuksessa esiintyy luonnollisia säännönmukaisuuksia. Esimerkiksi, on jokseenkin mielekästä väittää, että luonnollisen kielen lauseet koostuvat nk.
LisätiedotOpetuskielen vaikutuksesta oppimiseen: Kuvailevaa evidenssiä opiskelijoiden näkemyksistä
Harri J. Seppänen Opetuskielen vaikutuksesta oppimiseen: Kuvailevaa evidenssiä opiskelijoiden näkemyksistä 1. Johdanto Onko opetus kielellä vaikutusta opiskelijoiden oppimiseen? Tämä on tärkeä kysymys
LisätiedotHistorian ja etnologian laitos
Historian ja etnologian laitos JYU. Since 1863. 15.11.2018 1 Historia JYU. Since 1863. 15.11.2018 2 Historian oppiaineen sisältöjä Historiassa ei opiskella vain tosiasioita tai faktoja, vaan opetellaan
Lisätiedot815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset
815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 2 vastaukset Harjoituksen aiheena on BNF-merkinnän käyttö ja yhteys rekursiivisesti etenevään jäsentäjään. Tehtävä 1. Mitkä ilmaukset seuraava
LisätiedotEuroTraffic Language Training
EuroTraffic Language Training Käyttäjän opas Sisällysluettelo Kurssin aloittaminen... 3 Rekisteröityminen... 4 Sisäänkirjautuminen... 6 Tehtävien aloittaminen... 7 Sanasto... 9 Yhdistä ääni ja kuva...
Lisätiedot811312A Tietorakenteet ja algoritmit 2015-2016. I Johdanto
811312A Tietorakenteet ja algoritmit 2015-2016 I Johdanto Sisältö 1. Algoritmeista ja tietorakenteista 2. Algoritmien analyysistä 811312A TRA, Johdanto 2 I.1. Algoritmeista ja tietorakenteista I.1.1. Algoritmien
Lisätiedot