Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio

Koko: px
Aloita esitys sivulta:

Download "Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio"

Transkriptio

1 Puhekorpukset ja puhetietokannat Puhekorpus Puhekorpukset Martti Vainio Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen luettavassa muodossa ja on annotoitu sekä dokumentoitu siten, että sitä voi käyttää yhä uudelleen organisaation sisällä (in-house) tai sen ulkopuolella. Näin ollen, esim. yleisradioiden tallenteet jäävät määritelmän ulkopuolelle. Määritelmä koskee siis, esim. joukkoa puhesignaali-, laryngografi- ja EMG-signaaleja, sillä ehdolla, että ne on sopivasti annotoituja ja dokumentoituja. Tavallisen äänisignaalin lisäksi voimme siis sisällyttää korpukseen kaikenlaisia muitakin, joko tallennettuja tai alkuperäisestä signaalista analysoituja, signaaleja: esim. video, aikakoodi, perustaajuuskäyrät jne. Puhekorpukseet HY - Yleisen kielitieteen laitos Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 1 Puhekorpukset ja puhetietokannat Puhekorpukset ja puhetietokannat Puhekorpus sisältää siis puhesignaalin lisäksi: Annotaatiot Tiedot puhujasta: ikä sukupuoli äidinkieli murretausta yms. Mahdollisimman paljon tietoa itse äänityksestä: Äänityspaikan sijainti ja laatu Mikrofoni ja tallennintyyppi Äänitysaika yms. Yllä oleva informaatio ei ehkä vaikuta kiinnostavalta, mutta se voi olla hyvinkin tärkeätä jossain myöhemmässä vaiheessa! Tyypillisesti puhekorpukset sisältävät seuraavia asioita: Digitoidut signaalit: akustinen puhesignaali, laryngografin signaali, röntgen data. Analyysien tulokset: FFT data, LPC data, perustaajuus- ja äänekkyysdata, formantit. Markkerit: äänihuuliperiodit, vokaalien alut. Kuvailut: puhujien kuvailut, äänitysolosuhteet. Annotaatiot: (engl. annotations/labels), ortografiset, foneemiset, foneettiset, prosodiset transkriptiot, puheenvuorot, topiikit... Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 2 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 3

2 Puhekorpukset ja puhetietokannat Puhekorpuksen käyttöön saattaminen koostuu kolmesta vaiheesta: 1. Vaihe ennen äänityksiä = suunnittelu 2. Äänitysvaihe 3. Jälkikäsittelyvaihe = annotointi, analyysit Vaihe, ennen äänitystä sisältää seuraavat askeleet: 1. Korpuksen tarkoituksen määrittely 2. Korpuksen lingvistisen sisällön määrittely 3. Puhujien tyypin ja lukumäärän määrittely Puhekorpukset eroavat tekstikorpuksista ainakin kahdeksalla tavalla, jotka riippuvat seuraavista asioista: 1. puhe on katoavaista, teksti pysyvää, 2. puheen ja tekstin tuottoon kuluva aika ei ole sama, 3. virheiden rooli on erilainen, 4. kirjoitetut ja puhutut sanat eroavat toisistaan, 5. erilaiset tietorakenteet: ASCII vs. näytteistetty data, 6. syyt, jotka johtavat korpusten erilaisiin kokoihin, 7. kirjoitetun ja puhutan materiaalin laillisen statuksen erot, ja 8. kirjoitettu kieli on symbolista ja puhe fyysisesti mitattavaa jatkuvaa signaalia ajassa! Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 4 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 5 1. Puhe on transienttia Puhe katoaa heti kun se on tuotettu: kirjoitus säilyy! Puhe on siis erikseen tallennettava sen kerääminen ei ole triviaali asia, kuten on (yleensä) laita kirjoitetun tekstin kanssa. 2. Puheentuottoon käytetty aika on vähäistä Puheentuottoon kulunut aika on yleensä puhumiseen kulunut aika. Puhe tuotetaan keskimäärin sanaa minuutissa (englanti) tai n. 300 tavua minuutissa (suomi). Kirjoittamiseen käytetään yleensä huomattavasti enemmän aikaa. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 6 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 7

3 3. Puhe on täynnä virheitä Spontaanissa puheessa puhujan editointi on kuuluvaa ja jää mukaan tallenteeseen. Keskeytykset, hesitaatiot, toistot ja korjaukset ovat olennainen osa puhetta ja tulee säilyttää (spontaanin puheen) korpuksissa. Tekstikorpuksissa kirjoittajan suorittamat korjaukset ovat jo editoidut pois. Puhekorpuksissa suuntaus on kohti spontaania puhetta luettu laboratoriopuhe on väistymässä. 4. Sanat vaihtelevat foneettisesti Puhutut versiot ortografisesti identtisistä sanoista osoittavat yleensä suurta foneettista variaatiota sekä segmentaalisesti että prosodisesti. Sanat saattavat jopa kokonaan kadota tai jäädä vain jonkin segmentaalisen tai prosodisen vihjeen varaan: onko sinulla se onksuse. Erillään lausutut sanat ovat jatkuvaan puheeseen verrattuna hyvinkin erilaiset: kanoninen tai sitaatiomuoto. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 8 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 9 Näin ollen on tärkeää, että korpukseen tallennetaan ainakin kahden, mieluummin kolmen tasoista, symbolista kuvausta, joilla kaikilla on suhde akustiseen signaaliin: 1. Puhutut sanat erotetaan leksikaalisesti ortografisella tasolla. 2. Sanat tulisi esittää myös karkealla foneettisella kirjoituksella ns. sitaatiomuodoissaan, jotka voidaan tuottaa esim. automaattisella grafeemi-foneemi -konversiolla. 3. Todelliset foneettiset kuvaukset tulee tehdä ns. kapealla tarkekirjoituksella, jonka symbolit suhteutetaan ajallisesti signaaliin, joko manuaalisesti tai automaattisesti. 5. Tallennettu puhe on vain aikafunktioita Puhtaana datana, kirjoitetut tekstit koostuvat lähinnä merkeistä, jotka voidaan koodata joko 7, 8 tai 16 bittisinä ASCII- tai Unikoodimerkkeinä. Koodatut merkkijonot sisältävät jo sellaista informaatiorakennetta, joka ei ole läsnä puhesignaalissa. Puhesignaali ei sisällä eksplisiittisiä sanarajoja, pilkkuja, pisteitä, huutomerkkejä jne. Tallennettu puhesignaali on primäärisesti vain digitalisoituja aikafunktioita. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 10 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 11

4 6. Puhe vaatii paljon tilaa Tallennettu puhe vie huomattavasti enemmän tilaa kuin vastaava ASCII-muotoinen data. Kolmikirjaimen sana vie vain kolme tavua (byte) tilaa kun vastaava digitoitu, puhuttu sana vie huomattavasti enemmän. Kolme äännettä: 0.5 s, 16 bittisellä kvantisoinnilla ja 48 khz:n näyttenottotaajuudella kirjoitutun ja puhutun tallenteen suhteeksi tulee 1/16000! Toisaalta puhuttujen muotojen erilaisuus vaatii jokaisen sanan tallentamista useaan kertaan riippuen puhujasta, puhetyylistä. Näin ei kuitenkaan kovin usein tehdä. 7. Puhe tuo lisää laillisia ongelmia Yleensä kirjoitetut tekstit on jo julkaistu, jolloin niiden käyttö määräytyy olemassaolevien lakien ja säännöstöjen mukaan: lait voivat mutkistaa tai estää korpusten jakamisen käyttäjille. Puheen kannalta tilanne voi olla vieläkin mutkikkaampi: valmiiksi äänitetty materiaali voi tuottaa ylitsepääsemättömiä ongelmia, joista itse äänitettävällä materiaalilla selviää tekemällä puhujan kanssa sopimuksen ennen äänittämistä. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 12 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo Puhe on jatkuvaa! Digitoitu signaali ei itsessään sisällä minkäänlaisia kategorioita kuten on laita kirjoitetun ASCII-datan kanssa. Nykyisillä tekniikoilla ei ole periaatteessa edes mahdollista (varmasti) sanoa, onko jokin signaali puhetta vai ei: puhedatan kategorioiminen annotaatioiksi vaatii aina manuaalista käsittelyä ja inhimillistä tulkintaa. Toisaalta puhesingnaali sisältää relevanttia prosodista ja paralingvististä informaatiota, jota teksti ei sisällä. Foneettinen tutkimus Foneettiseen tutkimukseen kuuluvat kaikki puheeseen liittyvät tekijät: usein tutkimus vaatii tarkasti kontrolloitua ja systemaattista dataa jonka tutkijat joutuvat keräämään erikseen. Kiinnostus spontaania ja vähemmän kontrolloitua puhetta kohtaan on kuitenkin antanut foneetikoillekin mahdollisuuden käyttää jo valmiita korpuksia. Spontaanin puheen tilastollinen kuvaus vaatii kaiken lisäksi suuria määriä dataa, jonka keräämiseen ja annotointiin yksittäisellä tutkijalle ei ole mahdollisuuksia. Tämä lisää edelleen spontaanin puheen korpusten arvoa foneettisessa tutkimuksessa. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 14 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 15

5 Sosiolingvistinen tutkimus Sosiolingvistinen puheentutkimus on yleensä pohjautunut kolmella tavalla hankittuun dataan: 1. Kirjoitettujen kyselyiden avulla: esim. miten vastaajat mielestään lausuvat tietyn sanan. 2. Tutkijan observaatioiden pohjalta: esim. Labovin tutkimukset /r/:n ellipsiksestä New Yorkilaisilla puhujilla. Labov yksinkertaisesti kirjasi, onko puhujalla kyseistä äännettä tietyissä sanoissa. 3. Keräämällä puhekorpuksia: perkeptuaalista analyysiä on tuettu keräämällä korpuksia. Psykolingvistinen tutkimus Psykolingvistinen tutkimus on hyvin laajaa: se vaihtelee lapsen kielen oppimisen tutkimisesta aikuisten kielen ymmärtämisen liittyvien mentaalisten prosessien tutkimukseen aina kielen häiriöiden tutkimukseen. Yksi alue, jossa psykolingvistit ovat käyttäneet puhekorpuksia on ns. lipsahdusten tutkimus. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 16 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 17 Lapsen kielen kehitys Lapsen kielen kehitystä tutkitaan monilla eri tieteen aloilla, tutkimus voi olla: lingvististä sosiolingvististä psykolingvististä foneettista Kaikki osa-alueet hyötyvät puhekorpuksista, mutta toistaiseksi korpukset koostuvat lähinnä transkriptioista (CHILDES). Vieraan kielen oppiminen Vieraan kielen oppimista on jonkin verran tutkittu myös puhekorpuspohjaisesti, mutta toistaiseksi tutkimus on perustunut lähinnä transkriptioihin. Korpuksia voidaan käyttää esim. opetusmateriaalin tekemiseen. Kunnollisen spontaanin puheen elisitoiminen lapsilta on vaikeaa, mutta puhetta voidaan saada helposti esim. pelien avulla. Lapsen kielen kehittymistä kuvaavien korpusten on hyvä olla longitudinaalisia; ts. saman henkilön puhetta tulee tallentaa eri kielen kehityksen vaiheissa. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 18 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 19

6 Kielitieteellinen tutkimus Chomskylainen mentalistinen kielitieteellinen tutkimus, joka koskee lähinnä kompetenssia ei introspektiivisen luonteensa vuoksi hyödy korpuksista. Kielen lopullinen teoria vaatii kuitenkin kompetenssin ja performanssin integrointia. Performanssin tutkiminen on luonnostaan dataan perustuvaa, joten puhtaasti kielitieteellinenkin tutkimuksen tulee osaltaa perustua mm. puhekorpuksiin. Puhekorpukset yhdistävät siis aukon kompetenssiin perustuvan kieliopin ja todellisen kielenkäytön välillä. Diskurssianalyysi on yksi kielitieteellinen suuntaus, joka selkeästi hyötyy korpuksista. Audiologia Audiologia on kuuloa tutkiva tiede, jota puheen havaitseminen koskee vain epäsuorasti. Audiologit ovat kuitenkin käyttäneet puhetta ja puhekorpuksia kuulon mittaamiseen jo kauan. Kuulon mittaamiseen käytetyt korpukset ovat tarkasti kalibroituja akustisten muuttujien ja normaalikuuloisten vastaanoton suhteen. Yleensä ne sisältävät erillisiä äänteitä, nonsense sanoja, todellisia sanoja ja jatkuvaa puhetta. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 20 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 21 Puhekorpusten käyttötarkoitukset: teknologiset sovellukset Patologinen puhe Patologisen puheen tutkimus liittyy monenlaisiin häiriöihin käheästä puheesta afasiaan. Puhekorpusten rooli patologisen puheen suhteen liittyy esim. automaattisen diagnostiikan kehittämiseen. Patologisen puheen korpuksia käytetään myös kieli- ja puhehäiriöiden aiheuttavien prosessien tutkimukseen. Sovellustyypit Teknologiset sovellukset, jotka tarvitsevat kehitykseensä puhekorpuksia, voidaan karkeasti jakaa neljään luokkaan: 1. puhesynteesi 2. puheentunnistus 3. puhejärjestelmät (esim. dialogijärjestelmät) 4. puhujan tunnistus/verifiointi Sovellusten tekemiseen tarvittavat korpukset vaihtelevat suuresti niin sisältönsä kuin kokonsakin suhteen! Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 22 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 23

7 Puheen lingvistiset representaatiot Puheen lingvistiset representaatiot Symbolinen representaatio Puhekorpuksen tutkimininen on mahdollista vain symbolisen representaation kautta näytteistettyä puhetta ei sellaisenaan voi tutkia. Kaikki korpuksen representaatiot ovat jonkinlaisen analyysin tai luokittelun tulosta. Representaatiot eivät itse ole puhetta, vaan abstraktioita! Yleensä symbolinen representaatio tarkoittaa transkriptioita, joita käytetään niin foneettisessa kuin sosiologisessakin tutkimuksessa. Käytetyn transkription tyyppi riippuu hyvin paljon, siitä mihin tarkoitukseen se on tehty. Näin ollen niiden taso ja tarkkuus vaihtelevat suuresti. Transkription tarkkuus Suuria korpuksia on mahdotonta annotoida kovin tarkasti tarkka foneettinen segmentointi vaatii paljon taitoa ja aikaa. Yleensä suuret (spontaania puhetta) sisältävät korpukset on annotoitu vain ortografisesti (ATIS, Switchboard). Pienemmät korpukset voidaan kuitenkin analysoida ja annotoida tarkemmin segmentaalisin merkein ja jopa segmentoiden äännetasolla (TIMIT, PhonDAt). Ortografinen translitteraatio voidaan myöhemmin muuntaa ns. kanoniseen foneemiseen muotoon vaikkapa grafeemi-foneemi -säännöin. On huomattu, että luotettavien foneettisten transkriptioiden tekeminen suurille korpuksille ei ole mahdollista. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 24 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 25 Puheen lingvistiset representaatiot Puheen lingvistiset representaatiot Luetun vs. spontaanin puheen transkripointi Luetun puheen pohjana on kirjoitettu teksti spontaanille puheelle teksti täytyy tuottaa jälkikäteen. Spontaanin puheen luovuus aiheuttaa monia merkittäviä piirteitä, jotka erottavat sen luetusta puheesta: se on täynnä taukoja, väärin lausuttuja sanoja, vääriä aloituksia ja toistoa. Riippuen tilanteesta, spontaani puhe sisältää myös ns. puhekielisiä, epästandardeja muotoja ja reduktiota, jolloin jopa kokonaiset sanat voivat kadota. Ilmaus spontaanissa ja luetussa puheessa Eräs tärkeä erottava piirre spontaanin ja lukupuhunnan välillä on ilmauksen (utterance) määritteleminen: lukupuhunnassa ilmaukset yleensä korreloivat lauseiden tai virkkeiden kanssa, spontaanissa näin ei tietenkään voi olla. Spontaanin puheen suhteen joudutaan yleensä tarkasti määrittelemään ilmaukset: dialogissa ne liittyvät useinmiten (puheen)vuoroihin; monologeissa ilmaus määritellään usein taukojen rajaamaksi intervalliksi, jolla on jonkinlainen syntaktinen, semanttinen, pragmaattinen ja prosodinen rakenne. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 26 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 27

8 Puheen lingvistiset representaatiot Transkription tasot ja tyypit Dialogin transkripoiminen Puhujien välisessä keskustelussa on usein keskeytyksiä, jotka voivat olla kokonaisia ilmauksia tai vaikkapa affirmatiivisiä yhden sanan tai äänteen muodostamia; joo tai hmm. Yleensä keskeytykset tapahtuvat samanaikaisesti muun puheen kanssa päällekkäispuhunta tulee merkitä annotointeihin. Ortografisessa transkriptiossa voidaan käyttää esim. Switchboardin tapaan #-symbolia: A: # Right, bye # B: # Bye bye # Transkriptiot ja niistä tuotetut representaatiot Tärkein ero on itse transkriptioden ja niiden avulla tuotettujen muiden representaatioden välillä: Transkriptoita tehdessä joudutaan aina joko manuaalisesti tai koneellisesti monitoroimaan puhesignaalia. Transkriptioista tuotettujen representaatioiden suhteen puhesignaalia ei välttämättä tarvita: tällaiset representaatiot voivat olla esim. ortografiasta tuotetut fonologiset, morfologiset, syntaktiset yms. analyysit. Useamman kuin kahden puhujan kanssa tilanne monimutkaistuu ja voidaan käyttää esim. ns. partituurinotaatiota (engl. score). Esim. Praatin TextGrid. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 28 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 29 Transkription tasot ja tyypit Puhesignaalien segmentointi ja nimikointi Transkriptioden tyypit Transkriptiot voidaan jakaa seuraaviin tyyppeihin, jotka kaikki voidaan kohdentaa puhesignaaliin: 1. Translitteraatiot (engl. script); esim. tuomioistuinten tallenteet 2. Ortografiset transkriptiot 3. Morfologiset, syntaktiset, semanttiset ja pragmaattiset representaatiot 4. Foneemiset (sitaatiomuotoiset) representaatiot 5. Karkeat (engl. broad) foneettiset transkriptiot 6. Tarkat (engl. narrow) foneettiset transkriptiot 7. Akustis-foneettiset transkriptiot 8. Fyysiset transkriptiot 9. Prosodiset transkriptiot Segmentointi ja nimikointi Segmentoinnilla tarkoitetaan puhesignaalin jakamista ei-päällekkäisiin osiin, jotka vastaavat tiettyjä lingvistisiä tai fyysisiä yksiköitä. Nimikointi (engl. labeling) tarkoittaa segmentoitujen kappaleiden nimeämistä fyysisesti tai lingvistisesti määritetyillä symboleilla. Rajatut segmentit voivat olla monen tyyppisiä riippuen korpuksen käyttötarkoituksesta. Yleisesti suositellaan ainakin seuraavia tasoja: ortografinen foneettinen tarkka foneettinen Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 30 Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 31

9 Puhesignaalien segmentointi ja nimikointi Varoituksen sana Puheen käsittäminen lineaariseksi sekvenssiksi erilaisia yksiköitä on mukavuussyistä kehitetty fiktiivinen harha. Esim. monien äänteiden väliset rajat ovat hyvinkin vaikeita paikantaa vokaalit vs. puolivokaalit, vokaalit vs. vokaalit. Toisaalta konsonanttien identiteetti ääntymäpaikan suhteen on koodattuna sitä ympäröivissä vokaaleissa jne. Näin ollen puhetta ei voida käsitellä jonona diskteettejä äänteitä tai muitakaan yksiköitä äänteellinen segmentointi on kuitenkin tiettyyn pisteeseen saakka täysin mahdollista ja arbitraarinen raja on parempi kuin ei mitään. Puhekorpukseet HY - Yleisen kielitieteen laitos Kalvo 32

Vfo254: Puhekorpusten käyttö

Vfo254: Puhekorpusten käyttö Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan

Lisätiedot

Vfo254: Puhekorpusten käyttö

Vfo254: Puhekorpusten käyttö Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan

Lisätiedot

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus Symbolinen representaatio Vfo 254: Puhekorpusten käsittely: Puhekorpusten lingvistinen representaatio Martti Vainio Puhekorpuksen tutkimininen on mahdollista vain symbolisen representaation kautta näytteistettyä

Lisätiedot

Yhdyssana suomen kielessä ja puheessa

Yhdyssana suomen kielessä ja puheessa Yhdyssana suomen kielessä ja puheessa Tommi Nieminen Jyväskylän yliopisto Anna Lantee Tampereen yliopisto 37. Kielitieteen päivät Helsingissä 20. 22.5.2010 Yhdyssanan ortografian historia yhdyssanan käsite

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

Suomen prosodian variaation tutkimuksesta

Suomen prosodian variaation tutkimuksesta Suomen prosodian variaation tutkimuksesta Tommi Nieminen Itä-Suomen yliopisto Tommi Kurki Turun yliopisto Prosodian käsitteestä prosodia käsittää kaikki ne puheen ilmiöt, jotka eivät ole segmentoitavissa

Lisätiedot

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA Heini Kallio, tohtorikoulutettava Käyttäytymistieteiden laitos, fonetiikka Helsingin yliopisto heini.h.kallio@helsinki.fi Fonetiikan haasteet kielenopetuksessa

Lisätiedot

Puhutun ja kirjoitetun rajalla

Puhutun ja kirjoitetun rajalla Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic

Lisätiedot

Prosodian havaitsemisesta: suomen lausepaino ja focus

Prosodian havaitsemisesta: suomen lausepaino ja focus Prosodian havaitsemisesta: suomen lausepaino ja focus Martti Vainio Helsingin yliopisto, Fonetiikan laitos; Kieliteknologia Juhani Järvikivi, Turun yliopisto, Psykologia; University of Dundee Yleistä Lingvistisen

Lisätiedot

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla Mietta Lennes FIN-CLARIN / Helsingin yliopisto Johdanto Kun puhetta ja kieltä tutkitaan kvantitatiivisesti, on

Lisätiedot

Puhe ja kommunikaatio

Puhe ja kommunikaatio Puhe ja kommunikaatio Puhe on ihmisen kehittämistä kommunikoinnin muodoista hienostunein ja monimutkaisin -- siihen on kerrostunut useanlaista informaatiota, joiden määrittelyyn tarvitaan jonkinlainen

Lisätiedot

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin

Lisätiedot

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa

Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Say it again, kid! - peli ja puheteknologia lasten vieraan kielen oppimisessa Sari Ylinen, Kognitiivisen aivotutkimuksen yksikkö, käyttäytymistieteiden laitos, Helsingin yliopisto & Mikko Kurimo, signaalinkäsittelyn

Lisätiedot

Mitä suomen intonaatiosta tiedetään

Mitä suomen intonaatiosta tiedetään Mitä suomen intonaatiosta tiedetään ja mitä ehkä tulisi tietää? Tommi Nieminen Itä-Suomen yliopisto AFinLAn syyssymposium Helsinki 13. 14. 11. 2015 Johdanto Jäsennys 1 Johdanto 2 Mitä intonaatiosta tiedetään?

Lisätiedot

Foneettiset symbolit

Foneettiset symbolit Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003 Puhesynteesi Signaalin generointi Martti Vainio mailto:martti.vainio@helsinki.fi 11. huhtikuuta 2003 Signaalin generointi puhesynteesissä Kuinka tuottaa foneettisesta symbolisesta tiedosta jatkuvaa signaalia

Lisätiedot

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat

FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat FP1/Clt 120: Fonetiikan perusteet: artikulaatiotavat Martti Vainio -- syksy 2006 Artikulaatiotavat Konsonantit voivat siis vaihdella artikulaatipaikan mukaan ja sen mukaan ovatko ne soinnillisia vai eivät

Lisätiedot

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004

Lisätiedot

Kieli ja viestinnän kokonaisuus

Kieli ja viestinnän kokonaisuus Kieli ja viestinnän kokonaisuus viesti verbaalinen nonverbaalinen kielioppi sanasto parakieli ekstralingv. keinot proksemii kka kinemiikk a 1 Pakieli l. paralingvistiset keinot sävelkulku äänenpaino vokalisaatiot

Lisätiedot

8003051 Puheenkäsittelyn menetelmät

8003051 Puheenkäsittelyn menetelmät 8003051 Puheenkäsittelyn menetelmät Luento 7.10.2004 Puhesynteesi Sisältö 1. Sovelluskohteita 2. Puheen ja puhesyntetisaattorin laatu 3. Puhesynteesin toteuttaminen TTS-syntetisaattorin komponentit Kolme

Lisätiedot

Kielellisen datan käsittely ja analyysi tutkimuksessa

Kielellisen datan käsittely ja analyysi tutkimuksessa Kielellisen datan käsittely ja analyysi tutkimuksessa Kimmo Koskenniemi 4.4.2007 Yleisen kielitieteen laitos Humanistinen tiedekunta Kielidataa on monenlaista Tekstiä erilaisista lähteistä kirjoista, lehdistä,

Lisätiedot

Teknillinen korkeakoulu T-76.115 Tietojenkäsittelyopin ohjelmatyö. Testitapaukset - Koordinaattieditori

Teknillinen korkeakoulu T-76.115 Tietojenkäsittelyopin ohjelmatyö. Testitapaukset - Koordinaattieditori Testitapaukset - Koordinaattieditori Sisällysluettelo 1. Johdanto...3 2. Testattava järjestelmä...4 3. Toiminnallisuuden testitapaukset...5 3.1 Uuden projektin avaaminen...5 3.2 vaa olemassaoleva projekti...6

Lisätiedot

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:

Lisätiedot

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä

Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä olevilla komponenteilla? Voisiko jollakin ohjelmointikielellä

Lisätiedot

Johdatus rakenteisiin dokumentteihin

Johdatus rakenteisiin dokumentteihin -RKGDWXVUDNHQWHLVLLQGRNXPHQWWHLKLQ 5DNHQWHLQHQGRNXPHQWWL= rakenteellinen dokumentti dokumentti, jossa erotetaan toisistaan dokumentin 1)VLVlOW, 2) UDNHQQHja 3) XONRDVX(tai esitystapa) jotakin systemaattista

Lisätiedot

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas Tiedonhallinnan perusteet Viikko 1 Jukka Lähetkangas Kurssilla käytävät asiat Tietokantojen toimintafilosofian ja -tekniikan perusteet Tiedonsäilönnän vaihtoehdot Tietokantojen suunnitteleminen internetiä

Lisätiedot

Sisällys. Sisällys. Esipuhe...13. 1 Äänteellisen kehityksen peruskäsitteet...17. I Äänteellisen kehityksen edellytykset

Sisällys. Sisällys. Esipuhe...13. 1 Äänteellisen kehityksen peruskäsitteet...17. I Äänteellisen kehityksen edellytykset Sisällys Esipuhe...13 1 Äänteellisen kehityksen peruskäsitteet...17 1.1 Äänteiden tuotto...17 1.1.1 Vokaalit...18 1.1.2 Konsonantit...19 1.2 Fonologia...22 1.3 Foneettinen kirjoitus...23 I Äänteellisen

Lisätiedot

Sisällönanalyysi. Sisältö

Sisällönanalyysi. Sisältö Sisällönanalyysi Kirsi Silius 14.4.2005 Sisältö Sisällönanalyysin kohde Aineistolähtöinen sisällönanalyysi Teoriaohjaava ja teorialähtöinen sisällönanalyysi Sisällönanalyysi kirjallisuuskatsauksessa 1

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15 Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/15 Lisää säännöllisistä lausekkeista Aikaisemmin esityt * ja + yrittävät osua mahdollisimman pitkään merkkijonoon

Lisätiedot

Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria

Signaalinkäsittely Musiikin sisältöanalyysi Rumpujen nuotinnos Muotoanalyysi Yhteenveto. Lectio praecursoria Lectio praecursoria Signal Processing Methods for Drum Transcription and Music Structure Analysis (Signaalinkäsittelymenetelmiä rumpujen nuotintamiseen ja musiikin muotoanalyysiin) Jouni Paulus 8.1.2010

Lisätiedot

Puhesynteesin perusteet Luento 5: unit selection -synteesi

Puhesynteesin perusteet Luento 5: unit selection -synteesi Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen

Lisätiedot

Puhesynteesin perusteet Luento 4: difonikonkatenaatio

Puhesynteesin perusteet Luento 4: difonikonkatenaatio Puhesynteesin perusteet Luento 4: difonikonkatenaatio Nicholas Volk 7.2.2008 Käyttäytymistieteellinen tiedekunta Idea Äänteet ovat stabiileimmillaan keskellä äännettä, joten mallinnetaan siirtymät äänteestä

Lisätiedot

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Suomen kielen variaatio 1 Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Puhuttu ja kirjoitettu kieli Puhuttu kieli on ensisijaista. Lapsi oppii (omaksuu) puhutun kielen luonnollisesti siinä ympäristössä,

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 3 puheen havaitseminen Mikä on akustinen vihje (acoustic cue)? Selitä seuraavat käsitteet ohjelman ja kirjan tietoja käyttäen: Spektrogrammi

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

Esimerkkejä vaativuusluokista

Esimerkkejä vaativuusluokista Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään

Lisätiedot

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot Laajennettu tiedonkäsitys ja tiedon erilaiset muodot Totuudesta väitellään Perinteinen käsitys Tutkimuksella tavoitellaan a. On kuitenkin erilaisia käsityksiä. Klassinen tiedon määritelmä esitetään Platonin

Lisätiedot

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset 815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 2 vastaukset Harjoituksen aiheena on BNF-merkinnän käyttö ja yhteys rekursiivisesti etenevään jäsentäjään. Tehtävä 1. Mitkä ilmaukset seuraava

Lisätiedot

Taulukot. Jukka Harju, Jukka Juslin 2006 1

Taulukot. Jukka Harju, Jukka Juslin 2006 1 Taulukot Jukka Harju, Jukka Juslin 2006 1 Taulukot Taulukot ovat olioita, jotka auttavat organisoimaan suuria määriä tietoa. Käsittelylistalla on: Taulukon tekeminen ja käyttö Rajojen tarkastus ja kapasiteetti

Lisätiedot

Tilastotiede ottaa aivoon

Tilastotiede ottaa aivoon Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen

Lisätiedot

ELM GROUP 04. Teemu Laakso Henrik Talarmo

ELM GROUP 04. Teemu Laakso Henrik Talarmo ELM GROUP 04 Teemu Laakso Henrik Talarmo 23. marraskuuta 2017 Sisältö 1 Johdanto 1 2 Ominaisuuksia 2 2.1 Muuttujat ja tietorakenteet...................... 2 2.2 Funktiot................................

Lisätiedot

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä

Puheen akustiikan perusteita Mitä puhe on? 2.luento. Äänet, resonanssi ja spektrit. Äänen tuotto ja eteneminen. Puhe äänenä Puheen akustiikan perusteita Mitä puhe on? 2.luento Martti Vainio Äänet, resonanssi ja spektrit Fonetiikan laitos, Helsingin yliopisto Puheen akustiikan perusteita p.1/37 S-114.770 Kieli kommunikaatiossa...

Lisätiedot

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

E. Oja ja H. Mannila Datasta Tietoon: Luku 2 2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto

Lisätiedot

Alkukartoitus Opiskeluvalmiudet

Alkukartoitus Opiskeluvalmiudet Alkukartoitus Opiskeluvalmiudet Päivämäärä.. Oppilaitos.. Nimi.. Tehtävä 1 Millainen kielenoppija sinä olet? Merkitse rastilla (x) lauseet, jotka kertovat sinun tyylistäsi oppia ja käyttää kieltä. 1. Muistan

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

Kaikki maksavat sanastotyöstä. Seija Suonuuti 30.10.2014

Kaikki maksavat sanastotyöstä. Seija Suonuuti 30.10.2014 Kaikki maksavat sanastotyöstä Seija Suonuuti Väite Kaikki yritykset tekevät sanastotyötä joko tietoisesti tai tiedostamatta Yritys voi vain valita tehdäänkö sanastotyötä kontrolloidusti ja kustannuksia

Lisätiedot

Annotaatioon liittyvä ydinkäsitteistö

Annotaatioon liittyvä ydinkäsitteistö Annotaatioon liittyvä ydinkäsitteistö Mietta Lennes 27. marraskuuta 2002 Ydinkäsitteitä *aivastus (sneeze) Merkintä: [.sneeze] *annotaatio (annotation) Jonkin tallenteen (puhe, video, teksti tms.) määrättyyn

Lisätiedot

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla. Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti

Lisätiedot

JHS 160 Paikkatiedon laadunhallinta Liite I: Esimerkkejä mitattavien laatutekijöiden osatekijöiden sovelluskohteista. 1. Johdanto...

JHS 160 Paikkatiedon laadunhallinta Liite I: Esimerkkejä mitattavien laatutekijöiden osatekijöiden sovelluskohteista. 1. Johdanto... JHS 160 Paikkatiedon laadunhallinta Liite I: Esimerkkejä mitattavien laatutekijöiden osatekijöiden sovelluskohteista Sisällysluettelo 1. Johdanto...2 2. Täydellisyys...2 3. Looginen eheys...3 4. Sijaintitarkkuus...5

Lisätiedot

Oppilas pystyy nimeämään englannin kielen lisäksi myös muita vieraita kieliä niitä kohdatessaan.

Oppilas pystyy nimeämään englannin kielen lisäksi myös muita vieraita kieliä niitä kohdatessaan. Englanninkielisen aineiston löytäminen Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen Kielellinen päättely Kielellisen ympäristön hahmottaminen Arvioinnin kohde Englannin kielen arviointikriteerit

Lisätiedot

VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen

VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen VHOPE-sovelluksen ja VHOPE-kirjastotiedostojen asentaminen Vaihe 1: Asenna VHOPE PC:hen täytyy asentaa VHOPE-sovellus, ennen kuin USB-muistitikun esitysaineistoa voidaan ryhtyä käyttämään. VCN (Volvo Corporate

Lisätiedot

Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä. FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi

Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä. FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi Treffit mönkään? Ääntämisen opetuksesta ja sen tärkeydestä FT Elina Tergujeff, Jyväskylän yliopisto elina.tergujeff@jyu.fi Kuka Elina Tergujeff? englannin ja ruotsin opettaja filosofian tohtori, soveltava

Lisätiedot

Kieliohjelma Atalan koulussa

Kieliohjelma Atalan koulussa Kieliohjelma Atalan koulussa Vaihtoehto 1, A1-kieli englanti, B1- kieli ruotsi 6.luokalla 1 lk - 2 lk - 3 lk englanti 2h/vko 4 lk englanti 2h/vko 5 lk englanti 2-3h/vko 6 lk englanti 2-3h/vko, ruotsi 2h/vko

Lisätiedot

KUN LUKEMINEN ON HANKALAA. Helena Sorsa

KUN LUKEMINEN ON HANKALAA. Helena Sorsa KUN LUKEMINEN ON HANKALAA Helena Sorsa Lukemisen ja kirjoittamisen vaikeudet Lukivaikeus dysleksia fonologinen häiriö: henkilö ei kykene muuttamaan lukemaansa puheeksi näkee sanat, mutta ei löydä äänneasua

Lisätiedot

Approbatur 3, demo 1, ratkaisut A sanoo: Vähintään yksi meistä on retku. Tehtävänä on päätellä, mitä tyyppiä A ja B ovat.

Approbatur 3, demo 1, ratkaisut A sanoo: Vähintään yksi meistä on retku. Tehtävänä on päätellä, mitä tyyppiä A ja B ovat. Approbatur 3, demo 1, ratkaisut 1.1. A sanoo: Vähintään yksi meistä on retku. Tehtävänä on päätellä, mitä tyyppiä A ja B ovat. Käydään kaikki vaihtoehdot läpi. Jos A on rehti, niin B on retku, koska muuten

Lisätiedot

Tekstien ääniä. Tommi Nieminen Itä-Suomen yliopisto

Tekstien ääniä. Tommi Nieminen Itä-Suomen yliopisto Tekstien ääniä Tommi Nieminen Itä-Suomen yliopisto 39. Kielitieteen päivät, Tallinna 16. 18.5.2012 Mitä väliä? teoreettinen ja metodologinen tarve? teksti ääni suhde työkaluajatteluun ei ääniä > monologinen

Lisätiedot

Määrittelydokumentti

Määrittelydokumentti Määrittelydokumentti Aineopintojen harjoitustyö: Tietorakenteet ja algoritmit (alkukesä) Sami Korhonen 014021868 sami.korhonen@helsinki. Tietojenkäsittelytieteen laitos Helsingin yliopisto 23. kesäkuuta

Lisätiedot

Onko empiirinen käänne vain empirian kääntötakki?

Onko empiirinen käänne vain empirian kääntötakki? Onko empiirinen käänne vain empirian kääntötakki? Tommi Nieminen 40. Kielitieteen päivät, Tampere 2. 4.5.2013 Empiria (kielitieteessä)? lähtökohtaisesti hankala sana niin käsitteellisesti kuin käytöltään

Lisätiedot

Lausuminen kertoo sanojen määrän

Lausuminen kertoo sanojen määrän Sivu 1/5 Lausuminen kertoo sanojen määrän Monta osaa Miten selvä ero Rinnasteiset ilmaisut Yhdyssana on ilmaisu, jossa yksi sana sisältää osinaan kaksi sanaa tai enemmän. Puhutussa kielessä tätä vastaa

Lisätiedot

Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs

Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs Kulttuuriset käytännöt opetuksessa ja oppimisessa Marianne Teräs Esitys koulutuksessa: Maahanmuuttajien ammatillinen koulutus, 20.3.2009 Opetushallitus Esityksen sisältö Lähestymistapoja kulttuuriin ja

Lisätiedot

Digitaaliset tarinat

Digitaaliset tarinat Future School research Ist Wave-hanke 2009-2011 Digitaaliset tarinat Esi- ja alkuopetusryhmissä Marja Hytönen KM, Tutkija Literacy in the 21st Century- Uusi luku ja kirjoitustaito Digitarina>

Lisätiedot

Lukemaan ja kirjoittamaan oppiminen toisella kielellä

Lukemaan ja kirjoittamaan oppiminen toisella kielellä Lukemaan ja kirjoittamaan oppiminen toisella kielellä FT Lea Nieminen Jyväskylän yliopisto 3.10.2016 Lukemisen ja kirjoittamisen monitasoiset prosessit Lukemisen alemman tason prosessit Dekoodaaminen kirjainjono

Lisätiedot

Mitä puhe on? Fonetiikan perusteet kieliteknologeille. Puheen analyysin viitekehys. Puhe ja Kommunikaatio. Puhe ja kommunikaatio (jatkoa)

Mitä puhe on? Fonetiikan perusteet kieliteknologeille. Puheen analyysin viitekehys. Puhe ja Kommunikaatio. Puhe ja kommunikaatio (jatkoa) Mitä puhe on? Fonetiikan perusteet kieliteknologeille Martti Vainio Puheen analyysin viitekehys Fonetiikan laitos, Helsingin yliopisto Mitä puhe on? p.1/43 S-114.770 Kieli kommunikaatiossa... Kevät 2001

Lisätiedot

Mitä puhe on? Fonetiikan perusteet kieliteknologeille

Mitä puhe on? Fonetiikan perusteet kieliteknologeille Mitä puhe on? Fonetiikan perusteet kieliteknologeille Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mitä puhe on? p.1/43 Puheen analyysin viitekehys S-114.770 Kieli kommunikaatiossa... Kevät 2001

Lisätiedot

Cubase perusteet pähkinänkuoressa. Mikä Cubase on? Projektin aloitus

Cubase perusteet pähkinänkuoressa. Mikä Cubase on? Projektin aloitus Cubase perusteet pähkinänkuoressa 1. Mikä Cubase on? 2. Projektin aloitus 3. Audion äänittäminen. 4. MIDI-tiedon tallentaminen ja virtuaali instrumentit 5. Miksaus. Mikä Cubase on? Cubase on Windows XP

Lisätiedot

Miten opetan suomea? luento 19.8.2011 CIMO:ssa Comenius-apulaisopettajiksi lähteville Emmi Pollari

Miten opetan suomea? luento 19.8.2011 CIMO:ssa Comenius-apulaisopettajiksi lähteville Emmi Pollari Miten opetan suomea? luento 19.8.2011 CIMO:ssa Comenius-apulaisopettajiksi lähteville Emmi Pollari Suomen kielestä 1/2 erilainen kieli kuinka eroaa indoeurooppalaisista kielistä? o ei sukuja, ei artikkeleita,

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 2 visuaalinen prosessointi Treismanin FIT Kuva 1. Kuvassa on Treismanin kokeen ensimmäinen osio, jossa piti etsiä vihreätä T kirjainta.

Lisätiedot

Luova opettaja, luova oppilas matematiikan tunneilla

Luova opettaja, luova oppilas matematiikan tunneilla Luova opettaja, luova oppilas matematiikan tunneilla ASKELEITA LUOVUUTEEN - Euroopan luovuuden ja innovoinnin teemavuoden 2009 päätösseminaari Anni Lampinen konsultoiva opettaja, Espoon Matikkamaa www.espoonmatikkamaa.fi

Lisätiedot

4. Lausekielinen ohjelmointi 4.1

4. Lausekielinen ohjelmointi 4.1 4. Lausekielinen ohjelmointi 4.1 Sisällys Konekieli, symbolinen konekieli ja lausekieli. Lausekielestä konekieleksi: - Lähdekoodi, tekstitiedosto ja tekstieditorit. - Kääntäminen ja tulkinta. - Kääntäminen,

Lisätiedot

Järjestelmäriippumattomia siivousohjeita

Järjestelmäriippumattomia siivousohjeita Järjestelmäriippumattomia siivousohjeita Laatua luettelointiin -webinaari 24.1.2017 Suunnittelija Sampsa Heinonen Mistä metadatan siivouksessa on kyse? Metadatan siivouksessa kyse sen laadun parantamisesta

Lisätiedot

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla

Lisätiedot

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38 Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.

Lisätiedot

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting

Puheentunnistus. Joel Pyykkö 1. 1 DL-AT Consulting Puheentunnistus Joel Pyykkö 1 1 DL-AT Consulting 2018 Sisällysluettelo Puheentunnistus Yleisesti Chattibotin Luonti Esimerkkinä - Amazon Lex Puheentunnistus Yleisesti Puheentunnistus Yleisesti Puheentunnistus

Lisätiedot

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38

Puhesynteesi. Martti Vainio. Fonetiikan laitos, Helsingin yliopisto. Puhesynteesi p.1/38 Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Puhesynteesi p.1/38 Puhesynteesin historiaa Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein.

Lisätiedot

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein

Puhesynteesin historiaa. Puhesynteesi. Historiaa: Kempelen. Historiaa: Kratzenstein Puhesynteesin historiaa Puhesynteesi Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mekaaniset synteesit: 1700-luvulla asiaa harrastivat Wolfgang von Kempelen ja Christian Kratzenstein. 1900-luvulla

Lisätiedot

JOHDATUS TEKOÄLYYN TEEMU ROOS

JOHDATUS TEKOÄLYYN TEEMU ROOS JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ

Lisätiedot

Evantia 360 Teen Start -taulusto

Evantia 360 Teen Start -taulusto Evantia 360 Teen Start -taulusto Evan%a360 Teen Start - taulusto on suunniteltu nuorten ja nuorten aikuisten sekä joissain tapauksissa myös aikuisten sähköiseksi kommunikoinnin apuvälineeksi. Taulusto

Lisätiedot

Laskennan rajoja. Sisällys. Meta. Palataan torstaihin. Ratkeavuus. Meta. Universaalikoneet. Palataan torstaihin. Ratkeavuus.

Laskennan rajoja. Sisällys. Meta. Palataan torstaihin. Ratkeavuus. Meta. Universaalikoneet. Palataan torstaihin. Ratkeavuus. TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 17. lokakuuta 2016 Sisällys Harjoitustehtävätilastoa Tilanne 17.10.2016 klo 15:07 passed waiting redo submitters

Lisätiedot

Matterport vai GeoSLAM? Juliane Jokinen ja Sakari Mäenpää

Matterport vai GeoSLAM? Juliane Jokinen ja Sakari Mäenpää Matterport vai GeoSLAM? Juliane Jokinen ja Sakari Mäenpää Esittely Tutkimusaineiston laatija DI Aino Keitaanniemi Aino Keitaanniemi työskentelee Aalto yliopiston Rakennetun ympäristön mittauksen ja mallinnuksen

Lisätiedot

Automaattinen semanttinen annotointi

Automaattinen semanttinen annotointi Automaattinen semanttinen annotointi Matias Frosterus, Reetta Sinkkilä, Katariina Nyberg Semantic Computing Research Group (SeCo) School of Science and Technology, Department of Media Technology and University

Lisätiedot

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet

Lisätiedot

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python Ohjelmoinnin perusteet Y Python T-106.1208 16.3.2009 T-106.1208 Ohjelmoinnin perusteet Y 16.3.2009 1 / 40 Kertausta: tiedostosta lukeminen Aluksi käsiteltävä tiedosto pitää avata: tiedostomuuttuja = open("teksti.txt","r")

Lisätiedot

Suorityskyvyn mittaaminen viittomakielisten videoiden sisältöanalyysissä. Ville Viitaniemi Tietojenkäsittelytieteen laitos 16.1.

Suorityskyvyn mittaaminen viittomakielisten videoiden sisältöanalyysissä. Ville Viitaniemi Tietojenkäsittelytieteen laitos 16.1. Suorityskyvyn mittaaminen viittomakielisten videoiden sisältöanalyysissä Ville Viitaniemi Tietojenkäsittelytieteen laitos 16.1.2014 Viittomakieli tapa jolla kuurot viestivät keskenään Suomessa n. 5000

Lisätiedot

Nimettömien tietojen lähettäminen Lenovolle

Nimettömien tietojen lähettäminen Lenovolle Nimettömien tietojen lähettäminen Lenovolle Sisältö Nimettömien tietojen lähettäminen Lenovolle... 1 Harmony... 1 Lenovo Companion 3.0... 2 Lenovo Customer Engagement Service... 3 Lenovo Experience Improvement

Lisätiedot

ESIOPETUS-1-2 LUOKKA OMA OPPIMISPOLKU

ESIOPETUS-1-2 LUOKKA OMA OPPIMISPOLKU Väritä yhdessä aikuisen kanssa: ESIOPETUS-- LUOKKA OMA OPPIMISPOLKU nimi: kun harjoittelet tietoa tai taitoa kun osaat tiedon tai taidon kun osaat tiedon tai taidon ja voisit opettaa sen toisille. MATEMATIIKKA

Lisätiedot

ATLAS.ti -ohjelma laadullisen analyysin tukena Miten me sitä on käytetty?

ATLAS.ti -ohjelma laadullisen analyysin tukena Miten me sitä on käytetty? ATLAS.ti -ohjelma laadullisen analyysin tukena Miten me sitä on käytetty? Sanna Karhunen, FM, tohtorikoulutettava viestintätieteiden laitos, Jyväskylän yliopisto Emma Kostiainen, FT, lehtori opettajankoulutuslaitos,

Lisätiedot

LAADULLISESTA SISÄLLÖNANALYYSISTÄ

LAADULLISESTA SISÄLLÖNANALYYSISTÄ LAADULLISESTA SISÄLLÖNANALYYSISTÄ Aineiston ja teorian suhde INDUKTIIVINEN ANALYYSI Tulokset/teoria muodostetaan aineiston perusteella Tutkimuskysymykset muotoutuvat analyysin edetessä ABDUKTIIVINEN ANALYYSI

Lisätiedot

Tutkimuksen alkuasetelmat

Tutkimuksen alkuasetelmat Tutkimuksen alkuasetelmat Ihan alussa yleensä epämääräinen kiinnnostus laajaan aiheeseen ( muoti, kulutus, nuoriso, luovuus, värit, sukupuoli )... Kiinnostusta kohdennetaan (pilotit, kirjallisuuden haravointi)

Lisätiedot

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? 2012-2013 Lasse Lensu 2 Ongelma 2: Voidaanko dataa tai informaatiota tallettaa tiiviimpään tilaan koodaamalla se uudelleen? 2012-2013 Lasse

Lisätiedot

Tommi Nieminen. 35. Kielitieteen päivät Vaasa

Tommi Nieminen. 35. Kielitieteen päivät Vaasa Kielten laitos Jyväskylän yliopisto 35. Kielitieteen päivät Vaasa 23. 24.5.2008 Jäsennys Jäsennys Jäsennys Jäsennys Metateorian ongelma taustalla kielitieteen metateorian tai tieteenparadigman epätyydyttävä

Lisätiedot

KIELITIETEEN ELEKTRONINEN SANAST0: Hankkeen esittelyä. Sirpa Leppänen Jyväskylän yliopisto Kielten laitos/ englanti

KIELITIETEEN ELEKTRONINEN SANAST0: Hankkeen esittelyä. Sirpa Leppänen Jyväskylän yliopisto Kielten laitos/ englanti KIELITIETEEN ELEKTRONINEN SANAST0: Hankkeen esittelyä Sirpa Leppänen Jyväskylän yliopisto Kielten laitos/ englanti sleppane@cc.jyu.fi Sanastohankkeen taustavoimat Kielten laitos Soveltavan kielentutkimuksen

Lisätiedot

Mikä muuttuu musiikin kuvailussa? (äänitteet ja nuottijulkaisut)

Mikä muuttuu musiikin kuvailussa? (äänitteet ja nuottijulkaisut) (äänitteet ja nuottijulkaisut) Kuvailupäivä 5.3.21012 Katerina Sornova Kansalliskirjasto katerina.sornova[ät]helsinki.fi Yleistä säännöistä Ennen: Audiovisuaalisen aineiston kuvailu ja Nuottijulkaisujen

Lisätiedot

Järjestelmäriippumattomia siivousohjeita

Järjestelmäriippumattomia siivousohjeita Järjestelmäriippumattomia siivousohjeita Laatua luettelointiin -webinaari 7.9.2017 Suunnittelija Sampsa Heinonen Mistä metadatan siivouksessa on kyse? Metadatan siivouksessa kyse sen laadun parantamisesta

Lisätiedot

Aineistot ja kenttä tänään

Aineistot ja kenttä tänään Aineistot ja kenttä tänään Liisa Raevaara, Kotimaisten kielten keskus Marja-Leena Sorjonen, Helsingin yliopisto Aineistojen kentällä ja äänten jäljillä Pertti Virtarannan syntymästä 100 vuotta Muistoseminaari

Lisätiedot

Yleistä säännöistä 6.3.2012. Mikä muuttuu musiikin kuvailussa? (äänitteet ja nuottijulkaisut) 0-alue: Sisältö- ja mediatyyppi Sisältötyyppi

Yleistä säännöistä 6.3.2012. Mikä muuttuu musiikin kuvailussa? (äänitteet ja nuottijulkaisut) 0-alue: Sisältö- ja mediatyyppi Sisältötyyppi (äänitteet ja nuottijulkaisut) Kuvailupäivä 5.3.21012 Katerina Sornova Kansalliskirjasto katerina.sornova[ät]helsinki.fi Yleistä säännöistä Ennen: Audiovisuaalisen aineiston kuvailu ja Nuottijulkaisujen

Lisätiedot

Tiedon arvottaminen osana arkistointia

Tiedon arvottaminen osana arkistointia Tiedon arvottaminen osana arkistointia Pirkko Kortekangas VSSHP, VS atj kehittämispäällikkö Tiedon arvotus koskee dataa, josta ei ole lainsäädäntöä Nykyinen Asetus potilasasiakirjojen laatimisesta ja säilyttämisestä

Lisätiedot

AAC -menetelmien sovellus kehitysvammahuoltoon. Kirsi Vainio 24.3.2011

AAC -menetelmien sovellus kehitysvammahuoltoon. Kirsi Vainio 24.3.2011 AAC -menetelmien sovellus kehitysvammahuoltoon Kirsi Vainio 24.3.2011 1 Kommunikointi Tarkoittaa niitä keinoja joilla ihminen on yhteydessä toisiin Merkittävä tekijä ihmisen persoonallisuuden muodostumisessa

Lisätiedot

Mitä aivokuvantaminen kertoo kielen kehityksen ja lukemisen erityisvaikeuksista?

Mitä aivokuvantaminen kertoo kielen kehityksen ja lukemisen erityisvaikeuksista? Mitä aivokuvantaminen kertoo kielen kehityksen ja lukemisen erityisvaikeuksista? Päivi Helenius Aivotutkimusyksikkö Kylmälaboratorio Aalto-yliopisto Foniatrian poliklinikka Silmä-korvasairaala HUS Funktionaalinen

Lisätiedot

Arkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14

Arkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14 Arkkitehtuurikuvaus Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy Ryhmä 14 Muutoshistoria Versio Pvm Päivittäjä Muutos 0.4 1.11.2007 Matti Eerola 0.3 18.10.2007 Matti Eerola 0.2

Lisätiedot

11.4. Context-free kielet 1 / 17

11.4. Context-free kielet 1 / 17 11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä

Lisätiedot