Annotaatioon liittyvä ydinkäsitteistö

Koko: px
Aloita esitys sivulta:

Download "Annotaatioon liittyvä ydinkäsitteistö"

Transkriptio

1 Annotaatioon liittyvä ydinkäsitteistö Mietta Lennes 27. marraskuuta 2002 Ydinkäsitteitä *aivastus (sneeze) Merkintä: [.sneeze] *annotaatio (annotation) Jonkin tallenteen (puhe, video, teksti tms.) määrättyyn ulottuvuuteen (ts. tallenteen osaan tai pisteeseen) liitetty kuvaus tai representaatio (symbolinen tai ei). Annotaatio siis liittyy joko segmenttiin tai ankkuriin, jotka taas viittaavat tiettyyn tallenteeseen. Yksittäisen annotaation sisältämää kuvausta kutsutaan myös nimikkeeksi. Esimerkkejä: Äänisignaalista tehty transkriptio on annotaatio, kun se on liitetty äänisignaalin aikaulottuvuuteen. Erilaiset tekstin joukkoon lisätyt tagit (tag) ovat annotaatioita. Samalla tallenteella voi olla useita rinnakkaisia annotaatioita. Mutta: jollakin perusteella pitänee kuitenkin määritellä, mikä rinnakkaisista annotaatioista on oletusannotaatio? Ehkä tietokannan käyttäjä määrittelee preferenssinä suosikkiannotoijansa? Ehdotus: kun annotoija tarkastelee tai muuttaa jonkun toisen tekemää annotaatiota, hän voi samalla merkitä tiettyjä annotaatiotasoja tai niiden osia sellaisinaan hyväksytyiksi. Näin saadaan käyttöön mahdollisimman paljon useamman henkilön tarkastamia annotaatioita. Hakuvaiheessa hakukone voi sisällyttää hakuun tietystä tallenteesta vain ne osat, jotka ovat käyttäjän suosikkiannotoijien tekemiä tai hyväksymiä. *annotaatioalue, annotaatiodomeeni (annotation domain) Joukko annotoitavia ilmiöitä, jotka ainakin löyhästi liittyvät samaan aihealueeseen. Annotaatioalueet eivät ole ehdottomia tietokannan rakenteen kannalta, ja käsitteet tietyllä annotaatioalueella voivat olla tiiviissäkin yhteydessä jonkin toisen alueen käsitteisiin. *annotoija (annotator) Annotaatioiden laatija. Sisältyy tallenteeseen liittyvään metadataan. Samalla tallenteella voi olla useita annotoijia ja vastaavasti useita rinnakkaisia annotaatioita. Annotoijaa koskevaa metadataa: milloin viimeksi muuttanut annotaatiotaan, onko sertifioitu annotoija,... *dialogi (dialogue) Keskustelu, johon osallistuu (aktiivisesti) kaksi puhujaa. Attribuutit: suunnittelematon puhe. *ei-kielellinen äännähdys (non-speech noise) Merkintä: [.ns] *ele (gesture) Puheeseen liittyvä vartalon tai raajojen liike. Standardit puuttuvat. ISLE: Pään eleet: rotaatio, kulma eteen/taakse, sivuttaiskulma. Käsien eleet: funktio ( osoittaminen, ei, takaisin ), modifioijat: viittaus projisoitavaan kuvaan, raaka morfologinen muoto (esim. ympyrä yhdellä kädellä ), alku- ja loppukoordinaatit. *epäselvä puhe (unclear speech) Jakso puhetta, jonka sisällöstä annotoija ei ole saanut selvää. Merkintä: [.unclear] *haukotus (yawn) Merkintä: [.yawn] *hengitys (breathing) Vaatii oman annotaatiokerroksen, koska sisään- ja uloshengitys voi esiintyä päällekkäin monen muun puheen ilmiön kanssa. Esim. sisäänhengitys puhunnoksen aikana implikoi ingressiivistä puhetta. Läheskään kaikki hengitykset eivät erotu äänisignaalissa eivätkä siis ole annotoitavissa (ilman fysiologista lisäinformaatiota). Jos hengityksen alku ja loppu ovat erotettavissa, ne eivät kuitenkaan välttämättä ole tarkkarajaisia. Attribuutit: sisään/ulos *huokaus (sigh) Merkintä: [.sigh] 1

2 *institutionaalinen puhetilanne (institutional speech situation) Puhetilanne, jossa ainakin yksi puhuja edustaa jonkinlaista muodollista organisaatiota (tai on tilanteessa ammattilainen).[?] *ilme (mimic) Kasvojen ilme. (Attribuuttina ilmeen kategoria: viha, ikävystyneisyys, ilo/onnistuminen, hämmästys, neutraali/määrittelemätön, kasvot osittain näkymättömissä. Standardit vasta kehitteillä.) *istunto, sessio (session) Lingvistisen analyysin perusyksikkö: koherentti lingvistisen toiminnan tai suorituksen tyyppi [?]. Istunto on tekninen nimitys niille metatiedoille, erityyppisille tallenteille ja annotaatioille, jotka kuvaavat samaa kielellistä tapahtumaa tai tilannetta. Istunto muodostaa kimpun tiiviisti yhteenkuuluvaa aineistoa: esim. tietystä puhujasta tehty videotallenne, kuvia hänen kodistaan, kenttähuomautuksia tapahtumapaikasta ja videotallenteeseen liittyvät multimodaaliset annotaatiot. Istunnon käsite on määritelty IMDI-standardissa. *keskustelu Puhetilanne, johon osallistuu vähintään kaksi puhujaa. Yläkäsite: puhetilanne. Alakäsitteitä: arkikeskustelu, institutionaalinen keskustelu. Attribuutit: suunnittelematon puhe. *kuiskaus (whisper) Merkintä: äänenlaatutasolla [0] *lause (clause) Alakäsitteet: päälause, sivulause. *lukupuhunta (reading aloud) Alakäsitteet: institutionaalinen ja ei-institutionaalinen lukupuhunta. Attribuutit: suunniteltu puhe. *maiskaus huulilla (lip smack) Merkintä: [.ls] *maiskaus kielellä (tongue click) Merkintä: [.tc] *metatieto, metadata (metadata) Kokonaiseen puhetietokantaan tai johonkin sen sisältämään tallenteeseen liitetty yleiskuvaus, viitetiedot ja muu oheisinformaatio. EAGLES/ISLE:n yleiskatsaus kielitieteelliseen metadataan: [?] *monologi, yksinpuhelu Puhetilanne, jossa on vain yksi puhuja. Passiivisia kuulijoita voi kuitenkin olla läsnä. Yläkäsite: puhetilanne. *murre (dialect) *nauru (laughter) Merkintä: [.laugh] *nielaisu (swallow) Merkintä: [.swallow] *nimike (label) Ankkurille tai segmentille (tai näiden joukolle) annettu kuvaus tai analyyttinen merkintä, eli annotaatio. *nimikointi (labeling) Puheen symbolisten kuvausten (transkriptioiden) liittäminen segmentoituun puhetallenteeseen. *noodi/ankkuri näyte (sample) tai indeksoitu yksikkö (esim. tekstitallenteessa merkki). Tietty tallenteen piste tai paikka, johon voidaan kohdistaa annotaatio tai jota voidaan käyttää segmentin alkuna tai loppuna. *puhetietokanta (speech database) Järjestetty kokoelma annotoituja puhetallenteita, joista voidaan tehdä hakuja (sisältää jonkinlaisen hallintajärjestelmän). Yläkäsite: puhekorpus. *puhetilanne Tilanne, jossa vähintään yksi ihminen tuottaa puhetta. Sisältyy tallenteen metadataan. Attribuutteja: puhujien kokonaismäärä tallenteessa; institutionaalinen vai arkikeskustelu; avoin/yksityinen; onko yleisöä tai tarkkailijoita läsnä; tilanteeseen liittyvät esineet; jne. Mukana voi olla vapaasanainen kuvaus, esim. syntymäpäiväjuhlat, ostoksilla, kaupan takahuoneessa. Alakäsitteitä: monologi, keskustelu. Assosiaatiot: tapahtumapaikka. *puhuja (speaker) Puhetietokannan sisältämissä tallenteissa esiintyvän puhujan pysyvät tiedot puhetietokannan metadatassa, tai puhujan muuttuvat tiedot kunkin relevantin puhetallenteen metadatassa. Kummassakin tapauksessa tiettyyn puhujaan viitataan ainutkertaisella ID-koodilla. Myös jossakin tallenteessa esiintyvällä tunnistamattomalla puhujalla on oma ID-koodi, vaikkei hänestä tiedettäisi mitään muuta. Puhujan pysyvät attribuutit: ID-koodi, sukupuoli, syntymäaika, syntymäpaikka, vanhempien murteet 2

3 Puhujan muuttuvat l. tallennekohtaiset attribuutit: kielitaito, asuinpaikat, koulutus, ammatti, uskonto, puolison murre, lasten määrä; rooli ko. puhetilanteessa; suhde kuhunkin toiseen puhujaan; palkkio tms. korvaus; lupa tallenteen käyttöön *puhujat (speakers) Tallenteen aikana esiintyvien puhujien ID-koodit. Tallenteeseen liittyvää metatietoa. *puhujien lukumäärä (number of speakers) Puhujien kokonaismäärä tallenteen aikana. Tallenteeseen (tai koko istuntoon) liittyvää metatietoa. Puhujien kokonaislukumäärä voidaan ohittaa alemman tason annotaatiossa esim. kun puhujia liittyy mukaan tai poistuu keskustelusta. *puhujien visuospatiaalinen suhde (visuospatial relationship between speakers) Puhujan suhde tilassa kuhunkin toiseen puhujaan. Attribuutit: näkyvyys, kanava (esim. puhelin), fyysinen välimatka. (voidaan ohittaa alemman tason annotaatiossa, jos muuttuu) *puhunnos (utterance) Jakso, jonka aikana puhuja yhtäjaksoisesti puhuu (artikuloi). Puhunnoksen voi päättää tauko, hengitys (jonka aikana ei artikuloida), täytetty tauko, tms. *rykäisy (clear throat) Merkintä: [.ct] *sane, sananmuoto (word form, token) Sana siinä muodossa kuin se puheessa esiintyy, kaikkine affikseineen. Attribuutteja: sanaluokka, lemma, (onko myöhäinen laina,) onko vierasta kieltä Mahdollisia merkintätapoja eri tasoilla: ortografinen, ortokrafine, [saneen foneettinen transkriptio]. *segmentointi (segmentation) Erilaisten yksiköiden (ajallisten) alku- ja loppupisteiden etsiminen ja merkitseminen puhe- tms. signaalista. Tuloksena segmenttejä. *segmentti (segment) Puhe-, video- tms. signaalin osa, jolla on määrätty alku- ja loppupiste, eli segmentti liittyy kahteen eri kohdissa signaalia olevaan ankkuriin. (Huom. yksittäinen, jollakin periaatteella signaalista määritetty piste ei ole segmentti vaan ankkuri.) *suunniteltu puhe (planned speech) Puhetyyli, jossa puhujan puhe on suunniteltu etukäteen, esim. hän lukee ääneen, puhuu ulkomuistista tai näyttelee. Alakäsitteet: suunniteltu institutionaalinen puhe, suunniteltu ei-institutionaalinen puhe, suunniteltu puhe koetilanteessa. *suunnittelematon puhe (unplanned speech) Puhetyyli, jossa puhujan puhetta ei ole suunniteltu etukäteen. Alakäsitteet: suunnittelematon institutionaalinen puhe, suunnittelematon puhe kontrolloidussa koetilanteessa ja suunnittelematon ei-institutionaalinen puhe. *tallenne (record) Tarkoittaa tässä vain digitaalisia tallenteita, jotka on mahdollista liittää puhetietokantaan. Yläkäsite: istunto. Alakäsitteitä: äänitallenne, videotallenne, tekstitallenne. Metadataa: Attribuutteja: *tunniste, *nimi, *koko, *tyyppi, *formaatti, tapahtumapaikan kuvaus, tallennusvälineet, äänitysajankohta, muutosajankohdat, äänittäjä, aihe, kuvaus, julkaisija, toimittaja, lähde, kieli, suhde, kattavuus, *oikeudet. Assosiaatiot: puhetilanne (kuuluu myös tallenteen metadataan). *tapahtumapaikka (setting) Yleiskuvaus paikasta, josta istunnon sisältämä aineisto on kerätty. Assosiaatiot: puhetilanne. *tauko (pause) Puhetallenteen segmentti, jonka aikana puhuja ei artikuloi. (Huom. muut prosodiset rajat, esim. intonaatioyksiköt, merkitään erikseen ja ne kuuluvat prosodiseen alueeseen.) *transkriptio (transcription) Puhetallenteen tai sen osan symbolinen kuvaaminen. Edellyttää aina tulkintaa. Tiukasti määriteltynä transkriptio on annotaation alakäsite vain siinä tapauksessa, että transkriptio on jollakin tavalla liitetty siihen tallenteeseen, jota se kuvaa. *vuoro, puheenvuoro (turn) 1) saman puhujan tietyssä keskustelussa tuottama puheen jakso, jonka aikana muut eivät puhu päälle (vallitseeko keskusteluntutkimuksessa nykyään? voiko sisältää taukoja ja kuinka pitkiä?) tai 2) saman puhujan tietyssä keskustelussa tuottama puheen jakso, jonka aikana muut samaan keskusteluun osallistuvat puhujat eivät keskeytä häntä (esim. tauot, minimipalautteet, epäonnistuneet keskeytysyritykset sallittaisiin) Huom. Vuoron määrittely ei tässä vaiheessa ole välttämätöntä, koska vuoron käsite voidaan molemmissa 3

4 tapauksissa johtaa muista annotaatioista. (Attribuutteja: ks. kommunikatiivinen akti.) *yleisö (audience) Yksi tai useampia ihmisiä, jotka ovat läsnä puhetilanteessa, mutteivät osallistu siihen puhujina. Yleisö voi joko yksinomaan tarkkailla tai myös antaa merkkejä hyväksynnästä (nyökkäykset, suosionosoitukset). Puhujat ovat tietoisia yleisöstä. Yleisö voi olla myös esim. kokeen johtaja. Yleisön läsnä- /poissaolo on istuntoon tai tallenteeseen liittyvää metatietoa (puhetilanteen attribuutti). *yskiminen (cough) Merkintä: [.cough] *äänenlaatu (voice quality) Puhujan tuottaman soinnin laatu, esim. modaaliääni, narina, henkäyssointi, falsetti ja kuiskaus. Vaatii oman annotaatiotasonsa, koska voi esiintyä päällekkäin muiden ilmiöiden kanssa. Äänenlaatuilmiöiden luokittelu on vaikeaa ja tutkimuksissa on todettu, että ihmiset kykenevät erottamaan lähinnä vain narinaäänen melko luotettavasti [?]. Merkintäehdotus: glottalisaatio [?], henkäyssointi [Hv], kuiskaus [0],... (modaaliääntä ei tarvitse merkitä) *äänne, fooni (sound, phone) Pienin mahdollinen kvalitatiivinen (= laadullinen) puheen segmentti, joka kuulon avulla voidaan erottaa muista segmenteistä. Esim. brit. engl. sanassa <church> kirkko, jonka kirjoitusasussa on kuusi kirjainta, voidaan erottaa viisi äännettä. Sana alkaa ja päättyy affrikaattaan [ts], jonka kaksi segmenttiä ([t] ja [S] = suhu-s) voidaan erottaa kuulon avulla. Fonologisesti sanassa on kuitenkin vain kolme foneemia, koska affrikaatta on itsenäinen foneemi. Tietyissä tapauksissa äänne ja #piirre# voivat olla vaikeasti erotettavissa: voimakas aspiraatio on kuultavissa (esim. englannissa vokaalin edessä [p]:ssä sanassa <pea> papu ) ja voi olla kestoltaan tavallisen äänteen mittainen ja muodostaa oman, puheen virrasta erottuvan segmentin[?]. Merkintä: [foneettinensymboli( tarke)( tarke)]. Annotaatiodomeenit Akustis-laskennallinen annotaatiodomeeni akustis-laskennallinen annotaatiodomeeni (acoustic-computational annotation domain) Tämän annotaatiodomeenin käsitteet ovat automaattisesti tai puoliautomaattisesti johdettavissa muusta tietokannan informaatiosta. Millaista akustista ja laskennallista tietoa tietokantaan pitäisi välttämättä tallentaa? Ylimääräiset mittaukset ja tiedot vievät tallennustilaa, mutta usein käytettävät ja raskaat analyysit voidaan suorittaa ja päivittää offline, jolloin ne ovat heti käyttäjän ulottuvilla. Foneettinen annotaatiodomeeni foneettinen annotaatiodomeeni (phonetic annotation domain) Annotaatiodomeeni, jossa kuvataan foneettista tulkintaa vaativat ilmiöt. prosodinen annotaatiodomeeni (prosodic annotation domain) Puheen sävelkulkua, painotusta ja kestoja käsittelevä annotaatiodomeeni. Sisältyy osana foneettiseen domeeniin. Lingvistinen (kielellinen) annotaatiodomeeni lingvistinen annotaatiodomeeni (linguistic annotation domain) Lingvististä tulkintaa vaativat annotaatiot. morfologinen annotaatiodomeeni (morphological annotation domain) Morfologisten annotaatioiden muodostama kokonaisuus. Syntaktinen annotaatiodomeeni syntaktinen annotaatiodomeeni (syntactic annotation domain) Lauseiden rakenteeseen liittyvät annotaatiot. 4

5 Tekstuaalinen annotaatiodomeeni tekstuaalinen annotaatiodomeeni (textual annotation domain) Annotaatiodomeeni, joka koskee tekstitallenteita tai lukupuhuntaa (kirjoitetun tekstin piirteiden annotointi). Semanttis-pragmaattinen annotaatiodomeeni semanttis-pragmaattinen annotaatiodomeeni (semantic-pragmatic annotation domain) Annotaatiodomeeni, joka koskee tekstitallenteita tai lukupuhuntaa (kirjoitetun tekstin piirteiden annotointi). Paralingvistinen annotaatiodomeeni paralingvistinen annotaatiodomeeni (paralinguistic annotation domain) Puheen paralingvistisiä ominaisuuksia käsittelevät annotaatiot. Diskurssiannotaatiodomeeni diskurssiannotaatiodomeeni (discourse annotation domain) Annotaatiodomeeni, joka käsittelee puheen vuorovaikutuksellisia piirteitä. Visuospatiaalinen annotaatiodomeeni visuospatiaalinen annotaatiodomeeni (visual annotation domain) Näköaistiin ja siihen pohjautuvaan kommunikaatioon liittyvien käsitteiden muodostama kokonaisuus ja annotaatiodomeeni. Eleet, ilmeet. Haptinen annotaatiodomeeni haptinen annotaatiodomeeni (haptic annotation domain, tactile annotation domain) Kosketus- ja tuntoaistia käsittelevä annotaatiodomeeni. Mittausannotaatiodomeeni mittausannotaatiodomeeni (measurement annotation domain) Annotaatiodomeeni, joka koskee sellaisia mitattuja fysiologisia signaaleja, joihin edellämainitut annotaatiot eivät sovellu. Esim. artikulaatioon liittyvät mittaukset, aivosähkökäyrä (EEG), tms. Muita mahdollisesti tarvittavia käsitteitä Eleiden luokittelua deiktinen ele (deictic gesture) Osoittamiseleitä, joilla merkitään joko läsnäolevaa objektia tai henkilöä tai abstraktia entiteettiä kuten se oli hyvin valmisteltu ja [se] oli hyvä juttu, missä [se]-sanan aikana esiintyy osoittava ele, joka viittaa se oli hyvin valmisteltu. emblemaattinen ele (emblematic gesture) Ele, johon liittyy kulttuurisidonnainen viesti joka olisi myös ilmaistavissa sanoin; esimerkiksi peukalot pystyyn -ele. ikoninen ele (iconic gesture) Ele, joka on jossakin suhteessa samanaikaisen puheen sisältöön, esim. kirjoituseleen tekeminen, kun pyydetään allekirjoitusta. Attribuutteja: muoto = muoto tai toiminta, johon ele viittaa. iskuele (beat gesture) Rytminen liike, joka esiintyy sanan tai ilmauksen yhteydessä, muttei ole missään visuaalisessa suhteessa kielelliseen sisältöön. lokaatio (location) Korkeus ja lateraalinen asema eleavaruudessa. Eleen ominaisuus. metaforinen ele (metaphoric gesture) Ikonisen eleen sukulainen, joka on metaforisessa suhteessa puheen sisältöön, esimerkiksi palikan piirtäminen kädellä ilmaan, kun palikka kuvaa vaikkapa taloa tai pankkitiliä. 5

6 Muita käsitteitä lingvistinen signaali (linguistic signal) Aikasidonnainen, kielellisestä toiminnasta tehty tallenne (Steven Birdin määritelmä). Esimerkkejä: kielellistä toimintaa kuvaava ääni-, video- tai fysiologinen tallenne, jokin näistä johdettu signaali (esimerkiksi perustaajuus), tai teksti. Lingvistinen signaali indeksoidaan joko näytteinä (sample) tai tekstin kohdalla merkkeinä (character). tavu (syllable) Tavu on puheentuoton eräs perusyksikkö. Tavun sisäisessä rakenteessa erotetaan tavun keskus (centre, nucleus), tavun avaava segmentti (onset) ja tavun päättävä segmentti (coda). Tavunrajaa ei kuitenkaan ole aina helppoa määrätä.[?] Fonologinen tavurakenne voi erota huomattavasti foneettisesti toteutuneesta äännejonosta. Yläkäsite: sana (tavu ei ole mahdollinen ilman tunnistettavaa sanaa?). Merkintä: [tavu] (omalle annotaatiotasolleen) funktionaalinen tyyppi (functional type) Saneen attribuutti. Arvoja: negaatio; modaalinen (välttämättömyys, mahdollisuus); episteeminen (tieto, usko); 3-ulotteiset suhteet objektien välillä, kausaaliset suhteet asiantilojen välillä, deiktiset funktiot (henkilö, spatiaalinen, temporaalinen); palautefunktio, oman kommunikaation hallinta; muu? kommunikatiivinen akti (communicative act) Yhteisesti hyväksyttyä ja kaikkiin tapauksiin sopivaa perusluokitusta ei ole, mutta periaatteessa tällainen informaatio on mahdollista annotoida tutkijan omien mieltymysten mukaan. (Miten määritetään puheen tai eleen segmentti, johon tietty akti liittyy?) Olisi ehkä mahdollista jaotella puheenvuorot seuraavasti: partikkelivuoro, lauseke, lause, moniyksikköinen (multiunit turn). Voisi myös merkitä helposti tunnistettavia rakenteellisia piirteitä: interrogatiivi (hakukysymys tai ko-kysymys), deklaratiivi, eksklamatiivi. Sekalaisempia esimerkkejä: väite/toteamus, ymmärrys, kysymys, vastaus, vahvistus, avaus, lopetus, varmistus, kiittäminen, toisto, uudelleenmuotoilu, jatkokehotus, odotus, korjaus, toistopyyntö, hyväksyntä, vahvistuspyyntö, täydennys/selvennys, anteeksipyyntö, selitys, epäröinti, keskeytys, vitsi, vuoron pitäminen, vastalause, tarjous, muistutus, johtopäätös, pyyntö, itsen vahvistus, määrittely, esittäytyminen, muu (epäselvä). 6

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus

Vfo254: Puhekorpusten käyttö. Puhekorpusten lingvistinen representaatio. Yleistä. Symbolinen representaatio. Martti Vainio. Transkription tarkkuus Symbolinen representaatio Vfo 254: Puhekorpusten käsittely: Puhekorpusten lingvistinen representaatio Martti Vainio Puhekorpuksen tutkimininen on mahdollista vain symbolisen representaation kautta näytteistettyä

Lisätiedot

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla Mietta Lennes FIN-CLARIN / Helsingin yliopisto Johdanto Kun puhetta ja kieltä tutkitaan kvantitatiivisesti, on

Lisätiedot

Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio

Puhekorpukseet. Puhekorpukset ja puhetietokannat. Puhekorpus. Martti Vainio Puhekorpukset ja puhetietokannat Puhekorpus Puhekorpukset Martti Vainio Määritelmä: Puhutun kielen korpus (engl. spoken language corpus) on mikä tahansa kokoelma puheäänitteitä, joka on tietokoneen luettavassa

Lisätiedot

Mitä suomen intonaatiosta tiedetään

Mitä suomen intonaatiosta tiedetään Mitä suomen intonaatiosta tiedetään ja mitä ehkä tulisi tietää? Tommi Nieminen Itä-Suomen yliopisto AFinLAn syyssymposium Helsinki 13. 14. 11. 2015 Johdanto Jäsennys 1 Johdanto 2 Mitä intonaatiosta tiedetään?

Lisätiedot

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA Heini Kallio, tohtorikoulutettava Käyttäytymistieteiden laitos, fonetiikka Helsingin yliopisto heini.h.kallio@helsinki.fi Fonetiikan haasteet kielenopetuksessa

Lisätiedot

Automaattinen semanttinen annotointi

Automaattinen semanttinen annotointi Automaattinen semanttinen annotointi Matias Frosterus, Reetta Sinkkilä, Katariina Nyberg Semantic Computing Research Group (SeCo) School of Science and Technology, Department of Media Technology and University

Lisätiedot

Puhutun ja kirjoitetun rajalla

Puhutun ja kirjoitetun rajalla Puhutun ja kirjoitetun rajalla Tommi Nieminen Jyväskylän yliopisto Laura Karttunen Tampereen yliopisto AFinLAn syyssymposiumi Helsingissä 14. 15.11.2008 Lähtökohtia 1: Anekdotaaliset Daniel Hirst Nordic

Lisätiedot

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto

Åbo Akademi 3.5.2011 klo 12-16. Mietta Lennes mietta.lennes@helsinki.fi. Nykykielten laitos Helsingin yliopisto Åbo Akademi 3.5.2011 klo 12-16 Mietta Lennes mietta.lennes@helsinki.fi Nykykielten laitos Helsingin yliopisto Praat-puheanalyysiohjelma Mikä on Praat? Mikä on Praat? Praat [Boersma and Weenink, 2010] on

Lisätiedot

Foneettiset symbolit

Foneettiset symbolit Clt 120: Fonetiikan perusteet: intro, äänentuotto, artikulaatiopaikat Martti Vainio -- syksy 2006 Foneettiset symbolit 5000-8000 eri kieltä n. 300 foneettista symbolia riittää niiden kuvaamiseen puheentuotto-

Lisätiedot

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN

» Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN » Fonetiikka tutkii puheen: Tuottamista -> ARTIKULATORINEN Akustista ilmenemismuotoa -> AKUSTINEN Havaitsemista -> AUDITIIVINEN 1 Puhe-elimistä Helsingin Yliopiston sivuilla» Puhe-elimet voidaan jakaa

Lisätiedot

Suomen prosodian variaation tutkimuksesta

Suomen prosodian variaation tutkimuksesta Suomen prosodian variaation tutkimuksesta Tommi Nieminen Itä-Suomen yliopisto Tommi Kurki Turun yliopisto Prosodian käsitteestä prosodia käsittää kaikki ne puheen ilmiöt, jotka eivät ole segmentoitavissa

Lisätiedot

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech,

TTS. Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, Tekstiä, plaa plaa, plaa Puhesynteesi (tekstistä puheeksi, engl. text-tospeech, TTS): Generoidaan tietokoneen avulla akustinen puhesignaali annetun tekstin perusteella. TTS HUOM: Vaikka nyt keskitytäänkin

Lisätiedot

Yhdyssana suomen kielessä ja puheessa

Yhdyssana suomen kielessä ja puheessa Yhdyssana suomen kielessä ja puheessa Tommi Nieminen Jyväskylän yliopisto Anna Lantee Tampereen yliopisto 37. Kielitieteen päivät Helsingissä 20. 22.5.2010 Yhdyssanan ortografian historia yhdyssanan käsite

Lisätiedot

Prosodian havaitsemisesta: suomen lausepaino ja focus

Prosodian havaitsemisesta: suomen lausepaino ja focus Prosodian havaitsemisesta: suomen lausepaino ja focus Martti Vainio Helsingin yliopisto, Fonetiikan laitos; Kieliteknologia Juhani Järvikivi, Turun yliopisto, Psykologia; University of Dundee Yleistä Lingvistisen

Lisätiedot

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset 815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 2 vastaukset Harjoituksen aiheena on BNF-merkinnän käyttö ja yhteys rekursiivisesti etenevään jäsentäjään. Tehtävä 1. Mitkä ilmaukset seuraava

Lisätiedot

Mitä puhe on? Fonetiikan perusteet kieliteknologeille. Puheen analyysin viitekehys. Puhe ja Kommunikaatio. Puhe ja kommunikaatio (jatkoa)

Mitä puhe on? Fonetiikan perusteet kieliteknologeille. Puheen analyysin viitekehys. Puhe ja Kommunikaatio. Puhe ja kommunikaatio (jatkoa) Mitä puhe on? Fonetiikan perusteet kieliteknologeille Martti Vainio Puheen analyysin viitekehys Fonetiikan laitos, Helsingin yliopisto Mitä puhe on? p.1/43 S-114.770 Kieli kommunikaatiossa... Kevät 2001

Lisätiedot

Mitä puhe on? Fonetiikan perusteet kieliteknologeille

Mitä puhe on? Fonetiikan perusteet kieliteknologeille Mitä puhe on? Fonetiikan perusteet kieliteknologeille Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mitä puhe on? p.1/43 Puheen analyysin viitekehys S-114.770 Kieli kommunikaatiossa... Kevät 2001

Lisätiedot

ARVO - verkkomateriaalien arviointiin

ARVO - verkkomateriaalien arviointiin ARVO - verkkomateriaalien arviointiin Arvioitava kohde: Jenni Rikala: Aloittavan yrityksen suunnittelu, Arvioija: Heli Viinikainen, Arviointipäivämäärä: 12.3.2010 Osa-alue 5/8: Mediaelementit Edellinen

Lisätiedot

Voimaa arkeen, esiintymistaito, osa 1. c/o Katja Kujala

Voimaa arkeen, esiintymistaito, osa 1. c/o Katja Kujala Voimaa arkeen, esiintymistaito, osa 1 Katja Kujala Ensivaikutelma Luodaan täysin vieraasta henkilöstä sadasosasekunneissa Pukeutuminen Kehon kieli Äänenkäyttö, puheilmaisu, puhetapa (esim. murre) Ystävä

Lisätiedot

Luento 12: XML ja metatieto

Luento 12: XML ja metatieto Luento 12: XML ja metatieto AS-0.110 XML-kuvauskielten perusteet Janne Kalliola XML ja metatieto Metatieto rakenne sanasto Resource Description Framework graafikuvaus XML Semanttinen Web agentit 2 1 Metatieto

Lisätiedot

Vfo254: Puhekorpusten käyttö

Vfo254: Puhekorpusten käyttö Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan

Lisätiedot

Puheaineiston annotaatio eli nimikointi. Mietta Lennes Sanna Ahjoniemi

Puheaineiston annotaatio eli nimikointi. Mietta Lennes Sanna Ahjoniemi Puheaineiston annotaatio eli nimikointi Mietta Lennes Sanna Ahjoniemi Versio 1.01 11. toukokuuta 2005 2 Sisältö I Puheen annotaatio 7 1 Mitä on annotaatio? 9 Miksi puhetta nimikoidaan eli annotoidaan?....................

Lisätiedot

Vfo254: Puhekorpusten käyttö

Vfo254: Puhekorpusten käyttö Aikataulu ja kurssin sisältö Puhekorpukset ja niiden käyttö Kurssi on jaettu luentoihin, joissa käsitellään seuraavia asioita: Puhekorpusten suunnittelu Vfo 254: Puhekorpusten käsittely Martti Vainio Puhedatan

Lisätiedot

Puhe ja kommunikaatio

Puhe ja kommunikaatio Puhe ja kommunikaatio Puhe on ihmisen kehittämistä kommunikoinnin muodoista hienostunein ja monimutkaisin -- siihen on kerrostunut useanlaista informaatiota, joiden määrittelyyn tarvitaan jonkinlainen

Lisätiedot

9. Periytyminen Javassa 9.1

9. Periytyminen Javassa 9.1 9. Periytyminen Javassa 9.1 Sisällys Periytymismekanismi Java-kielessä. Piirteiden näkyvyys periytymisessä. Ilmentymämetodien korvaaminen. Luokkametodien peittäminen. Super-attribuutti. Override-annotaatio.

Lisätiedot

Mitä puhe on? Fonetiikan perusteet kieliteknologeille

Mitä puhe on? Fonetiikan perusteet kieliteknologeille Mitä puhe on? Fonetiikan perusteet kieliteknologeille Martti Vainio Fonetiikan laitos, Helsingin yliopisto Mitä puhe on? p.1/55 Tyypillinen ilmaus: 6 khz frequency 0 Hz 150 Hz F0 50 Hz 81 db intensity

Lisätiedot

Varhainen leikki ja sen arviointi

Varhainen leikki ja sen arviointi Varhainen leikki ja sen arviointi Paula Lyytinen Jyväskylän yliopisto Psykologian laitos Hyvä Alku messut 2.9.2004 Leikin sisällöt eri ikävaiheissa Esine- ja toimintaleikit (0-3 v) Eksploratiiviset Funktionaalis-relationaaliset

Lisätiedot

Taulukot. Jukka Harju, Jukka Juslin 2006 1

Taulukot. Jukka Harju, Jukka Juslin 2006 1 Taulukot Jukka Harju, Jukka Juslin 2006 1 Taulukot Taulukot ovat olioita, jotka auttavat organisoimaan suuria määriä tietoa. Käsittelylistalla on: Taulukon tekeminen ja käyttö Rajojen tarkastus ja kapasiteetti

Lisätiedot

TIEDONHAKU INTERNETISTÄ

TIEDONHAKU INTERNETISTÄ TIEDONHAKU INTERNETISTÄ Internetistä löytyy hyvin paljon tietoa. Tietoa ei ole mitenkään järjestetty, joten tiedonhaku voi olla hankalaa. Tieto myös muuttuu jatkuvasti. Tänään tehty tiedonhaku ei anna

Lisätiedot

Suomen kielen Osaamispyörä -työkalu

Suomen kielen Osaamispyörä -työkalu Suomen kielen Osaamispyörä -työkalu Tavoitteet Kohderyhmät Käyttö Suomen kielen Osaamispyörän tavoitteena on tehdä näkyväksi maahanmuuttajataustaisten työntekijöiden suomen kielen osaamista. Osaamispyörä

Lisätiedot

Tuotetietopankin alustanvaihdon muutostöiden luokittelu

Tuotetietopankin alustanvaihdon muutostöiden luokittelu Tuotetietopankin alustanvaihdon muutostöiden luokittelu Sisällys Tuotetietopankin alustan vaihdon muutostöiden luokittelu... 3 I-vaihe... 3 I-vaihe tehtävät muutokset... 3 I-vaihe tarkistettavat asiat...

Lisätiedot

Kuulohavainnon perusteet

Kuulohavainnon perusteet Kuulohavainnon ärsyke on ääni - mitä ääni on? Kuulohavainnon perusteet - Ääni on ilmanpaineen nopeaa vaihtelua: Tai veden tms. Markku Kilpeläinen Käyttäytymistieteiden laitos, Helsingin yliopisto Värähtelevä

Lisätiedot

osassa III max-pist pistem pistemäärä osan III maksimista III:N MAX 30 Z Y X (X/Y)xZ=Å Åx0,3 TEHTÄVÄ

osassa III max-pist pistem pistemäärä osan III maksimista III:N MAX 30 Z Y X (X/Y)xZ=Å Åx0,3 TEHTÄVÄ Helsingin yliopiston humanistinen tiedekunta/valintakoe 19.5.2017 Kotimaisten kielten ja kirjallisuuksien kandiohjelma/suomen kieli ja kulttuuri MALLIKAAVAKE KOKELAAN NIMI Meikäläinen, Maija KOKELAAN TUNNISTE

Lisätiedot

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003

Puhesynteesi. Martti Vainio. 11. huhtikuuta 2003 Puhesynteesi Signaalin generointi Martti Vainio mailto:martti.vainio@helsinki.fi 11. huhtikuuta 2003 Signaalin generointi puhesynteesissä Kuinka tuottaa foneettisesta symbolisesta tiedosta jatkuvaa signaalia

Lisätiedot

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004

Lisätiedot

Puhesynteesin perusteet Luento 5: unit selection -synteesi

Puhesynteesin perusteet Luento 5: unit selection -synteesi Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen

Lisätiedot

Organization of (Simultaneous) Spectral Components

Organization of (Simultaneous) Spectral Components Organization of (Simultaneous) Spectral Components ihmiskuulo yrittää ryhmitellä ja yhdistää samasta fyysisestä lähteestä tulevat akustiset komponentit yhdistelyä tapahtuu sekä eri- että samanaikaisille

Lisätiedot

KESKUSTELUNANALYYSI. Anssi Peräkylä Kvalitatiiviset menetelmät 04.11.2009

KESKUSTELUNANALYYSI. Anssi Peräkylä Kvalitatiiviset menetelmät 04.11.2009 KESKUSTELUNANALYYSI Anssi Peräkylä Kvalitatiiviset menetelmät 04.11.2009 Esitelmän rakenne KESKUSTELUNANALYYTTINEN TAPA LUKEA VUOROVAIKUTUSTA ESIMERKKI: KUNINGAS ROLLO KESKUSTELUNANALYYSIN PERUSOLETTAMUKSET

Lisätiedot

8. Kieliopit ja kielet

8. Kieliopit ja kielet 8. Kieliopit ja kielet Suomen kielen sanoja voidaan yhdistellä monella eri tavalla. Kielioppi määrää sen, milloin sanojen yhdistely antaa oikein muodostetun lauseen. "Mies räpyttää siipiään" on kieliopillisesti

Lisätiedot

Lapsen tyypillinen kehitys. -kommunikaatio -kielellinen kehitys

Lapsen tyypillinen kehitys. -kommunikaatio -kielellinen kehitys Lapsen tyypillinen kehitys -kommunikaatio -kielellinen kehitys Kielellinen kehitys Vauvalla on synnynnäinen kyky vastaanottaa kieltä ja tarve olla vuorovaikutuksessa toisen ihmisen kanssa Kielellinen kehitys

Lisätiedot

Kielten rikas maailma jo ennen sanoja Kielen oppimisen varhaisvaiheet, tuen tarpeen tunnistaminen ja tukemisen keinot

Kielten rikas maailma jo ennen sanoja Kielen oppimisen varhaisvaiheet, tuen tarpeen tunnistaminen ja tukemisen keinot Kielten rikas maailma jo ennen sanoja Kielen oppimisen varhaisvaiheet, tuen tarpeen tunnistaminen ja tukemisen keinot Marja-Leena Laakso Varhaiskasvatuksen, erityisesti lapsi- ja kehityspsykologian professori,

Lisätiedot

Poikkeusinfo XML-rajapinnan kuvaus, rajapinnan versio 2 Seasam Group

Poikkeusinfo XML-rajapinnan kuvaus, rajapinnan versio 2 Seasam Group 1.10.2010 1(15) Poikkeusinfo XML-rajapinnan kuvaus, rajapinnan versio 2 Seasam Group Graanintie 7 Tel. + 358 15 338 800 FIN-50190 MIKKELI Fax + 358 15 338 810 VERSIOHISTORIA Versio Pvm Tekijä Selite 1.0

Lisätiedot

Esiintyminen. N-piirin JOVA-koulutus 2010

Esiintyminen. N-piirin JOVA-koulutus 2010 Esiintyminen N-piirin JOVA-koulutus 2010 Klubikokous Esiinnyt klubisi kokouksessa Kuulijoita 10-50 Sinulla on aikaa 3-5 minuuttia Ei videotykkiä Esityksesi kokouksen lopulla Innostat klubiasi uuteen tapahtumaan

Lisätiedot

Digitaalinen audio

Digitaalinen audio 8003203 Digitaalinen audio Luennot, kevät 2005 Tuomas Virtanen Tampereen teknillinen yliopisto Kurssin tavoite Johdanto 2 Tarjota tiedot audiosignaalinkäsittelyn perusteista perusoperaatiot, sekä niissä

Lisätiedot

VeRan laboratoriotietojen siirtoformaatti

VeRan laboratoriotietojen siirtoformaatti FCG Finnish Consulting Group Oy VERA TOIMINTAOHJEET Rev./pvm 1.03 Hyväksytty 30.4.2010 Sisältö Käyttö Vastuuhenkilö VeRan tiedonsiirtoformaatti Laboratoriot, jotka toimittavat tulokset suoraan VeRaan.

Lisätiedot

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen:

Luento: Puhe. Mitä puhe on? Anatomiaa ja fysiologiaa. Puhetapahtuma. Brocan ja Wernicken alueet. Anatomiaa ja fysiologiaa. Puheen tuottaminen: Puheen anatomiaa ja fysiologiaa Puhesignaalin analyysi Puheen havaitseminen luku 11 Luento: Puhe Mitä puhe on? Ihmisen kehittämä symbolinen kommunikaatiojärjestelmä. Perustuu sovittuihin kielellisiin koodeihin

Lisätiedot

Tietokoneohjelmien käyttö laadullisen aineiston analyysin apuna

Tietokoneohjelmien käyttö laadullisen aineiston analyysin apuna Tietokoneohjelmien käyttö laadullisen aineiston analyysin apuna Laadullinen, verbaalinen, tulkinnallinen aineisto kootaan esimerkiksi haastattelemalla, videoimalla, ääneenpuhumalla nauhalle, yms. keinoin.

Lisätiedot

Tutoriaaliläsnäoloista

Tutoriaaliläsnäoloista Tutoriaaliläsnäoloista Tutoriaaliläsnäolokierroksella voi nyt täyttää anomuksen läsnäolon merkitsemisestä Esim. tagi ei toiminut, korvavaltimon leikkaus, yms. Hyväksyn näitä omaa harkintaa käyttäen Tarkoitus

Lisätiedot

M. Merikanto 2012 XML. Merkkauskieli, osa 2

M. Merikanto 2012 XML. Merkkauskieli, osa 2 XML Merkkauskieli, osa 2 Esimerkki: XML-dokumentti resepti maitokaakao

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15 Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/15 Lisää säännöllisistä lausekkeista Aikaisemmin esityt * ja + yrittävät osua mahdollisimman pitkään merkkijonoon

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

Toimintokaavio. UML-Toimontokaavio 1

Toimintokaavio. UML-Toimontokaavio 1 Toimintokaavio - Toimintokaaviot (octivity diagrams) kuvaavat toimintoja ja niiden seurauksia. - Toimintokaavio on tilakaavion muunnos, toimintojen ja niiden tulosten kuvaamisen olioiden tilamuutoksina.

Lisätiedot

ARVO - verkkomateriaalien arviointiin

ARVO - verkkomateriaalien arviointiin ARVO - verkkomateriaalien arviointiin Arvioitava kohde: Jenni Rikala: Aloittavan yrityksen suunnittelu, Arvioija: Heli Viinikainen, Arviointipäivämäärä: 12.3.2010 Osa-alue 2/8: Informaation luotettavuus

Lisätiedot

FI3 Tiedon ja todellisuuden filosofia LOGIIKKA. 1.1 Logiikan ymmärtämiseksi on tärkeää osata erottaa muoto ja sisältö toisistaan:

FI3 Tiedon ja todellisuuden filosofia LOGIIKKA. 1.1 Logiikan ymmärtämiseksi on tärkeää osata erottaa muoto ja sisältö toisistaan: LOGIIKKA 1 Mitä logiikka on? päättelyn tiede o oppi muodollisesti pätevästä päättelystä 1.1 Logiikan ymmärtämiseksi on tärkeää osata erottaa muoto ja sisältö toisistaan: sisältö, merkitys: onko jokin premissi

Lisätiedot

PUHU MINULLE KUUNTELE MINUA

PUHU MINULLE KUUNTELE MINUA Helsingin terveyskeskus poliklinikka Puheterapeutit: K. Laaksonen, E. Nykänen, R. Osara, L. Piirto, K. Pirkola, A. Suvela, T. Tauriainen ja T. Vaara PUHU MINULLE KUUNTELE MINUA Lapsi oppii puheen tavallisissa

Lisätiedot

Kompleksiluvut signaalin taajuusjakauman arvioinnissa

Kompleksiluvut signaalin taajuusjakauman arvioinnissa Kompleksiluvut signaalin taajuusjakauman arvioinnissa Vierailuluento IMA-kurssilla Heikki Huttunen Lehtori, TkT Signaalinkäsittely, TTY heikki.huttunen@tut.fi Department of Signal Processing Fourier-muunnos

Lisätiedot

Automaatit. Muodolliset kielet

Automaatit. Muodolliset kielet Automaatit Automaatit ovat teoreettisia koneita, jotka käsittelevät muodollisia sanoja. Automaatti lukee muodollisen sanan kirjain kerrallaan, vasemmalta oikealle, ja joko hyväksyy tai hylkää sanan. Täten

Lisätiedot

Kirjautumisosoite: wilma.tuusula.fi

Kirjautumisosoite: wilma.tuusula.fi Kirjautumisosoite: wilma.tuusula.fi Myös koulun sivuilta koti.mbnet.fi/riha ja ylälaidan valikosta Wilma Nettiselaimen osoiteriville kirjoitetaan wilma.tuusula.fi (https://wilma.tuusula.fi). On muistettava,

Lisätiedot

1. Skannaus ja tekstintunnistus (OCR) verkkoskannerilta

1. Skannaus ja tekstintunnistus (OCR) verkkoskannerilta M-Files OCR M-Files OCR:n avulla voidaan skannattavalle paperidokumentille tehdä tekstintunnistus skannerista riippumatta. Tällöin tekstiä sisältävät kuvat tunnistetaan varsinaisiksi tekstimerkeiksi, jonka

Lisätiedot

Verbin valenssi määrää, minkälaisia argumentteja ja komplementteja verbi odottaa saavansa millaisissa lauseissa verbi voi esiintyä.

Verbin valenssi määrää, minkälaisia argumentteja ja komplementteja verbi odottaa saavansa millaisissa lauseissa verbi voi esiintyä. Valenssista Valenssi saksalaisessa ja venäläisessä kieliopintutkimuksessa käytetty nimitys, joka tavallisesti tarkoittaa verbin ominaisuutta: sitä, kuinka monta ja millaisia nomineja obligatorisesti ja

Lisätiedot

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke

Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke Rakenteisuus kahdella tasolla Oppimisaihiot ( Learning Objects

Lisätiedot

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Suomen kielen variaatio 1 Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu Puhuttu ja kirjoitettu kieli Puhuttu kieli on ensisijaista. Lapsi oppii (omaksuu) puhutun kielen luonnollisesti siinä ympäristössä,

Lisätiedot

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas Tiedonhallinnan perusteet Viikko 1 Jukka Lähetkangas Kurssilla käytävät asiat Tietokantojen toimintafilosofian ja -tekniikan perusteet Tiedonsäilönnän vaihtoehdot Tietokantojen suunnitteleminen internetiä

Lisätiedot

Puhesynteesin perusteet: Lingvistinen esikäsittely

Puhesynteesin perusteet: Lingvistinen esikäsittely Puhesynteesin perusteet: Lingvistinen esikäsittely Nicholas Volk 24.1.2008 Käyttäytymistieteellinen tiedekunta Tekstin esikäsittely Jaetaan syöteen luettaviin saneisiin ja äännevastineettomiin välimerkkeihin

Lisätiedot

Kielipankki ja AV-aineistot

Kielipankki ja AV-aineistot Kielipankki ja AV-aineistot Mietta Lennes FIN-CLARIN c/o Nykykielten laitos, Helsingin yliopisto FIN-CLARIN ja Kielipankki FIN-CLARIN on kansallinen konsortio, johon kuuluu joukko yliopistoja, Kotimaisten

Lisätiedot

FM, laaja-alainen erityisopettaja. Tiina Muukka. 20.11.2012 Oulu

FM, laaja-alainen erityisopettaja. Tiina Muukka. 20.11.2012 Oulu FM, laaja-alainen erityisopettaja Tiina Muukka 20.11.2012 Oulu Primaarilukutaidoton = oppija ei osaa lukea/kirjoittaa millään kielellä eikä hänellä ole tavallisesti koulutaustaa Sekundaarilukutaitoinen

Lisätiedot

Analytiikka tulosten mittaamisessa. Google Analytics

Analytiikka tulosten mittaamisessa. Google Analytics Analytiikka tulosten mittaamisessa Google Analytics #digitie Tämän dokumentin sisältämä koulutusmateriaali on Kuuki Marketing Lab Oy:n omaisuutta ja se on luottamuksellisesti annettu vain Kuuki Marketing

Lisätiedot

TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN

TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN Hanna Vilkka Mikä on havainto? - merkki (sana, lause, ajatus, ominaisuus, toiminta, teko, suhde) + sen merkitys (huom. myös

Lisätiedot

Ruma merkitys. Tommi Nieminen. XLII Kielitieteen päivät. Kielitieteen epäilyttävin välttämätön käsite. tommi.nieminen@uef.fi. Itä-Suomen yliopisto ...

Ruma merkitys. Tommi Nieminen. XLII Kielitieteen päivät. Kielitieteen epäilyttävin välttämätön käsite. tommi.nieminen@uef.fi. Itä-Suomen yliopisto ... Ruma merkitys Kielitieteen epäilyttävin välttämätön käsite Tommi Nieminen tomminieminen@ueffi Itä-Suomen yliopisto XLII Kielitieteen päivät 21 23 toukokuuta 2015, Vaasa Merkitys, subst lingvistisen merkityksen

Lisätiedot

4.1 Urakäsite. Ympyräviiva. Ympyrään liittyvät nimitykset

4.1 Urakäsite. Ympyräviiva. Ympyrään liittyvät nimitykset 4.1 Urakäsite. Ympyräviiva. Ympyrään liittyvät nimitykset MÄÄRITELMÄ 6 URA Joukko pisteitä, joista jokainen täyttää määrätyn ehdon, on ura. Urakäsite sisältää siten kaksi asiaa. Pistejoukon jokainen piste

Lisätiedot

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin? Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin? Avoin verkkoalusta ihmisen ja koneen ymmärtämien tietomääritysten tekemiseen Riitta Alkula 20.3.2019 Esityksen sisältö

Lisätiedot

Korpusten käsittely clt131, P Luento 6

Korpusten käsittely clt131, P Luento 6 Korpusten käsittely clt131, P2 2006 Luento 6 Nicholas Volk 8.12.2006 Humanistinen tiedekunta Syöterivien lukemista while () { käsky1; käsky2; käskyn; } continue { print $_; }

Lisätiedot

AAC -menetelmien sovellus kehitysvammahuoltoon. Kirsi Vainio 24.3.2011

AAC -menetelmien sovellus kehitysvammahuoltoon. Kirsi Vainio 24.3.2011 AAC -menetelmien sovellus kehitysvammahuoltoon Kirsi Vainio 24.3.2011 1 Kommunikointi Tarkoittaa niitä keinoja joilla ihminen on yhteydessä toisiin Merkittävä tekijä ihmisen persoonallisuuden muodostumisessa

Lisätiedot

Fonetiikan perusteet (FA1/Clt 120): ääni II, ilmavirtamekanismit ja äänteet

Fonetiikan perusteet (FA1/Clt 120): ääni II, ilmavirtamekanismit ja äänteet Fonetiikan perusteet (FA1/Clt 120): ääni II, ilmavirtamekanismit ja äänteet Martti Vainio, syksy 2006 Voice Onset Time (VOT) soinnittomilla klusiileilla äänihuulten värähtely (fonaatio) lakkautetaan sulkeumavaihetta

Lisätiedot

Esiintyminen. N-piirin JOVA-koulutus 2012

Esiintyminen. N-piirin JOVA-koulutus 2012 Esiintyminen N-piirin JOVA-koulutus 2012 Klubikokous Esiinnyt klubisi kokouksessa Kuulijoita 10-50 Sinulla on aikaa 3-5 minuuttia Ei videotykkiä Esityksesi kokouksen lopulla Innostat klubiasi uuteen tapahtumaan

Lisätiedot

Päivi Homanen Satakieliohjelma 17.1.2013 Tampere

Päivi Homanen Satakieliohjelma 17.1.2013 Tampere Päivi Homanen Satakieliohjelma 17.1.2013 Tampere LAPSET OVAT ERILAISIA SOSIAALINEN LAPSI Jos kommunikaatiotaidot vielä heikot Huomioidaan aloitteet Jatketaan lapsen aloittamaa keskustelua Jutellaan kahden

Lisätiedot

ETNIMU-projektin, aivoterveyttä edistävän kurssin 5.osa. Aistit.

ETNIMU-projektin, aivoterveyttä edistävän kurssin 5.osa. Aistit. ETNIMU-projektin, aivoterveyttä edistävän kurssin 5.osa Aistit. Aistien maailma Ympäristön havainnointi tapahtuu aistien välityksellä. Tarkkailemme aistien avulla jatkuvasti enemmän tai vähemmän tietoisesti

Lisätiedot

Suomen puherytmi typologisessa katsannossa

Suomen puherytmi typologisessa katsannossa Suomen puherytmi typologisessa katsannossa Tommi Nieminen Jyväskylän yliopisto Michael O Dell Tampereen yliopisto 36. Kielitieteen päivät Jyväskylässä 14. 16.5.2009 Lopputulemat heti kärkeen suomen tavuajoitteisuus

Lisätiedot

ISO SUOMEN KIELIOPPI S2- OPETUKSESSA. Muutama havainto

ISO SUOMEN KIELIOPPI S2- OPETUKSESSA. Muutama havainto ISO SUOMEN KIELIOPPI S2- OPETUKSESSA Muutama havainto Maisa Martin Alumnipäivä 26.9.2009 KOLME ASIAA Uusia termejä S2-alan näkökulmasta ja muutenkin Hyödyllisiä erotteluja Ope, mitä eroa on Mikä on tavallista?

Lisätiedot

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä Puhe ja kommunikaatio Fonetiikka ja fonologia Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä Martti Vainio Puhetieteiden laitos, Helsingin yliopisto Puhe on ihmisen kehittämistä kommunikoinnin

Lisätiedot

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä

Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä Fonetiikka ja fonologia p. 1/47 Fonetiikka ja fonologia Fonetiikan asema semioottisesti ja fonologian peruskäsitteistöä Martti Vainio Puhetieteiden laitos, Helsingin yliopisto FP1 Fonetiikan perusteet

Lisätiedot

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja

SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja SGN-4010, Puheenkäsittelyn menetelmät Harjoitus 6, 18. ja 21.2.2010 1. (Matlab, 2 pistettä) Vokaalit ja soinnilliset konsonantit ovat lähes jaksollisia ja niillä on äänihuulten värähtelystä johtuva perustaajuus.

Lisätiedot

Datatähti 2019 loppu

Datatähti 2019 loppu Datatähti 2019 loppu task type time limit memory limit A Summa standard 1.00 s 512 MB B Bittijono standard 1.00 s 512 MB C Auringonlasku standard 1.00 s 512 MB D Binääripuu standard 1.00 s 512 MB E Funktio

Lisätiedot

Sivuston tiedotwindowsrepublic.com.au

Sivuston tiedotwindowsrepublic.com.au Sivuston tiedotwindowsrepublic.com.au Luotu Maaliskuu 28 2019 14:41 PM Pisteet48/100 SEO Sisältö Otsikko Windows Republic - upvc windows manufacturer and supplier in Melbourne Pituus : 70 Täydellistä,

Lisätiedot

CLT131: Tekstityökalut 2011, viides luento

CLT131: Tekstityökalut 2011, viides luento CLT131: Tekstityökalut 2011, viides luento Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 30. marraskuuta 2011 tommi.pirinen+clt131@helsinki.fi

Lisätiedot

Kielen oppimisen perusta on vuorovaikutus (Launonen, K Vuorovaikutus, riskit ja tukeminen kuntoutuksen keinoin)

Kielen oppimisen perusta on vuorovaikutus (Launonen, K Vuorovaikutus, riskit ja tukeminen kuntoutuksen keinoin) Erityispedagogiikan koulutus Kommunikaatiokurssin luento 2010 Dosentti Elina Kontu Kielen oppimisen perusta on vuorovaikutus (Launonen, K. 2007. Vuorovaikutus, riskit ja tukeminen kuntoutuksen keinoin)

Lisätiedot

Kieli merkitys ja logiikka. 4: Luovuus, assosiationismi. Luovuus ja assosiationismi. Kielen luovuus. Descartes ja dualismi

Kieli merkitys ja logiikka. 4: Luovuus, assosiationismi. Luovuus ja assosiationismi. Kielen luovuus. Descartes ja dualismi Luovuus ja assosiationismi Kieli merkitys ja logiikka 4: Luovuus, assosiationismi Käsittelemme ensin assosiationismin kokonaan, sen jälkeen siirrymme kombinatoriseen luovuuteen ja konstituenttimalleihin

Lisätiedot

VIESTINTÄSUUNNITELMA CITIZEN MINDSCAPES TUTKIMUSRYHMÄLLE

VIESTINTÄSUUNNITELMA CITIZEN MINDSCAPES TUTKIMUSRYHMÄLLE VIESTINTÄSUUNNITELMA CITIZEN MINDSCAPES TUTKIMUSRYHMÄLLE Joulukuu 2015 Mira Matilainen LÄHTÖKOHDAT Kohderyhmät: Rahoittajat, tutkijakollegat, muut sosiaalisen median tutkimuksesta ja hankkeesta kiinnostuneet

Lisätiedot

Uudet EU-asetukset. EUR-Lexin tarkennetun haun käyttöohje

Uudet EU-asetukset. EUR-Lexin tarkennetun haun käyttöohje Uudet EU-asetukset EUR-Lexin tarkennetun haun käyttöohje Aloitus Mene EUR-Lex-sivustolle: http://eur-lex.europa.eu/homepage.html?locale=fi. Valitse (tarvittaessa) vaakasuorasta valikosta "Etusivu" ja siirry

Lisätiedot

Ilmoita organisaatiosi kotipaikkana toimiva maa tai alue 2.c KEPA: Sisältääkö hanke 5 prosentin omarahoitusosuuden?

Ilmoita organisaatiosi kotipaikkana toimiva maa tai alue 2.c KEPA: Sisältääkö hanke 5 prosentin omarahoitusosuuden? Hakemuslomake Huom: Lomaketta päivitetty 21.3.2018. Sujuvoitettu kieliasua ja lisätty ohje lomakkeen täyttämisestä Word-tiedostoon. Täytetty hakemus on lähetettävä verkkohakemusmoduulin kautta osoitteessa

Lisätiedot

Elisa Chat. Leila Virta

Elisa Chat. Leila Virta Elisa Chat Leila Virta 20.2.2018 1 Chatti-palvelut verkkosivustoilla Tarjotaan asiakaspalvelua monesta kanavasta. Chatillä madalletaan asiakkaan yhteydenottokynnystä. Chatissä selvitetty asia on yleensä

Lisätiedot

Matematiikan peruskurssi 2

Matematiikan peruskurssi 2 Matematiikan peruskurssi Demonstraatiot III, 4.5..06. Mikä on funktion f suurin mahdollinen määrittelyjoukko, kun f(x) x? Mikä on silloin f:n arvojoukko? Etsi f:n käänteisfunktio f ja tarkista, että löytämäsi

Lisätiedot

AV-muotojen migraatiotyöpaja - video. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen

AV-muotojen migraatiotyöpaja - video. KDK-pitkäaikaissäilytys seminaari / Juha Lehtonen AV-muotojen migraatiotyöpaja - video KDK-pitkäaikaissäilytys 2013 -seminaari 6.5.2013 / Juha Lehtonen Elävän kuvan muodot Videoon vaikuttavia asioita Kuvamuotojen ominaisuudet Audiomuotojen ominaisuudet

Lisätiedot

Intonaation analyysi ja annotointi puhekorpuksissa

Intonaation analyysi ja annotointi puhekorpuksissa Intonaation analyysi ja annotointi puhekorpuksissa 4.4.2002/HY:n fonetiikan laitos Stefan Werner stefan.werner@joensuu.fi Kieliteknologia/JoY Intonaation analyysi/annotointi HY 4.4.2002 p.1/43 Intonaation

Lisätiedot

KUN LUKEMINEN ON HANKALAA. Helena Sorsa

KUN LUKEMINEN ON HANKALAA. Helena Sorsa KUN LUKEMINEN ON HANKALAA Helena Sorsa Lukemisen ja kirjoittamisen vaikeudet Lukivaikeus dysleksia fonologinen häiriö: henkilö ei kykene muuttamaan lukemaansa puheeksi näkee sanat, mutta ei löydä äänneasua

Lisätiedot

Luonnos eams-rakenteeksi

Luonnos eams-rakenteeksi JHS-XXX: eams-rakenne ja xml-skeema Luonnos eams-rakenteeksi 19.4.2013 Tässä dokumentissa kuvataan keskeiset linjaukset tulevan JHS-suosituksen määrittämäksi eamsrakenteeksi. Dokumentti ei ole JHS-suositusluonnos,

Lisätiedot

Sisällys. 9. Periytyminen Javassa. Periytymismekanismi Java-kielessä. Periytymismekanismi Java-kielessä

Sisällys. 9. Periytyminen Javassa. Periytymismekanismi Java-kielessä. Periytymismekanismi Java-kielessä Sisällys 9. Periytyminen Javassa Periytymismekanismi Java-kielessä. Piirteiden näkyvyys periytymisessä. Metodien korvaaminen ja super-attribuutti. Attribuutin peittäminen periytymisen kautta. Rakentajat

Lisätiedot

LAINAUSJÄRJESTELMÄ. Kyllä. Vihermetsän lukion kirjastossa on samankaltainen, mutta monimutkaisempi lainausjärjestelmä:

LAINAUSJÄRJESTELMÄ. Kyllä. Vihermetsän lukion kirjastossa on samankaltainen, mutta monimutkaisempi lainausjärjestelmä: LAINAUSJÄRJESTELMÄ Holopaisten lukion kirjastossa on yksinkertainen kirjojen lainausjärjestelmä: henkilökunnalle laina-aika on 28 päivää, ja opiskelijoille laina-aika on 7 Alla on tätä yksinkertaista järjestelmää

Lisätiedot

Massahaun tulosten tulkintaa

Massahaun tulosten tulkintaa Massahaun tulosten tulkintaa Joonas Pihlaja, Copyright 2003 Novo Meridian Oy 2. heinäkuuta 2003 Sisältö 1 Yleiskatsaus 1 2 Company 1 3 Country 2 4 Timezone 2 5 Language 2 6 Station 3 7 Trnsattr ja Trnsmode

Lisätiedot

Hankinnan sisällön määrittely

Hankinnan sisällön määrittely Hankinnan sisällön määrittely lakimies Rasmus Ingman Markkinakartoitus sekä ehdokkaan tai tarjoajan osallistuminen hankinnan valmisteluun Ennen hankintamenettelyn aloittamista voi tehdä markkinakartoituksen

Lisätiedot