Korpukset. Tommi Jantunen, SVKS112,

Samankaltaiset tiedostot
Koko aineisto. ProGramin korpustyö. Fokuksessa sarjakuvanarrahivit (1) KuvausHlanne. Tommi Jantunen, SVKS112,

Viittomakielen korpusaineisto ja sen käyttö

Ei-manuaalisuus. Tommi Jantunen, SVKS112,

Transitiivisuus. Tommi Jantunen, SVKS112,

Kurkotellen kohti kielioppia Miten syntaksia on venyte.y suomalaisen vii.omakielen tutkimuksessa?

Videoaineiston ja mittausdatan yhdistäminen tapaus viittomakieli

Omissioilmiöt. Tommi Jantunen, SVKS112,

Kurkotellen kohti kielioppia

Aihe, aineisto ja argumenf. Viitekehys RINNASTUKSEN PROSODIAA SUOMALAISESSA VIITTOMAKIELESSÄ. Lauserinnastustutkimuksen videoaineisto

Vii#omajärjestys. Tommi Jantunen, SVKS112,

VIITTOMAN α JA Ω ANNOTAATION NÄKÖKULMASTA

Viittomisto. Tommi Jantunen, SVKS112,

Kolme esimerkkiä ei- manuaalisuuden. Messing with the head SYVYYSSUUNTAISET PÄÄNLIIKKEET MOCAP- AINEISTON PERUSTEELLA. Aineisto 26.4.

Konstruoitu toiminta. Tommi Jantunen, SVKS112,

Prosodinen alanmerkintä. Nonmanuals (Pfau & Quer 2010) Prosodia. Fone?ikka. Lingvis?ikka - Morfologia - Fonologia. Tommi Jantunen, SVKS112, 29.4.

Kohti viittomakielten käyttöpohjaista fonologista tutkimusta. SVKS1010 Viittomakielten fonetiikan ja fonologian tutkimus (5 op)

Mikä on ele? Eleet ja syntaksi. Puhe ja manuaalinen ele. Ele semiootsesta näkökulmasta

Aiheita. Fonee+sta syntaksia. Prologi: "ArMkulatorinen kaaos" Alojen ja rajojen fonemikkaa

SUOMEN VIITTOMAKIELTEN KORPUSPROJEKTIN (CFINSL) ANNOTOINTIOHJEET

SUOMEN VIITTOMAKIELTEN KORPUSPROJEKTIN (CFINSL) ANNOTOINTIOHJEET

Nominaalit ja verbaalit. Metodinen perusta. Sanaluokkatutkimuksen filosofinen perusta. Tommi Jantunen, SVKS112,

TIETOSUOJAILMOITUS TUTKIMUKSESTA JA TUTKIMUKSESSA KERÄTYN AINEISTON KÄYTÖSTÄ

VIITTOMAKIELET HYBRIDISYSTEEMEINÄ HÄMÄRÄRAJAISUUS JA EPÄKONVENTIONAALISUUS OSANA VIITTOMAKIELTEN RAKENNETTA

VIITTOMAKIELET HYBRIDISYSTEEMEINÄ HÄMÄRÄRAJAISUUS JA EPÄKONVENTIONAALISUUS OSANA VIITTOMAKIELTEN RAKENNETTA

Lauseen käsitteestä ja käsittämättömyydestä SVK:ssa

Kielitiedettä ja viittomakieliteknologiaa

Kertausta kompleksisista lauseista. Komplementtilauseet. Komplementtilauseen skeema. Alisteisia lausetyyppejä. Tommi Jantunen, SVKS112, 6.4.

Lause. Yksinkertaisen lauseen vii/omajärjestys. Yksinkertainen lause. Yksinkertainen lause. Tommi Jantunen, SVKS112,

Kielitieteellisten aineistojen käsittely

Oppijansuomen piirteitä korpusvetoisesti

Kielipankki ja FIN-CLARIN. Mietta Lennes Nykykielten laitos, Helsingin yliopisto

Prologi: ele viittomana ja sen osana. Viittomisto (Jantunen 2010) Leksikaalis-kieliopilliset kategoriat. Sanaluokkatutkimuksen filosofinen perusta

The (very) basics of clause- linking. Lauseiden rinnastaminen. Background on clausal coordinaxon. Tommi Jantunen, SVKS112, 15.4.

Hakukysymysviittoman paikka suomalaisessa viittomakielessä

Puheenjohtaja totesi kokouksen laillisesti koollekutsutuksi ja päätäntävaltaiseksi.

Fone'ikka & fonologia. Ohala (1997:674) Ohala (1997:676) KÄSITTEIDEN ANALYYSIA. SVKS110 (kevät 2016) Tommi Jantunen

Ritva Takkinen & Anna Puupponen (toim.) MAISTERIKSI. VIITTOMAKIELESTÄ 11 sukellusta suomalaiseen viittomakieleen

Tiede. Tieteen ominaispiirteitä. Teknologiset menetelmät vii5oma- kielten fonee9sessa tutkimuksessa TIEDE, TUTKIMUS JA MENETELMÄ

Puheenjohtaja totesi kokouksen laillisesti koollekutsutuksi ja päätäntävaltaiseksi. 4. Lautakunnan edellisen kokouksen pöytäkirjojen tarkistaminen.

3 9-VUOTIAIDEN LASTEN SUORIUTUMINEN BOSTONIN NIMENTÄTESTISTÄ

THE TEHDESSÄ CONSTRUCTION OF FINNISH AND THE TYPICALITY OF ADVANCED LEARNER LANGUAGE IN THE LIGHT OF NATIVE USERS' GRAMMATICALITY JUDGEMENTS

OPPIMINEN ja SEN TUKEMINEN Supporting learning for understanding

Laskelmia uudenvuodenpuheista

Nominaalit ja verbaalit

Lähtökohta. Tavoitteeni. Ihmetyksen aiheet eli motiivit. Argumentoin, että. Suomalaisen viittomakielen sanaluokat

OPETTAJAN OSA Kurkistus korpuksiin ja kieltoilmauksiin

FT Henna Makkonen-Craig Äidinkielen ja kirjallisuuden opetuksen foorumi

SVKS112 Viittomakielten syntaksin tutkimus ( )

Integration of Finnish web services in WebLicht Presentation in Freudenstadt by Jussi Piitulainen

F15 HIIT VOIMAA JA KUNTOA

Haasteita oppijankielen korpusanalyysille: oppijankielen universaalit

Englannin kielen ja viestinnän ja ammattiaineiden integrointiyhteistyö insinöörikoulutuksessa

Vii)oman fonologiset rakenneyksiköt

This is an electronic reprint of the original article. This reprint may differ from the original in pagination and typographic detail.

LÄHI- JA VERKKO- OPETUKSEEN OSALLISTUNEIDEN KOKEMUKSIA OPETUKSESTA

Rinnastuksen prosodiaa suomalaisessa viittomakielessä

Ei- manuaalisuus. Prologi. Nonmanuals PERUSASIOITA EI- MANUAALISUUDESTA. SVKS110 (kevät 2016) Tommi Jantunen

1. SIT. The handler and dog stop with the dog sitting at heel. When the dog is sitting, the handler cues the dog to heel forward.

NÄIN KÄYTÄT SIGNWIKIÄ

Peruskysymyksiä. Fonee+sia tapaustutkimuksia (suomalaisesta) vii8omakielestä. Ma klo n PÄÄN LIIKKEIDEN FONETIIKKAA

APA-tyyli. Petri Nokelainen

OPINNÄYTETYÖ. Korpus tulkkien käsissä mikä ja miten?

Totta kirjoitetun keskustelun dialogipartikkeli?

Kielet. Professori Ritva Kantelinen Itä-Suomen yliopisto, Filosofinen tiedekunta, Soveltavan kasvatustieteen ja opettajankoulutuksen osasto

Kuvaus suomalaisen viittomakielen poijurakenteista

KATSAUS SUOMALAISEN VIITTOMAKIELEN KIELITIETEELLISEEN TUTKIMUKSEEN Tommi Jantunen, Jyväskylän yliopisto, kielten laitos

Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä

The (very) basics of clause-linking. Lauseiden rinnastaminen. Background on clausal coordination. Tommi Jantunen, SVKS112, 6.4.

Työpajan tarkoitus. Prolegomena viittomaan. Kysymyksenasetteluja. Sana ~ viittoma. Näkökulmia sanaan. Näkökulmia viittomaan ja viittomistoon

Foneettinen näkökulma konstruoituun toimintaan. SVKS1010 Viittomakielten fonetiikan ja fonologian tutkimus (5 op)

Ote teoksesta: Jantunen, Tommi (2003). Johdatus suomalaisen viittomakielen rakenteeseen. Helsinki: Finn Lectura.

Puheenjohtaja totesi kokouksen laillisesti koollekutsutuksi ja päätäntävaltaiseksi.

Käänteismatriisin. Aiheet. Käänteismatriisin ominaisuuksia. Rivioperaatiot matriisitulona. Matriisin kääntäminen rivioperaatioiden avulla

Research in Chemistry Education

TVT-Menetelmiä esteettömään oppimisympäristöön. Antti Peltoniemi Pedagoginen asiantuntija Oppimis - ja ohjauskeskus Valteri

COUNTER-tilastosuositukset - Code of Practice for Journals and Databases, Release 3 - Code of Practice for Books and Reference Works, Release 1

Puhenäytteiden mittailusta puhekorpuksen perkuuseen: kalastelua mato-ongella ja verkoilla. Mietta Lennes FIN-CLARIN / Helsingin yliopisto

Ruma merkitys. Tommi Nieminen. XLII Kielitieteen päivät. Kielitieteen epäilyttävin välttämätön käsite. Itä-Suomen yliopisto ...

KIELIOPILLISET SIDOSKEINOT KAHDESSA SUOMALAISELLA VIITTOMAKIELELLÄ TUOTETUSSA ASIATEKSTISSÄ

NÄIN KÄYTÄT SIGNWIKIÄ

Aiheet. Suomalaisen vii2omakielen morfologiaa ja syntaksia *) Teoreeaset ja metodiset lähtökohdat

MONIKULTTUURINEN TYÖYHTEISÖ JA YHDENVERTAISUUDEN AVAINTEKIJÄT ULLA-KRISTIINA TUOMI, HELSINGIN YLIOPISTO, KIELIKESKUS

Open Journal Systems digitoitujen aineistojen tallennusalustana ANTTI-JUSSI NYGÅRD SUUNNITTELIJA, TIETEELLISTEN SEURAIN VALTUUSKUNTA

Eväspussi. Onko lähipiirissä esiintynyt hitautta tai vaikeutta lukemaan ja kirjoittamaan oppimisessa? Millaista?

arvostelija OSDA ja UDDI palveluhakemistoina.

VALMENTAJA 1 AMMUNNAN PERUSTEET. Asko Nuutinen

Luottamusta rakentamassa kotoutumiskentällä. Johanna Leinonen ja Elina Turjanmaa Kaikilla on oikeus kotiseutuun -seminaari, 13.4.

Tieto- ja viestintätekniikkaa opetustyön tueksi

XML-tutkimus Jyväskylän yliopistossa

Kahden virtualisointiohjelmiston suorituskyvyn testaus (valmiin työn esittely)

Pikapaketti logiikkaan

2009 Doctor of Technology (Ph.D) defended at 13 th November

SUOMALAISEN VIITTOMAKIELEN LAUTAKUNNAN 24. KOKOUS

Teollisuuden tilanne on alkanut heikentyä Industry Situation Entering a Decline

Monikielisessä viittovassa perheessä kielet täydentävät toisiaan

Johdanto: Semanttinen Kalevala projekti

Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa

KÄYTÖSSÄ KEHITTYVÄ KIELI. Sanna Mustonen & Nina Reiman CIMO, Turku Esitelmän runko. Muuttunut käsitys kielestä, oppimisesta ja kielitaidosta

Kirjoja vai kirjallisuutta etsimässä? Kaunokirjallisuuden haku Melindasta käyttäjän näkökulma

Voisiko asiakirja olla kuva?

Transkriptio:

Korpukset Tommi Jantunen, SVKS112, 12.3.2019

Vii#omakielten korpukset Johnston, T. & Schembri, A. (2013). Corpus analysis of sign languages. In C.A. Chapelle (Ed.), The Encyclopedia of Applied Linguis5cs [online publicafon, accessed 5 March 2019]. Blackwell Publishing. DOI: 10.1002/9781405198431.wbeal0252 Ovat annotoituja ja täten konelueyavia videokorpuksia, joissa videoille on tallenne+u vii+omakieltä sen eri rekistereissä. Tähtäävät viiyomakielten dokumentoin0in ja tutkimuksen edistämiseen; tutkimuksen edistämiseen mm. aikaisempia väiyämiä arvioimalla ja uusia kysymyksiä kysymällä. Voivat toimia myös viiyomakielen opetuksen ja arvioinnin työkaluina.

Suomen viittomakielten korpus Salonen, J., Takkinen, R., Puupponen, A., Nieminen, H. & Pippuri, O. (2016). Crea]ng Corpora of Finland s Sign Languages. In E. Eahimiou, F. Stavroula-Evita, T. Hanke, J. Hochgesang, J. Kristoffersen & J. Mesch (Eds.), Proceedings of the 7th Workshop on the Representa;on and Processing of Sign Languages: Corpus Mining, pp. 179 184. Paris: ELRA. Monikuvakulmainen videomateriaali Kuvaukset JY:n televisiostudiossa 2013 2017. 6 kamerakulmaa, Full HD -laatu KuvaAu yhteensä 104 viiaojaa (sis. 15 srvk). Jokainen viiaoja tuoaaa 6 7 kielellistä tehtävää. Videomateriaalin annotointi ELAN-ohjelmassa Merkitään viittomat ja käännökset (valmiina n. 20%). Viittomien lemmatisointi Signbank-tietokannassa. Tavoitteena monipuoliset haut tietokoneen avulla. Korpuksen pitkäaikaissäilytys ja julkaisu Tavoitteena siirtää korpusmateriaali Kielipankkiin. Ensimmäisen paketin julkaisu maaliskuussa 2019. Paketin nimi on Suomalaisen viittomakielen korpus (Corpus FinSL).

Snowfrog-aineisto Kielipankissa Jantunen, T., Pippuri, O., Wainio, T., Puupponen, A. & Laaksonen, J. (2016). Annotated video corpus of FinSL with Kinect and computer-vision data. In E. EWhimiou, F. Stavroula-Evita, T. Hanke, J. Hochgesang, J. Kristoffersen & J. Mesch (Eds.), Proceedings of the 7th Workshop on the Representa5on and Processing of Sign Languages: Corpus Mining, pp. 93-100. Paris: ELRA. Perus&etoa aineistosta Lumiukko- ja sammakkotarinat Otos vuonna 2013 kuvatusta korpusmateriaalista. 20 minuu9a, 6 vii<ojaa Annotoin> ELAN-ohjelmassa: vii<omat tyypiteltyinä virketasoiset käännökset lauseet pään liikkeet tyypiteltyinä kehon liikkeet tyypiteltyinä Videoiden >etokonenäkökäsi<ely: pään 3D-liike silmien avonaisuusaste suun avonaisuusaste Erikseen annotoitu myös (mu<a ei julk.): lauseiden rakenne ja konstruoitu toiminta.

Snowfrog-aineiston S-glossit S-glossi on merkityslähtöises3 systema3soitu glossi, joka iden3fioi yksiseli:eises3 yhden vii:oman eli distribuu3oltaan vapaan merkitys muoto-parin. Kirjoite:u yhdelle riville dom. käden toim. perusteella. Jako merkitysglosseihin ja kuvailuglosseihin, joista jälkimmäiset indeksoitu glossin e3sellä, alaviivalla glossiin kytketyllä symbolilla (prefiksillä) k kuvailu. S-glosseihin on lisäksi prefiksoitu 3etoa vii:oman pääsanaluokasta (n nominaali, v verbaali, x määri:elemätön ) ja statuksesta yhdisteenä (y). S-glossien erikoistapauksia, jotka eivät sisällä prefiksejä, ovat osoitukset (OS) ja tietyt konventionaalistuneet eleet (esim. PALM-UP). Negatiivit on osoitettu glossiosaan liitetyllä alukkeella EI- (esim. EI-HALUA). Kaikkien S-glossien lopussa voi olla tietoa viittoman rakenteesta (sulkujen sisään merkitty tieto viittoman käsimuodosta, paikasta tai liikkeestä), tai pienillä kirjaimilla kirjoitettu merkityksen tarkennin (tämä on erotettu muusta glossista kaksoispisteellä).

Snowfrog-aineiston S-glossit Merkitysglossit [n,v,x]_y_ei-merkitys(rakenne7eto):merkityksen_tarkennin Kuvailuglossit n_aamu, n_y_ampiaispesä, n_metsä(gg) v_antaa:minulle, v_y_mennä-ulos, v_ei-tykätä, v_juosta(s) x_tai, x_pieni(b) OS:minä, OS(V):me_kaksi [n,v,x]_k_ merkityksen_kuvaus v_k_ lumiukko_kavahtaa_taaksepäin n_k_ mehiläisparven_muoto x_k_ hytkyqää_päätä

Snowfrog-aineiston S-käännös S-käännös on vii,omisen systema2soitu virketasoinen suomenkielinen käännös, joka pyrkii nouda,amaan lähtöteks2ä mahdollisimman tarkas2. Kaarisuluilla on merki,y käännökseen ellipsi ja muut vii,omisesta puu,uvat, mu,a suomen kieleen kuuluvat yksiköt. Hakasuluilla on ilmoite,u konteks2n tai ei-manuaalisen toiminnan kau,a ilmenevä merkitys. Esimerkiksi: Herä%yään (ja) venyteltyään (hän) katsoo ulos (ja) huomaa, (e%ä) ulkona sataa [kovas8 lunta].

Snowfrog-aineiston muu annotaa1o Lausetasoisessa annotaatiossa viittomat on ryhmitelty predikoivien yksiköiden ympärille muodostuviksi (yksinkertaisiksi) lauseiksi. Pään ja kehon liikkeet on annotoitu karkeisiin analyyttisiin luokkiin. Pään liikkeiden kymmenen luokkaa ovat: nyökkäys (nod), nyökyttely (nodding), työntö (thrust), veto (pull), leuka ylös (chin-up), leuka alas (chin-down), kallistus (tilt), kallistelu (tilting), kääntö (turn), pudistus (headshake). Kehon liikkeiden yhdeksän luokkaa ovat: nojaus eteen (lean forward), nojaus taakse (lean backwards), nojaus oikealle (lean right), nojaus vasemmalle (lean left), kääntö oikealle (turn right), kääntö vasemmalle (turn left), kallistelu (tilting), olkapäät ylös (shoulders up), hartioiden kohautus (shrug).

Suomalaisia vk-korpuslinkkejä Suomen viittomakielten korpusprojekti http://r.jyu.fi/ttc Suomalaisen viittomakielen korpus Kielipankissa http://urn.fi/urn:nbn:fi:lb-2019012321 Snowfrog-aineisto Kielipankissa http://urn.fi/urn:nbn:fi:lb-1001100113005 Kipo-korpus Kielipankissa http://urn.fi/urn:nbn:fi:lb-1001100112530 Suomen Signbank https://signbank.csc.fi

Korpustutkimuksen tavoitteita Biber, D., Reppen, R. & Friginal, E. (2012). Research in Corpus Linguis?cs. [online publica?on, accessed 5 March 2019]. Oxford University Press. DOI: 10.1093/oxfordhb/9780195384253.013.0038 Jonkin kielellisen piirteen deskrip.o - Leksikaalisella tai kieliopin tasolla - YksiXäiskielessä tai kielten välillä Varietee1en deskrip.o - Kielen rekisteriin kuuluvien piirteiden deskrip?o - Useiden rekisterien erojen ja samankaltaisuuksien deskrip?o - Historiallisten rekisterien deskrip?o Kielen oppimisen ja opexamisen edistäminen

Korpustutkimuksen lajit Korpuspohjainen tutkimus Engl. corpus-based research Ole)aa, e)ä kieliteorian kuvaamat muodot ja rakenteet ovat valideja Ensisijainen tavoite on analysoida systemaa9suu)a ennaltamäärä)yjen kielellisten piirteiden variaa;ossa. Korpusvetoinen tutkimus Engl. corpus-driven research On induk;ivisempaa, eli kielelliset yksiköt ja rakenteet emergoituvat korpuksen analyysista Tekee minimaalises; oletuksia siitä, millaisia kielellisiä piirteitä on olemassa ja miten ne varioivat. Biber, D. (2012). Corpus-Based and Corpus-driven Analyses of Language Variation and Use. [online publication, accessed 5. March 2019]. Oxford University Press. DOI: 10.1093/oxfordhb/9780199544004.013.0008

Korpustutkimusta suomalaisen viittomakielen syntaksista BÖRSTELL, C., Jantunen, T., Kimmelman, V., de Lint, V., Mesch, J. & Oomen, M. (submiaed). TransiDvity prominence within and across modalides. JANTUNEN, T. (2017). Fixed and NOT free: RevisiDng the order of the main clausal consdtuents in Finnish Sign Language from a corpus perspecdve. SKY Journal of Linguis1cs 30, 137 149. Available online: hap://www.linguisdcs.fi/julkaisut/sky2017/skyjol30_jantunen.pdf JANTUNEN, T. (2017). Constructed acdon, the clause and the nature of syntax in Finnish Sign Language. Open Linguis1cs 3, 65-85. DOI: 10.1515/opli- 2017-0004 JANTUNEN, T. (2018). [EllipDcal phenomena in] Finnish Sign Language. In J. van Craenenbroeck, & T. Temmerman (Eds.), The Oxford Handbook of Ellipsis, pp. 765 784. Oxford: Oxford University Press. Available online: hap://urn.fi/urn:nbn:fi:jyu-201901031057 NORDLUND, S. (forthcoming). Agent defocusing in two-pardcipant clauses in Finnish Sign Language. To appear in Glossa: A Journal of General Linguis1cs. PUUPPONEN, A., Jantunen, T., & Mesch, J. (2016). The alignment of head nods with syntacdc units in Finnish Sign Language and Swedish Sign Language. In J. Barnes, A. Brugos, S. ShaAuck-Hufnagel & N. Veilleux (Eds.), Speech Prosody 2016: Proceedings of the 8th Interna1onal Conference on Speech Prosody, Boston University, USA, 31 May - 3 June 2016, pp. 168-172. Baixas: InternaDonal Speech CommunicaDon AssociaDon. DOI: 10.21437/SpeechProsody.2016-35 TAKKINEN, R., Keränen, J. & Salonen, J. (2018). DepicDng signs and different text genres: Preliminary observadons in the Corpus of Finnish Sign Language. In M. Bono, E. Ekhimiou, F. Stavroula-Evita, T. Hanke, J. Hochgesang, J. Kristoffersen, J. Mesch & Y. Osugi (Eds.), Proceedings of the 8th Workshop on the Representa1on and Processing of Sign Languages: Involving the Language Community, pp. 189 194. Paris: ELRA. Available online: hap://lrec-conf.org/workshops/lrec2018/w1/pdf/18038_w1.pdf