Korpukset Tommi Jantunen, SVKS112, 12.3.2019
Vii#omakielten korpukset Johnston, T. & Schembri, A. (2013). Corpus analysis of sign languages. In C.A. Chapelle (Ed.), The Encyclopedia of Applied Linguis5cs [online publicafon, accessed 5 March 2019]. Blackwell Publishing. DOI: 10.1002/9781405198431.wbeal0252 Ovat annotoituja ja täten konelueyavia videokorpuksia, joissa videoille on tallenne+u vii+omakieltä sen eri rekistereissä. Tähtäävät viiyomakielten dokumentoin0in ja tutkimuksen edistämiseen; tutkimuksen edistämiseen mm. aikaisempia väiyämiä arvioimalla ja uusia kysymyksiä kysymällä. Voivat toimia myös viiyomakielen opetuksen ja arvioinnin työkaluina.
Suomen viittomakielten korpus Salonen, J., Takkinen, R., Puupponen, A., Nieminen, H. & Pippuri, O. (2016). Crea]ng Corpora of Finland s Sign Languages. In E. Eahimiou, F. Stavroula-Evita, T. Hanke, J. Hochgesang, J. Kristoffersen & J. Mesch (Eds.), Proceedings of the 7th Workshop on the Representa;on and Processing of Sign Languages: Corpus Mining, pp. 179 184. Paris: ELRA. Monikuvakulmainen videomateriaali Kuvaukset JY:n televisiostudiossa 2013 2017. 6 kamerakulmaa, Full HD -laatu KuvaAu yhteensä 104 viiaojaa (sis. 15 srvk). Jokainen viiaoja tuoaaa 6 7 kielellistä tehtävää. Videomateriaalin annotointi ELAN-ohjelmassa Merkitään viittomat ja käännökset (valmiina n. 20%). Viittomien lemmatisointi Signbank-tietokannassa. Tavoitteena monipuoliset haut tietokoneen avulla. Korpuksen pitkäaikaissäilytys ja julkaisu Tavoitteena siirtää korpusmateriaali Kielipankkiin. Ensimmäisen paketin julkaisu maaliskuussa 2019. Paketin nimi on Suomalaisen viittomakielen korpus (Corpus FinSL).
Snowfrog-aineisto Kielipankissa Jantunen, T., Pippuri, O., Wainio, T., Puupponen, A. & Laaksonen, J. (2016). Annotated video corpus of FinSL with Kinect and computer-vision data. In E. EWhimiou, F. Stavroula-Evita, T. Hanke, J. Hochgesang, J. Kristoffersen & J. Mesch (Eds.), Proceedings of the 7th Workshop on the Representa5on and Processing of Sign Languages: Corpus Mining, pp. 93-100. Paris: ELRA. Perus&etoa aineistosta Lumiukko- ja sammakkotarinat Otos vuonna 2013 kuvatusta korpusmateriaalista. 20 minuu9a, 6 vii<ojaa Annotoin> ELAN-ohjelmassa: vii<omat tyypiteltyinä virketasoiset käännökset lauseet pään liikkeet tyypiteltyinä kehon liikkeet tyypiteltyinä Videoiden >etokonenäkökäsi<ely: pään 3D-liike silmien avonaisuusaste suun avonaisuusaste Erikseen annotoitu myös (mu<a ei julk.): lauseiden rakenne ja konstruoitu toiminta.
Snowfrog-aineiston S-glossit S-glossi on merkityslähtöises3 systema3soitu glossi, joka iden3fioi yksiseli:eises3 yhden vii:oman eli distribuu3oltaan vapaan merkitys muoto-parin. Kirjoite:u yhdelle riville dom. käden toim. perusteella. Jako merkitysglosseihin ja kuvailuglosseihin, joista jälkimmäiset indeksoitu glossin e3sellä, alaviivalla glossiin kytketyllä symbolilla (prefiksillä) k kuvailu. S-glosseihin on lisäksi prefiksoitu 3etoa vii:oman pääsanaluokasta (n nominaali, v verbaali, x määri:elemätön ) ja statuksesta yhdisteenä (y). S-glossien erikoistapauksia, jotka eivät sisällä prefiksejä, ovat osoitukset (OS) ja tietyt konventionaalistuneet eleet (esim. PALM-UP). Negatiivit on osoitettu glossiosaan liitetyllä alukkeella EI- (esim. EI-HALUA). Kaikkien S-glossien lopussa voi olla tietoa viittoman rakenteesta (sulkujen sisään merkitty tieto viittoman käsimuodosta, paikasta tai liikkeestä), tai pienillä kirjaimilla kirjoitettu merkityksen tarkennin (tämä on erotettu muusta glossista kaksoispisteellä).
Snowfrog-aineiston S-glossit Merkitysglossit [n,v,x]_y_ei-merkitys(rakenne7eto):merkityksen_tarkennin Kuvailuglossit n_aamu, n_y_ampiaispesä, n_metsä(gg) v_antaa:minulle, v_y_mennä-ulos, v_ei-tykätä, v_juosta(s) x_tai, x_pieni(b) OS:minä, OS(V):me_kaksi [n,v,x]_k_ merkityksen_kuvaus v_k_ lumiukko_kavahtaa_taaksepäin n_k_ mehiläisparven_muoto x_k_ hytkyqää_päätä
Snowfrog-aineiston S-käännös S-käännös on vii,omisen systema2soitu virketasoinen suomenkielinen käännös, joka pyrkii nouda,amaan lähtöteks2ä mahdollisimman tarkas2. Kaarisuluilla on merki,y käännökseen ellipsi ja muut vii,omisesta puu,uvat, mu,a suomen kieleen kuuluvat yksiköt. Hakasuluilla on ilmoite,u konteks2n tai ei-manuaalisen toiminnan kau,a ilmenevä merkitys. Esimerkiksi: Herä%yään (ja) venyteltyään (hän) katsoo ulos (ja) huomaa, (e%ä) ulkona sataa [kovas8 lunta].
Snowfrog-aineiston muu annotaa1o Lausetasoisessa annotaatiossa viittomat on ryhmitelty predikoivien yksiköiden ympärille muodostuviksi (yksinkertaisiksi) lauseiksi. Pään ja kehon liikkeet on annotoitu karkeisiin analyyttisiin luokkiin. Pään liikkeiden kymmenen luokkaa ovat: nyökkäys (nod), nyökyttely (nodding), työntö (thrust), veto (pull), leuka ylös (chin-up), leuka alas (chin-down), kallistus (tilt), kallistelu (tilting), kääntö (turn), pudistus (headshake). Kehon liikkeiden yhdeksän luokkaa ovat: nojaus eteen (lean forward), nojaus taakse (lean backwards), nojaus oikealle (lean right), nojaus vasemmalle (lean left), kääntö oikealle (turn right), kääntö vasemmalle (turn left), kallistelu (tilting), olkapäät ylös (shoulders up), hartioiden kohautus (shrug).
Suomalaisia vk-korpuslinkkejä Suomen viittomakielten korpusprojekti http://r.jyu.fi/ttc Suomalaisen viittomakielen korpus Kielipankissa http://urn.fi/urn:nbn:fi:lb-2019012321 Snowfrog-aineisto Kielipankissa http://urn.fi/urn:nbn:fi:lb-1001100113005 Kipo-korpus Kielipankissa http://urn.fi/urn:nbn:fi:lb-1001100112530 Suomen Signbank https://signbank.csc.fi
Korpustutkimuksen tavoitteita Biber, D., Reppen, R. & Friginal, E. (2012). Research in Corpus Linguis?cs. [online publica?on, accessed 5 March 2019]. Oxford University Press. DOI: 10.1093/oxfordhb/9780195384253.013.0038 Jonkin kielellisen piirteen deskrip.o - Leksikaalisella tai kieliopin tasolla - YksiXäiskielessä tai kielten välillä Varietee1en deskrip.o - Kielen rekisteriin kuuluvien piirteiden deskrip?o - Useiden rekisterien erojen ja samankaltaisuuksien deskrip?o - Historiallisten rekisterien deskrip?o Kielen oppimisen ja opexamisen edistäminen
Korpustutkimuksen lajit Korpuspohjainen tutkimus Engl. corpus-based research Ole)aa, e)ä kieliteorian kuvaamat muodot ja rakenteet ovat valideja Ensisijainen tavoite on analysoida systemaa9suu)a ennaltamäärä)yjen kielellisten piirteiden variaa;ossa. Korpusvetoinen tutkimus Engl. corpus-driven research On induk;ivisempaa, eli kielelliset yksiköt ja rakenteet emergoituvat korpuksen analyysista Tekee minimaalises; oletuksia siitä, millaisia kielellisiä piirteitä on olemassa ja miten ne varioivat. Biber, D. (2012). Corpus-Based and Corpus-driven Analyses of Language Variation and Use. [online publication, accessed 5. March 2019]. Oxford University Press. DOI: 10.1093/oxfordhb/9780199544004.013.0008
Korpustutkimusta suomalaisen viittomakielen syntaksista BÖRSTELL, C., Jantunen, T., Kimmelman, V., de Lint, V., Mesch, J. & Oomen, M. (submiaed). TransiDvity prominence within and across modalides. JANTUNEN, T. (2017). Fixed and NOT free: RevisiDng the order of the main clausal consdtuents in Finnish Sign Language from a corpus perspecdve. SKY Journal of Linguis1cs 30, 137 149. Available online: hap://www.linguisdcs.fi/julkaisut/sky2017/skyjol30_jantunen.pdf JANTUNEN, T. (2017). Constructed acdon, the clause and the nature of syntax in Finnish Sign Language. Open Linguis1cs 3, 65-85. DOI: 10.1515/opli- 2017-0004 JANTUNEN, T. (2018). [EllipDcal phenomena in] Finnish Sign Language. In J. van Craenenbroeck, & T. Temmerman (Eds.), The Oxford Handbook of Ellipsis, pp. 765 784. Oxford: Oxford University Press. Available online: hap://urn.fi/urn:nbn:fi:jyu-201901031057 NORDLUND, S. (forthcoming). Agent defocusing in two-pardcipant clauses in Finnish Sign Language. To appear in Glossa: A Journal of General Linguis1cs. PUUPPONEN, A., Jantunen, T., & Mesch, J. (2016). The alignment of head nods with syntacdc units in Finnish Sign Language and Swedish Sign Language. In J. Barnes, A. Brugos, S. ShaAuck-Hufnagel & N. Veilleux (Eds.), Speech Prosody 2016: Proceedings of the 8th Interna1onal Conference on Speech Prosody, Boston University, USA, 31 May - 3 June 2016, pp. 168-172. Baixas: InternaDonal Speech CommunicaDon AssociaDon. DOI: 10.21437/SpeechProsody.2016-35 TAKKINEN, R., Keränen, J. & Salonen, J. (2018). DepicDng signs and different text genres: Preliminary observadons in the Corpus of Finnish Sign Language. In M. Bono, E. Ekhimiou, F. Stavroula-Evita, T. Hanke, J. Hochgesang, J. Kristoffersen, J. Mesch & Y. Osugi (Eds.), Proceedings of the 8th Workshop on the Representa1on and Processing of Sign Languages: Involving the Language Community, pp. 189 194. Paris: ELRA. Available online: hap://lrec-conf.org/workshops/lrec2018/w1/pdf/18038_w1.pdf