Koko aineisto ProGramin korpustyö Tommi Jantunen, SVKS112, 16.3.2015 Korpustyö vii@omakielenkeskuksessa Vuonna 2013 kerä@y monikuvakulmainen videomateriaali Tehtävät 5 (sarjakuvat) ja 6 (teemakeskustelu) Kokonaiskesto vajaa 2 tunha (1:49:32) 12 äidinkielistä vii@ojaa (20-60 vuo@a) Annotoituna: Raakaglossit (n=12350) Virkekäännökset (n=2568) KommenHt 6 vii@ojaa on kuva@u myös Kinect- sensorilla. KuvausHlanne Fokuksessa sarjakuvanarrahivit (1) Puupponen, A.; Jantunen, T.; Takkinen, R.; Wainio, T. & Pippuri, O. (2014). Taking non- manuality into account in collechng and analyzing Finnish Sign Language video data. In O. Crasborn, E. E^himiou, E. FoHnea, T. Hanke, J. Hochgesang, J. Kristoffersen & J. Mesch (Eds.), Proceedings of the 6th Workshop on the Representa6on and Processing of Sign Languages: Beyond the Manual Channel [organized as a part of LREC'14 at Reykjavik, Iceland, May 31, 2014], pp. 143-148. Paris: European Language Resources AssociaHon (ELRA). Lumiukko- ja sammakkotarina (tehtävä 5) Kokonaiskesto noin 45 minuufa (0:45:12) SystemaHsoitu annotaaho: Merkityslähtöisyys (asiat eroteltu teoista) Vii@omia edustavat S- glossit (n=4309), jotka jakautuvat merkitysglosseihin (n=3356) ja kuvailuglosseihin (n=953). Leksikko, jossa merkitysglosseja edustaa 539 lekseemiä. AnnotaaHo mahdollistaa strukturoidut haut. 1
Fokuksessa sarjakuvanarrahivit (2) Raakaglossit Tutkimusta tukeva perusannotaaho: Lause- alkiot (n=1873) Pään liiketyypit Kehon liiketyypit NarraHiviaineistoon lii@yvä SLMoHon data: Pään liikkumisen kuvaus (yaw, pitch, roll; centroid x, y) Suun horisontaalisen ja verhkaalisen liikkumisen luoki@elu Silmien avonaisuusasteen luoki@elu Kulmakarvojen asentojen luoki@elu Raakaglossauksen tavoi@eena: idenhfioida vii@omajaksot ja niiden kontekstuaaliset merkitykset tuo@aa nopeash aineistoa tutkimuksen hyödynne@äväksi. Kirjoite@u yhdelle riville per vii@oja. Ajoite@u dominoivan käden toiminnan mukaan. Perustuvat suhteellisen vapaisiin annotoinhkonvenhoihin. Korostavat merkitystä ennen muotoa, eli esimerkiksi työ ja työskentely on glossa@u eri tavalla. Jakautuvat isoilla kirjaimilla kirjoite@uihin merkitysglosseihin ja pienillä kirjaimilla kirjoite@uihin kuvailuglosseihin, jotka edustavat vastaavassa järjestyksessä merkitykseltään suhteellisen vakioisia vii@omia ja merkitykseltään vaikeammin kuva@avia vii@omia. Esimerkkejä raakaglossausvaiheen merkitysglosseista Raakaglossausnäkymä ELANissa Vähemmän kielioppi-etoa Enemmän kielioppi-etoa Vähemmän merkitystä PI OSOITUS POIKA+B- OSOITUS LÄHTEÄ:viuh PÄÄ+TYHJÄ:unohtaa OSOITUS:tuo Enemmän merkitystä EI- HALUA LASI+KULHO SYÖDÄ+JO 2
S- glossit (1) S- glossit (2) Raakaglossauksen pohjalta merkityslähtöisesh systemahsoitu glossi. Kirjoite@u yhdelle riville dominoivan käden toiminnan perusteella. IdenHfioi yksiseli@eisesh yhden vii@oman eli distribuuholtaan vapaan merkitys muoto- parin. Sisäinen jako merkitysglosseihin ja kuvailuglosseihin, joista jälkimmäiset erikseen indeksoitu glossin ehsellä, alaviivalla glossiin kytketyllä symbolilla (prefiksillä) k kuvailu. S- glosseihin on lisäksi prefiksoitu Hetoa vii@oman pääsanaluokasta (n nominaali, v verbaali, x määri@elemätön ) ja statuksesta yhdisteenä (y yhdiste ). S- glossien erikoistapauksia, jotka eivät sisällä prefiksejä, ovat osoitukset (OS) ja Hetyt konvenhonaalistuneet eleet (esim. PALM- UP). NegaHivit on osoite@u glossiosaan liitetyllä alukkeella EI- (esim. EI- HALUA). Kaikkien S- glossien lopussa voi olla Hetoa vii@oman rakenteesta (sulkujen sisään merki@y Heto vii@oman käsimuodosta, paikasta tai liikkeestä), tai pienillä kirjaimilla kirjoite@u merkityksen tarkennin (tämä on erote@u muusta glossista kaksoispisteellä). S- glosseihin tullaan myöhemmin lii@ämään lisähetoa mm. siitä, onko vii@oma numeraali, sormiaakkonen tai sormitus, vii@omanimi tai ele. S- glossien syntaksi ja esimerkkejä Merkitysglossit [n,v,x]_y_ei- MERKITYS(rakenneHeto):merkityksen_tarkennin n_aamu, n_y_ampiaispesä, n_metsä(gg) v_antaa:minulle, v_y_mennä- ULOS, v_ei- TYKÄTÄ, v_juosta(s) x_tai, x_pieni(b) OS:minä, OS(V):me_kaksi Kuvailuglossit [n,v,x]_k_ merkityksen_kuvaus v_k_ lumiukko_kavahtaa_taaksepäin n_k_ mehiläisparven_muoto x_k_ hytky@ää_päätä Merkityksen ja muodon erikoisyhdistelmät Vain suhteessa harvinainen synonymia vaahi erikoismerkinnän, joka toteutetaan glossiin lisä@ävällä rakennehedolla: Perustapaus 1 merkitys 1 muoto EI- HALUA, KENKÄ Synonymia 1 merkitys 2 muotoa JUOSTA(BB), JUOSTA(GG) Polysemia 2 (sukulais)merkitystä 1 muoto SUKLAA, RUSKEA Homonymia 2 merkitystä 1 muoto ARKI, MAASEUTU 3
S- glossinäkymä ELANissa Leksikkonäkymä Excelissä Virkekäännökset Raakakäännöksiä Tavoi@eena rakenteellinen vastaavuus lähtötekshn kanssa. Virkerajoista on olemassa vaihtoehtoinen näkemys. Virkejaksoista on tehty lauseraja- analyysi. Aineistoon tullaan myöhemmin lisäämään idiomaafset käännökset. LauseannotaaHot Tavoi@eena idenhfioida aineiston yksinkertaisia lauseita ja etenkin niiden vii@omatason sisältöjä. Toteute@u puoliautomaafsesh lauseraja- analyysin pohjalta. AnnotaaHosolujen alut ja loput eivät (väl@ämä@ä) ole lauseiden tarkkoja alku- ja loppukohha. Lause määritelty jaksoksi, joka sisältää predikaahn. Lauseeseen väli@ömäsh lii@yvät, mu@a rakenteellisesh sen yhmen ulkopuolelle sijoi@uvat elemenht, kuten topiikki, on lähtökohtaisesh lue@u osaksi lause@a. LausekonsHtuenfen funkhoanalyysi toteutetaan myöhemmin. 4
Pään ja kehon liiketyyppiannotaaho SLMoHon- data ELANissa Pää Nyökkäys (nod) Nyöky@ely (nodding) Työntö (thrust) Veto (pull) Leuka ylös (chin- up) Leuka alas (chin- down) Kallistus (Hlt) Kallistelu (HlHng) Kääntö (turn) Pudistus (headshake) Keho Nojaus eteen (lean forward) Nojaus taakse (lean backwards) Nojaus oikealle (lean right) Nojaus vasemmalle (lean le^) Kääntö oikealle (turn right) Kääntö vasemmalle (turn le^) Kallistelu (HlHng) Olkapäät ylös (shoulders up) HarHoiden kohautus (shrug) 5