EESTI FILOLOOGIA OSAKONNA TOIMETISED 10
ÕPPIJAKEELE ANALÜÜS: VÕIMALUSED, PROBLEEMID, VAJADUSED Toimetanud Pille Eslon TALLINN 2008
TALLINNA ÜLIKOOLI EESTI FILOLOOGIA OSAKONNA TOIMETISED 10 ÕPPIJAKEELE ANALÜÜS: VÕIMALUSED, PROBLEEMID, VAJADUSED Toimetaja: Pille Eslon Retsensent: Katre Õim Toimetiste kolleegium: Martin Ehala, Mart Rannut, Anna Verschik, Jüri Viikberg Kujundus ja küljendus: Maria Must Autoriõigus: Pille Eslon (toimetaja) ja artiklite autorid, 2008 Autoriõigus: Tallinna Ülikool, 2008 ISSN 1736-4221 ISBN 978-9985-58-577-1 Tallinna Ülikooli kirjastus Narva mnt 25 10120 Tallinn, ESTONIA www.kirjastus.tlu.ee Trükitud: OÜ Vali Press 4
SISUKORD Reili Argus Eesti lastekeelekorpuse morfoloogiliste vigade märgendamisest ja liigitamisest...11 Pille Eslon Käändevormide kasutussageduse võrdlus eesti õppijakeeles ja kirjakeeles...31 Jarmo Jantunen Haasteita oppijankielen korpusanalyysille: oppijankielen universaalit...67 Annekatrin Kaivapalu Lähtekeele mõju korpuspõhine uurimine...93 Anne Kostenko Vene-eesti koodivahetus kui vene üliõpilaste kõne iseloomulik joon...120 Ingrid Krall Eesti keele käändevormide moodustamise ja kasutamisega seotud probleeme vene üliõpilaste kirjalikes töödes...137 Anastassia Zabrodskaja Rühmatööst sisupõhises keeleõppes...196 5
SAATEKS Kogumik Õppijakeele analüüs: võimalused, probleemid, vajadused põhineb ettekannetel, mis peeti II sügisseminaril 2007. aastal Tallinna Ülikoolis. Artiklite temaatika käsitleb võimalusi erinevate keelevariantide korpuspõhiseks uurimiseks. See lubab püstitada küsimusi keeles toimuvate muutuste, sealhulgas õppijakeele arengu ning universaalide, esimese ja teise keele omandamise kohta. Rakenduslikuma loomuga ülevaadetes antakse õpetajatele vajalikke juhiseid, et keeleõpet veelgi tõhusamaks muuta. Kogumikus leiab kajastust vaid osa tööst, mis on tehtud kolme projekti raames: sihtfinantseeritav teema nr 0132493s03 Eesti keelekeskkonna arengu analüüs, modelleerimine ja juhtimine (2003 2007), ETFi grant nr 6151 Koodivahetuse, eesti vahekeele ning lastekeele andmekorpuste koostamine ja üldkirjeldus (2005 2008) ja riikliku programmi Eesti keel ja rahvuslik mälu grant R05/01 Koodivahetuse, vahe- ja lastekeele korpuste töötlemine ja haldamine (2005 2008). II sügisseminari Õppijakeele analüüs: võimalused, probleemid, vajadused ajakava Aeg: 1. november 2007 Koht: Senatiruum U-648 Ettekanneteks ja aruteluks kokku 30 minutit (25 + 5) 10.00 10.10 Avasõna Anna Verschik 7
Juhatab Anna Verschik 10.10 10.40 Anastassia Zabrodskaja. Towards a description of L1 and L2 use 10.40 11.10 Anne Kostenko. Vene-eesti koodivahetus kui vene üliõpilaste kõne iseloomulik joon 11.10 11.40 Reili Argus. Veaanalüüs lastekeeles 11.40 12.30 LÕUNA Juhatab Helena Sulkala 12.30 13.00 Annekatrin Kaivapalu. Õppijakeelekorpuste osast lähtekeele mõju uurimisel 13.00 13.30 Jarmo Harri Jantunen. Haasteita oppijankielen korpusanalyysille: oppijankielen universaalit 13.30 14.00 Anastassia Šmõreitšik. Statistiliste meetodite rakendamisest EVKK vealiikide vaheliste seoste tuvastamisel 14.00 14.30 KOHVIPAUS 8
Juhatab Jarmo Harri Jantunen 14.30 15.00 Pille Eslon. Käändevormide kasutussagedus eesti õppijakeeles 15.00 15.30 Ingrid Krall. Eesti keele käänete moodustamise ja kasutamisega seotud probleeme vene üliõpilaste kirjalikes töödes 15.30 16.00 Mare Kitsnik. Kuidas õpetada eitust eesti keele kui teise keele õppijale? 16.00 16.30 Kokkuvõtete tegemine ja mõttevahetus 9
EESTI LASTEKEELEKORPUSE MORFOLOOGILISTE VIGADE MÄRGENDAMISEST JA LIIGITAMISEST Ülevaade Reili Argus Artiklis on vaatluse all eesti keele kui esimese keele omandamisel laste kõnes esinevad morfoloogilised vead. Kuigi artikli põhirõhk on praktilisel vigade määratlemis- ja liigitamisprobleemidel ning vealiigituse ja -kodeeringu mõjul analüüsitulemustele, peatutakse ka vigade teoreetilisemat laadi tähendusel ning näidatakse, millist informatsiooni võivad lastekeeles esinevad vead anda keeleteadusele. Järgnevas pakutakse lahendusi lastekeele vigade liigitamiseks, märgendamiseks ja analüüsimiseks 1. Võtmesõnad: esimese keele omandamine, morfoloogiaviga, vigade kodeerimine 1 Tööd on toetanud riiklik programm Eesti keel ja rahvuslik mälu (2004 2008) ning grant R 05/01 Koodivahetuse, vahe- ja lastekeele admekorpuste koostamine ja üldkirjeldus (2005 2008). 11
Sissejuhatus Veaanalüüsist on keeleteadlased huvitunud eelkõige rakenduslingvistilistes käsitlustes ja teise keele omandamise kontekstis, vähem on tähelepanu pööratud sellele, et ka esimese keele omandaja teeb vigu. Siinse kirjutise eesmärk ongi osutada väikelaste spontaanses kõnes esinevate vigade klassifitseerimise ja kodeerimisega seotud põhiprobleemidele, näidata, et vigade erinev liigitus võib viia erineva analüüsitulemuse ja seetõttu ka üksjagu erinevate üldistusteni. Artiklis pakutavad liigitus- ja kodeerimisvõimalused puudutavad eelkõige muutemorfoloogiaga seotud vigu, on esmased ega pretendeeri seetõttu universaalsusele ja täiuslikkusele. Kindlasti peab iga uurija enda uurimiseesmärgist lähtuvalt töötama välja täpsema liigituse ning seega ka kodeerimissüsteemi. Artikli teoreetilisem eesmärk on näidata, kuidas suhtestuvad fonoloogilise ja morfoloogilise tasandi vead. Vaadeldud on CHILDESi eesti korpuse alamkorpustes Andreas (lapse vanuses 1;7 2;8 kokku 1545 minutit keelematerjali 2 ) ja Hendrik (lapse vanuses 1;7 2;5, 183 minutit keelematerjali) noomenite kasutuses leidunud fonoloogilisi, morfoloogilisi ja morfofonoloogilisi vigu. Terminoloogiline arutelu ehk mida üldse veaks pidada Veaks on enamasti peetud keele normist kõrvalekaldumist. Sellest üldisest definitsioonist lähtuvalt tekib aga vigade määramisel küsitavusi nii teise kui ka esimese keele omandamise uurimisel. Kui teise keele omandamisel tekib vea määramise probleem sageli asjaolust, et ka emakeelsete kõnelejate keelekasutuses on paljugi normile mittevastavat (vt Verschik 2002) 2 Andrease korpuse on koostanud Maigi Vija, Hendriku korpuse Reili Argus. 12
ja tähendusega seotud vigade puhul on üldse raske määrata, mis on norm (vt Pajusalu 2004: 231 232), lisaks tuleb arvestada murdeerisustega, idiolektiga, siis esimese keele omandamisel tuleb pidada silmas, et lapsele suunatud kõne sisaldab peale hoidjakeelsete sõnade või sõnavormide ka selliseid keeleüksusi, mis ei vasta sageli normile, on kasutusel ainult perekonnaliikmete omavahelises kõnes ja mida kõnelejad ise veaks ei pea. Teine ja tõsisem vigade määratlusprobleem tekib seetõttu, et lapse keelekasutus on alles areneva süsteemi peegeldus ja tundub kohatu pidada näiteks aastase lapse ühesilbilisi, enamasti ainult sõnade esimestest silpidest koosnevaid sõnu vigasteks, sest tegelikult ei ole need mitte vead, vaid ebatäielikud sõnakujud. Seega tuleks lastekeele puhul vältida ettekujutust, et keeleline sisend ehk see kõne, mida lapsega räägitakse, ja keeleline väljund ehk lapse enda kõne peaksid olema identsed. Parema termini puudumisel on aga siingi kasutatud terminit viga 3 teadvustades samas, et lastekeele puhul ei ole tegemist traditsioonilises mõttes vigade, vaid pigem ebatäiuslike sõnakujudega. Carl James pakub keeleüksuse vigaseks tunnistamiseks välja neli mõõtekategooriat: 1) grammatilisus, 2) aktsepteeritavus, 3) korrektsus ja 4) sobivus (James 1998: 64 65). Kõige problemaatilisem tundub siinkirjutaja jaoks grammatilisuse ja korrektsuse eristamine. Jamesi järgi ei ole ebagrammatiliste keeleüksuste puhul konteksti, kus keeleüksust oleks võimalik produtseeritud kujul kasutada, ebakorrektsete keeleüksuste puhul aga võib olla tegemist küll grammatiliste, kuid konkreetses kontekstis ebakorrektseks peetavate keelenditega. Jamesi väitel või- 3 Inglise keeles eristatakse vigu, mida kõneleja ise parandab (mistake), vigu, mida kõneleja ise parandada ei suudaks (error), vigu, mis on pigem keelevääratused (slip) ning eksimusi viisakustavade või õigekirjareeglite vastu (solecism) (James 1998: 83). 13
vad kõnelejad keeleüksust ebakorrektseks pidada mitte pelgalt seetõttu, et nad ise nii arvavad, kuivõrd sellepärast, et neid on õpetatud nii arvama (James 1998: 64 75). Lapse varase keelelise arengu perioodil ei saa eeldada, et lapsel oleks mingeidki metakeelelisi teadmisi, seega ei ole korrektsuse kategooria lastekeele puhul oluline. Samuti ei ole lapsel varasel keelelise arengu perioodil veel väljakujunenud registreid, mistõttu ei saa pidada oluliseks ka sobivuse kategooriat. Lisaks võib esimese keele omandamise puhul suhtuda teatava reservatsiooniga aktsepteeritavuse kategooriasse, sest lapse ebatäielikke keeleüksuseid ei tajuta enamasti vigadena. Vanemad (või vestluspartnerid) saavad lapse keelenditest üldjuhul aru ega pruugigi neid alati korrigeerida ehk teisisõnu: vanemad aktsepteerivad suuremat osa ebagrammatilistest vormidest. Järgnevas käsitluses on vea määramisel lähtutud esmajärjekorras aktsepteeritavusest (vead on need keeleüksused, mida vestluspartner ei aktsepteeri) ja seejärel grammatilisusest (eeldades, et vanem ei paranda kõiki lapse ebatäielikke või vigaseid vorme). Vigadeks ei ole peetud selliseid sõnakujusid, mis ei ole grammatilised, kuid mida vanem samasugusel kujul isegi kasutab. Teoreetiline keeleteadus, lastekeel ja veaanalüüs ehk millist infot annavad vead Vigu võib pidada justkui aknaks, mille kaudu avaneb uurijal võimalus näha, kuidas laps sisendkeelest memoreeritud elementide põhjal üldistusi teeb ja enda keelesüsteemi üles ehitab. Vigade kaudu on võimalik vaadelda, mis aitab lapsel keelt omandada, mis teda seejuures segadusse ajab. Nsakala Lengo väitel pööratakse vigadele tähelepanu sellepärast, et need aitavad mõista, milliseid strateegiaid inimesed keele omandami- 14
seks kasutavad (Lengo 1995: 1). Näiteks võib eesti keele muutemorfoloogia omandamise kohta saadud andmestikust saada teavet selle kohta, kuidas laps kasutab läbipaistavama tunnusega muuttüüpi vähem läbipaistva asemel (Argus 2008: 33). Konstruktivistliku keeleomandamiskäsitluste järgi ei eeldata lapsel sünnipärase universaalse grammatika ega keeleliste moodulite olemasolu (vt Dressler, Karpf 1995: 3). Arvatakse, et laps konstrueerib grammatilised moodulid ise (Dressler 2004: 9), valides ümbritsevast keelekeskkonnast ehk sisendkeelest sobivaid üksuseid, kusjuures eri omandamisetappidel juhivad lapse valikuid erinevad tegurid (Bittner, Dressler, Kilani-Schoch 2003: xviii). Seejuures ei peeta keele kui kognitiivse süsteemi allsüsteemide koostööd sünnipäraseks, vaid see väidetakse välja kujunevat alles arengu käigus. Keele kui iseorganiseeruva süsteemi moodulid ehk allsüsteemid moodustavad esialgu terviku ja lahknevad alles siis, kui kogu süsteemi keerukus on saavutanud mingi kriitilise taseme (Karpf 1991: 341). Vead näitavadki, kuidas mittemodulaarsest süsteemist saab esialgu modulaarne ja kuidas seejärel modulaarne süsteem asendub eri moodulite koostööd eeldava süsteemiga. Teisisõnu: grammatikaeelsel perioodil omandatakse keeleüksused analüüsimata tervikutena ning varasel grammatika omandamise perioodil asendub tervikomandamine (grammatikaeelne periood) grammatilise süsteemi tuumikkategooriaid esindavate vormide produktiivse moodustamisega (miniparadigmade mõiste kohta vt Dressler jt 2002: 396 või Argus 2004) ning seejärel keele eri tasandite ehk moodulite koostöös sündiva grammatikaga. Seega ilmneb lapse vigadest morfoloogia omandamise käigus fonoloogilise ja morfoloogilise tasandi interaktsioon. 15
Liigitusprobleemidest ehk mida pidada morfofonoloogiliseks ja mida morfoloogiliseks veaks Traditsioonilise, keele tasanditest lähtuva vealiigituse järgi saab vigu liigitada fonoloogiliseteks, morfoloogilisteks, süntaktilisteks jne. Lisaks võib eesti laste materjalist leida hulganisti vigu, mida ei ole üheselt võimalik määratleda. Näiteks on laste keelematerjalis hulk vigu, mida võib käsitleda kui kahele tasandile kuuluvaid ehk morfofonoloogilisi. Morfofonoloogiliseks veaks on siinses kirjutises peetud sellist kõrvalekallet sõna häälduses (kas lühendust, lisandust, asendust või nende kombinatsiooni), mille tulemusel on tekkinud vormimoodustusviga, nt mitmuse partitiivi vormi silmi asemel vorm *silme. Lapse kõnes võib esineda ka selliseid fonoloogilisi vigu, mis on n-ö potentsiaalsed morfofonoloogilised vead. Näiteks kasutab laps kolmesilbilise sõna diktofon asemel kahesilbilist kuju diktohhe. Selline fonoloogiline viga mõjutab ka vormimoodustust, nimelt nihkub sõnakuju algsest sõnast (diktofon > diktofoni) erinevasse muuttüüpi (diktohhe > diktohhet). Morfofonoloogiliseks veaks ei saa lugeda selliseid fonoloogilisi vigu, mille puhul asendus, ärajätt või lisandus esineb ainult ainsuse nominatiivi vormis ja mille tulemusel võib oletada, et sõna muutmisel viga ei teki ning muuttüüp säilib, näiteks sõnakuju *piilats, mis muutuks *piilats : *piilatsi : *piilatsit (vdl pliiats : pliiatsi : pliiatsit). Peale traditsioonilise, keeletasanditest lähtuva liigituse võib vigu liigitada ka nende tekkemehhanismist lähtuvalt, näiteks: väljajätt, asendus jne. Ühe võimaliku üldisemat laadi vealiigituse on esitanud Nsakala Lengo, kes eristab selliseid vigu nagu ärajätt (omission) ehk selline viga, kus mingi element on puudu; lisandus (addition), kus mingi element on ülearune; valikuviga 16
(selection), kus laps on valinud vale keeleelemendi; ning järjestusviga (ordering), kus sõnas esinevad küll õiged elemendid, kuid vales järjestuses. Lengo väitel saab neid veatüüpe kasutada kõikide keeletasandite, nt fonoloogia-, morfoloogia- ja süntaksivigade liigitamisel (Lengo 1995: 23). Ometi on fonoloogiliste vigade puhul valikuvigu raske ette kujutada. Kui morfoloogilise vea puhul võib laps valida näiteks ühe käände tunnuste hulgast vale allomorfi, siis fonoloogilisel tasandil jääb ähmaseks, milliste häälikute hulgast laps vale hääliku valiks. Vea tekkemehhanismist lähtuva liigituse puhul võib üks viga esineda kas ainult ühel või ka mitmel keeletasandil. Näiteks kui ärajätt on enamasti fonoloogilise tasandi viga, siis asendus või lisandus võib olla nii fonoloogiline (laps asendab sõnas mõne hääliku) kui ka morfoloogiline viga (laps kasutab vale tunnust või ühes sõnavormis mitut sama tähendusega muutetunnust). Lapse keelelise arengu eri perioodidel esineb tema kõnes eri tüüpi vigu mõnevõrra erineval määral. Varasel ehk premorfoloogilisel perioodil on ülekaalus fonoloogilist laadi vead: häälikute ärajätt, näiteks sõnakuju *jäku 'jänku', asendus, näiteks *kuuki 'kooki' (Andreas vanus 1;7) või mõlemad koos, näiteks sõnakuju porgandid asemel kuju *pooga (Hendrik vanuses 1;9). Protomorfoloogilisel perioodil, mil laps hakkab muutemorfoloogiat aktiivselt omandama, suureneb morfoloogiliste vigade hulk (vt Argus 2008). Sel perioodil tekib vormimoodustuses nähtus, mida on defineeritud kui inflektsionaalset imperialismi ehk ühe morfoloogilise muutmismalli täielikku või peaaegu täielikku asendamist teisega (mõiste kohta vt Slobin 1985: 1216). Eesti keele omandamisel asendab läbipaistvam muutmismall reeglina mitte nii läbipaistvat, näiteks t-partitiiv tunnuseta partitiivi või sse-illatiiv lühikest lõputa illatiivi: *nukut 'nukku', *toolit 'tooli', *tädit 'tädi', *tühjasse 'tühja' (Andreas vanus 2;0). 17
On väidetud, et laste vead on produktiivse malli üleüldistamised (MacWhinney 2004: 884). Üleüldistada võib nii fonoloogiliselt produktiivset malli, eesti keele puhul näiteks trohheilist kõnetakti, nt saarmas > saamma, ämber > ämpu (Andreas 1;7 1;8), kui ka morfoloogiliselt produktiivset malli, nt t-lõpulist partitiivi. Samas võib vale vorm tekkida varem omandatud või kasutatud vormi analoogia põhjal, näiteks mitmuse partitiivi vorm palju pükse (Andreasel enne vanust 2;8), mille eeskujul moodustas laps vormi palju *kinge (vanus 2;8). Lisaks võib eesti laste keelematerjalist leida ka tüvevariandi valiku vigu, nt *nugaga, *juhtmet (Andreas vanus 2;6). Morfosüntaktilise tasandi vigu leidub nii pre- kui ka protomorfoloogilisel perioodil ning selliste vigade puhul kasutab laps kõige sagedamini mingi semantilise rolli väljendamiseks vale käändevormi: NÄIDE 1 *CHI: emme, võta ära *rätikut. %com: tahab, et ema võtaks rätiku ära. Kõige sagedamini esineb eesti laste keelematerjalis genitiivi tüve ülekasutust, seda nii obliikvakäänete (nt *tule- 'tuleb', *bussi- 'bussiga') kui nominatiivi asemel (nt *kassi 'kass', *koti 'kott') (vanus 1;7). Kuigi esialgu võib tunduda mõttekam vaadelda keele eri tasandite vigu eraldi, ei saa seda lapse varasel keeleomandamisperioodil ometi teha. Nii on sageli üsna problemaatiline eristada fonoloogilisi ja morfoloogilisi vigu. Näiteks esineb lapse keelelise arengu varasel ehk premorfoloogilisel perioodil kõige enam fonoloogilisi vigu, mille põhjuseks võib üldjuhul pidada hääldusorganite ebaküpsust. Fonoloogilised vead võivad olla häälikute asendus, nt *lusikama 'lusikaga' (Andreas vanus 2;0), ärajätt ehk enamasti just premorfoloogilisel perioodil esinev kahesilbiliste sõnakujude eelistamine, nt *pooni 'šampooni' (vanus 18
2;1), aga ka trohheilise kõnetakti eelistamine, nt *villu 'viiul' (vanus 1;8). Samas võib häälikute ärajätt olla nii fonoloogiline (häälikuühendist jääb hääldamata üks häälik, nt *kapsat 'kapsast' (vanus 1;9)) kui ka morfoloogiline (hääldamata jäänud häälik on muutetunnus, nt *mammu- 'mammud', enne- 'herned' (vanus 2;0)). Ühelt poolt võib muutetunnuse hääldamata jätmise põhjustada küll fonoloogilise süsteemi ehk hääldusorganite ebaküpsus, näiteks jääb varasel omandamisperioodil väga sageli hääldamata kinnise järgsilbi lõpphäälik, *õue- 'õues' (vanus 1;11). Teisalt ei ole laps võibolla omandanud mingit tunnust, nt käände- või mitmuse tunnust: bussi- 'bussiga' (vanus 1;7). Kokku võivad langeda sõna kinnise järgsilbi lõpphäälik ja mõni käändetunnus (*musta- 'mustaks', *õue- 'õues'), mille puhul on raske otsustada, kas tegemist on kinnise silbi lõpphääliku ärajätu või pigem morfosüntaktilise veaga, genitiivi tüve ülekasutusega, mis on samuti premorfoloogilisel perioodil lapse kõnes üsna sage (vt Argus, ilmumas). Ka selliste käändevormide puhul, kus tunnus ei muuda järgsilpi kinniseks, nt *poti- 'potile' (vanus 1;8), võib vea liigitada nii fonoloogiliseks (kahesilbilisuse piirang), morfoloogiliseks (laps ei ole omandanud käändelõppu) või morfosüntaktiliseks (laps ülekasutab genitiivi tüve). Premorfoloogilisel perioodil esineb vigu, mis võivad liigituda nii fonoloogilisteks kui ka morfosüntaktiliseks, nt *suure 'suurde'. Selliste vigade puhul võib olla tegemist hääliku ärajätuga ehk kaashäälikuühendi vältimisega, aga samahästi ka genitiivi tüve ülekasutusega. Vealiigituse ja veakodeeringu mõju analüüsitulemustele ning võimalikke lahendusi Kirjeldatud liigitusprobleemide puhul on oluline teada, kui suurt osa vigadest mõjutab see, kuidas neid liigitatakse ja kodeeri- 19
takse. Näiteks oleks uurijal vigade analüüsimisel hea teada, kas ja kui suurel määral mõjutab konkreetseid uurimistulemusi see, kui viga on liigitatud ja kodeeritud fonoloogilise (nt ärajätt) või morfosüntaktilise veana (nt genitiivi vormi ülekasutus). Andrease korpuse vaadeldud perioodi materjalis leidunud kõikidest käändsõnavormidest kokku oli normile mittevastavaid sõnakujusid ainult 1,4%, kusjuures nagu eespool juba mainitud, premorfoloogilisel perioodil olid ülekaalus fonoloogilised, protomorfoloogilisel perioodil morfoloogilised vead. Vigade vähesusest hoolimata leidus küllaltki palju selliseid vigu, mida oleks võimalik liigitada mitmeti. Problemaatilised on eelkõige fonoloogilise ja morfosüntaktilise vea piirid. Näiteks vigu, mis võiksid liigituda morfosüntaktiliste alla, täpsemalt genitiivi ülekasutuse hulka, aga mida võiks samal ajal tõlgendada ka kui fonoloogilisi vigu ehk kahesilbilisuse piirangust tulenevat lühenenud ehk ärajätuga vorme, oli kõikide vigade hulgas 30%. Selliseid morfosüntaktilisi vigu (jällegi genitiivi tüve ülekasutusi), mille puhul on täpsemalt tegemist kinnise järgsilbi vältimisega (kusjuures sõnavormi silpide arv ei vähene), leidus vigade koguarvust 18%. Niisuguste liigitamisprobleemide puhul on üks võimalus lähtuda sellest, kuidas käituvad samad või sarnased muutetunnused teistes sõnades: aluseks tuleb võtta seisukoht, kas puuduv tunnus esineb või ei esine lapse vaatlusaluse või varasema vanuse keelekasutuses. Näiteks ei leidu mitmuse nominatiivi tunnust -d Andrease vanuses 1;7 lindistatud keelematerjalis, mis lubab selle tunnuse puudumise mingis sõnavormis, kus see oleks oluadekvaatne, liigitada ärajätuks ehk fonoloogiliseks veaks. Kui aga tunnus on lapse keelematerjalis juba esinenud, siis on võimalik liigitada viga genitiivi tüve ülekasutuseks. Nii võib sõnakujus *bussi- 'bussiga' näha genitiivi tüve ülekasutust, sest samas lindistuses esines lapse kõnes ka komitatiivi lõpuga vorme. 20
Esitatu põhjal võib kõigepealt öelda, et vigade liigitamisel (nii keeletasandite kaupa kui ka ühe keeletasandi sees mehhanismide kaupa) jääb hulk vigu siiski mitmeti määratavaks. Tundmata lapse fonoloogilise, morfoloogilise ja morfosüntaktilise süsteemi üldist arengutaset, ei ole adekvaatne liigitus võimalik. Seetõttu eeldab keelematerjali veatüüpidega märgendamine kõigepealt materjali esmast analüüsi. Vigade transkribeerimis- ja kodeerimisprobleemidest Vigade transkribeerimise puhul on esmatähtis, et analüüsija näeks, milline oli tegelik öeldud sõna või sõnavorm ehk keelelise elemendi realisatsioon kõnes. Seejärel peab nägema transkriptsioonis ka seda, millist keelendit kõneleja soovis öelda (transkribeerimispõhimõtete kohta vt Hennoste 2000). Veakodeerimine peaks sobima nii neile, kes andmekoguga alles tutvuvad ja kel ei ole väga kindlat kitsast uurimisülesannet, kelle jaoks on oluline saada kõikidest vigadest lihtsalt ülevaade, kui ka neile uurijatele, kes soovivad tegeleda mingi kitsama uurimisaspektiga, muu hulgas näiteks erinevate vigade esinemisproportsioonide ning potentsiaalsete allikate analüüsimisega. Keelematerjali kodeerijalt oodatakse kaht liiki otsustuseid, mille järjekindlus määrab, kas kodeering on uurija jaoks usaldusväärne või mitte. Veaanalüüsi puhul on esimene otsus see, kas mingi keeleline üksus (lausung, fraas, vorm) vastab normile või mitte. Teine otsus puudutab normist erineva keeleüksuse edasist tähistamist ehk kodeeringut ja liigitust. Seda, kas keelüksus erineb normist või mitte, otsustab kodeerija tavaliselt iseenda keelevaistule tuginedes, eeldades, et tema kui üks selle keele kõneleja tajub keeleelemente samamoodi, kui seda teevad teised sama keele kõnelejad. Traditsiooniliselt kontrollib 21
kodeeringu üle teine kodeerija, kes on samuti sama keele kõneleja nii saavutatakse kodeeringu suurem usaldusväärsus. Veainfo paigutus ja esitamine on kokkuleppeline, see võib varieeruda isegi ühes ja samas korpuses. Näiteks on rahvusvahelises lastekeelekorpuses CHILDES kasutatud veainfo esitamiseks erinevaid võimalusi. Mõnes korpuses on veainfo paigutatud morfoloogia sõltreale 4 (nt Stephany & Bast 2007 ja Curtiss jt 2008). Sel juhul ei ole vigade jaoks loodud eraldi koode, väljajättude puhul on lisatud n-ö tõlge võrdusmärgi järel ning kui vormi on võimalik kaheti tõlgendada, siis on antud mõlemad variandid. Üldiselt on veainfo esitatud nii, et kasutatud vormi järel on võrdusmärk ning selle järel õige vorm. Valikuviga ehk vale allomorfi tähistab näiteks hüüumärk (vt Curtiss jt 2008: 19 20). Praegu on eesti lastekeele andmekogus vigu kodeeritud erinevalt: a) kasutatud on põhireal n-ö tõlke lisamist, sedagi kahe erineva tähistusega (võrdusmärk ja koolon) NÄIDE 2 *CHI: eissaa [= ei saa]. (Andreas 1;7) NÄIDE 3 *CHI: pall ümmalgune [: ümmargune] pall loheline [: loheline]. (Andreas 2;0.8) b) mõnede vigade tarbeks on kasutatud eraldi vigade sõltrida NÄIDE 4 *CHI: kes tuleb meie [*] külla? %err: meie=meile $ MOR. 4 Sõltridade ja transkriptsiooni kohta üldiselt vt Zabrodskaja 2007: 328 ja Argus 2007: 66. 22
NÄIDE 5 *CHI: suule [: suure] latase [*] Atu [: Andreas] tegi. %err: ratase=ratta $ MOR (Andreas 2;0.8). Vigane vorm on põhireal tähistatud nurksulgudes tärniga kas sõna järel (üldiselt eesti korpuses, vt näide 5) või ka sõna ees (Curtiss jt 2008: 17). Transkribeerimisreeglid võimaldavad põhireal ebakorrektse vormi järele nurksulgudesse lisada vormi või sõna, mida laps kavatses öelda ehk täiskasvanupärase korrektse vormi ning seda siis kas võrdusmärgi või kooloni järele (vt ka Argus 2008: 75). Viimases näites ongi fonoloogiline viga märgitud põhireal nurksulgudes, kuid morfoloogilise vea tarbeks on kasutatud eraldi sõltrida. Olgu siinkohal meenutatud, et CLAN-programm analüüsib sellisel juhul just kavatsetud ehk korrektset nurksulgudes esitatud vormi. 5 Funktsioonivigade kodeeringust peaks olema näha, milline oli kategooria, mida laps kasutas, ja see kategooria, mida laps oleks pidanud kasutama. Näiteks on saksa lastekeele korpuses märgendatud vigased vormid mitte eraldi veareal, vaid morfoloogilise kodeeringu sõltreal ning seal on tärni ees toodud ära see kategooria, mida laps kasutas, tärni ja võrdusmärgi järel algvorm ning see kategooria, mida ta oleks pidanud kasutama: NÄIDE 6 *LEA: dann ist der junge auf einen baum geklettert und guckte in ein grosses loch. %mor:... V gucken:past*=perf:3s... (Stephany, Bast 2007) Esitatud transkribeeringu järgi saab uurija tegeleda eelkõige morfoloogiliste vigadega. Selline transkribeerimisviis, kus kõik vead on tähistatud põhireal sümboliga [*] ja kodeeritud lahti sõltreal ehk spetsiaalsel veareal %err, annab uurijale aga või- 5 Põhireal vigade tähistamise problemaatilisuse kohta vt Argus 2008: 75 76. 23
maluse keskenduda ka ainult kitsamalt veaanalüüsile ning teisalt vaadelda mitte kitsalt morfoloogiatasandi vigu, vaid tegeleda ka fonoloogiliste ja süntaktiliste vigadega. Kui viga veareal lahti kodeeritud ei ole, ei oska süsteem viga ise ei liigitada ega ka analüüsida. Seega peaks adekvaatne ja uurijasõbralik kodeerimisviis lähtuma sellest, et põhireal järgneb vigasele sõnale või sõnavormile sümbol [*] ning veareal peab olema alati sõna või sõnavorm, mida tegelikult öeldi, sümbol = ja see sõna või sõnavorm, mida kõneleja kavatses öelda: NÄIDE 7 *CHI: linna [*] komm. %err: linna = linnas. (Hendrik 1;7) Märgendaja võib lisada vea liiki tähistava koodi sümboli $ järel, kusjuures esimene kood märgib vea üldist liiki ehk keeletasandit ning sellele võib järgneda vea täpsem ehk tekkemehhanismi tähistav kood. Alljärgnevas näites on kasutatud kahe keeletasandi veakoode, millest esimene, $MOR tähistab morfoloogilist viga ja $FON fonoloogilist viga. Teised, täpsemad koodid nende järel tähistavad vea tekkemehhanismist lähtuvat liigitust: $SUB asendusviga ja $LOS ärajättu. NÄIDE 8 *CHI: kipsi [*]. %err: kipsi = küpsist $FON $SUB $MOR $LOS. (Andreas 1;7) Eesti lastekeelekorpuse veakodeerimisvõimalusi Rahvusvaheline lastekeele korpus CHILDES ei paku kodeerimissüsteemis 6 peale inglise keele morfoloogiliste veakoodide teiste 6 Kodeerimisjuhised on aadressil http://childes.psy.cmu.edu/manuals/chat.pdf, 04.04.2008. 24
keelte jaoks sobivaid koode ega ka vigade liigitust. Kindlasti ei sobitu inglise keele suhteliselt reeglipärase morfoloogilise süsteemi jaoks pakutud koodid eesti keelematerjaliga ning seega tuleb eesti lastekeelekorpuse kasutajail andmete analüüsimiseks töötada välja eesti materjaliga sobituv vigade keeletasandist ja veamehhanismist lähtuv liigitus ning veakodeerimissüsteem. Konkreetsed veakoodid võiksid olla sellised, mis oleksid arusaadavad ka eesti keelt mittevaldava uurija jaoks, näiteks eelmainitud $FON fonoloogiatasandi, $MOR morfoloogiatasandi, $MSY morfosüntaksitasandi vea ning $SUB asenduse ja $LOS ärajätu tarbeks. Eesti keele muutemorfoloogia omandamise uurija seisukohalt võiks eesti lastekeelekorpuse vigade jaotuses olla vähemalt kolme keeletasandi fonoloogia, morfoloogia ja morfosüntaksi vead. Fonoloogiliste vigade puhul saab tekkemehhanismist lähtuvalt eristada häälikute ärajättu, asendust ja lisamist. Kolmandal, täpsemal tasandil võiks tähistada ärajätu juures mingis kindlas positsioonis oleva hääliku ärajättu, näiteks kinnise lõppsilbi häälikute vältimist. Eraldi ei ole ilmtingimata vajalik liigitada kahesilbilisuse piirangust tulenevaid lühenenud sõnakujusid, pigem on lihtsam analüüsijal saada automaattöötluse tulemina nimekiri kõikidest ärajättudest ja neist enda huvidele vastavalt eristada kahesilbiliseks lühenenud sõnakujud, mis üsna sageli ühtivad kinnise järgsilbi lõpphääliku vältimisega. Eesti laste keelelise arengu varasele perioodile väga omane ja sage nähtus, sõnakuju sobitamine trohheilisse kõnetakti (vt Argus 2008: 31), vajaks aga eraldi märgendamist ja et selliste vigade puhul on tegemist mitme veamehhanismi üheaegse toimimisega, kus jääb ära sõna lõpphäälik ja toimub ka häälikute asendus, nt viiul > *villu. Ilmselt ongi lihtsam kodeerida sellised sõnakujud eraldi vealiigina, näiteks koodiga $TRO: 25
NÄIDE 9 *MOT: karumõmm mängib viiulit. *CHI: villu [*]. %err: villu=viiulit $MOR $TRO (Andreas 1;8) Morfoloogiliste vigade puhul tuleks kindlasti eristada tüvevariandi valiku vead ning vale muutmismalli ja tähistada mõne muuttüübi üldistamise vead eraldi koodiga $PSH (ingl pattern shift): NÄIDE 10 *CHI: munat [*] ei ole siin. %err: munat=muna $MOR $PSH (Andreas 1;8) Morfosüntaktilistest vigadest vajaksid omaette alajaotust mingis semantilises rollis vale vormi kasutused (kood $FUN, ingl functional error): NÄIDE 11 *CHI: siis # Atu [: Andreas] ka tahab kaltulit [: kartulit] kausit [*] seest äla [: ära]. %err: kausit=kausi $MOR $FUN (Andreas 2;0) Tabelis 1 on pakutud eesti keele muutemorfoloogiale keskenduva uurija jaoks esmane vajalik vigade liigitus ja nende märgendamiskoodid. Tabel 1. Muutemorfoloogiaga seotud vigade võimalik jaotus ja tähistuskoodid Fonoloogiline viga $FON $SUB (asendus) $LOS (ärajätt) $ADD (lisandus) $TRO (sõnavormi sobitamine trohhelilisse kõnetakti) 26
Morfoloogiline viga $MOR $SUB (muutetunnuse asendus) $LOS (muutetunnuse ärajätt) $ADD (muutetunnuse lisandus) $PSH (vale muutmismalli kasutus) Morfosüntaktiline viga $MSY $FUN (vale vormi kasutus) Kokkuvõtteks Eesti keele muutemorfoloogia omandamise ajal lapse keelekasutuses esinevad vead näitavad ilmekalt seda, kuidas keeletasandite vahel toimub omandamisprotsessi käigus pidev interaktsioon. Seetõttu võibki rangelt keeletasandist lähtuva vealiigituse puhul tekkida liigitusprobleeme. Vigu, mille puhul on raske otsustada, kas tegemist on fonoloogilise või morfosüntaktilise veaga, on eesti keelematerjalis olulisel hulgal ning nende liigitamine ühe või teise tasandi vigade alla mõjutab uurimistulemusi märkimisväärselt. Seetõttu on oluline varustada seda tüüpi vead mõlema keeletasandi veakoodidega ning lasta uurijal täpsema kodeeringu ja liigituse osas ise otsustada. Et vigade liigitus sõltub suurel määral analüüsimetoodikast ja täpsemast uurimishuvist, peaks veakodeerimine käima käsikäes materjali analüüsiga, kergendama analüüsija tööd, kuid olema samas piisavalt paindlik. Kirjandus Argus, Reili (ilmumas). The early development of case and number in Estonian. Acquisition of Case and Number in 27
Typological Perspective / Ed. by M. D. Voeikova & U. Stephany. Berlin: Mouton de Gruyter. Argus, Reili 2008. Eesti keele muutemorfoloogia omandamine. Tallinna Ülikooli humanitaarteaduste dissertatsioonid 19. Tallinn: TLÜ Kirjastus. Argus, Reili 2007. Eesti lastekeelekorpuse morfoloogilisest märgendamisest. Tallinna Ülikooli keelekorpuste optimaalsus, töötlemine ja kasutamine / Toim. P. Eslon. Tallinna Ülikooli eesti filoloogia osakonna toimetised 9. Tallinn: TLÜ Kirjastus, 65 86. Argus, Reili 2004. Eesti keele käändesüsteemi omandamine: esimestest sõnadest miniparadigmadeni. Emakeele Seltsi aastaraamat, 49, 2003 / Toim. M. Erelt, M-M. Sepper. Tallinn: Emakeele Selts, 23 48. Bittner, Dagmar & Dressler, Wolfgang U. & Kilani-Schoch, Marianne 2003. Introduction. Development of Verb Inflection in First Language Acquisition. A Cross-Linguistic Perspective / Ed. by D. Bittner, W. U. Dressler, M. Kilani- Schoch. Studies on Language Acquisition, 21. Berlin / New York: Mouton de Gruyter, 7 26. Dressler, Wolfgang U. 2004. Degrees of grammatical productivity in inflectional morphology. Italian Journal of Linguistics, 15, 31 62. Dressler, Wolfgang U. & Kilani-Schoch, Marianne & Klampfer, Sabine 2002. How does a child detect morphology? Evidence from production. Morphological Structure in Language Processing. Trends in Linguistics. Studies and Monographs, 151 / Ed. by R. H. Baayen, R. Schreuder. Berlin: Mouton de Gruyter, 391 425. Dressler, Wolfgang U.& Karpf, Annemarie 1995. The theoretical relevance of pre- and protomorphology in language acquisition. Mechanisms of Morphological Change. Yearbook of 28
Morphology 1994 / Ed. by G. Booji & J. van Marle. Dordrecht: Kluwer, 99 122. Curtiss, Susan & MacSwan, Jeff & Schaeffer, Jeannette & Mural Kural & Tetsuya Sano. GCS: A Grammatical Coding System for Natural Language Data www.linguistics.ucla.edu/ people/curtiss/gcscodingpaper.pdf, 19.02.2008. Hennoste, Tiit 2000. Suulise eesti keele uurimine: transkriptsioon, taust ja korpus. Keel ja Kirjandus 2, 91 106. James, Carl 1998. Errors in Language Learning and Use. Exploring Error Analysis. Applied Linguistics and Language Study / Ed. by C. N. Candlin & M. England. Karpf, Annemarie 1991. Universal grammar needs organization. Folia Linguistica, XXV/3 4, 339 360. Lengo, Nsakala 1995. What is An Error? Forum, Vol 33, No 3. http://exchanges.state.gov/forum/vols/vol33/no3/p20.htm, 4.03.2008. MacWhinney, Brian 2004. A multiple process solution to the logical problem of language acquisition. Journal of Child Language, Vol. 31(4), 883 914. Pajusalu, Renate 2004. Keeleõppija tähendusviga ja selle hindamine. Toimiv keel II. Rakenduslingvistika konverentsi kogumik / Koost. H. Metslang, toim. M-M. Sepper & J. Lepasaar. Tallinna Pedagoogikaülikooli eesti keele õppetooli toimetised 3. Tallinn: TPÜ Kirjastus, 218 235. Slobin, Dan Isaac 1985. Crosslinguistic evidence for the language-making capacity. The Crosslinguistic Study of Language Acquisition, Vol. 2. Theoretical Issues / Ed by D. I. Slobin. Hillsdale, NJ: Lawrence Erlbaum Associates, 1157 1256. Stephany, Ursula & Connie Bast 2007. Working with the childes tools: transcription, coding and analysis. http:// childes.psy.cmu.edu/intro/stephany.pdf, 18.02.2008. 29
Verschik, Anna 2002. Viga! Viga? Viga... Oma Keel, 2, 76 82. Zabrodskaja, Anastassia 2007. Vene-eesti koodivahetuse korpus: kodeerimispõhimõtete väljatöötamine. Eesti Rakenduslingvistika Ühingu aastaraamat. Toim. H. Metslang & M. Langemets & M-M. Sepper. Tallinn: Eesti Keele Sihtasutus, 321 338. CODING AND CLASSIFICATION OF MORPHOLOGICAL ERRORS OF ESTONIAN CHILD LANGUAGE DATABASE Summary This article focuses on morphological errors children make in course of the acquisition Estonian as their first language. The main goal of the paper is to demonstrate the theoretical importance of the error-analyses and some important problems connected with the definition of the morphological error and to present a preliminary classification of morphological errors. The classification offered is based at first on the level of the language structure (morphosyntactic, morphological, phonological errors) and secondly on the mechanism of the error (omission, substitution, loss of the morphological element etc.). The amount of errors which can be classified as for example morphological or phonological errors is quite significant in the Estonian child language database. The purpose of the paper is also to demonstrate how much can the classification of errors influence the final results of the study and how the suitable criterion for the classification can be established. 30
KÄÄNDEVORMIDE KASUTUSSAGEDUSE VÕRDLUS EESTI ÕPPIJAKEELES JA KIRJAKEELES Ülevaade Pille Eslon Õppijakeelt kui omaette keelevarianti on uuritud erinevalt. Tavaliselt on selleks kasutatud tõlke-, kontrastiiv- ja veaanalüüsi viimastel aastakümnetel rakendatuna suuremahulistele elektroonilistele andmekogudele ehk korpustele. Sel moel on võimalik teha avaramapõhjalisi järeldusi õppijakeele lingvistiliste universaalide ning omapära kohta. Võrreldes saadud tulemusi kirjakeele korpuse andmetega, on võimalus näha nii õppijakeelele omaseid jooni (sihtkeele vahendite üle- ja alakasutus, vajakajäämised semantilises ja grammatilises valentsis, vormimoodustusvead jne) kui ka teha oletusi sihtkeele arengutendentside kohta, kuna õppija keelekasutuses võivad ilmneda nähtused, mis kirjakeeles arenevad märkamatult 1. 1 Uurimust on alustatud sihtfinantseeritava teema nr 0132493s03 Eesti keelekeskkonna arengu analüüs, modelleerimine ja juhtimine (2003 2007) toel ning jätkatud ETFi granti nr 6151 Koodivahetuse, eesti vahekeele ning lastekeele andmekorpuste koostamine ja üldkirjeldus (2005 2008) ja riikliku programmi Eesti keel ja rahvuslik mälu (2004 2008), grant R 05/01 Koodivahetuse, vahe- ja lastekeele korpuste töötlemine ja haldamine abil. 31
Võtmesõnad: käändekategooria, vormivariatiivsus, korpuspõhine andmeanalüüs Eesmärk Käesolev uurimus on esialgne, kuna analüüs on tehtud piiratud keeleainese õppijakeele kuue sagedasema nimisõna põhjal 2. Eesmärk on välja selgitada mõningad seaduspärasused grammatiliste ja semantiliste käänete kasutuses vene emakeelega inimeste eesti õppijakeeles võrrelduna eesti kirjakeelega. Eraldi on vaadeldud korrektset ning keelenormile mittevastavat vormikasutust. Tähelepanu keskmes on grammatilised käänded, kuna mõlemas keelevariandis on objektikäänetes täheldatud teatavaid nihkeid, mis viitavad üldisele partitiivistumisele ehk partitiivi ülekasutusele võrreldes nominatiivi ja genitiiviga (vt Metslang et al 2003: 75 79, 83 85, 126 131; Tamm 2004: 207 222; Ehala 2007; Pool 2007 jt). Aspektikategooriat mitte omavas eesti keeles on nende käändevormide peamine funktsioon kirjeldatava sündmuse aspektuaalse tähenduse edastamine (vt Eslon & Pihlak 1993; Tamm 2003: 639 653; Tamm 2004: 69 70, 117 135; Eslon 2004; Vaiss 2004; Eslon 2006). Siit ka küsimus, kas partitiivistumine on õppijale omase lihtsustamise / vältimisstrateegia tulemus või seisneb probleem eesti keele kui teise keele õppe lingvistilistes alustes, õppematerjalides, sõnastikes või õpetamise metoodikas? Samuti ei saa välistada võimalust, et tegu on mingi kindla arengusuunaga keelesüsteemis eneses. 2 Samas on need sõnad leitud Eesti vahekeele korpuse rohkem kui 700000 sõnet sisalduvast tekstikorpusest, mille statistikamoodul võimaldab uurida ka saja ja enamsagedasema nimisõna käändevormide kasutamist. 32
Materjal Uurimismaterjal on võetud kahest andmebaasist: õppijakeele näited pärinevad Tallinna Ülikooli Eesti vahekeele korpusest 3, kirjakeele näited Eesti kirjakeele sagedussõnastikust 4 ; teave käänete kasutamise kohta õppijakeeles on saadud Eesti vahekeele korpuse konkordantsileidja abil, andmed kirjakeele kohta on võetud Tartu Ülikooli Eesti kirjakeele korpuse morfoloogiliselt ühestatud osast 5. Õppijakeele ja kirjakeele sagedasemad nimisõnavormid on välja valitud sageduste kahanevas järjekorras: õppijakeel (1) inimesed 940, (2) ajal 870, (3) inimene 698, (4) keele 660, (5) elu 629, (6) keeles 618, (7) sõna 466, (8) keelt 413, (9) aega 378, (10) töö 377, (11) raha 370, (12) tööd 342, (13) elus 339, (14) sõnad 337, (15) kirja 377, (16) aastat 327, (17) kultuur 317, (18) koolis 310, (19) lapsed 300, (20) keel 296, (21) kultuuri 290, (22) eestlased 290, (23) aeg 290, (24) kiri 280, (25) aasta 269, (26) inimeste 260, (27) õpilased 259 jne; kirjakeel (1) aasta 1130, (2) krooni 1127, (3) mees 1082, (4) sõnul 974, (5) raha 831, (6) ajal 814, (7) aastal 779, (8) elu 698, (9) naine 694, (10) ema 648, (11) aastat 642, (12) aega 626, (13) isa 488, (14) aeg 484, (15) maja 443, (16) inimesed 440, (17) linna 419, (18) päeva 419, (19) inimene 407, (20) riigi 401, (21) asi 400, (22) töö 361, (23) päeval 322, (24) hommikul 321, (25) mehed 316, (26) õhtul 316, (27) maailma 315 jne. Selle loendi alusel on eesti õppijakeele kümme kõige sagedamat nimisõna keel, inimene, aeg, elu, sõna, töö, kiri, kultuur, aasta, raha ning kirjakeeles aasta, aeg, mees, 3 Vt http://evkk.tlu.ee, 15.11.2007 4 H.-J. Kaalep, K. Muischnek. Eesti kirjakeele sagedussõnastik. Tartu: Tartu Ülikooli Kirjastus, 2002. 5 Vt http://www.cl.ut.ee/korpused/morfkorpus/, 15.11.2007 33
kroon, sõna, inimene, raha, elu, naine, ema. Artiklis on analüüsitud õppijakeele kuue esimese sõna neid käändevorme, mis õnnestus leida Eesti vahekeele korpuse vormisageduse tähestikulise järjekorra alusel. Näiteks: aeg aeg 290, aega 378, aegade 14, aegadel 5, aegadele 2, aegadest 5, aegaga 1, aegaps 1, aegu 5, aja 145, ajad 8, ajadel 1, ajaga 19, ajaks 34, ajal 870, ajale 8, ajani 1, ajas 54, ajasse 1, ajast 48, ajata 1. Sõnavormide tähestikulise järjekorra alusel on eraldatud keelenormile vastavad (Series 1) ja mittevastavad (Series 2) käändevormid. Saadud arvandmed on käänete järjekorras kantud Exeli tabelisse, mis võimaldab neid töödelda ning võrrelda eesti kirjakeele korpuse morfoloogiliselt ühestatud osa vastavate andmetega. Teatud raskusi tekitab vormihomonüümia keeleuurija probleem, keeleõppija tugi (vt Pool 2006), kuid mitte ainult. Näiteks grammatiliste käänete ainsuse vormid (NOMsing sõna, GENsing sõna, PARTsing sõna) või erinevate grammatiliste vormide kokkulangevus (ajad võib olla nimisõna aeg mitmuse nominatiiv või verbi ajama indikatiivi oleviku 2. pööre). Sedalaadi juhtumid on täpsustatud kontekstide toel, mis saadud Eesti vahekeele korpuse konkordantsileidja abil. Analüüsi käigus on võrreldud omavahel õppijakeelele ning kirjakeelele omaseid käändevormide kasutuskontekste, püütud välja tuua ühisjooni ja erisusi sõnade semantilistes seostes ning kasutatud grammatilistes konstruktsioonides. Analüüsi tulemused I. Üldised tähelepanekud 1. Kui võrrelda omavahel õppijakeele ja kirjakeele 27 sagedasemat sõnavormi ning nende seast välja valitud kümmet sagedasemat sõna, siis ilmneb, et tegu on suuresti kokkulange- 34
vustega (vt Tabel 1). Nii õppija- kui ka kirjakeeles on sõna viiendal kohal, väga lähedane on sõna aeg kasutamine (vastavalt 3. ja 2. koht). Kümne piires varieerub sõnade inimene (2. ja 6. koht), elu (4. ja 8. koht) ja raha (10. koht ja 7. koht) sagedus. Distants on suurem sõna aasta kasutuses (9. koht ja 1. koht), kuid ka see kõikumine mahub kümne sisse. Sõna töö on õppijakeeles 6. kohal, samas kui kirjakeeles seda kümne hulgas pole, kuid on esindatud 27 sagedasema seas. Õppijakeeles osutusid marginaalseks sõnad keel (1. koht), kiri (7. koht) ja kultuur (8. koht), mis kirjakeele 27 sagedasema nimistus puuduvad. Nende asemel kuuluvad kümne sagedasema hulka sõnad mees (3. koht), kroon (4. koht), naine (9. koht) ja ema (10. koht). Sõnade keel, kiri ja kultuur marginaalsus on põhjustatud ilmselt õppijakeele spetsiifilisest teemavalikust. Eesti vahekeele korpus sisaldab palju esseesid, milles õppijad kirjutavad, kui oluline on osata eesti keelt ning tunda selle maa kultuuri, kus sa elad, unustamata samas oma emakeelt ja kultuuri. Tähtsaks peetakse eesti keele valdamist ning haridust, kuna siis on kergem leida hästi tasustatud tööd. Tabel 1. Õppijakeele ja kirjakeele kümme sagedasemat sõna Õppijakeel Kirjakeel 1. keel 1. aasta 2. inimene 2. aeg 3. aeg 3. mees 4. elu 4. kroon 5. sõna 5. sõna 6. töö 6. inimene 7. kiri 7. raha 8. kultuur 8. elu 9. aasta 9. naine 10. raha 10. ema 35
2. Õppijakeele analüüsimisel vaadeldi eraldi sõna- ning vormikasutuse vastavust keelenormile. Tuleb märkida, et õppijad olid sagedasi käändevorme kasutades üldiselt väga korrektsed (vt Tabel 2). Soodustava asjaoluna võib siin arvesse võtta grammatiliste käänete vormihomonüümiat (sõnad elu ja sõna, osaliselt ka töö), kuid määravaks seda pidada siiski ei saa. Pigem on tegu sellega, et väga sagedased sõnavormid ja nende standardsed kasutuskontekstid on õppides pähe kulunud. Tabelis 2 viitab kaldkriipsule järgnev arv vigasele vormimoodustusele, mis üldiselt jääb vahemikku 0 2, välja arvatud sõna inimene. Ilmselt on selle sõna käändevormide moodustamine olnud raske mitme asjaolu tõttu: pole omandatud algvormi (nt (*)inime 1, *inimen 1, *inimine 7, *inimnene 1); ei tunta käändevormide moodustusmehhanismi ja häälikumuutusi (nt NOMpl *inimened 1, GENsing *inimenese 1); järgitakse häälduspärast kirjaviisi (nt NOMpl *inimesd 3, *inimeset 1); mõju on avaldanud eesti kõnekeel (nt (*)inime 1, *inimine 7) 6 jm. Tabel 2. Korrektsete ja mittekorrektsete käändevormide suhe õppijakeeles Kääne Keel Inimene Aeg Elu Sõna Töö NOMsing 296/0 698/10 290/0 329/0 279/0 251/0 NOMpl 13/1 941/14 0/0 1/0 337/0 84/1 GENsing 661/1 221/6 143/0 161/2 38/0 126/0 GENpl 26/2 260/0 14/0 2/0 65/0 13/0 PARTsing 413/3 235/0 378/0 169/0 149/0 258/13 PARTpl 20/1 257/7 0/0 3/0 46/0 31/2 ILLsing 127/1 0/0 0/0 10/0 0/0 2/0 6 Siin ja edaspidi tähistab sõna ees olev tärn mittekorrektset sõnakasutust, sulgudes olev tärn veidi ebatavalist ja pigem loomingulist sõnakasutust, mida ei saa pidada valeks. 36
ILLpl 1/0 3/0 0/0 0/0 0/0 0/0 INESsing 620/2 8/0 0/0 339/0 5/0 28/0 INESpl 9/1 5/0 0/0 2/0 9/0 37/0 ELATsing 75/0 22/1 0/0 66/0 17/0 23/0 ELATpl 2/0 44/0 5/0 0/0 58/0 19/0 ALLATsing 28/2 43/3 8/0 6/0 14/0 87/1 ALLATpl 1/0 86/0 2/0 0/0 4/0 1/1 ADESsing 3/1 93/3 870/0 2/0 13/0 42/2 ADESpl 0/0 111/3 5/1 0/0 65/0 0/0 ABLsing 1/0 4/0 0/0 0/0 1/0 14/0 ABLpl 0/0 2/0 0/0 0/0 0/0 0/0 TRANSsing 8/1 12/1 34/0 11/3 1/0 0/0 TRANSpl 0/1 1/0 0/0 0/0 0/0 0/0 TERMsing 0/0 1/0 0/0 0/0 0/0 8/0 TERMpl 0/0 2/0 0/0 0/0 0/0 2/0 ESSIIVsing 0/0 8/1 0/0 0/0 0/0 0/0 ESSIIVpl 0/0 0/0 0/0 0/0 1/0 0/0 ABESsing 2/0 0/0 0/0 11/0 0/0 46/2 ABESpl 0/0 1/1 0/0 0/0 0/0 0/0 KOMsing 16/0 19/0 19/1 24/0 37/0 20/0 KOMpl 3/0 102/4 0/0 0/0 41/0 1/1 3. Õppijakeele kuue sagedasema sõna käändevormide sageduses kajastub eesti keele grammatiliste ja semantiliste käänete disproportsioon ning vastandatus. Kõige enam on kasutatud ainsuse nominatiivi, genitiivi ja partitiivi vorme ning kõige vähem mitmuse essiivi (sõna 1/0), abessiivi (inimene 1/1), translatiivi (inimene 1/0, keel 0/1), terminatiivi (inimene 2/0, töö 2/0) ja illatiivi (inimene 3/0, keel 1/0) vorme. Näiteks toome sagedasemad käändevormid sõnade kaupa (vt Diagramm 1): keel GENsing 661, INESsing 620, PARTsing 413, NOMsing 296, ILLsing 127 37
inimene NOMpl 941, NOMsing 698, GENpl 260, PARTpl 257, PARTsing 235, GENsing 221, ADESpl 111, KOMpl 102 aeg ADESsing 870, PARTsing 378, NOMsing 290, GENsing 143 elu INESsing 339, NOMsing 329, PARTsing 169, GENsing 161 sõna NOMpl 337, NOMsing 279, PARTsing 149 töö PARTsing 258, NOMsing 251, GENsing 126 Diagramm 1. Käändevormide sagedus 1000 900 800 700 600 500 400 keel inimene aeg elu sõna töö 300 200 100 0 NOMsing NOMpl GENsing GENpl PARTsing PARTpl ILLsing ILLpl INESsing INESpl ADESsing ADESpl KOMsing KOMpl Diagrammi 1 aluseks olnud arvulised andmed näitavad, et õppijakeele kõige sagedamini kasutatav käändevorm on ainsuse nominatiiv (2143 näidet), järgnevad ainsuse partitiiv (1602), ainsuse genitiiv (1312), mitmuse nominatiiv (1278), ainsuse inessiiv (959), ainsuse adessiiv (870), mitmuse genitiiv (260), mitmuse partitiiv (257), ainsuse illatiiv (127), mitmuse adessiiv (111) ja mitmuse komitatiiv (102). 38
Tartu Ülikooli eesti kirjakeele korpuse morfoloogiliselt ühestatud osa andmetel on valdavalt ülekaalus ainsuse genitiiv (39871 näidet), järgnevad ainsuse nominatiiv (33515), ainsuse partitiiv (17027), mitmuse nominatiiv (9996), mitmuse genitiiv (8785), ainsuse adessiiv (8360), ainsuse inessiiv (8140), mitmuse partitiiv (6292), ainsuse elatiiv (5007), ainsuse allatiiv (4872) ja ainsuse komitatiiv (4589). Ülaltoodud andmete võrdlusest võib järeldada, et nii õppijakeeles kui ka eesti kirjakeeles kasutatakse mitmuse nominatiivi (sagedusreas 4. kohal), ainsuse adessiivi (6. koht) ja mitmuse partitiivi (8. koht) vorme samal sagedusastmel, mis üldjuhul kehtib ka komitatiivi suhtes (11. koht), kuid selle erinevusega, et õppijakeeles on kasutatud mitmuse vormi ja kirjakeeles ainsuse vormi. Ülejäänud käänete puhul on märgata suuremaid või väiksemaid nihkeid. Enam-vähem samal sagedusastmel olevateks võib pidada ainsuse nominatiivi (õppijakeeles valdav käändevorm, kirjakeeles 2. kohal), ainsuse partitiivi (vastavalt 2. ja 3. koht), ainsuse inessiivi (5. ja 7. koht) ja mitmuse genitiivi kasutust (7. ja 5. koht). Disproportsioonis tundub olevat ainsuse genitiivi kasutamine see eesti kirjakeeles valdav käändevorm on õppijakeele sagedasemate käändevormide hulgas alles kolmandal kohal (eelnevad ainsuse nominatiiv ja partitiiv), vt Diagramm 2. Statistika näitab, et grammatilistest käänetest eelistavad õppijad kasutada käändevorme järjestuses ainsuse nominatiiv, partitiiv ja genitiiv, samas kui kirjakeele järjestus on ainsuse genitiiv, nominatiiv ja partitiiv. Nominatiivi ja partitiivi eelistamisel genitiivi ees on õppijakeeles omad kindlad põhjused. Et selles selgusele jõuda, on vaja uurida, missugustes sõnaühendites ja grammatilistes konstruktsioonides neid käändevorme põhiliselt kasutatakse. Samas tuleb märkida, et ainsuse genitiivi ja partitiivi kasutatakse õppijakeeles peaaegu võrdses suurusjärgus (näiteid vastavalt 1312 ja 1602), mis aga ei ole omane kirjakeelele. 39
Diagramm 2. Sagedasemad käändevormid 45000 40000 35000 30000 25000 20000 Õppijakeel Kirjakeel 15000 10000 5000 0 NOMsing NOMpl GENsing GENpl PARTsing PARTpl ILLsing ILLpl INESsing INESpl ELATsing ELATpl ALLATsing ALLATpl ADESsing ADESpl KOMsing KOMpl Järgnevalt võrreldaksegi õppijakeele kuue sagedasema sõna käändevormide kasutust eesti kirjakeele vastavate kontekstidega ning püütakse leida vastus küsimusele, millistest teguritest võiksid sõltuda võimalikud kokkulangevused ja erinevused. II. Käändevormide sagedus ja kasutuskontekstid 1. Keel Sagedasemad käändevormid on: GENsing 661, INESsing 620, PARTsing 413, NOMsing 296, ILLsing 127. Peaaegu ei kasutata 7 : ILLpl, INESpl, ELATpl, ALLATpl, ADESsing, ABLsing, TRANSsing, ABESsing, KOMpl. Üldse ei kasutata: ADESpl, ABLpl, TRANSpl, TERMsing, TERMpl, ESSIIVsing, ESSIIVpl, ABESpl (vt Tabel 2 ja Diagramm 3). Seda fakti võib interpreteerida ilmselt kaheselt: 1. käändevormide disproportsioon tuleneb õppijakeele sõnavara (temaatilisest) piiratusest, 2. sõna keel võimalikud kontekstid on seotud eesti kirjakeeles peami- 7 Siin ja edaspidi peetakse selle all silmas vormisagedust vahemikus 1 10. 40
selt grammatiliste käänete kasutamisega, mis kajastub ka teistes keelevariantides, antud juhul õppijakeeles. Diagramm 3. Sõna "keel" käändevormid 700 600 500 400 300 Sarja1 Sarja2 200 100 0 NOMsing NOMpl GENsing GENpl PARTsing PARTpl ILLsing ILLpl INESsing INESpl ELATsing ELATpl ALLATsing ALLATpl ADESsing ADESpl ABLsing ABLpl TRANSsing TRANSpl TERMsing TERMpl ESSIVsing ESSIVpl ABESsing ABESpl KOMsing KOMpl 1.1. Analüüsi tulemused Sõna keel kasutamisele õppijakeeles on omane noomeniühendite rohkus; verbidest on esindatud vaid temaatiliselt piiratud sõnad, mis tähistavad keelte õppimist ja valdamist. Näiteks: koos omadussõnaga: *kohalikuid ~ kohalikke keeli, eesti, inglise / *englise / *eenglise, vene, soomeugri, saksa, taani, ladina, rootsi, soome, prantsuse, liivi, võõras, vajalik, raske, huvitav jt possessiivsete ja viitavate asesõnadega: meie keel, nende keel, oma keel, see keel, selles keeles, need keeled jt koos nimisõnadega: venelaste keel, maailma keel, keele õppimine, keele valdamine, märk keelest ja kultuurist, vene keel võõrkeelena jt verbilaiendina: õppima mida, tahtma mida teha, rääkima milles, valdama mida, meeldima mida teha, suhtlema milles, ei tea mida jt 41