Oppijansuomen piirteitä korpusvetoisesti III Virsu-konferenssi Joensuussa 19. 20.1.2007 Jarmo H. Jantunen
Esitelmän rakenne Kotekstuaalia valintoja yleensä ja aiempia havaintoja oppijankielestä Pilottiaineisto Menetelmät Alustavia havaintoja ja hypoteeseja
Lekseemin kotekstuaalisia valintoja Kollokaatio kahden lekseemin välinen suhde (leksikaalinen myötäesiintymä) (mm. Firth 1957, Sinclair 1996, Stubbs 2001) Kolligaatio: lekseemin ja kieliopillisen kategorian (tai lauseaseman) välinen suhde (kieliopillinen myötäesiintymä) (mm. Firth 1957, Hoey 1997, Sinclair 1998) kovin <(kielto)verbi> (Jantunen 2004) Semanttinen preferenssi: lekseemin ja kotekstissa esiintyvän merkityspiirteen suhde (Sinclair 1996, 1998, Stubbs 2001) oikein < arvo : hyvä, hyvin, mainio, onnistunut> (Jantunen 2004)
Aiempia kotekstianalyyseja: kollokaationalyyseja Angela Hasselgren 1994: adverbiadjektiivi-kollokaattien ja nomini-verbikollokaattien virheet (yleisimpien adverbien yliedustuminen) apologize <very (much)> vrt. apologize <sincerely> Nadja Nesselhauf 2003: verbi-nominikollokaattien virheet (take <film> vrt. make <film> Sylviane Granger 1998: edistyneitten kielenoppijoiden kollokaatiot Maija Grönholm mm. 2001: kollokaatioiden ja idiomien virheet
Aineisto Kansainvälisen oppijansuomen korpuksen pilottikorpus Saneita 13 400 Tekstejä 86 Tekstilajit: kuvaus, kirje, referaatti Tuottotapa: yksilötuotos (66), ryhmätuotos (20) Äidinkielet: puola, saksa 8; venäjä 7; unkari 6; japani, espanja 3 (yht. 16 eri äidinkieltä) Sukupuoli: f 45 / m 9 Vertailuaineistona Supisuomen korpus, 3,8 milj. sanetta, (Käännössuomen korpuksen osakorpus, Mauranen 2000)
Menetelmä Korpusvetoinen analyysi (Tognini-Bonelli 1996) tutkija antaa aineiston johdattaa mahdollisesti mielenkiintoisten kielenainesten pariin, niiden avulla testataan hypoteesia tai luodaan uusia hypoteeseja Sanaston frekvenssianalyysi Avainsana-analyysi Kotekstianalyysi WordSmith Tools -ohjelmapaketti (Wordlist, Keywords, Concord) (Scott 1999)
Avainsana-analyysi N SANE F / PILOTTI F / SUPIKORPUS AVAINSANAISUUS 1 HE 214 5 858 608,3 2 ON 605 62 632 455,5 3 KUVASSA 49 164 324,8 4 SIRKKA 38 45 315,0 5 SAVONLINNASSA 27 6 273,7 6 KOSKA 113 3 981 270,6 7 PALJON 84 3 261 187,1 8 KAUNIS 37 483 154,4 9 SAVONLINNA 15 4 149,9 10 ME 73 3 190 148,0 11 SAVONLINNAN 16 23 128,0 12 ANNE 16 24 127,0 13 POLKKA 12 2 124,0 14 MONTA 37 827 118,2 15 OVAT 121 11 024 109,5 16 SOITTIVAT 14 23 109,2 17 MOI 16 61 102,4 18 RÄPÄTÄDIT 9 0 101,6 19 MINÄ 121 11 728 99,6 20 VALSSI 11 8 98,4
f Paljon kaunis kaupunki lemma KAUNIS f /10 000 Oppijansuomi Supisuomi Esimerkkejä oppijansuomesta 53 39,6 1246 3,3 kollokaatit R1 ja (15) kaupunki (5) ilma (1) ja (179) kuin (45) nainen (59) tyttö (41) Se on pieni mutta paljon kaunis kaupunki. Minä voin hyvin, tassa on kaunis ilma, mutta eilen satai. kollokaatit L1 ja (5) hyvin (3) oikein (3) paljon (2) ja (139) niin (53) maailman (50) että (15) Kappaleet ovat hyvin kaunis ja iloinen. Olavinlinna on oikein kaunis linna. hyvin (15)
Kaupunki supisuomessa N WORD Total L3 L2 L1 R1 R2 R3 1 KOKO 38 2 3 29 3 1 0 2 SUOMEN 41 5 6 26 1 1 2 3 TÄSSÄ 28 0 4 21 0 3 0 4 HELSINGIN 16 0 0 15 1 0 0 5 YMPÄRI 12 0 0 12 0 0 0 6 POIS 13 1 1 9 0 0 2 7 MYÖS 36 4 10 9 3 5 5 8 MUIDEN 11 1 0 9 1 0 0 9 TÄMÄN 13 1 2 8 1 0 1 10 ULOS 10 1 1 7 1 0 0... KAUNIS 3 0 0 3 0 0 0
Syödään paljon kalaa N Concordance 1 et... olivat isossa juhlassa, joivat koko yön oikein paljon. Tänään tämä mies heräsi kello yhdeltä. 2 keskustaan ja päättivät istua kahvilassa ja juoda paljon kahvia. Kesällä kaupungiin keskustassa 3 teatterissa. P.P. Viime lauvantaina yöllä joimme paljon kosken korvaa, se on kiva! Moi Moi! 4 ja järvessä joka illalla söimme makkara. Joimme paljon olutta. Viime lauvantaina illalla uimme j 5 kuppia Colan kanssa, BigMac. McDonaldissa on paljon ruoka, joka ei ole terve. McDonalin ruokal (6 hänen onkinsa ja alkoi kalastaa. Koska se ei ole paljon kaloja tällä paikalla, se kesti ihan kauan s) 7 ttelivat, että he laittivat kalaruoka, koska heillä oli paljon kalaa. He kuitenkin huomasivat, että he u 8 vä, he menevät kalastamaan järvellä, ja Raija syö paljon kalaa. Koska hän syö ainaa kalaa, hanes (9 erilaisia kuvia. Kuvissa ovat eläimiä (esim.poro), paljon kaloja. Yksi kuvassa on gallerin ohjelma: ) 10 än vaimo on maailman kuuluisia kalastaja ja liian paljon muikkuja on paistettu. Oliivin öljyä tuli It 11 :issa kivan elokuvan jälkeen. Heillä on myös aika paljon makeita jälkiruokia ja lapsillekin tarjoteta 12 ivätkä ole hyödyllisiä. Ihmisten täytyy syödä mitä paljon vihanneksia ja valitettavasti McDonald's:i 13 tää sen. Täytyy olla kokenut kokki. Tarvitaan liian paljon hiiva ja sitten täytyy odottaa koska "voul- 14 arjalan ihmisillä on nyt kuuma aika: metsässä on paljon erinlaisia sienia ja marjoita, joita täytyy p 15 aulin joutui mennä ulos vain pari minuuttia sitten. Paljon olutta virtasi saunomisen aikana, ja kolm OS:n pilottikorpus
Havaintoja ja hypoteeseja Epätyypillisiä kielenaineisten kotekstuaalisten suhteiden frekvenssejä: - lemmat KAUNIS, PALJON (yliedustuminen) - kollokaatiot KAUNIS <KAUPUNKI, PALJON> (yliedustuminen) - kollokaatiot KAUNIS <NAINEN, TYTTÖ> (aliedustuminen) - kolligaatio KAUPUNKI <prepositio> (aliedustuminen) - semanttinen preferenssi KAUNIS < naispuolinen > (aliedustuminen) - semanttinen preferenssi PALJON < ruoka-aine, nauttia ravinnoksi > (yliedustuminen). Hypoteesi oppijankielen epätyypillisistä - kielenainesten frekvensseistä - kotekstuaalista valintasuhteista ja kotekstuaalisista frekvensseistä.
Kirjallisuus Firth, J. R. 1957. Papers in Linguistics 1934 51. Oxford University Press. Granger, S. 1998. Prefabricated patterns in advanced EFL writing: collocations and formulae. - Cowie A. (toim.) Phraseology: theory, analysis and applications. Oxford University Press. 145-160. Grönholm, M. 2001. Idiomien ja kollokaatioiden oppiminen suomenkielisessä kielikylvyssä. Sulkala, H. & Nissilä, L. (toim.), XXVII Kielitieteen päivät Oulussa 10. 20.5.2000. Suomen ja saamen kielen ja logopedian laitos. Oulun yliopisto. 55 62. Hassselgren, A. 1994. Lexical teddy bears and advanced learners: a study into the ways Norwegian students cope with English vocabulary. International Journal of Applied Linguistics 4 (2). 237 260. Hoey, Michael 1997. From concordance to text structure: new uses for computer corpora. Lewandowska-Tomaszczyk, B Melia, P. (toim.), PALC'97. Applications in Language Corpora Proceedings s. 2 23. Lódz University Press. Jantunen, J. H. 2004. Synonymia ja käännössuomi. Korpusnäkökulma samamerkityksisyyden kontekstuaalisuuteen ja käännöskielen leksikaalisiin erityispiirteisiin. Joensuun yliopiston humanistisia julkaisuja 35. Nesselhauf, N. 2003. The Use of collocations by Advanced Learners of English and Some Implications for Teaching. Applied Linguistics 24 (2). 223 242. Sinclair, J. 1996. The Search for Units of Meaning. Textus IX s. 75 106. Sinclair, J. 1998. The Lexical Item. Weigand, E. (toim.), Contrastive Lexical Semantics. Benjamins, Amsterdam. 1 24. Stubbs, M. 2001. Words and Phrases. Corpus Studies of Lexical Semantics. Blackwell, Oxford.