KORPUSANALYYSI OPPIJANSUOMEN EPÄTYYPILLISISTÄ KONTEKSTUAALISTA RAKENTEISTA



Samankaltaiset tiedostot
Oppijansuomen piirteitä korpusvetoisesti

Corpus-driven Analysis of Learner Finnish

Minulla on aivan paljon rahaa. - Elementtirakenteita kielenopetukseen?

Corpus-driven analysis of cotextual units of meaning in learner language

Haasteita oppijankielen korpusanalyysille: oppijankielen universaalit

AFinLan syyssymposiumi Oulu

11th International Congress for Finno-Ugric Studies

Learner Language, Learner Corpora Oulu

liitettä. Tekijä Tanja Seppälä Työn nimi Oppijansuomen kolligaatit ketjuuntuvissa verbirakenteissa Oppiaine. Työn laji pro gradu

Korpuspohjainen tutkimus ruotsinkielisten suomenoppijoiden paikallissijojen käytöstä kirjallisessa tuotannossa

PALJON-ADVERBIN KOLLOKOINTI OPPIJANSUOMESSA KORPUSVETOINEN TUTKIMUS

Objektiharjoituksia. Harjoitus 2 Tässä on lyhyitä dialogeja. Pane objektit oikeaan muotoon. 1) - Vien... TÄMÄ KIRJE postiin.

Frekventtien adjektiivien kollokaatiot oppijansuomessa ja natiivisuomessa

SANOA-VERBI FRASEOLOGISENA YKSIKKÖNÄ OPPIJANSUOMESSA

SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.

LAUSEEN KIRJOITTAMINEN. Peruslause. aamu - minä - syödä muro - ja - juoda - kuuma kahvi Aamulla minä syön muroja ja juon kuumaa kahvia.

Tallinnan yliopisto. Humanististen tieteiden instituuti. Sanojen nainen ja mies kollokaatiot suomenkielisissä teksteissä

On a blind date with the data: Corpus-driven analysis as a method for studying learner language

Odpowiedzi do ćwiczeń

SAMU ON TYÖSSÄ KOULUSSA. LAPSET JUOKSEVAT METSÄÄN. POJAT TULEVAT KAUPASTA.

VERBI + VERBI - LAUSE. -maan/-mään, -massa/-mässä, -masta/-mästä

Tervetuloa! Mä asun D-rapussa. Mun asunto on sellainen poikamiesboksi.

Preesens, imperfekti ja perfekti

SAADA-verbin fraseologiaa: vertaileva korpustutkimus oppijan- ja natiivisuomesta

LIKIMÄÄRÄN ILMAISIMET NATIIVI- JA OPPIJANSUOMESSA Lekseemien lähes ja melkein vierussanatarkastelu

Yleinen kielitutkinto, keskitaso, harjoituksia /

LAUSESANAT KONJUNKTIOT

Täytyy-lause. Minun täytyy lukea kirja.

Suomi 2A. Tiistai

Laskelmia uudenvuodenpuheista

o l l a käydä Samir kertoo:

Kappale 3. Hyvää ruokahalua!

TUTKIMUS KÄÄNNÖSSUOMESTA JA ASTEMÄÄRITTEIDEN SYNONYMIASTA

FRASEOLOGISET VIRHEET KANSAINVÄLISESSÄ OPPIJAN- SUOMEN KORPUKSESSA

Oppijansuomen kolligaatit ketjuuntuvissa verbirakenteissa

MILLOIN PARTITIIVIA KÄYTETÄÄN? 1. NEGATIIVINEN LAUSE o Minulla ei ole autoa. o Lauralla ei ole työtä. o En osta uutta kännykkää.

AJANILMAISUT AJAN ILMAISUT KOULUTUSKESKUS SALPAUS MODUULI 3

KÄÄNNÖSSUOMI KIELIVARIANTTINA: SYNTAKTISIA JA LEKSIKAALISIA erityispiirteitä

Oppimiskontekstin vaikutus oppijanpragmatiikkaan: astemääritteet leksikaalisina nallekarhuina 1

LAUSETREENEJÄ. Kysymykset:

Kysyminen & vastaaminen (Asking & Answering)

Harjoittele suomea! Suomen kielen perusteita. Vihko 2. Jussi Örn

TÄYTYMISTÄ ILMAISEVIEN MODAALIVERBIEN KOTEKSTI LEHTITEKSTEISSÄ JA INTERNETIN KESKUSTELUPALSTOILLA

TÄSSÄ VÄHÄN KORJAUKSIA Hyvää työtä!

Hei, mulla on nälkä, mennäänkö täältä ravintolaan syömään.

MISSÄ OLET TÖISSÄ? MINKÄLAINEN ON SINUN TAVALLINEN TYÖPÄIVÄ?

Valitse jokaiseen lauseeseen sopiva kysymyssana vastauksen mukaan:

- Kummalla on vaaleammat hiukset? - Villellä on vaaleammat hiukset.

------lmltätieltä Te pu h utte?)

VERBI + TOINEN VERBI = VERBIKETJU

TEE OIKEIN. Minun naapuri on (rikas) kuin minä. Hänellä on (iso) asunto ja (hieno) auto.

Aamupala, välipala, lounas, välipala, päivällinen ja iltapala. * Nämä ruokailut tulisi löytyä urheilijan päivästä Salpa ry, Taitoluistelu

HELPPO KOTIRUOKA. Valmiit ainekset viikon jokaiselle päivälle. Kuudes Kerros

URHEILIJANUOREN RUOKAVALIO

Pane verbi oikeaan muotoon (kolmas infinitiivi).

Synonyymien EHKÄ ja MAHDOLLISESTI kollokaatit ja semanttiset preferenssit

vaikutusta ruotsinkielisten alkeistason suomenoppijoiden kirjallisiin

Kappale 2. Tervetuloa!

HELSINGIN UIMARIT URHEILULLISTEN ELÄMÄNTAPOJEN EDISTÄMINEN SEURASSA

Vnitřní lokální pády statický: inessiv ssa směr od: elativ sta směr do: illativ Vn, -hvn, -seen

OMAT RUOKA-, LIIKUNTA- JA UNITOTTUMUKSET

Nimeni on. Tänään on (pvm). Kellonaika. Haastateltavana on. Haastattelu tapahtuu VSSHP:n lasten ja nuorten oikeuspsykiatrian tutkimusyksikössä.

Viittomisto. Tommi Jantunen, SVKS112,

North2north Winnipeg Kanada

Kappale 3. Hyvää ruokahalua!

KÄYDÄ

Dialogi 1 Luonto ja ympäristö

Esi-kakkosen uutiset Helmikuu 2013

苏 州 (Suzhou)

Syökää porkkanaa! Mikä akka asuu pellossa? Palsternakka. Miksi maanviljelijä ajaa jyrällä perunamaalla? Mikä kaali voi syödä sinut?

TERVEISET TÄÄLTÄ IMATRAN POUTAPILVEN PALVELUKODISTA

Matias magneettitutkimuksessa. Digitaalinen kuvakirja magneettikuvaukseen tulevalle lapselle ja vanhemmille

Omissioilmiöt. Tommi Jantunen, SVKS112,

6. Vastaa kysymyksiin Onko sinulla isoveli? Oletko sinä lyhyt? Minkä väriset hiukset sinulla on? Onko sinulla siniset silmät? Oletko nyt iloinen?

Titta Hänninen

Veikeä vilja, kiva kuitu. Toteutettu osin MMM:n tuella


ERASMUS+ -tapaaminen Italian Bresciassa

Sinivalkoinen jalanjälki. Kampanjatutkimus

Avainsana-analyysi annotoidun oppijankieliaineiston tutkimisessa: Alustavia havaintoja

Juomat Kahvi / tee annos 3,07 Virvokkeet 0,33 l 3,07 Tuoremehu 3,07 Fruitie (mehupohjainen) Smoothie (jogurttipohjainen)

istä satuja saadaan Poika ihmetteli: Miten sadut syntyvät? Mistä satuja saadaan? Mene metsään, pojan isoäiti neuvoi. Etsi satuja metsästä.

Krista Ojutkangas kirjoittaa Virittäjän

Syödään yhdessä - ruokasuositukset lapsiperheille Palveluesimies Päivi Ylönen

Herää joka aamu säännöllisesti samaan aikaan

Elämän kartat -3. koulutustapaaminen-

Miten tutkia lähdekielen vaikutusta oppijankielen universaalina piirteenä?

Koulujen ruokapalveluiden asiakastyytyväisyyskysely Alakoulut

SYNONYMIA JA KÄÄNNÖSSUOMI

Copylefted = saa monistaa ja jakaa vapaasti 1. Käännä omalle kielellesi. Ilolan perhe

C.I.F.P Paseo de los Puentes-kouluvierailu.

1. Koulusi Vastaajien määrä: 33

RAVINTO Matti Lehtonen

SEKALAISIA IMPERFEKTI-TREENEJÄ

Suomen kielessä on 6 verbityyppiä:

VERBI ILMAISEE MYÖNTEISYYTTÄ JA KIELTEISYYTTÄ

Lähisukukielen vaikutus suomen ja viron omaksumiseen: korpuspohjainen tutkimus

SUOMEN KIELESSÄ ON KAKSI ERILAISTA KYSYMYSTYYPPIÄ: Ei, en auta. Ei, minä olen surullinen.

Minun elämäni. Kirjoita 10 lausetta sinun elämästäsi. Voit laittaa myös kuvan. :) SANNA JANUARY 11, 2017

Nominaalit ja verbaalit. Metodinen perusta. Sanaluokkatutkimuksen filosofinen perusta. Tommi Jantunen, SVKS112,

Transkriptio:

KORPUSANALYYSI OPPIJANSUOMEN EPÄTYYPILLISISTÄ KONTEKSTUAALISTA RAKENTEISTA Jarmo H. Jantunen Projekti Korpustutkimus oppijankielen kielikohtaisista ja universaaleista ominaisuuksista http://www.oulu.fi/oppijankieli/ jarmo.jantunen@oulu.fi

KORPUSANALYYSI OPPIJANSUOMEN EPÄTYYPILLISISTÄ KONTEKSTUAALISTA RAKENTEISTA Esitelmän rakenne: Kotekstuaalisia merkityssuhteita ja aiempia havaintoja oppijankielestä Aineisto ja menetelmät Alustavia havaintoja ja hypoteeseja

Lekseemin kotekstuaalisia valintoja Kollokaatio kahden lekseemin välinen suhde (tilastollinen leksikaalinen myötäesiintymä) (mm. Firth 1957, Sinclair 1996, Stubbs 2001) Kolligaatio: lekseemin ja kieliopillisen kategorian (tai lauseaseman) välinen suhde (kieliopillinen myötäesiintymä) (mm. Firth 1957, Hoey 1997, Sinclair 1998) kovin <kieltoverbi>, oikein <ADJ, ADV> (Jantunen 2004) Semanttinen preferenssi: lekseemin ja kotekstissa esiintyvän merkityspiirteen suhde (semanttinen myötäesiintymä) (Sinclair 1996, 1998, Stubbs 2001) oikein < arvo : hyvä, hyvin, mainio, onnistunut> (Jantunen 2004)

Aiempia kotekstianalyyseja (kollokaationalyyseja) Hasselgren 1994: kielenoppijat tekevät virheellisiä adverbi verbi-kollokaatioita (yleisimpien adverbien yliedustuminen) apologize <very (much)> vrt. apologize <sincerely, a lot> Nesselhauf 2003: verbi nomini-kollokaatioiden virheet film <take> vrt. film <make> Granger 1998: edistyneitten kielenoppijoiden kollokaatiovirheet Grönholm mm. 2001: kielikylpyoppilaiden kollokaatiovirheet

Aineisto Kansainvälisen oppijansuomen korpuksen pilottikorpus (OS-aineisto) 41 200 sanetta 211 tekstiä tekstilajit: hakemus, päiväkirja, kirje, postikortti, raportti, vastine, tiivistelmä... tuottotapa: yksilötuotos (191), pari/ryhmätuotos (20) äidinkielet: ruotsi 56, venäjä 20, saksa 16, japani 11 (yhteensä 19 eri äidinkieltä) Vertailuaineistot: Supisuomen korpus (Käännössuomen korpuksen osakorpus, 3,8 milj. sanetta, Mauranen 2000) (NS1) Kielipankki (Kaleva, 9,8 milj. sanetta) (NS2)

Metodi Kuvaileva korpusvetoinen analyysi (corpus/data-driven, Tognini-Bonelli 1996) Tutkija antaa aineiston johdattaa mahdollisesti mielenkiintoisten kielenainesten pariin, niiden avulla testataan hypoteesia tai luodaan uusia hypoteeseja. Löydöksiä ei pidetä virheinä. Frekvenssianalyysi Avainsana-analyysi Kotekstianalyysi WordSmith Tools -ohjelmapaketti (Wordlist, Keywords, Concord; Scott 1999), Lemmie 2.0 (CSC)

Avainsana-analyysi N Sananmuoto F / OS-aineisto F / NS1-aineisto Avainsana-arvo 1 TIMO 130 114 843,9 2 OLEN 275 3 831 558,5 3 ON 1 316 62 632 466,5 4 PALJON 222 3 261 431.6 5 HE 262 5 858 338,5 6 KELLO 86 435 322,2 7 MINÄ 377 11 728 312,3 8 KOSKA 205 3 981 308,2 9 OSTAISIN 34 6 274,5 10 OULU 39 24 270,3 11 MINUN 187 4 026 251,9 12 SYÖN 37 29 245,5 13 TÄNÄÄN 74 495 241,7 14 SIRKKA 38 45 230,9 15 KOTIIN 90 973 220,3 16 MENEN 53 212 219,8 17 KUVASSA 49 164 217,9 18 SÖIN 38 61 213,9 19 SAVONLINNASSA 27 6 213,6 20 YLIOPISTOSSA 37 68 200,6

PALJON-LEMMAN KOLLOKAATIOT OS-aineisto (kaikki tilastollisesti merkitsevät) SE, SUOMI, PITÄÄ, RUOKA, KOSKA, RAHA, OPISKELLA, TEHDÄ, ESIMERKIKSI, JO, KALA, SUOMI, USEIN, AINA, KÄYTTÄÄ, VIHREÄ, ERI, ERI, LAULAA, LAULAA, IHMINEN, IHMINEN, JUODA, JUODA, SAVONLINNA, SAVONLINNA, TIETÄÄ, TIETÄÄ, JOS, JOS OSTAA, NIIN, LIIAN, PUHUA, KUIN, TÄÄLLÄ, OPPIA NS2-aineisto (30 merkitsevintä) NIIN, KUIN, KUINKA, YHTÄ, KOVIN, PUHUA, MAHDOLLISIMMAN, LIIAN, RAHA, MITEN, TODELLA, RIIPPUA, YLLÄTTÄVÄN, VÄKI, SIELLÄ, TÄÄLLÄ ERITTÄIN, POIKKEUKSELLISEN, LIIKKUA, OPPIA, POIKETA, HERÄTTÄÄ, VAIHDELLA, TEKEMINEN, ERITYISEN, MELKO, TURHAN, HELPPO, SISÄLTÄÄ, JULKISUUS Kolligaatio PALJON <astemäärite> aliedustunut oppijankielessä

et... olivat isossa juhlassa, joivat koko yön oikein paljon. Tänään tämä mies heräsi kello yhdeltä. keskustaan ja päättivät istua kahvilassa ja juoda paljon kahvia. Kesällä kaupungiin keskustassa teatterissa. P.P. Viime lauvantaina yöllä joimme paljon kosken korvaa, se on kiva! Moi Moi! järvessä joka illalla söimme makkara. Joimme paljon olutta. Viime lauvantaina illalla uimme j tarjosivat olutta. Onneksi Adam ei joi liian paljon ja ei minua. Kiinalaiset eivät puhu aulin joutui mennä ulos vain pari minuuttia sitten. Paljon olutta virtasi saunomisen aikana, ja kolm ivätkä ole hyödyllisiä. Ihmisten täytyy syödä mitä paljon vihanneksia ja valitettavasti McDonald's:i rkiksi dallaspullia. Yleensä Suomessa syödään paljon terveellisemmin kuin Amerikassa. Suomess vä, he menevät kalastamaan järvellä, ja Raija syö paljon kalaa. Koska hän syö ainaa kalaa, hanes ssa Timo tilasi ruoka mutta hän ei syönyt paljon. Minä täydyn löytää hänet Timo Lle ja sukeltaisin ja katsoisin kalat. Söisin paljon tuoretta hedelmiä. Ostaisin markkinasta Lauantaina hyvä seisova pöytää. Minä söin paljon pizzaa. Siellä oli pastaa, pizzaa, kanaa ja salaatia Ltornit! Se on suuri ja vaikuttava. Söimme paljon hyvää ruokaa, esimerkiksi juustotorttu ja patonget -Villelle ruuat, mutta onneksi hän tykkäsi paljon niistä. Me syötiin raakoja kaloja, katkarapuja Otta. Annani luota söimme täytekakkua, paljon täytekakkua. Sitten menin kotiin. Itoa ranskaa kahvilaa. Hurjan hyvin! Söin paljon lehteväjä voisarvia. Tänään on k kuppia Colan kanssa, BigMac. McDonaldissa on paljon ruoka, joka ei ole terve. McDonalin ruokalista maistuvaa ruokaa. Siksi että minä pidä tosi paljon kiinalaista ruokaa. Thaimaassa minä nauttisin N että minun matakani Aasiassa sisältäisi paljon hyvää maistuvaa ruokaa. Siksi että Semanttinen preferenssi Kuuta Jouluaatto oli hauskaa ja mukava. Paljon roukaa, paljon pakettia, paljon naurua! hänen onkinsa ja alkoi kalastaa. Koska se ei ole paljon kaloja tällä paikalla, se kesti ihan kauan s) telivat, että he laittivat kalaruoka, koska heillä oli paljon kalaa. He kuitenkin huomasivat, että he u PALJON <'syöminen, juominen, ruoka, erilaisia kuvia. Kuvissa ovat eläimiä (esim.poro), paljon kaloja. Yksi kuvassa on gallerin ohjelma: ) än vaimo juoma > on maailman kuuluisia kalastaja ja liian paljon muikkuja on paistettu. Oliivin öljyä tuli It :issa kivan elokuvan jälkeen. Heillä on myös aika paljon makeita jälkiruokia ja lapsillekin tarjoteta ää sen. Täytyy olla kokenut kokki. Tarvitaan liian paljon hiiva ja sitten täytyy odottaa koska "voul-au-vent arjalan ihmisillä OS-aineisto on nyt kuuma aika: 14,0 metsässä %, on paljon NS1-aineisto erinlaisia sienia ja marjoita, 3,4 % joita täytyy p mutta kummallinen. Kauppoissa ostin paljon suomen levyitä, jogurtteja ja san Huomaan aina, että Suomessa ei ole niin paljon eri amerikkalaisia roskaruoka-ketjuja

Alustavia havaintoja ja hypoteeseja Epätyypillisiä kielenaineisten kotekstuaalisia suhteita ja frekvenssejä oppijansuomessa: - lemma PALJON (yliedustunut) - kollokaatiot PALJON <SE, SUOMI, PITÄÄ RUOKA, KOSKA, RAHA, OPISKELLA, TEHDÄ, ESIMERKIKSI, JO, KALA, SUOMI, USEIN, AINA, KÄYTTÄÄ, VIHREÄ, ERI, LAULAA, IHMINEN, JUODA, SAVONLINNA, TIETÄÄ, JOS> (yliedustuneet) - kolligaatio PALJON <astemäärite> (aliedustunut) - semanttinen preferenssi PALJON <'nauttia ravinnoksi, ravintoaine > (yliedustunut) Hypoteeseja oppijankielestä: - oppijankielessä on epätyypillisiä kielenainesten frekvenssejä - oppijankielessä on epätyypillisiä kotekstuaalisten valintasuhteiden frekvenssejä - oppijankielessä on epätyypillisiä kotekstuaalisia rakenteita - myös muita kuin kollokaatioita - epätyypilliset kotekstuaaliset rakenteet ovat tunnusomaisia oppijankielelle oletus oppijankielen universaalista piirteestä

Lähteet Firth, J. R. 1957. Papers in Linguistics 1934 51. Oxford University Press. Granger, S. 1998. Prefabricated patterns in advanced EFL writing: collocations and formulae. - Cowie A. (toim.) Phraseology: theory, analysis and applications. Oxford University Press. 145-160. Grönholm, M. 2001. Idiomien ja kollokaatioiden oppiminen suomenkielisessä kielikylvyssä. Sulkala, H. & Nissilä, L. (toim.), XXVII Kielitieteen päivät Oulussa 10. 20.5.2000. Suomen ja saamen kielen ja logopedian laitos. Oulun yliopisto. 55 62. Hassselgren, A. 1994. Lexical teddy bears and advanced learners: a study into the ways Norwegian students cope with English vocabulary. International Journal of Applied Linguistics 4 (2). 237 260. Hoey, Michael 1997. From concordance to text structure: new uses for computer corpora. Lewandowska-Tomaszczyk, B Melia, P. (toim.), PALC'97. Applications in Language Corpora Proceedings s. 2 23. Lódz University Press. Jantunen, J. H. 2004. Synonymia ja käännössuomi. Korpusnäkökulma samamerkityksisyyden kontekstuaalisuuteen ja käännöskielen leksikaalisiin erityispiirteisiin. Joensuun yliopiston humanistisia julkaisuja 35. Nesselhauf, N. 2003. The Use of collocations by Advanced Learners of English and Some Implications for Teaching. Applied Linguistics 24 (2). 223 242. Sinclair, J. 1996. The Search for Units of Meaning. Textus IX s. 75 106. Sinclair, J. 1998. The Lexical Item. Weigand, E. (toim.), Contrastive Lexical Semantics. Benjamins, Amsterdam. 1 24. Stubbs, M. 2001. Words and Phrases. Corpus Studies of Lexical Semantics. Blackwell, Oxford.