Englannin kielen tutkimusta tietokoneiden aikaan



Samankaltaiset tiedostot
Englanti maailmankieli

Helpon suomen alkeet. Miten puhua niin, että kielenoppijakin ymmärtää? Salla Kurhila & Taija Udd, Suomen kieli ja kulttuuri, Helsingin yliopisto

TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN

Ketkä muuttivat kieltä? Englannin historiallista sosiolingvistiikkaa

Politiikka-asiakirjojen retoriikan ja diskurssien analyysi

Suomen kielen variaatio 1. Puhuttu ja kirjoitettu kieli Suomen puhekielen vaihtelu

Puhutun ja kirjoitetun rajalla

Sisällönanalyysi. Sisältö

4. Lausekielinen ohjelmointi 4.1

Mitä on tutkimus ja tutkijan työ? Luonnonvarakeskus

SOSIAALITYÖN TUKEMASSA SOSIAALITYÖTÄ. Rovaniemi AN 1

Kieli ja viestinnän kokonaisuus

Teoreettisen viitekehyksen rakentaminen

KIELITIETEEN ELEKTRONINEN SANAST0: Hankkeen esittelyä. Sirpa Leppänen Jyväskylän yliopisto Kielten laitos/ englanti

Alkukartoitus Opiskeluvalmiudet

Aino Kääriäinen Aino Kääriäinen yliopistonlehtori Helsingin yliopisto

Mittariston laatiminen laatutyöhön

Suomen kielen Osaamispyörä -työkalu

Laajennettu tiedonkäsitys ja tiedon erilaiset muodot

Mitä on laadullinen tutkimus? Pertti Alasuutari Tampereen yliopisto

Kielellisen datan käsittely ja analyysi tutkimuksessa

Aino Kääriäinen yliopistonlehtori Helsingin yliopisto

Esko Korpilinna ja ketsua. Esitys Ruutiukoissa Matti Kataja

Tieteiden välinen kommunikaatio oikeus- ja yhteiskuntatieteiden välillä

Onko empiirinen käänne vain empirian kääntötakki?

Humanistiset tieteet

Tieteellisen artikkelin kirjoittaminen ja julkaiseminen

TUTKIMUSOTTEITA TIEDONINTRESSIN NÄKÖKULMA

ervetuloa Puistolan oulujen ielivalintailtaan staina luokkalaiset

Yleisen kielitieteen opetus

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Jatko-opintoja englannista kiinnostuneille

Kääntämisen sisäkkäiset etenevät ympyrät

Kommunikaatio ja vuorovaikutus

TYÖPAJA 3. SAMAUTTAMINEN VUOROVAIKUTUKSESSA KEVÄT 2015

1 Kannat ja kannanvaihto

PUHU MINULLE KUUNTELE MINUA

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

How to prepare for the 7th grade entrance exam? Kuinka lukea englannin linjan soveltuvuuskokeisiin?

Pro gradu -tutkielmien arvostelu maantieteessä

HAVAINTO LÄhde: Vilkka 2006, Tutki ja havainnoi. Helsinki: Tammi.

Kielen muuttumisesta, muutosten seuraamisesta ja muutosten tarkastelussa käytettävistä menetelmistä

Yliopistonlehtori, dosentti

MIKSI TUKIVIITTOMAT?

KOTOUTUMISKOULUTUS VERKOSSA. Tavoitteet

Vammaispalvelujen valtakunnallinen kehittämishanke 2. Etelä-Pohjanmaan ja Pohjanmaan osahanke. Voimavaralähtöisyys ja kuvat palvelusuunnittelussa

VETY-hanke. Vapaaehtoistyö yleishyödyllisessä yhteisössä. Vapaaehtoistoiminnan kulujen ja hyötyjen laskeminen. Jenni Sademies,

Eväspussi. Onko lähipiirissä esiintynyt hitautta tai vaikeutta lukemaan ja kirjoittamaan oppimisessa? Millaista?

Yhdyssana suomen kielessä ja puheessa

MAAHANMUUTTAJIEN ÄIDINKIELI MANDARIINIKIINAN KIELEN OPETUKSEN SUUNNITELMA 2006

Äidinkielen ja kirjallisuuden vuosiluokaton opetussuunnitelma

FT Henna Makkonen-Craig Äidinkielen ja kirjallisuuden opetuksen foorumi

Kirjastojen verkkoaineistoja opetukseen

KERHOPAKETIN OHJELMA JA TAVOITTEET ( ARABIAN KIELI )

7.LUOKKA. Tavoitteisiin liittyvät sisältöalueet. Laaja-alainen osaaminen. Opetuksen tavoitteet

Kirjastojen verkkoaineistoja opetukseen

Selkokeskus Selkoa selkokielestä Kuka sitä tarvitsee? Mitä se on?

Useasti Kysyttyä ja Vastattua

Englanti A1 kieli vuosiluokilla 7 9

Pikapaketti logiikkaan

Keravan kaupungin lukiokoulutuksen kieliesite

Alberta Language and Development Questionnaire (ALDeQ) A. Varhaiskehitys Lapsen nimi

Säädöskieli ja ymmärrettävyys, harmaita alueita

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Luova opettaja, luova oppilas matematiikan tunneilla

LOGIIKKA johdantoa

KORKEAKOULUJEN MAHDOLLISUUDET JA HAASTEET MAAHANMUUTTAJIEN VALMENTAVASSA KOULUTUKSESSA

Oppilas pystyy nimeämään englannin kielen lisäksi myös muita vieraita kieliä niitä kohdatessaan.

Teorian ja käytännön suhde

Opiskelijan lähtötason arviointi. Testipiste / Janne Laitinen ja Eveliina Sirkeinen Osallisena arvioinnissa , Helsinki

Osallisuuden taitojen harjoittelua yhteisöllisesti kirjoittamalla. Anne Jyrkiäinen ja Kirsi-Liisa Koskinen-Sinisalo Tampereen yliopisto

Tavoitteet Sisällöt Arvioinnin kohteet oppiaineissa ja hyvän osaamisen kuvaus

Liite A: Kyselylomake

Mauno Rahikainen

Opettaja yhteiskunnallisena ja kulttuurivaikuttajana

Englanti. 3. luokan keskeiset tavoitteet

Laadullisen tutkimuksen piirteitä

Aineistot ja kenttä tänään

MUISTIYSTÄVÄLLISEN YMPÄRISTÖN PIKAOPAS

Rahoittajat ja tiedon julkisuus. Pirjo Hiidenmaa Suomen Akatemia

Kieli merkitys ja logiikka. 4: Luovuus, assosiationismi. Luovuus ja assosiationismi. Kielen luovuus. Descartes ja dualismi

ISO SUOMEN KIELIOPPI S2- OPETUKSESSA. Muutama havainto

Kieli ja työelämä Marjut Johansson & Riitta Pyykkö

Monikielisen viestinnän ja käännöstieteen syventävien opintojen vastaavuustaulukko

Kandidaatintutkielman arviointikriteerit

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

Tommi Nieminen. 35. Kielitieteen päivät Vaasa

Kieltä ja kulttuuria

LAADULLISEN TUTKIMUKSEN OMINAISLAATU

Ilmaisun monet muodot

SOSIAALIPOLITIIKKA & INTERSEKTIONAALISUUS MARIA OHISALO, YT T, TUTKIJA, Y -SÄÄTIÖ

Kielenhuolto ja sen tarvitsema tutkimus muuttuvassa yhteiskunnassa. Salli Kankaanpää AFinLAn syyssymposiumi

Juliet-ohjelma: monipuolisia osaajia alaluokkien englannin opetukseen

Kielten rikas maailma jo ennen sanoja Kielen oppimisen varhaisvaiheet, tuen tarpeen tunnistaminen ja tukemisen keinot

Ylöjärven opetussuunnitelma Valinnainen kieli (B2)

Osallisuuden ja kokemuksen prosessointia tehtävän avulla

Kohti onnistuneempia asiakastilanteita. Sähköinen versio löytyy

KASVATETTAVAN OSALLISTAMINEN JA KASVUN ARVIOINTI

Yhdistyspäivä

Ytimenä validaatio. Irmeli Kauppi, sh, TunteVa-kouluttaja

Transkriptio:

nglannin kielen tutkimusta tietokoneiden aikaan Matti Rissanen ietokonekorpukset ovat mullistaneet etenkin kielen varhaisten vaiheiden tutkimuksen. Korpusten tukema kielen vaihteluun perustuva muutosteoria on myös yhdistänyt nykykielen ja kielihistorian tutkimuksen. nnen kaikkea aikaisemmin jopa vuosia vienyt esimerkkiaineiston kerääminen ja kirjaaminen voidaan korpusten avulla suorittaa murto-osassa tästä ajasta. On kuitenkin muistettava, että kielentutkijalle korpukset tarjoavat vain tehokkaan menetelmän tutkimusaineiston tallennukseen sekä kielen lukemattomia ilmaisuja valaisevien esimerkkien poimimiseen sekä laadulliseen ja määrälliseen luokitteluun. ineiston analysointi, tulosten merkityksen havainnointi ja osoittaminen, yleistysten ja teorian kehittely on edelleen tutkijan aivotyön varassa. Viimeisen puolen vuosisadan aikana on kielentutkimuksessa tapahtunut kaksi merkittävää mullistusta. nsimmäinen niistä oli amerikkalaisen, poliittisena kannanottajanakin nimeä saavuttaneen Noam Chomskyn 1950-luvulla kehittelemä transformatiivis-generatiivinen kielioppi, joka siirsi kielen selityksen ja analyysin vahvasti abstraktille tasolle. ämä teoria oli tärkeä kielen systemaattisen kuvauksen kannalta, mutta se ei kiinnittänyt riittävästi huomiota kielen perusluonteeseen kommunikaation välineenä, jonka tarkoitus on välittää viestejä, tietoa ja tunteita ja pitää yllä yhteyttä ihmisten kesken. Kielen perusolemusta ei voi ymmärtää ymmärtämättä ihmistä, ja tätä ei transformaatiokielioppi korostanut kylliksi. Jo seuraavalla vuosikymmenellä alkoi kehittyä toinen voimakas kielen selitysmalli ja teoria vastapainoksi kielen kommunikaatioluonteen unohtaneelle suuntaukselle. Malli perustuu kielen vaihtelevuuteen, variaatioon, ja se tarkastelee kieltä monimuotoisena kokonaisuutena, ihmisten keskinäisen kommunikaation välineenä. lmaisuvaihtoehtojen usein tiedostamatonta valintaa säätelevät mitä moninaisimmat sosiaaliset, alueelliset sekä viestin tarkoitukseen ja viestintätilanteeseen liittyvät seikat. Vaihtoehdot näkyvät tietenkin luontevimmin sanastossa, mutta ne näyttelevät tärkeää osaa myös kieliopin rakenteissa ja ääntämisessä, ja jopa yleisten tekstistrategioiden valinnassa. ämän vaihtelun johdosta kieli muuttuu jatkuvasti eilen, tänään ja huomenna. Jotkin ilmaisuvariantit katoavat ja uusia syntyy koko ajan, joskin muutokset ovat yleensä helpoimmin havaittavissa joidenkin varianttien yleistymisenä ja toisten käytön vähenemisenä. Muutosta ei siis pidä mieltää pölyiseksi ja epäkiinnostavaksi menneisyyden ilmiöksi, vaan jännittäväksi jatkuvaksi tapahtumaksi, jonka keskellä elämme, ja josta meidän on syytä olla koko ajan tietoisia. Vaihtelun aiheuttajia jatus kielen vaihtelusta ja vaihteluun perustuvasta muutoksesta ei tietenkään ole uusi; jo vuosisatojen ajan on huomattu, että eri ihmiset puhuvat samaa kieltä eri tavoin, ja että joidenkin ihmisten ja ihmisryhmien käyttämä kieli tuottaa muutoksia enemmän kuin toisten. eoreettiseksi rakennelmaksi tämä tutkimuslähtökohta hahmottui kuitenkin vasta 1960- ja 1970-lukujen taitteessa. eorioiden kehittäjistä huomattavimpia olivat amerikkalaiset riel Weinreich, William Labov ja Marvin. erzog sekä nykyisin ustraliassa vaikuttava M.. K. alliday. allidayn mukaan kielen perustana on merkityspotentiaali, lukematon määrä merkityksiä. Kutakin merkitystä voidaan ilmaista suurella joukolla kielellisiä ilmaisuvaihtoehtoja, variantteja. uurin piirtein samaa merkitsevät ilmaisuvaihtoehdot voidaan ryhmittää varianttikentik- 19 Ä 5/2004

Ä 20 si. Varianttikenttien sisällä ilmaisuvaihtoehdon valintaan vaikuttavat monet eri tekijät, joiden kartoittaminen ja selittäminen on kielentutkijan tärkeimpiä tehtäviä. äysin kattavan ja aukottoman kuvauksen laatiminen näistä tekijöistä olisi luonnollisesti ylivoimainen tehtävä, mutta yleisiä suuntaviivoja ja tekijäkimppuja on melko helppo määritellä ja rajata. simerkiksi seuraavat tarkastelun kohteet ovat keskeisiä variaatiotutkimukselle: lueellinen vaihtelu aikallismurteet- aikallismurteet Brittienglanti, amerikanenglanti jne.- Brittienglanti, amerikanenglanti jne. osiolingvistinen vaihtelu uhujan ja kuulijan välinen suhde- uhujan ja kuulijan välinen suhde uhujan sosiaalinen asema, koulutus jne.- uhujan sosiaalinen asema, koulutus jne. ekstilajin aiheuttama vaihtelu ieteen kieli, sanomalehtikieli, yksityiskirjeet, reseptit, käyttöohjeet jne.- ieteen kieli, sanomalehtikieli, yksityiskirjeet, reseptit, käyttöohjeet jne. uhuttu kieli / kirjoitettu kieli aikallismurteet ovat kaikkien tuntema selitys sille, miksi samankin kielen puhujat voivat käytellä kieltä varsin eri tavoin. jatellaanpa vaikka kotimurrettaan puhuvaa savolaista, hämäläistä tai varsinaissuomalaista. nglannin kielen alueelliseen variaatioon kuuluvat tietenkin myös eri puolilla maailmaa puhutut englannit: son Britannian ja Yhdysvaltain lisäksi vaikkapa ustraliassa, Kanadassa tai telä-frikassa käytetyt kielivarieteetit (ks. Nevalaisen ja ahdan artikkelit tässä lehdessä). osiolingvistinen vaihtelu on paljon monitahoisempi asia (ks. Raumolin-Brunbergin artikkeli tässä lehdessä). ämän vaihtelun piiriin kuuluu muun muassa puhujan ja kuulijan välinen suhde, joka määräytyy esimerkiksi heidän sosiaalisesta asemastaan tai siitä, kuinka hyvin he tuntevat toisensa; todennäköisesti puhumme tai kirjoitamme esimerkiksi tasavallan presidentille aivan eri tapaan kuin kollegoille tai perheenjäsenille. Myös tekstilajin ja viestintätilanteen aiheuttama variaatio on voimakas ja monitahoinen vaihtelutekijä. ieteen kielellä on oma erityinen ilmaisutapansa (ks. aavitsaisen artikkeli tässä lehdessä). anomalehdillä on oma tyylinsä, samoin resepteillä ja käyttöohjeilla, puhumattakaan yksityiskirjeistä ja erilaisista kaunokirjallisista teksteistä. On myös muistettava, että kirjoitettu kieli eroaa monessa suhteessa puhutusta kielestä. dellä mainittujen seikkojen lisäksi ei tietenkään pidä unohtaa myöskään sitä, että meillä jokaisella on oma yksilöllinen tapamme ilmaista itseämme. oiset puhuvat ja kirjoittavat selkeän asiallisesti ja niukkasanaisesti välttäen korostuksia; toisten kieli taas on värikästä, painokasta, kuvailmaisuja viljelevää. Lisäksi ihmisten kyky ja taito hallita useita eri ilmaisun tasoja, rekistereitä, vaihtelee suuresti esimerkiksi perhetaustasta ja koulutuksesta riippuen. Vaihtelusta muutokseen hkä jo edellä esitetystä suppeasta ja väistämättä ylimalkaisesta hahmottelusta voi päätellä, että vaihteluun perustuva kielentutkimus on monitahoista ja tieteidenvälisyyttä edellyttävää työtä. Mutta vielä haastavammaksi se muuttuu, kun siihen liitetään kielen muutoksen tutkimus. Variaatioteorian keskeisiä teemoja on, että kieli muuttuu suureksi osaksi vaihtelun perusteella. ikaisemmin muutoksen kuvaustapa oli suunnilleen tällainen: > B Jokin kielen ilmaisutapa siis muuttuu toiseksi, ja sillä hyvä. ieman karrikoiden voidaan lisätä, että jos tällaisen mallin esittäjältä erehtyi kysymään, mistä sitten johtui, että muuttui B: ksi, saattoi tämä vastata: Koska on sääntö, että :sta tulee B. ämä muutoksen kuvaus on tietenkin selkeä ja saattaa palvella riittävästi jonkinasteisia teoreettisia ajatusrakennelmia kielen muutoksesta. en vikana on kuitenkin, että se antaa puutteellisen kuvan kielen muutoksen todellisuudesta ja siihen vaikuttavista tekijöistä. Jos halutaan havainnollistaa muuttuvaa ilmaisua isoin kirjaimin, lähempänä kielen todellisuutta on seuraavanlainen kuvaustapa: B B B B B C B C Ä 5/2004

oisin sanoen kielen muutos ei suinkaan aina tai edes useimmiten merkitse sitä, että jokin ilmaisuvaihtoehto katoaa ja toinen tulee tilalle, vaan paljon useammin ja tyypillisemmin muutoksia varianttikentän ilmaisuvaihtoehtojen yleisyydessä ja keskinäisissä suhteissa. : sta ei siis tule B, vaan ilmaisutapa, joka on ollut yleisin varhaisempana aikana, menettää asemaansa suunnilleen samaa merkitsevälle ilmaisulle B, ja jostakin ilmestyy uusi vaihtoehto C. Väistyvät variantit leimautuvat usein tyylillisesti vanhanaikaisiksi, juhlallisiksi tai vain erikoistilanteisiin sopiviksi. Vähitellen ne saattavat tietenkin kadota kokonaan mutta usein vasta pitkän prosessin seurauksena. Kielen muutoksen tutkija pyrkii selvittämään, mitkä tekijät vaikuttavat varianttikentän yllä kuvattuun muutokseen, aivan samoin kuin hän vaihtelua tutkiessaan kysyy, mitkä tekijät vaikuttavat tietyn ilmaisuvaihtoehdon valintaan. ällöin tutkimuksen monitieteisyys korostuu. Muuttuva yhteiskunta, esimerkiksi agraarisesta teollistuneeksi, luokkarajojen syntyminen ja katoaminen, tieteen ja kaunokirjallisuuden kehityslinjat, eri kielten ja murteiden puhujien liikkuvuus ja uudet kontaktit vaikuttavat monien muiden tekijöiden ohella sanojen ja rakenteiden syntymiseen ja vanhojen väistymiseen. Kielen ilmaisut muuttuvat jatkuvasti myös niin kutsuttujen kielensisäisten muutosprosessien johdosta. Meidän puheemme on, jälleen yksinkertaistaen, jatkuvaa tasapainoilua pienimmän ponnistelun ja ymmärretyksi tulemisen tavoitteiden välillä tenkin puhuessamme yritämme lyhentää ja yksinkertaistaa ilmaisuamme erityisesti ääntämisen mutta myös kieliopin tasolla. anomme mieluummin tuu kun tule ja mennään kuin menkäämme tai me menemme. amalla kertaa meidän on kuitenkin huolehdittava siitä, ettei puheemme muutu täysin käsittämättömäksi muminaksi, etteivät tärkeät merkityserot katoa, ja että myös ilmaisun persoonallisuus ja ilmeikkyys ainakin jossakin määrin säilyvät. oistensa kanssa kilpailevia ilmaisuvaihtoehtoja syntyy myös tällä tavoin, ja esimerkiksi puhetilanteen muodollisuuden taso ja puhujien sosiaaliset erot vaikuttavat merkittävästi kielensisäisten muutosprosessien aiheuttamaan vaihteluun. ietokone kielentutkijan apuna Kielen vaihtelun tutkimus vaatii luonnollisesti suurten tekstimäärien hallintaa. simerkkejä ilmaisuvaihtoehdoista on löydettävä runsaasti, jotta voitaisiin tehdä edes kohtuullisen luotettavia päätelmiä niiden yleisyydestä, keskinäisistä suhteista ja ennen kaikkea niiden valintaan vaikuttavista tekijöistä. Kielen muutosta tutkittaessa tekstimateriaalin runsauden vaatimus yhä vain kasvaa. Vaihtelua on kartoitettava toisiaan seuraavina aikakausina muutoksen seuraamiseksi ja havaitsemiseksi. Lisäksi kirjoitetut tekstit ovat ainoa tapa saada ensikäden tietoa menneiden vuosisatojen tai jopa vuosituhansien kielestä. nglanninkielisiä tekstejä on kirjoitettu lähes puolentoista vuosituhannen ajan, klassillisten kielten kohdalla aikajänne on tietenkin vielä paljon pitempi. ietokoneteknologia on jo muutaman vuosikymmenen ajan tarjonnut korvaamatonta tukea kielentutkijalle tekstien tallennuksessa sekä esimerkkien etsinnässä ja analysoinnissa. On luotu niin kutsuttuja tietokonekorpuksia, laajoja elektronisesti tallennettuja tekstikokoelmia, joiden tekstit on huolellisesti valikoitu ja järjestetty siten, että ne antavat joko hyvän yleiskuvan kielestä tai keskitetyn kartoituksen jostakin kielen alueesta, kuten yksityiskirjeistä, tieteen kielestä tai murteista. Korpuksia on koottu sekä nykyenglannista että englannin kielen varhaisemmista vaiheista. uurimmat nykyenglannin korpukset käsittävät satoja miljoonia sanoja; pienimmät, kohdennetut korpukset voivat olla muutaman sadan tuhannen sanan suuruisia. Nykyenglannin korpukset kattavat myös alueellisia varieteetteja (britti- ja amerikanenglantia, ustralian englantia, tä-frikan englantia, ntian englantia, uden eelannin englantia ja niin edelleen). Nykyenglannin korpuksia British National Corpus (n. 100 milj. sanaa) Bank of nglish (n. 320 milj. sanaa) Brown Corpus (amer.engl. 1960-luv. 1 milj. sanaa) Frown Corpus (amer. engl. 1990-luv. milj. sanaa) LOB Corpus (brittiengl. 1960-luv. 1 milj. sanaa) FLOB Corpus (brittiengl. 1990-luv. 1 milj. sanaa) nternational Corpus of nglish (C) (1 milj. sanaa/ korpus) - ast frica - Great Britain - ndia - New Zealand - hilippines - ingapore 21 Ä 5/2004

Ä 22 Myös internetiä on alettu käyttää systemaattisesti englannin korpuspohjaisessa tutkimuksessa. nglannin kielen korpuksia elsingin yliopiston englannin kielen laitoksen yhteydessä toimiva nglannin kielen vaihtelun ja muutoksen tutkimusyksikkö sai alkunsa 1980- luvulla tutkimusprojektina, jonka tuloksena valmistui 1990-luvun alussa elsingin korpus, he elsinki Corpus of nglish exts. en laadintaan osallistuivat muun muassa kaikki tämän numeron anglistiartikkeleiden kirjoittajat sekä useat muut englannin kielen laitoksen nuoret ja varttuneet tutkijat. rojektiryhmän sihteeri oli nykyisin ppsalan yliopiston professorina toimiva Merja Kytö. elsingin korpus oli ensimmäinen yritys kartoittaa englannin kielen menneisyys monipuolisen tekstivalikoiman muodossa pitkällä aikakaarella, 700-luvulta 1700-luvun alkuun, ja se on yhä käytössä sadoissa yliopistoissa ja tutkimuskeskuksissa eri puolilla maailmaa. eruskorpuksen valmistuttua alkoi 1990- luvulla syntyä toisen sukupolven korpuksia, kuten nneli Meurman-olinin kokoama varhaisen skotin korpus, erttu Nevalaisen ja elena Raumolin-Brunbergin ryhmän kokoama varhaisten yksityiskirjeiden korpus (ks. Raumolin-Brunbergin artikkeli tässä numerossa) ja rma aavitsaisen ja äivi ahdan ryhmän lääketieteen englannin korpus (ks. aavitsaisen artikkeli). Loppusuoralla on myös brittienglannin nykymurteiden korpusprojekti, jonka edesmennyt professori auno F. Mustanoja aloitti jo 1970-luvulla, ja jota on viime vuodet johtanut dosentti Kirsti eitsara. ämän vuosikymmenen puolella on aloitettu myös kolmannen sukupolven tarkoin kohdennettujen historiallisten korpusten laadinta. utkimusyksikkömme nuorten jäsenten valmisteilla olevista korpuksista voidaan mainita varhaisten kasvitieteellisten tekstien korpus (Martti Mäkinen), 1700-luvun kirjeitä sisältävä Bluestocking Corpus (nni airio), seuraavalla vuosisadalla eläneiden köyhien ihmisten kirjeiden korpus (Mikko Laitinen) sekä 1500- ja 1600-luvuilla kirjoitettujen noitapamflettien korpus (Carla uhr) ja tupakkapamflettien korpus (Maura Ratia). Kansainvälisiä yhteistyöprojekteja ovat 1600-luvun lopun utta nglantia kuohuttaneiden alemin noitavaino -oikeudenkäyntien dokumenttien korpus sekä 1600-luvulta meidän päiviimme ulottuva brittiläisten ja amerikkalaisten tekstien yleiskorpus, joka jatkaa elsingin korpuksen aikajännettä. Luonnollisesti myös muualla maailmassa laaditaan suuria ja kunnianhimoisia historiallisia korpuksia. nglannin kielen varhaisimmista vaiheista on sanakirjaprojektien yhteydessä kerätty valtavia tekstitiedostoja, joskin ne ovat juuri koostaan johtuen vähemmän organisoituja ja strukturoituja kuin elsingin korpus. delleen esimerkiksi kaikki hakespearen näytelmät on koottu korpukseksi, ja kaupallisten tietopankkien puolelta löytyy erittäin suuri määrä kaunokirjallisia tekstejä, etunenässä edustava mutta kallis LON, eli Literature Online. nsimmäiset nykyenglannin ja englannin kielen historian korpukset eivät vielä käyttäneet kovinkaan paljon hyväkseen kaikkia tietokonetekniikan mukanaan tuomia mahdollisuuksia. elsingin korpus oli uranuurtava antaessaan jokaisen tekstiotteen alussa kohtuullisen tarkan tiedon paitsi tekstin iästä, murteesta ja tekstilajista myös mahdollisuuksien mukaan kirjoittajan iästä, sukupuolesta ja sosiaalisesta asemasta. ässä suhteessa kehitys on edennyt huikeasti muutamassa kymmenessä vuodessa, ja tekstianalyysiin perustuva tutkimus on ratkaisevasti helpompaa ja nopeampaa kuin ennen. Monien korpusten tekstit on koodattu kieliopillisesti, joten tekstiä voi tutkia paitsi sanojen ja niiden osien tai yhdistelmien perusteella myös etsimällä sanaluokkia tai lauseenjäseniä ja niiden yhdistelmiä. ulevaisuuden korpusvisioistamme voidaan vielä mainita todelliset multimediakorpukset, joissa tekstiin liittyy myös alkuperäiskäsikirjoitus, kuvia, monenlaista taustatietoa ja tarpeen mukaan myös ääntä. anakirja- ja sanastotiedon lisääminen on myös mahdollista. Kielitieteilijät ovat varsin yksimielisiä siitä, että tietokonekorpukset ovat mullistaneet täysin etenkin kielen varhaisten vaiheiden tutkimuksen. Korpusten tukema kielen vaihteluun perustuva muutosteoria on myös yhdistänyt nykykielen ja kielihistorian tutkimuksen. nnen kaikkea aikaisemmin jopa vuosia vienyt esimerkkiaineiston kerääminen ja kirjaaminen voidaan korpusten avulla suorittaa murto-osassa tästä ajasta. Mutta samanaikaisesti on muistettava, että kielentutkijalle korpukset tarjoavat vain tehokkaan menetelmän tutkimusaineiston tallennukseen sekä kielen lukemattomia ilmaisuja valaisevien esimerkkien poimimiseen sekä laadulliseen ja määrälliseen luokitteluun. ineiston analysointi, tulosten merkityksen havainnointi ja osoittaminen, yleistysten ja teorian Ä 5/2004

kehittely on edelleen tutkijan aivotyön varassa. utkimus alkaa siitä, mihin laskeminen loppuu, onkin yksi tutkimusyksikkömme mottoja. KRJLL alliday, M.. K. (1973): xplorations in the Functions of Language, dward rnold, London. Rissanen, Matti (2000): he World of nglish istorical Corpora: from Cædmon to Computer ge, Journal of nglish Linguistics 28: 7-20. Rissanen, Matti, Merja Kytö and Minna alander-collin (toim.)(1993), arly nglish in the Computer ge: xplorations through the elsin ki Corpus. Mouton de Gruyter, Berlin & New York. Weinreich, riel, William Labov and Marvin Y. erzog (1968): mpirical Foundations for a heory of Language Change, teoksessa W.. Lehmann ja Yakov Malkiel (toim.) (1968): Directions for istorical Linguistics: a ymposium, niversity of exas ress, ustin, exas. Matti Rissanen on englantilaisen filologian emeritusprofessori ja englannin kielen vaihtelun ja muutoksen tutkimusyksikön tutkija elsingin yliopistossa. 23 Ä 5/2004