Monimenetelmällinen (empiirinen) kielentutkimus käytännössä. Sisältö

Samankaltaiset tiedostot
Yhdyssana suomen kielessä ja puheessa

Hoitotieteen laitos. VALINTAKOE , Kysymykset ja arviointikriteerit

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Analyysi: päättely ja tulkinta. Hyvän tulkinnan piirteitä. Hyvän analyysin tulee olla. Miten analysoida laadullista aineistoa

Onko empiirinen käänne vain empirian kääntötakki?

Sisällönanalyysi. Sisältö

TUTKIMUS KÄÄNNÖSSUOMESTA JA ASTEMÄÄRITTEIDEN SYNONYMIASTA

OPS OPPIMISTAVOITTEET JA OPETUKSEN KESKEISET SISÄLLÖT TOINEN KOTIMAINEN KIELI

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Lausuminen kertoo sanojen määrän

LAADULLISESTA SISÄLLÖNANALYYSISTÄ

Politiikka-asiakirjojen retoriikan ja diskurssien analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi

PSYKOLOGIAN ARTIKKELI- JA MONOGRAFIAVÄITÖSKIRJOJEN RAKENNE MUISTILISTAA VÄITÖSKIRJOJEN OHJAAJILLE JA OHJATTAVILLE

VI Tutkielman tekeminen

SUOMESSA ILMESTYVÄT SANOMALEHDET

Mittariston laatiminen laatutyöhön

Äi 8 tunti 6. Tekstin rakenne, sitaattitekniikka

Puhutun ja kirjoitetun rajalla

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mitä suomen intonaatiosta tiedetään

Sovellettu todennäköisyyslaskenta B

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Laskelmia uudenvuodenpuheista

Selkokieltä verkkopalveluihin, kiitos! Leealaura Leskelä Kehitysvammaliitto, Selkokeskus

Artikkeli Sosiaalilääketieteellisessä aikakauslehdessä

Verbien morfosyntaksista, osa 2

Kuvattu ja tulkittu kokemus. Kokemuksen tutkimus -seminaari, Oulu VTL Satu Liimakka, Helsingin yliopisto

Eläinlääketieteen lisensiaatin tutkielma Seminaarityöskentelyohjeet

Englanti. 3. luokan keskeiset tavoitteet

MTTTS2 Pro gradu -tutkielma ja seminaari. Kevät 2014, 40op Jaakko Peltonen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tekstien ääniä. Tommi Nieminen Itä-Suomen yliopisto

Mitä tahansa voi saavuttaa kunhan vain yrittää!

MONOGRAFIAN KIRJOITTAMINEN. Pertti Alasuutari

Väitöskirjan kirjoittaminen ja viimeistely

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Verkko-opetus - Sulautuva opetus opettajan työssä PRO-GRADU KAUNO RIIHONEN

OHJEET SISÄMARKKINOIDEN HARMONISOINTIVIRASTOSSA (TAVARAMERKIT JA MALLIT) SUORITETTAVAAN YHTEISÖN TAVARAMERKKIEN TUTKINTAAN OSA C VÄITEMENETTELY

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Oppilas keskustelee ryhmässä ja tuo esille mielipiteitään. Oppilas osallistuu luokan ja koulun ilmaisuesityksiin. Oppilas harjoittelee

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Tilastollisten aineistojen kerääminen ja mittaaminen

Sanaluokkajäsennystä rinnakkaisilla transduktoreilla

Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms.

Käsitteistä. Reliabiliteetti, validiteetti ja yleistäminen. Reliabiliteetti. Reliabiliteetti ja validiteetti

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Kulttuuritaidot Oppilas tutustuu ruotsinkieliseen ja pohjoismaiseen elämänmuotoon ja oppii arvostamaan omaa ja muiden kulttuuria

Eiran aikuislukiossa voi toisena kotimaisena kielenä opiskella ruotsia. Opiskelija valitsee joko pitkän tai keskipitkän oppimäärän.

Kolikon tie Koululaistehtävät

TYÖODOTUKSET-HANKE Voin luottaa esimieheni oikeudenmukaiseen johtamistapaan kanssa

PSY181 Psykologisen tutkimuksen perusteet, kirjallinen harjoitustyö ja kirjatentti

HAVAITUT JA ODOTETUT FREKVENSSIT

Julkaisufoorumi tieteellisten lehtien ja kirjakustantajien tasoluokitus tutkimuksen arviointimenetelmänä

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

TEKSTINKÄSITTELYTEHTÄVIÄ, OSA 1

KÄYTTÄJÄKOKEMUKSEN PERUSTEET, TIE-04100, SYKSY Käyttäjätutkimus ja käsitteellinen suunnittelu. Järjestelmän nimi. versio 1.0

LASKENTATOIMEN PRO GRADU INFO

KIELENOPPIJOITA TIEDONHANKINTA KESKIÖSSÄ KUUNTELEMALLA OPPIJA (AUDITIIVINEN) KIELEN KÄYTTÖ, VUOROVAIKUTUS NÄKEMÄLLÄ

Osaamistavoitteiden asettaminen omalle opintojaksolle - Flipparit

Oulun murteessa on käytössä myös nää-pronomini, joka tarkoittaa sinä. Sää on kuitenkin enemmän käytetty.

Yhteentoimivuusvälineistö

Kielenhuolto ja sen tarvitsema tutkimus muuttuvassa yhteiskunnassa. Salli Kankaanpää AFinLAn syyssymposiumi

KOEKYSYMYKSIÄ IKI 7 -OPPIKIRJAN SISÄLTÖIHIN

- Passiivi-lauseessa ei ole tärkeää, kuka tekee. Yleisesti tehdään. (something is done)

Tutkimustiedonhallinnan peruskurssi

ohjelman arkkitehtuurista.

Verbien morfologia. I á: II ĕá: III e: IV í, î

Klaara-työpaja. Miten selkokieltä puhutaan? Sari Karjalainen

Tieteellisen artikkelin kirjoittaminen ja julkaiseminen

FONETIIKKA SUULLISEN KIELITAIDON ARVIOINNISSA

Prosodian havaitsemisesta: suomen lausepaino ja focus

ABHELSINKI UNIVERSITY OF TECHNOLOGY

HENKILÖKOHTAINEN OPINTOSUUNNITELMA HOPS RANSKAN KIELI

SUOMI L3-KIELEN OSAAMISTASON KUVAUKSET yläkoulu ja lukio

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle


TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Suomenkielisten tekstien morfologinen analysointi

Sovellettu todennäköisyyslaskenta B

LAADULLISEN TUTKIMUKSEN OMINAISLAATU

A2- espanja. Yleiset tavoitteet vuosiluokille luokan keskeiset tavoitteet

Miks toi sai enemmän?! - millintarkkaa sisarusrakkautta monikkoperheessä. Janna Rantala Lastenpsykiatri Pari- ja perhepsykoterapeutti Helmikuu 2017

Tutkimussuunnitelmaseminaari. Kevät 2011 Inga Jasinskaja-Lahti

Johanneksen saarna tulevasta (Q 3:16-17)

Pro gradu - tutkielma. Kasvatustieteiden tiedekunta, Oulun yliopisto KT HANNU Heikkinen

Hyvin suunniteltu on puoliksi tehty. Tutkimussuunnitelma. Miten se tehdään?

Kumula, Asiantuntijan blogiteksti

Yleisen kielitieteen opetus

Esko Korpilinna ja ketsua. Esitys Ruutiukoissa Matti Kataja

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Suomen Arkeologinen Seura ry. Arkeologi(a) ja media. Mikä on muinaisjäännös?

7.LUOKKA. Tavoitteisiin liittyvät sisältöalueet. Laaja-alainen osaaminen. Opetuksen tavoitteet

Sonja Kniivilä, Sari Lindblom-Ylänne & Anne Mäntynen

Tilastollisia peruskäsitteitä ja Monte Carlo

Kliininen arviointi ja kliininen tieto mikä riittää?

Aluekehitys ja -politiikka: Pohjoinen Eurooppa A, 5 op

Tommi Nieminen. 35. Kielitieteen päivät Vaasa

Transkriptio:

Monimenetelmällinen (empiirinen) kielentutkimus käytännössä Antti Arppe Kieliteknologian seminaari 23.4.2003 Sisältö keskeiset tutkimustulokset tähän saakka tutkimushypoteesi tutkimustavoitteet tutkimuksen kulku tästä eteenpäin etukäteismaistiaisia tulevista korpuspohjaisista tuloksista väitöskirjan sisällysluettelo ja aikataulu probleemeja ja pähkinöitä Happened so far... olen tarkastellut kahden synonyymisen ajatella-verbin, pohtia ja miettiä käytön eroja 2,3 Msanan sanomalehtitekstissä (Keskisuomalainen 1994/tammi-huhtikuu) taivutusprofiilin suhteen (yksittäiset piirteet ja niiden kombinaatiot aina kokonaisiin taivutusmuotoihin asti) tekstityypin (~sanomalehden osaston) suhteen kirjoittajan (~toimittajan) suhteen erityistutkimus eroista SG3:n eri agenttien suhteen (ihmisyksilö vs. ryhmä) ko. verbien dependenttikonteksti korpushavaintoja on verrattu teekkarien kieli-intuitioon kokeellisilla (psykolingvistisilla) testeillä

Korpustulokset taivutusprofiilit varsinaisessa tutkimuskorpuksessa ( KSML-94) miettiä I infinitiivi (77/112) yks. 1. persoona (22/23) toimittajat aaa, bbb ja ccc urheiluosasto yks. 1. persoona JA imperfekti pohtia yks. 3. persoona (199/320) ulkomaanosasto preesens JA yks. 3. persoona preesens toimittaja bbb Korpustulokset taivutusprofiilit suuremmassa vertailukorpuksessa ( JADT-02) miettiä I infinitiivi (417/670) yks. 1. persoona (88/96) yks. 1. persoona JA imperfekti (53/56) III infinitiivi passiivi ja 1. partisiippi imperatiivi (23/28 ) pohtia passiivi JA indikatiivi (341/481) mon. 3. persoona JA indikatiivi (1474/2468) yks. 3. persoona (932/1562) passiivi JA imperfekti (111/142) yks. 3. persoona JA indikatiivi (924/1551) mon. 3. persoona (178/252) Nämä ilmiöt nousivat tilastollisesti merkittävinä esille korpuksen koon kasvattamisen johdosta (2,3 Mw 15,8 Mw) Korpustulokset SG1/SG3 SG3-jakauma t-testi Fisher verbi n p,v /n f,total piirre 2.3581.000000 miettiä 24/26 0_SG1 2.1481.000000 pohtia 206/336 0_SG3-2.705 0.000013 miettiä 130/336 0_SG3-8.170 0.000001 pohtia 2/26 0_SG1 SG1-suhde on merkitsevä, ja suhdeluku on >9/10 SG3-suhde on merkitsevä, mutta suhdeluku on 4/6 olisiko joku toinen tekijä, jonka suhteen SG3-verbit jakautuisivat selkeämmin kahteen ryhmään? agentin laskettavuus: yksilö vs. kollektiivi?

Korpustulokset SG3:n eri agentit Agentti-jakauma: t-testi Fisher Verbi n p,v /n p,total Agentti 1.9081.0000 pohtia 34/44 GROUP 1.8441.0000 pohtia 155/254 INDIVIDUAL kollektiiviagenttien suhteen suhde-ero kasvaa (1/4 vs. 3/4) ja on edelleen tilastollisesti merkitsevä yksilöagenttien suhteen suhde-ero itse asiassa säilyy samana (4/10 vs. 6/10), mutta on edelleen tilastollisesti merkitsevä Pakotustesti XP1 (N=520) 60,0 % miettiä pohtia 1sg 45.0 10.4 3sg 35.8 31.9 3coll 19.2 57.7 % 50,0 40,0 30,0 20,0 10,0 0,0 1sg 3sg 3coll Miettiä Pohtia Pakotustesti... Vastausten kokonaisjakauma erosi merkitsevästi sattumasta (χ 2, p <.0001) SG1-agentti selkeästi suosi verbiä miettiä (χ 2, p <.001) SG3-KOLLEKTIIVI-agentilla suosi selkeästi verbiä pohtia (χ 2, p <.001) SG3-agentilla (ei-kollektiivinen) ei ollut preferenssiä kumpaakaan verbiä kohtaan (χ 2, ei merkitsevä)

Hyväksyttävyystesti XP2 miettiä pohtia SG1 5.6 5.2 SG3 5.3 5.6 COLL3 4.5 5.4 Hyväksyttävyystesti... MAS 6,0 5,5 5,0 4,5 4,0 3,5 3,0 1sg 3sg 3coll miettiä pohtia Hyväksyttävyystesti... Agenttityypin pääefekti merkitsevä Agenttityypin ja Verbin vuorovaikutus merkitsevä Agenttityyppi merkitsevä miettiä-verbin muttei pohtia-verbin kohdalla miettiä: COLL3 merkitsevästi vähemmän hyväksyttävä kuin joko SG1 tai SG3 (p<.001), ei merkitsevää eroa SG1:n ja SG3:n välillä (p>.2)

Hyväksyttävyystesti... Kolmen Agenttityypin sisällä: SG1: miettiä merkitsevästi hyväksyttävämpi kuin pohtia (p <.01) SG3: ei merkitsevää eroa (p >.1) 3COLL: miettiä merkitsevästi vähemmän hyväksyttävä kuin pohtia (p <.001) Korpushavaintojen suhde kieli-intuitioon pakotustestin tulokset vastasivat korpuksesta saatuja tuloksia pakotettu valinta vastaa tekstin tuottotilannetta (ainakin tässä tapauksessa) hyväksyttävyystestit kertoivat laajemmin eri vaihtoehtojen sopivuudesta ja käytettävyydestä eri konteksteissa, mitä voidaan käyttää selittämään miksi tuotetussa korpustekstissä ja pakotustesteissä tehdään ne valinnat mitkä tehdään valinnan syy voi siis olla, että toinen vaihtoehdoista sopii huonommin kontekstiin kuin toinen otaniemeläisten teekkarien ja keskisuomalaisten toimittajien näkemykset ko. synonyymien käytöstä vaikuttavivat samansuuntaisilta (triangulointia vahingossa?) Tutkimustavoite ja hypoteesi Tavoite-1 selvittää, miten empiirisiä, erityisesti kvantitatiivis-korpuspohjaisia ja kokeellisia psykolingvistisiä tutkimusmenetelmiä voidaan käyttää parantamaan yksittäisten lekseemien käytön kuvauksia sekä kielen yleisempiä kuvausmalleja. Hypoteesi yhdistelemällä eri tutkimusmenetelmiä voidaan kompensoida yksittäisten menetelmien ongelmia ja rajoituksia Tavoite-2 ei siis ainoastaan parantaa kuvauksia kielen käytöstä vaan myös löytää syitä ja selityksiä kielenkäytössä tehtäviin valintoihin (suomen kielessä) mitkä tekijät ylipäänsä vaikuttavat valintoihin: sanan oma morfologia, leksikaalinen lähikonteksti, tekstityyppi, sanan argumentit ja näiden funktiot, semanttiset luokitukset ja morfologia edellämainittujen yhdistelmät?

Käppyröitä ( hypoteettisia kokeellisten testien tuloksia) 7 6 6 5 5 4 4 3 A B 3 A B 2 2 1 1 0 i j k 0 i j k 7 6 5 4 A 3 B 2 1 0 i j k Työ tästä eteenpäin triangulointia kahta synonyymia on helpointa tutkia (tilastolliset menetelmät), mutta tulokset saattavat vääristyä, koska koko synonyymiryhmän keskinäisiä suhteita ei huomioida koko synonyymiryhmän yleisimmät jäsenet tarkasteluun: pohtia, miettiä ajatella, tuumia, harkita kenties toinen kognitiivisten verbien ryhmä ymmärtää, käsittää, tajuta olisiko jopa mahdollisesti parempi ryhmä tutkia, sillä yleisimpiä jäseniä on vain kolme? alkuperäisenä tavoitteena oli kuvata melko perusteellisesti ko. synonyymiryhmän samankaltaisuudet ja eroavaisuudet saattaisi edellyttää varsin suuriakin aineistoja (jos haluaa käsitellä kaikki persoonat tms.) riittäisikö tässä tutkimuksessa vain joidenkin kiinnostavien tapausten käsittely? Triangulointia... eri tekstiaineistojen vertailua toisiinsa sopivan kokoisia otoksia synkroninen ote aluksi pari sanomalehteä 1990-luvulta (liian heterogeenistä? mutta voi tarkastella eroja lehtien eri sektioissa) 1990-luvun kaunokirjallisuutta pari sähköistä uutisryhmää (toivottavasti enemmän dialogia eli 1. ja 2. persoonan käyttöä kuin sanomalehtitekstissä) diakroninenkin ote mahdollinen (1900-luvun puoliväli tai alku) vanhempia sanomalehti/asiaproosatekstejä (KOTUS) vanhempaa kaunokirjallisuutta

Triangulointia... korpuksista saatavien tulosten perusteella päätetään kokeellisten psykolingvististen testien asetelmat riittävätkö off-line testit kuten tähän asti (ei esim. reaktioaikojen mittausta) miten paljon pitäisi kiinnittää huomioita testiryhmien homo/heterogeenisyyteen Onko järkeviä vaihtoehtoja testien teettämiselle opiskelijoilla? Toisiko kaksikielisyysperspektiivi hyödyllisen lisän tutkimukselle? Miten suomea toisena kielenä puhuvat tuntevat ja hallitsevat havaitut ilmiöt? Triangulointia... tutkimuksen kohteena on tähän mennessä ollut kirjoitettu kieli 1.olisivatko havaitut preferenssit nähtävissä jotenkin myös puhutussa kielessä esim. intonaatiossa tai prosodiassa? Tai jollakin muulla tavalla? 2.lopullinen tavoite miten korpukset ja kokeelliset testit (ja muut evidenssityypit) suhtautuvat toisiinsa? Maistiaisia vilkaisu kontekstipiirteiden viidakkoon I 1.5700935 pohtia=v 100/164 <_N 1.2820441 miettiä=v 8/9-1_SX_TMP 1.1928297 pohtia=v 8/9-1_PL 1.1819780 pohtia=v 13/17 <_SEM-COGNITION 1.1728972 pohtia=v 16/22 <_SEM-HUMAN-GROUP 1.1493807 miettiä=v 5/5 0_SG1 1.1253767 pohtia=v 104/180 <_&NH 1.0899510 pohtia=v 12/16 <_INE 1.0445990 miettiä=v 13/19 <_PRON 1.0301592 miettiä=v 24/39 <_ADV 1.0301592 miettiä=v 24/39 <_&ADV 1.0280374 miettiä=v 4/4 <_PCP2 0.9925983 miettiä=v 7/9 +1_SEM-PERSON 0.9925983 miettiä=v 7/9 +1_SX_AGE 0.9925983 miettiä=v 7/9 <_-KO 0.9906542 pohtia=v 25/39 <_PL

Vilkaisu kontekstipiirteiden viidakkoon II 0.9825106 pohtia=v 34/55-1_&NH 0.9725915 pohtia=v 30/48 1_N 0.9439252 pohtia=v 9/12-1_SEM-HUMAN-GROUP 0.9207808 miettiä=v 18/29 <_SG3 0.8940810 miettiä=v 9/13-1_ADV 0.8940810 miettiä=v 9/13-1_&ADV 0.8903065 miettiä=v 3/3 <_että=cs 0.8903065 miettiä=v 3/3 <_mikä=pron 0.8903065 miettiä=v 3/3 <_pitää=v 0.8903065 miettiä=v 3/3 <_SX_GOA 0.8830946 miettiä=v 28/48 <_ACT 0.8568111 pohtia=v 5/6-1_PASS 0.8417443 pohtia=v 3/3 +1_ESS 0.8417443 pohtia=v 3/3 +1_muu=PRON 0.8417443 pohtia=v 3/3 <_laajasti=adv 0.8417443 pohtia=v 3/3 <_vaihto#ehto=n 0.8369053 pohtia=v 11/16 <_SX_MAN Sukellusta I: miettiä + SG1 1.0280374 miettiä=v 4/4 0_SG1:<_SX_PAT 0.7269322 miettiä=v 2/2 0_SG1:+1_SX_ 0.5140187 miettiä=v 1/1 0_SG1:+1_SX_PAT (0.5140187 miettiä=v 1/1 0_SG1:+1_SX_SEM-TIME) 0.5140187 miettiä=v 1/1 0_SG1:-1_SX_ 0.5140187 miettiä=v 1/1 0_SG1:-1_SX_DUR 0.5140187 miettiä=v 1/1 0_SG1:-1_SX_TMP 0.5140187 miettiä=v 1/1 0_SG1:<_SX_DUR 0.5140187 miettiä=v 1/1 0_SG1:<_SX_MAN (0.5140187 miettiä=v 1/1 0_SG1:<_SX_SEM-TIME) 0.5140187 miettiä=v 1/1 0_SG1:<_SX_TMP Sukellusta II: miettiä + SG1 + SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:<_että=CS:<_SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:<_keino=N:<_SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:<_persoona=N:<_SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:<_yrittää=V:<_SX_PAT

Sukellusta III: miettiä + SG1 + SX_?? 0.5140187 miettiä=v 1/1 0_SG1:+1_päivä=N:+1_SX_SEM-TIME 0.5140187 miettiä=v 1/1 0_SG1:+1_yrittää=V:+1_SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:-1_kun=CS:-1_SX_TMP 0.5140187 miettiä=v 1/1 0_SG1:-1_pitkään=ADV:-1_SX_DUR 0.5140187 miettiä=v 1/1 0_SG1:<_että=CS:<_SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:<_keino=N:<_SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:<_kun=CS:<_SX_TMP 0.5140187 miettiä=v 1/1 0_SG1:<_pääksytysten=ADV:<_SX_MAN 0.5140187 miettiä=v 1/1 0_SG1:<_päivä=N:<_SX_SEM-TIME 0.5140187 miettiä=v 1/1 0_SG1:<_persoona=N:<_SX_PAT 0.5140187 miettiä=v 1/1 0_SG1:<_pitkään=ADV:<_SX_DUR 0.5140187 miettiä=v 1/1 0_SG1:<_yrittää=V:<_SX_PAT Sukellusta IV: pohtia + SEM-HUMAN-GROUP 1.0394149 pohtia=v 13/18 <_SX_AGE:<_SEM-HUMAN-GROUP 0.6872814 pohtia=v 2/2 <_SX_ACT:<_SEM-HUMAN-GROUP 0.5140187 miettiä=v 1/1 <_SX_PAT:<_SEM-HUMAN-GROUP 0.4859813 pohtia=v 1/1 <_SX_MAN:<_SEM-HUMAN-GROUP -Infinity miettiä=v 0/2 <_SX_ACT:<_SEM-HUMAN-GROUP -Infinity pohtia=v 0/1 <_SX_PAT:<_SEM-HUMAN-GROUP -Infinity miettiä=v 0/1 <_SX_MAN:<_SEM-HUMAN-GROUP -1.6760061 miettiä=v 5/18 <_SX_AGE:<_SEM-HUMAN-GROUP Sukellusta V: pohtia + SEM-HUMAN-GROUP 0.4859813 pohtia=v 1/1 <_arkkitehti#toimisto=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_enemmistö=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_hallitus=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_jäsenistö=n:<_sx_act:<_sem-human-group 0.4859813 pohtia=v 1/1 <_käräjä#oikeus=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_länsi#ryhmä=n:<_sx_act:<_sem-human-group 0.4859813 pohtia=v 1/1 <_meijeri=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_ministerityöryhmä=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_MTK=N:<_SX_AGE:<_SEM-HUMAN-GROUP 0.4859813 pohtia=v 1/1 <_nato=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_oikeus=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_Suomi=N:<_SX_MAN:<_SEM-HUMAN-GROUP 0.4859813 pohtia=v 1/1 <_toimi#kunta=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_työ#ryhmä=n:<_sx_age:<_sem-human-group 0.4859813 pohtia=v 1/1 <_USA=N:<_SX_AGE:<_SEM-HUMAN-GROUP -Infinity pohtia=v 0/1 <_edus#kunta=n:<_sx_age:<_sem-human-group -Infinity pohtia=v 0/1 <_hallinto#neuvosto=n:<_sx_age:<_sem-human-group -Infinity pohtia=v 0/1 <_maalais#kunta=n:<_sx_age:<_sem-human-group -Infinity pohtia=v 0/1 <_Ruotsi=N:<_SX_AGE:<_SEM-HUMAN-GROUP -Infinity pohtia=v 0/1 <_valta#osa=n:<_sx_age:<_sem-human-group -Infinity pohtia=v 0/1 <_verkosto=n:<_sx_pat:<_sem-human-group

Sukellusta VI: pohtia/miettiä + SX_AGE 1.0394149 pohtia=v 13/18 <_SX_AGE:<_SEM-HUMAN-GROUP 0.7269322 miettiä=v 2/2 <_Lukkarinen=N:<_SX_AGE 0.7269322 miettiä=v 2/2 <_SX_AGE:<_SEM-HUMAN 0.7147058 miettiä=v 5/7 <_SX_AGE:<_PRON 0.6910518 pohtia=v 30/51 0_SG3:<_SX_AGE 0.6872814 pohtia=v 2/2 <_Koivisto=N:<_SX_AGE 0.6872814 pohtia=v 2/2 <_presidentti=n:<_sx_age 0.6591953 pohtia=v 32/55 <_SX_AGE:<_SEM-PERSON 0.6479952 pohtia=v 39/68 <_SX_AGE:<_SG 0.6000177 pohtia=v 43/76 <_SX_AGE:<_NOM 0.5449755 pohtia=v 3/4 0_PASS:<_SX_AGE 0.5449755 pohtia=v 3/4 <_SX_AGE:<_INE 0.5140187 miettiä=v 1/1 0_PL1:<_SX_AGE Sukellusta VII: pohtia/miettiä + SX_AGE 0.5140187 miettiä=v 1/1 <_edus#kunta=n:<_sx_age 0.5140187 miettiä=v 1/1 <_hallinto#neuvosto=n:<_sx_age 0.5140187 miettiä=v 1/1 <_jokainen=pron:<_sx_age 0.5140187 miettiä=v 1/1 <_koulutettu=a:<_sx_age 0.5140187 miettiä=v 1/1 <_Kokkonen=N:<_SX_AGE 0.5140187 miettiä=v 1/1 <_Kuusjärvi=N:<_SX_AGE 0.5140187 miettiä=v 1/1 <_maalais#kunta=n:<_sx_age 0.5140187 miettiä=v 1/1 <_me=pron:<_sx_age 0.5140187 miettiä=v 1/1 <_moni=pron:<_sx_age 0.5140187 miettiä=v 1/1 <_Mäkinen=N:<_SX_AGE Väitöskirjan sisällysluettelo 1. Johdanto taustaa 1.1. Eri menetelmien ja evidenssityyppien käytöstä kielitieteessä 1.1.1. Korpuslingvistiikka 1.1.2. Kokeellinen psykolingvistiikka 1.2. Menetelmien yhdistämisestä muut vastaavat tutkimukset 1.3. Tavoitteet ja hypoteesi 1.4. Menetelmät ja materiaalit tutkimuksen yleiskuvaus 1.4.1. Synonyymiryhmän käytön kuvaus miksi? 1.4.2. Korpukset, niiden valinta, kuvaus ja käsittely 1.4.3. Kokeelliset testit, testien ja testiryhmien valinta ja kuvaus 1.5. Synonymiasta 1.5.1. Mitä ovat synonyymit? 1.5.2. Synonyymien käyttöön vaikuttavat tekijät 1.5.3. Ajatella-verbien kuvaus tähän asti

Sisällysluettelo... 1. Korpuslähtöiset tutkimukset 2.1. Sanomalehtiaineisto 2.2. Kaunokirjallinen aineisto 2.3. Uutisryhmäaineisto 2.4. Yhteenveto käytöstä korpusten perusteella Kokeelliset testit Tulosten yhdistäminen 4.1. Synonyymiryhmän käytön kuvaus käytettyjen menetelmien ja aineistojen perusteella 4.2. Syyt ja selitykset havaitulle käytölle Sisällysluettelo... 1. Keskustelu ja johtopäätökset 5.1.Käytettyjen eri menetelmien ja aineistotyyppien suhde toisiinsa 5.2.Minkälaisissa tilanteissa menetelmät vastaavat toisiaan ja milloin eivät 6. Yhteenveto Väitöskirjan aikataulu Kevät/kesä 2003 Jatko-opintokurssit suoritettu päätökseen QITL-artikkeli kirjoitettu ja submittoitu Tutkimusosuus A: Tutkimustyön suorittaminen laajennetulla verbijoukolla ja syntaktissemanttisella kontekstilla, mahdollisesti kaksi erillistä tutkimusta, joista toinen keskittyy laajennettuun verbijoukkoon ja toinen laajennettuun kontekstiin Korpukset ja kieli kurssin järjestäminen

Aikataulu... Syksy 2003 Artikkelin/artikkelien kirjoittaminen ja submittoiminen A-tutkimuksesta Tutkimusosuus B: Psykolingvistisen tutkimustyön suorittaminen A-työn perusteella, mahdollisesti kaksi erillistä tutkimusta riippuen A-työn tuloksista Kevät 2004 Artikkelin/artikkelien kirjoittaminen ja submittoiminen B-työstä Tutkimusosuus C: Korpuslingvististen ja psykolingvististen tutkimusten tulosten vertailu, yleistykset ja johtopäätökset Vierailu Leuvenin yliopistossa Aikataulu... Syksy 2005 C-työn kirjoittaminen submittointi ja nipputiivistelmän kirjoittaminen tai monografian kirjoittaminen A-, B- ja C-työn pohjalta Kevät 2005 Monografia tai nippuväitöskirja esitarkastukseen Syksy 2005 Väitöstilaisuus Probleemeja ja pähkinöitä kuinka monia eri korpusaineistoja kannattaisi käyttää (minkä kokoisina)? mikä olisi sopiva tutkittavien lingvististen ilmiöiden määrä? mikä olisi sopivin tilastollinen menetelmä assosiaatioiden rankkaukseen? (kun tarkastellaan useampaa kuin kahta verbiä) onko mielekästä puhua tilastollisesta merkitsevyydestä? tyytyäkö tarkastelemaan yksittäisiä piirteitä vai pyrkiäkö tarkastelemaan niiden yhteisesiintymisiä? onko Perussanakirja riittävän hyvä lähde synonyymien valinnalle (ja synonyymisyyden määrittelylle), vai pitäisikö käyttää korpusta (à la Church) tai ihmisten kieli-intuitiota? mikä olisi kätevä tapa tutkia synonyymien käyttöä puheen näkökulmasta?

Probleemeja ja pähkinöitä... ovatko nyt valitut piirreryhmät riittävät/sopivat? fokaalisanan morfologia leksikaalinen ja funktionaalinen konteksti morfologia semanttinen luokitus (WordNet) funktionaalinen luokitus (FI-FDG) lauseketyyppi (yleisnimi, erisnimi, lyhenne, titteli,...) ekstralingvistiset tekijät teksityyppi kirjoittaja sijainti tekstissä (otsikko, lista) tekstiprosodiset tekijät edeltävä valinta samassa sanaryhmässä (saman artikkelin/dokumentin sisällä) sitaatin sisällä vai ennen tai jälkeen sitaatin? Probleemeja ja pähkinöitä... onko WordNetin semanttinen luokitus liian tiukka/väljä? SEM_ACTIVITY SEM_FAUNA SEM_ARTIFACT SEM_ATTRIBUTE SEM_BODY SEM_COGNITION SEM_COMMUNICATION SEM_EVENT SEM_EMOTION SEM_FOOD SEM_GROUP SEM_HUMAN_INDIVIDUAL SEM_HUMAN_GROUP SEM_LOCATION SEM_MOTIVE SEM_NATURAL_OBJECT SEM_NATURAL_PHENOM ENON SEM_FLORA SEM_POSSESSION SEM_PROCESS SEM_QUANTITY SEM_RELATION SEM_SHAPE SEM_STATE SEM_SUBSTANCE SEM_TIME Probleemeja ja pähkinöitä... onko Conexorin FI-FDG:n funktionaalinen luokitus liian tiukka/väljä? <_AGE <_PAT <_COMP <_DAT <_OBJ-COMP <_CO-PRED <_VOC <_TMP <_DUR <_FRQ <_QUA <_MAN <_LOC <_SOU <_FOA <_PUR <_RSN <_CND <_META <_QN <_ATTR <_MOD <_AD-ADV <_CC <_CC-ADP <_CC-FUNC

Probleemeja ja pähkinöitä... miten tiettyjä lingvistisiä piirteitä kannattaisi tai pitäisi käsitellä tai yhdistellä mitä tehdä liittomuodoilla? SG1: mietin, en mieti, en miettinyt, voin miettiä, olen/olin miettinyt, en ole/ollut miettinyt,... mitä tehdä eri persoonilla? tulisiko 1. ja 2. persoona niputtaa yhteen 3. persoonaa vastaan, mitä tehdä passiivilla? tulisiko SG/PL1/2-tapauksissa merkitä agentiksi INDIVIDUAL, vaikkei se olekaan avoimesti merkittynä minä mietin vs. Ø mietin Probleemeja ja pähkinöitä... miten tiettyjä dependentteja kannattaisi semanttisesti luokitella tai erotella toisistaan? miten polysemiaa pitäisi käsitellä? paikat: Ruotsissa mietitään... / Ruotsi pohtii... paikka? ihmiskollektiivi? tilaisuudet/tapahtumat: Kokouksessa pohditaan... / Hallituksessa mietitään... tapahtuma? paikka? ihmiskollektiivi?