Miten tietokone näkee suomen murteet?

Samankaltaiset tiedostot
Mitä murteita Suomessa onkaan?

Katsaus suomalaisen henkilönimistön maantieteelliseen vaihteluun

Kotimaisten kielten keskus eli Kotus ja sen arkistot ja aineistot. Elisa Stenvall

lasten läsnäolot, kasvatuskeskustelulomakkeet, varhaiskasvatussuunnitelmat, kuntoutussuunnitelmat, esiopetussuunnitelmat, hoitosopimukset,

Kielenhuolto ja sen tarvitsema tutkimus muuttuvassa yhteiskunnassa. Salli Kankaanpää AFinLAn syyssymposiumi

KARTTOJEN KARTOITUSTA

Etunimi. Sukunimi. Oppimistavoite: ymmärtää, kuinka positiiviset ja negatiiviset magneettiset navat tuottavat työntö- ja vetovoimaa.

Joustavan opintooikeuden. Avoimessa yliopistossa suoritetut opintopisteet (ei sis. TY:n tutkintoopiskelijoiden. Vaihtoopiskelijoiden.

Suomalais-ugrilaisten kielten ja kulttuurien opetus (kotimaisten kielten ja kirjallisuuksien kandiohjelma)

Vaihtoopiskelijoiden. Joustavan opintooikeuden. suorittamat opintopisteet. (JOO) opintopisteet

Kielellisen datan käsittely ja analyysi tutkimuksessa

Sanastosta tarkennusta tverinkarjalaisten lähtöseutuihin?

Kotimaisten kielten tutkimuskeskus taustaa ja vaiheita

Automaatit. Muodolliset kielet

Kielenhuoltoa kun alettiin tekemään. Riitta Eronen Tukholma

lasten läsnäolot, kasvatuskeskustelulomakkeet, varhaiskasvatussuunnitelmat, kuntoutussuunnitelmat, esiopetussuunnitelmat, hoitosopimukset,

Päällysteiden YP tarvittavat tiedot 1. Työpaja ma

Muu opetus- ja tutkimushenkilöstö. Muu 4. porras 3. porras 2. porras 1. porras

Kuvien tarinat -tehtävä ( 30 kpl tehtäväsivuja )

Rubikin kuutio ja ryhmät. Johanna Rämö Helsingin yliopisto, Matematiikan ja tilastotieteen laitos

Pohjoismaisten kielten tutkinto-ohjelman opintojen vastaavuudet ja

Tervetuloa opiskelemaan suomen kieltä. Henkilökunnan esittely Perus- ja aineopintojen rakenne Suomen kieli sivuaineena Opettajan kelpoisuusehdot

Kotimaisten kielten tutkimuskeskus Forskningscentralen för de inhemska språken

Opiskelija digimaailmassa

Suomen kielen opinnot syksystä 2017 alkaen. Kielen kehitys ja vaihtelu Kielenhuolto Äänne- ja muoto-oppi

Merkitse kertolasku potenssin avulla ja laske sen arvo.

Sohvalle vai lenkille?

Tampere-nimelle saamelaista koskiappellatiiviin

KOTIMAISTEN KIELTEN TUTKIMUSKESKUKSEN JULKAISUJA 80. Sana kiertää KIRJOITUKSIA PAINATUSKESKUS HELSINKI

213a. MS-A0503 Todennäköisyyslaskenna n ja tilastotieteen per; M (vkot 3-7)

LAULUMUSIIKIN PÄÄAINE I

MAAHANMUUTTAJIEN ÄIDINKIELI THAIKIELEN KIELEN OPETUKSEN SUUNNITELMA 2006

Kysely etäopetustuntien valvojille toukokuussa 2011 (vastauksia 13)

1) Kotus-kuulumisia & 2) Yleiskielen seurantatalkoot: yleisövihjeitä kielenkäytön muutoksista

METEORIEN HAVAINNOINTI III VISUAALIHAVAINNOT 3.1 YLEISTÄ

Ensikertalaisia % Hyväksytyistä ensikertalaisia % Hakukohde Hakijat yht. Hakijoista ensikertalaisia. ensikertalaiset yht.

osakeyhtiölain kielenhuolto

Mitä voin lainata Kielipankista?

KERHOPAKETIN OHJELMA JA TAVOITTEET ( ARABIAN KIELI )

Vinkkejä hyvään graduun. Janne Hukkinen Helsingin yliopisto

Miksi lähtisin vaihtoon? Miksi en lähtisi vaihtoon?

Omat rajat ja turvaohjeet

Filosofinen tiedekunta UUDET KOULUTUSOHJELMAT. Kielet ja viestintä -tiedealueen opiskelijainfo varadekaani Nina Pilke

TIETOTURVA. Eduberry tietotekniikka marjanviljelijän apuvälineenä Leena Koponen

TOISEN KOTIMAISEN KIELEN JA VIERAIDEN KIELTEN SÄHKÖISTEN KOKEIDEN MÄÄRÄYKSET

HYVY001-kurssin loppukyselyn yhteenveto

TOISEN KOTIMAISEN KIELEN JA VIERAIDEN KIELTEN SÄHKÖISTEN KOKEIDEN MÄÄRÄYKSET

4. Lausekielinen ohjelmointi 4.1

Suomen murteet, murrearkisto ja Suomen murteiden sanakirja. Suku Heikki Hurtta

LASTEN OIKEUDET. Setan Transtukipiste. Oikeudesta olla prinssi tai prinsessa tai miettiä vielä

Palveluiden henkilökohtaistaminen - Vaihtoehtona henkilökohtainen budjetointi. Vuorovaikutteisen osion koonti Lappeenranta 2.2.

Ehdotus uudeksi kalatalousaluejaoksi

Arviointi oppilaiden näkökulmasta

Saamen kielten oppimistulokset vuosiluokilla 2015

Kun tavallinen kirja ei riitä - Celian aineistot, äänikirjat, selkokirjat

Tervetuloa opiskelemaan suomen kieltä

Puhesuomen kaksoispassiivi

PAREMMALLES SE TÄMÄ MINUSTA MAESTO, NIM PAREMMALTA Ablatiivin ja allatiivin vaihtelu suomen murteiden vaikutelmaverbien rektiossa

Tietoja valintakokeesta

Tutkinto-ohjelma Tiedekunta Tutkinto Koulutusala Ohjauksen ala Bioteknologian tutkinto-ohjelma Lääketieteen ja biotieteiden tiedekunta

LUOTTAMUSHENKILÖT: Raili Kerola, Tuula Mäntymäki, Riitta Liinamaa, Riitta Toivonen, Reino Rissanen, Maria Riitta Laukkanen Veteläinen.

Virkakielikampanja Avoimen hallinnon virkamiesverkoston tapaaminen Ulla Tiililä

MAAHANMUUTTAJIEN ÄIDINKIELI THAIKIELEN OPETUSSUUNNITELMA

Algoritmi III Vierekkäisten kuvioiden käsittely. Metsätehon tuloskalvosarja 7a/2018 LIITE 3 Timo Melkas Kirsi Riekki Metsäteho Oy

JUJUPRIX Kalle Tuominen & Timo Mäkeläinen Markkinointiviestinnän suunnittelutoimisto Mainio Oy. kalle@mainiota.fi timo.makelainen@mainiota.

Virtuaalipoluilla edistämään nuorten informaatio- ja medialukutaitoja

OPETUS- JA KULTTUURIMINISTERIÖN JA KOTIMAISTEN KIELTEN KESKUKSEN VÄLINEN TULOSSOPIMUS VUOSILLE JA VOIMAVARAT VUODELLE 2013

Keskustelukokouksista ja niiden johtamisesta.

Miten valitsen sopivan tilitoimiston? suomentilitoimistot.fi

Sata Saarenrantaa Merikarvialla - EU/LEADER-hankkeen tulosten esittely Merikarvialla Krookan sataman Rantahuoneella klo 16.

SUKUKIELTEN DIGITOINTIPROJEKTI JA KIRJALLISUUSPANKKI ESIMERKKEINÄ TUTKIJAYHTEISTYÖSTÄ

Hirviaineistojen visualisointia

Historialliset paikat ja kartat

Puhelimen ostaminen Asiakas Myyjä Asiakas Myyjä Asiakas Myyjä Asiakas Myyjä Asiakas Myyjä Asiakas Myyjä

Mittalaitetekniikka. NYMTES13 Vaihtosähköpiirit Jussi Hurri syksy 2014

Aineistot ja kenttä tänään

Musiikkipäiväkirjani: Soitetaan rytmissä omaa ääntä käyttämällä (RV1) Juhlitaan kaikkia tunnettuja kielen ääniä.

Suomen kielen ja kulttuurin uudet tutkintovaatimukset SIVUAINEOPISKELIJOILLE

PORTFOLIO Por+olion laa0misessa on hyvä huomioida seuraavia seikkoja

FRA. Ihmisten oikeus asua itsenäisesti. Suomen tapaustutkimus raportti *** *** EUROPEAN UNION AGENCY FOR FUNDAMENTAL RIGHTS * *

Lukemisen ja kirjoittamisen kompensoivat apuvälineet. Marja-Sisko Paloneva lukiapuvälineasiantuntija Datero

Salakirjoitusmenetelmiä

OPETUS- JA KULTTUURIMINISTERIÖN JA KOTIMAISTEN KIELTEN KESKUKSEN VÄLINEN TARKISTETTU TULOSSOPIMUS VUOSILLE JA VOIMAVARAT VUODELLE 2015

Metsätalouden kannattavuuden mittaus - järkeä. Helsinki

SIJAISSISARUUS NYT! TEHTÄVÄKIRJA

PORTFOLIOT JA OPETUSANSIOIDEN ARVIOINTI

Yhteistoiminnallinen kokous Satu Kurvinen

Lainsäädäntö - vapaaehtoistoiminnan este vai kannustin? Vapaaehtoistoiminta vanhustyössä -seminaari Elina Willberg

Kotimaisten kielten tutkimuskeskuksen strategia

Nautitaan e-aineistoista

Suomalais-ugrilaisten kielten morfosyntaktisesta tutkimuksesta FT Arja Hamari Nuorten Akatemiaklubi

Opetus- ja kulttuuriministeriön asemointitilastot 2015 ammattikorkeakouluille

Pirjo Saanio 2014 ISBN:

Ehdotus uudeksi kalatalousaluejaoksi

Perusteos kotimaista kansandialektologiaa

Horisontti

KYSY KIRJASTONHOITAJALTA VASTAAJAVERKOSTO. Nina Granlund Kirjastot.fi

Tähtitieteen käytännön menetelmiä Kevät 2009

LIITE 1: ISÄ SAIRAALASSA / SYMBOLIARKKI FORMULAKISA

Tervetuloa selkoryhmään!

Transkriptio:

Miten tietokone näkee suomen murteet? Antti Leino antti.leino@cs.helsinki.fi suomen kielen ja kotimaisen kirjallisuuden laitos tietojenkäsittelytieteen laitos Kotimaisten kielten tutkimuskeskus 2.11.2009 HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 1(18)

Kuva: Kotus Kuva: popgadget.net Johdanto: aineistot tietokoneelle Menetelmiä: mitä sitten? Murteita: löytyykö niitä? HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 2(18)

Johdanto Suomalaiset murreaineistot Pitkät perinteet aineistojen keruussa Jotkut aineistot tietokonemuodossa Suomen murteiden sanakirjan konseptikarttoja Muoto-opin arkisto Lauseopin arkisto Suomen murteet III a osittain Osa aineistoista sopii alueellisen vaihtelun etsimiseen kunhan käytössä oikeat menetelmät... HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 3(18)

Johdanto Dialektometria Laskennallista murteentutkimusta murrepiirteistä laskettuja eroja usein ääntämyseroja joskus (ja tässä) myös yleisemmin Tavoite: lisää objektiivisuutta murteentutkijan intuitio ja asenteet taustalle tietokone laskee Löytääkö tietokone murrealueet? HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 4(18)

Menetelmiä Kuinka erilaisia murteet ovat? Levenštein-etäisyys sama teksti eri murteenpuhujilta tekstit litteroidaan kahden murteen ero = yhden kirjaimen kokoisten erojen (poisto / lisäys / vaihto) lukumäärä keskieurooppalaisessa tutkimuksessa tavallinen Päijäthämäläisen murrealueen kolme ryhmää 7a: Äete tahtoo männä ottamaan paalla maetoo kellarista. 7b: Äete tahtuu männä ottaan pajalla maetuu kellarista. 7c: Äete tahtoo männä ottamaan paalla maetova kellarista. 7a 7b: 7 eroa 7a 7c: 2 eroa 7b 7c: 8 eroa (Wiik 2006) HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 5(18)

Menetelmiä Kuinka erilaisia murteet ovat? Yhteiset murrepiirteet paljonko kahden pitäjän välillä on eroja? murrekartta-aineistoahan on Mitä etäisyysmitoilla voi tehdä? 600 600 kahden pitäjän välistä etäisyyttä on aika hankala lukea erilaisia tapoja havainnollistaa murteiden samanlaisuutta kuvin HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 6(18)

Menetelmiä Murre-erot kartaksi Sovitetaan kuntaparien väliset etäisyydet mahdollisimman hyvin tasolle HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 7(18)

Menetelmiä Murrerajat Ryvästys: jaetaan pitäjät luokkiin samaan rypääseen kuuluvat mahdollisimman samanlaisia eri rypäisiin kuuluvat mahdollisimman erilaisia Tätähän murteentutkijat ovat tehneet! Ei kumminkaan aina kauhean hyvä idea murre-erot harvoin jyrkkiä kummalle puolelle rajaa siirtymämurteistot? HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 8(18)

Menetelmiä Murrerajat HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 9(18)

Menetelmiä Murteiden diffuusio Entäpä jos rajoja ei olisi? ydinalueen ympärillä vähitellen laimenevaa vaikutusta kuvaa paremmin siirtymämurteistoja Tilastotieteen monimuuttujamenetelmiä yhdistellään piirteitä eri painokertoimilla painotukset niin, että vaihtelu mahdollisimman selvää Tätäkin murteentutkijat tehneet! HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 10(18)

Menetelmiä Murteiden diffuusio HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 11(18)

Murteita No mitä se tietokone tietää? Eri aineistoista saa vähän erilaisia tuloksia sanastosta kolmijako itä länsi pohjoinen äänne- ja muotopiirteistä perinteisemmin itä länsi Eri menetelmillä saa vähän erilaisia tuloksia ryvästyksellä saa rajoja näkyviin, jos niitä haluaa komponenttianalyyseillä näkee paremmin vähittäisen muutoksen Murteita on niin monta kuin haluaa nähdä tarkastelutarkkuuden voi valita tarpeen mukaan HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 12(18)

Murteita Erilaiset päämurrejaot Suomen murteet III a:n aineistosta itä länsi-jako HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 13(18)

Murteita Erilaiset päämurrejaot Murresanakirja-aineistosta pikemminkin itä länsi pohjoinen HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 14(18)

Murteita Rajoja vai ei? HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 15(18)

Murteita Montako saisi olla? HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 16(18)

Murteita Lopuksi Murrevaihtelua saa esiin tietokoneella kohtuullisen lähellä perinteistä näkemystä etenkin, kun lähtöaineisto on sama Ei yhtä ainoaa totuutta eroja eri aineistojen kesken eroja eri menetelmien kesken yllättyikö joku? HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 17(18)

HUMANISTINEN TIEDEKUNTA Antti Leino: Miten tietokone näkee suomen murteet? 18(18)