Johdatus kieliteknologiaan Luku 1: Johdanto
|
|
- Hanna-Mari Haavisto
- 5 vuotta sitten
- Katselukertoja:
Transkriptio
1 Johdatus kieliteknologiaan Luku 1: Johdanto Kimmo Koskenniemi 4. marraskuuta 2007 Sisältö 1 Mitä kieliteknologia on ja mihin sitä tarvitaan? 1 2 Kielen järjestelmä Kieltä ei tiedosteta Lekseemi eli hakusana, sananmuoto ja sane Kieli on iso Kielikyky Kieli on moniselitteistä ja epätäsmällistä Kieli vaihtelee ja muuttuu Sananmuotojen moniselitteisyys Lauserakenteen moniselitteisyys Merkityksen moniselitteisyys Kieli on epätäsmällistä Onko moniselitteisyys ja epätäsmällisyys rakennevirhe? Mitä kieliteknologia on ja mihin sitä tarvitaan? Kieliteknologia on kieleen liittyvää teknologiaa ja se käsittelee erityisesti sellaisia menetelmiä, joilla ihmisten kieltä voidaan tietokoneen avulla automaattisesti jäsentää, tuottaa tai tunnistaa ja erityisesti myös menetelmiä, joiden avulla ihminen voi kielensä avulla kommunikoida tietokoneen kanssa. Kieliteknologian ydin koostuu nimenomaan niistä menetelmistä, joilla kieltä ja sen käyttöä mallinnetaan. Ytimen ympärillä on laaja joukko sovelluksia, joissa ytimeen liittyviä menetelmiä voidaan hyödyntää ja jotka tuovat kieliteknologian piiriin uusia tarkastelukulmia ja haasteita kieliteknologian menetelmin ratkaistaviksi tehtäviksi. Usein tätä laajempaa kokonaisuutta kutsutaan nimenomaisesti kieliteknologiaksi (ruotsiksi språkteknologi, englanniksi language technology, language engineering, human language technology) ja ydintä tietokonelingvistiikaksi (ruotsiksi datalingvistik tai datorlingvistik, englanniksi computational linguistics). Suomessa kieliteknolgia-termiä käytetään nykyään molemmista. 1
2 Ajatus puhuvasta ja puhetta ymmärtävästä tietokoneesta on aika vanha. Kubrikin vuonna 1968 valmistuneessa elokuvassa Avaruusseikkailu 2000 oli HALiksi kutsuttu puhuva (teko)älykäs tietokone ja vuodesta 1966 alkaen tehdyissä Star Trek -filmeissä tietokonetta käytettiin luontevasti puhekäyttöliittymän kautta. Noista ajoista tietokoneet ovat kehittyneet ja nopeutuneet valtavasti. Silti näin laaja ja luonteva käyttöliittymä on pysyy yhä tulevaisuuden toiveena. Tosin nykyään pystytään jo toteuttamaan monia sovelluksia, joissa ihminen voi kysellä ja toimittaa erinäisiä asioita tietokoneen kanssa. Kieli- ja puheteknologian tehtävänä on opettaa tietokone tunnistamaan ihmisen puhetta sekä tuotamaan ymmärrettävää ja riittävän luontevaa puhetta. Keskusteltaessa tietokoneen kanssa täytyy tietokoneelle näiden lisäksi opettaa myös miten keskustellaan eli mitä ja miten laajasti milloinkin tulisi kysyä, todeta tai vastata. Eurooppa on monikielinen ja se on poliittisestikin sitoutunut monikielisyyteen. Euroopan unionin melkoisessa byrokratiassa kielen kääntäminen muodostanee isoimman yksittäisen kuluerän ja unioni työllistää melkoisen joukon kääntäjiä ja tulkkeja. EU:lla lienee pitkälti toistatuhatta vakinaista kääntäjää ja lisäksi freelancereita. Vuosittain siellä käännetään toista miljoonaa sivua tekstiä EU-kielille tai -kieliltä. Tekstejä käännetään osittain ihmisvoimin perinteiseen tapaan, mutta myös sekä kieliteknologisten ja muiden menetelmien avustamana ja osittain myös automaattisten käännösohjelmien avulla. Tietokoneohjelman suorittama käännös yleensä tarkistetaan ja korjaillaan kuitenkin ihmisen toimesta. Kielen kääntämisessä kieliteknologiasta on suuri apu ihmiselle, joka työkseen tai työssään kääntää tekstejä. Eri tavoin syntyvä tieto tallennetaan nykyään useimmiten valmiiksi suoraan tietokoneen muotoon. Uskomattoman paljon tietoa sijaitsee Internetissä kenen tahansa saatavilla tai erilaisissa yrityksissä ja organisaatioissa valikoidumpien käyttäjien nähtävissä. Tietoa on oikeastaan liikaa. Siksi tiedon valikointi eli tiedonhaku, tiedon tiivistäminen, luokittelu ja indeksointi ovat nousseet tärkeiksi. Kun tieto on kielen muodossa, tarvitaan kieliteknolgiaa neutraloimaan esim. sanojen taipumisesta johtuvia ongemlmia, jotta mahdollisimman monet halutuista dokumenteista löytyisivät. Toisaalta kielellisen rakenteen tunnistaminen auttaa monissa tapauksissa tarkentamaan käsittelyä eli tuomaan haussa enimmäkseen sellaisia dokumentteja, joita varsinaisesti halutaan. Muidenkin kielten kuin äidinkielen oppiminen kuuluu olennaisena osana eurooppalaiseen yhteiskuntaan. Tietokoneen ja kieliteknologian avulla voisimme helpottaa vieraskielisten tekstien ymmärtämistä ja avustaa ihmisiä vieraan kielen oppimisessa. Tietokoneet kun ovat paremmin saatavilla ajasta ja paikasta riippumatta kuin ihmisopettajat. Monien mielestä tietokone on myös hienotunteinen opettajana, kun sille tehtyä virhettä ei tarvitse häpeillä. Vammmaisten elämänlaatua voidaan parantaa kieliteknologian avulla, Viime vuosituhannella kieliteknologia (tai tietokonelingvistiikka) oli lähinnä tutkimuskohde, tosin varsin mielenkiintoinen kohde. Viime aikoina tietoverkkojen ja tietotekniikan läpimurron myötä ollaan konkreettisestikin siirtymässä tietoyhteiskuntaan, jossa uudet viestintävälineet ja erityisesti Internet koskettavat jo pääosaa kaikista kansalaisista ja niiden avulla on saatettu ennennäkemättömät tietomäärät ja verkkopalvelut jokaisen ulottuville. Suuri osa näistä tiedoista on luonnollisen kielen muodossa ja moniin palveluihin olisi puhuttu (tai kirjoitettu) kieli luontevin lähestymiskeino. Mitenkä muuten kännykän kanssa pyyntöjänsä esittäisi kuin puhumalla ja millaisessa muodossa vastauksia niin pienellä laittella haluaisi saada. Harvojen harrastuksesta on siten hyvin lyhyessä ajassa tullut massojen päivittäistä elämää ja toimintaa koskettava teknologiaa, jonka tulevaa merkitystä vieläkin ilmeisesti aliarvioidaan. Tämä kurssi on laadittu erityisesti kieliteknologian sovellusten näkökulmasta ja se jäsentyy kuudeksi teemaksi, kukin oman sovellusalueensa ympärille. Kieliteknologian menetelmiä ja käsitteitä tuodaan esille sovellusten esittelyn yhteydessä. Tavoitteena on johdattaa lukija ymmärtämään kielen olemusta kieliteknologian kannalta sekä auttaa tunnistamaan kieliteknologian merkitys ja mahdollisuudet erilaisissa nykyään jo yleisissä, mutta tulevaisuudessa vieläkin yleisemmissä tärkeissä sovelluksissa. Lyhyt katsaus kieliteknologian olemukseen, tehtäviin ja historiaan löytyy teoksen (Jurafsky et al. 2000) luvusta 1 (Introduction, ss. 1 18). 2
3 2 Kielen järjestelmä Ihmisen kieltä voidaan kuvata järjestelmänä, mutta järjestelmä on olemukseltaan jotain muuta kuin esimerkiksi tietokoneiden ohjelmointikieli tai kokoelma matemaatisia kaavoja. Ihmiskieli on sekä laaja, että monimuotoinen, mutta myös aivan erityisellä tavalla sumea ja rajoiltaan avoin järjestelmä. 2.1 Kieltä ei tiedosteta Ihmisellä ei luonnostaan ole intuitiivista kuvaa kielensä olemuksesta, ei sen monimutkaisuudesta, eikä monitulkintaisuudesta. Päin vastoin, useimmille kieli tuntuu jokseenkin itsestään selvältä ja ongelmattomalta. Äidinkielen kohdalla tällainen sokea pilkku on ehkä konkreettisempi kuin koululaisena tai aikuisena opiskeltujen vieraiden kielten. Useat kokevat äidinkielen paljon säännöllisemmäksi kuin, mitä se on. Vieraiden kielten tietyt poikkeuksellisuudet muistetaan helpommin. Silti, minkään kielen kohdalla sen oppiminen ei merkitse sitä, että henkilö itse pystyisi osaamisensa perusteella selittämään kielen sääntöjä tai säännönmukaisuuksia kovinkaan tarkasti. Osatakseen jotakin, esimerkiksi ajaa polkupyörällä tai kävellä, ihmisen ei tarvitse tietää, kuinka hän sen osaa. Taitoja vain opitaan, eikä ilmiöiden tarkempaa rakennetta tarvitsekaan tietää. Pyöräilijälle riittää, että pysyy pystyssä ja pääsee, minne haluaa. Ei ole siis pakko olla selvillä siitä, että kääntyäkseen oikealle pitää ensin saada pyörä kallelleen, esimerkiksi kääntämällä ensin hiukan vasemmalle, jonka jälkeen oikealle kääntyminen hoituu sillä, että pitää pyörän pystyssä ohjaamalla vaistonvaraisesti. Mutta, jotakin tällaista me teemme, vaikka emme tiedostaiskaan fysikaalisia tosiasioita, ja silti ajamme pyörää sujuvasti. Kävelemiseen tarvittava ohjeistus on kai vielä mutkikkaampaa, mutta onneksi voimme kävellä kahdella jalalla ilman tällaista tietoa. Kieleenkin liittyy tällaisia osaamisia, joita useimmat meistä eivät tiedosta. Meidän olisi vaikeaa ja hyvin työlästä kirjoittaa täsmällistä kielioppia äidinkielestämme, siitä millaiset sanajärjestykset ja sanavalinnat milloinkin ovat luontevia tai miten sanoja taivutetaan. Jos ja kun kielen toimintaa yritetään ohjelmoida tietokoneelle tai muuten kuvata eksplisiittisesti, käy pian ilmeiseksi, että kieli on kovin laaja, moniselitteinen ja vaikeasti kuvattava kohde. 2.2 Lekseemi eli hakusana, sananmuoto ja sane Tavallisessa kielenkäytössä sana voi tarkoittaa useammanlaisia asioita. Kieliteknologiassa ja kielitieteissä on tarpeen kuitenkin pitää tarvittaessa erillään seuraavat kolme käsitettä, jotka ovat tämän kurssin kannalta tärkeitä ja sen vuoksi ne tuodaan esille jo nyt. lekseemi eli hakusana Intuitiivista sanan käsitettä lähinnä lienee lekseemi (jota usein kutsutaan sanakirjojen yhteydessä myös hakusanaksi). Sellaisilla voi olla taivutusmuotoja ja merkityksiä ym. Esim. katto -lekseemillä on taivutusmuotoja siten kuin millä tahansa substantiivilla, esim. katto, katon, kattoa, jne. Yksikielisissä sanakirjoissa kuten Suomen kielen perussanakirjassa hakusanalla on oma selitystekstinsä, jossa sen mahdollisia erilaisia alamerkityksiä kuvataan. Kaksikieliset sanakirjat pyrkivät puolestaan luettelemaan kielen hakusanat ja antamaan kullekin yhden tai useampia käännöksiä jollekin toiselle kielelle. Lekseemi on siis yleensä tällaista ns. hakusana-artikkelia vastaava kielen kuvaamisen yksikkö, johon liittyy perusmuodon lisäksi esim. tieto sanaluokasta ja taipumisesta. Siten esimerkiksi laki merkityksessä säädös on eri lekseemi kuin laki merkityksessä huippu koska nämä kaksi taipuvat eri tavalla (lain vs. laen). Eri alamerkitys ei kuitenkaan tee eri lekseemejä eli esim. laskea erilaissa merkityksissään on yksi ja sama lekseemi (ja sen alamerkitykset luetellaan samassa hakusana-artikkelissa). Lekseemit voivat olla yksiosaisia tai yhdyssanoja, kuten harjakatto, ne voivat myös olla johdettuja sanoja, kuten ojentautua. 3
4 sananmuoto Lekseemin taivutusmuodot ovat sananmuotoja, esim. sananmuoto katolle on katto-lekseemin yksikön allatiivi. Samaan tapaan kuin lekseemikin, sananmuoto on käyttöyhteydestään irroitettavissa oleva käsite. Siten katto-lekseemillä on vain yksi yksikön allatiivimuoto katolle, vaikka tekstissä tuo kirjainjono esiintyisi useampia kertoja. Sananmuoto on vain merkkijono, esim. katosta, jolla voi olla useampikin tulkinta, tässä se voi olla joko katto-lekseemin elatiivi tai yhtä hyvin katos-lekseemin partitiivi. Erityisesti perusmuodotkin ovat sanamuotoja, siis katto on myös sananmuoto, nimittäin katto-lekseemin yksikön nominatiivi. sane Juokseva teksti koostuu puolestaan saneista, joita erottaa toisistaan sananväli tai välimerkit. Voimme siten laskea kuinka monta sanetta jossakin tekstissä on. Sane on siten sananmuodon esiintymä, eli tietty sananmuoto, esim. on voi esiintyä tekstissä vaikkapa 12 kertaa. Varsinkin tekstin pituudesta käytety ilmaus teksti on 1000 juoksevan sanan mittainen tarkottaa meidän termeillämme 1000 saneen mittainen. Vaikka olemme määritelleet nämä kolme käsitettä ja termiä, saatamme silti käyttää sujuvuuden vuoksi silloin tällöin termiä sana kussakin näistä merkityksistä sikäli, kun sekaantumisen vaaraa ei ole. Lauseet ja virkkeet koostuvat saneista, joiden välillä on erilaisia ns. määritesuhteita. Virkkeiden rakenteen tunnistaminen voisi muuten olla kohtuullisen helppoa, mutta tätä tehtävää vaikeuttaa sanojen ja rakenteiden moniselitteisyys. Virkkeiden merkitykset ovat niiden rakennettakin ongelmallisempia kuvata täsmällisesti, vaikka ihmisillä onkin se vaikutelma, että merkitykset olisivat itsestään selviä. 2.3 Kieli on iso Kieli ei ole pieni eikä yksinkertainen, vaikka sen koosta ja mutkikkuudesta meillä ei olekaan luontaista mielikuvaa. Päin vastoin, kieli on monella tavalla laaja tai ehkä ääretönkin. Tiedämme matematiikasta, että kokonaislukuja on äärettömän paljon, vaikka kukin luku koostuu jonosta numeromerkkejä, joita kymmenjärjestelmässämme on kymmenen erilaista: 0 9. Kielikin koostuu vastaavalla tavalla harvoista merkeistä: kirjoitettu kieli kirjaimista ja puhuttu kieli äänteistä. Jätämme tässä kutenkin hetkeksi puheen ja mutkikkaammat kirjoitusjärjestelmät syrjään ja käsittelemme suomen tapaista aakkosmerkeillä kirjoitettua kieltä. Kirjaimia tai äänteitä on kielissä muutama kymmenen erilaista ja niiden voidaan ajatella vastaavan numeromerkkejä. Kirjaimilla voidaan muodostaa sananmuotoja, joskaan kaikki kirjainyhdistelmät eivät ole mahdollisia: talossa ja spriin ovat mahdollisia, mutta kdpgv tuntuu mahdottomalta suomen kielessä. Kaikki mahdollisen tuntuisetkaan sananmuodot kuten heulo 1 eivät kuulu kieleen. Sananmuodoilla on myös rajallinen pituus, eikä minkään kielen sanavarasto ole loputon. Kielissä voi olla muutamia kymmeniä tuhansia tai jopa miljoona lekseemiä, jotka voivat olla lueteltuina hakusanoina sanakirjoissa. Vaikka lekseemien määrä on tässä mielessä rajallinen, elävien kielten sanasto on avoinna sekä pysyvämmin kieleen pyrkiville uudissanoille että puhujien muodostamille tarpeeseen luoduille lekseemeille, jotka saattavat unohtua käytön jälkeen. Lekseemit eivät kuitenkaan ole kiinteitä yksiköitä, vaan useimmissa kielissä ne taipuvat sananmuotoina, minkä lisäksi monista lekseemeistä voi johtaa säännönmukaisesti toisia lekseemejä ja lekseemejä voidaan vielä yhdistää yhdyssanoiksi, jotka ovat nekin lekseemejä. Tällainen lekseemien tuottaminen toisista lekseemeistä eli sananmuodostus saattaa olla vain pieni lisä kielen sanavarastoon kuten englannin kielessä, tai sitten ratkaiseva tekijä kuten suomessa. Suomen kielessä erityisesti sanojen taipuminen on yllättävänkin monimuotoista. Jokainen substantiivi saa erilaisia muotoja kahdessa luvussa (eli yksikössä ja monikossa) 1 Tämänniminen paikka lienee Havaijilla. 4
5 yli kymmenessä sijamuodossa (nominatiivi, genetiivi, partitiivi, jne.) omistusliitteen mukaan (yksikössä ja monikossa kolme persoonaa ja ilman liitettä) sekä liitepartikkelin mukaan (-kin, -pa, -han, jne). Yhteensä näiden yhdistelmät tuottavat noin 2000 erilaista sananmuotoa kustakin substantiivista. Adjektiivit taipuvat samaan tapaan kussakin kolmesta eri vertailuasteestaan (jotka ovat positiivi, komparatiivi, superlatiivi). Näin ollen kullekin adjektiiville tulee noin 6000 eri muotoa. Verbit yltävät vieläkin useampiin muotoihin, peräti noin muotoon, joista pääosa tulee partisiipeista ja muista nominaalimuodoista, jotka taipuvat kuten substantiivit (juokse+minen) tai joillakin verbeillä kuten adjektiivit (katso+ttu). Minkälaisiin suuruusluokkiin tämä johtaa? Jos oletamme suomen kielessä olevan esim yksiosaista substantiivia, saamme näistä taivuttamalla 200 miljoonaa eri muotoa. Adjektiiveja on vähemmän, mutta niistä voinee tulla sata miljoonaa sananmuotoa. Verbejä on myös vähemmän, ja niistä voisi tulla vielä sata miljoonaa lisää. Tässä lähes puolessa miljardissa sananmuodossa ei kuitenkaan ole koko totuus. Ensinnäkin voimme suomen kielessä johtaa verbeistä, adjektiiveista ja substantiiveista toisia hakusanoja, esim.: istua, istuskella, istuskeluttaa, istuttaa, istuutua, istuskeluttajamaisuus, jne. Tätä kautta saamme muotojen määrän ehkä yhtä kertalukua (eli kerrointa 10) suuremmaksi. kerroin yhteensä erilaisia muotoja perusmuoto: katto 1 yksikkö ja monikko: katto, 2 2 katot sijamuodot: n, a, na, ksi, ssa, sta, Vn, lla, lta, lle, tta, ine, in omistusliitteet: ni, si, Vn, nsa, mme, nne liitepartikkelit: kin, han, pa, ko,... yksiosaisille substantiiveille: aalto, aamu,..., katto,... kaksiosaisille yhdyssanoille: aalto-pelti,... kolmiosaisille yhdyssanoille: aalto-pelti-katto,... neliosaisille yhdyssanoille: jauhe-liha-makaronilaatikko Kuva 1: Suomen kielen sananmuotojen määrien suuruusluokkia Isompi vaikutus on kuitenkin yhdyssanojen muodostamisella. Kahdesta substantiivista voi muodostaa yhdyssanan, esim. talo ja kirja yhdistyy sanaksi talokirja tai talonkirja. Kaksiosaisia yhdyssanoja voisi siis olla noin ja niillä kullakin ne 2000 muotoa, eli yhteensä 40 biljoonaa (siis ). Yhdyssanojen muodostaminen ei kuitenkaan rajoitu kaksiosaisiin, vaan esimerkiksi ruokaloissa näemme useinkin sellaisia yhdyssanoja kuten jauhelihamakaronilaatikko, savukirjolohisalaatti. Neliosaisten yhdyssanojen mutojen teoreettinen määrä kohoaakin jo kohtuuttoman suureksi: eli 5
6 Kun huomaamme, että yhdyssanan alkuosa voi olla joko nominatiivissa tai genetiivissä, saamme tästä helopsti vaikka lukumääriä eli kvadriljoonan. Luvut ovat hyvin keinotekoisia kahdellakin tavalla. Toisaalta juuri neljä yhdyssanan osaa on mielivaltainen, joskus voidaan tehdä pitempiäkin. Tärkeää on huomata, että monet näistä muodollisesti mahdollisista kombinaatioista ovat vailla sovittua merkitystä tai käyttöä, esim. äänikalaunenheikkous tai jääovipiirakannaula. Kuitenkin jokainen suomen kielen taitaja eräässä mielessä hallitsee jokaikisen noista kvardiljoonasta sananmuodosta. Hän pystyy vaivattomasti tunnistamaan sellaisen osat ja taivutusmuodot, eli pystyy oitis todentamaan, onko muoto mahdollinen eli muodollisesti korrekti. Sen lisäksi, että näitä suuria lukuja voi kummastella, näistä laskelmista voidaan tehdä eräs johtopäätös ihmisen kielikyvystä. Ei ole uskottavaa, että kielenpuhujat oppisivat valmiita sananmuotoja siten, että heidän tulee kuulla opittavana oleva sananmuto ennen, kuin se tulee opituksi. Sananmuotoja on nimittäin liikaa. Kvadriljoonan sananmuodon luettelemiseen sananmuoto per sekunti tarvittaisiin enemmän sekunteja kuin, mitä maapallo on ollut olemassa. Maapallon iäksi kun arvioidaan noin 4 miljardia vuotta eli likipitäen s eli noin 1, sekuntia. Pieni muistutus on tässä paikallaan. Esimerkki sananmuotojen runsaudesta oli suomen kielestä. Meillä on usein houkutus kuvitella, että oma kielemme olisi jollakin tavoin äärimmäinen. Maailman muutaman tuhannen kielen joukossa se on kuitenkin monella tavalla keskiverto. Toiset kielet ovat sananmuodostukseltaan suomea yksinkertaisempia, jotkut taas monimutkaisempia. Esimerkiksi eskimokielissä yksi sananmuoto vastaa rakenteeltaan lähestulkoon eurooppalaisten kielten lausetta. Sen vuoks eskimokielissä voisi olla kertalukuja enemmän erilaisia sananmuotoja kuin suomessa. Sekä sanskritissa että klassillisessa arabiassa ovat sananmuotojen rakenteet ja taipumisen tai sananjohdon yhteydessä tapahtuvat vaihtelut paljon mutkikkaampia kuin suomen kielessä. 2.4 Kielikyky Kielenpuhujalla sanotaan olevan kielikyky eli kompetenssi, jonka turvin hän kieltä ymmärtää ja käyttää. Kielikykyyn liitetään erityisesti myös produktiivisuus eli kyky ymmärtää ja tuottaa ilmauksia säännönmukaisuuksien perusteella ilman, että niitä on nimenomaisesti enen kuultu, nähty tai opittu. Kieli ei ole tarkkarajainen kohde, vaan uusia sanoja opitaan ja tehdään tarpeen mukaan ja kielen sääntöjä joskus venytetään suorastaan leikiksi asti. Arkielämässäkin kohtaamme uusia nimiä, joita osaamme taivuttaa yhteisten sopimusten mukaisesti. Näin, vaikka emme tiedostaisi noita yhteisiä sopimuksia, emmekä osaisi niitä pukea miksikään säännöiksi, kuten aiemmin todettiin. Osaamme myös taivuttaa sujuvasti myös uusia, ennen kuulemattomia sanoja, nimiä tai uudissanoja. Esimerkiksi monikon genetiivin muodostaminen tekosanasta heuhu on ilman muuta heuhujen eikä mallina käytetä sananmuotoa arveluiden. Peruste valinnalle ei välttämättä ole tiedostettu, vaikka osaamme valinnan tehdä. Esimerkkinä suomen kielestä otamme kaksitavuiset a-loppuiset susbstantiivit. Osaamme taivuttaa niitä, esim.: koira koiria rotta rottia usva usvia korva korvia kaira kairoja kana kanoja kerma kermoja karva karvoja Näissä sanoissa havaitaan monikossa vartalonloppuisen a-äänteen joko katoavan tai muuttuvan o-äänteeksi. Useimmat meistä eivät kuitenkaan tunne sitä säännönmukaisuutta, jonka perusteella voidaan päätellä kummalla tavalla sanoja pitäisi taivuttaa. Jos keksimme sellaisia kaksitavuisia a-loppuisia sanoja, joita emme entuudestaan tunne, kuten seera tai 6
7 ruula osaamme kuitenkin taivuttaa tällaisia. Luultavasti lukijakin muodostaisi monikkomuodot seeroja ja ruulia (eikä seeriä tai ruuuloja). Jos suorittaisimme näitä taivutuksen kokeiluja vierustoverin nähden ja kuullen tai yksin ollessamme peilin edessä ja tarkkailisimme huulten asentoa niissä sanoissa, joista a häviää, huomaisimme hyvinkin sen, että aivan ensimmäisen vokaalin kohdalla suu olisi supussa, eli sanan ääntämystä kuvaavilla termeillä ensivokaali on ns. pyöreä vokaali (joita ovat suomessa o, ö. u ja y). 3 Kieli on moniselitteistä ja epätäsmällistä Kieli ei ole aina ollut samanlaista, eikä kieli nytkään ole kaikille aivan samaa. Kielessä on myös moniselitteisyyttä eri tasoilla. Yksittäisiä sananmuotoja tai virkkeitä voidaan tulkita useammalla tavalla. Kielen koodausjärjestelmät ovat löyhiä eivätkä luonnolliset kielet näiltä osin ole lainkaan ohjelmointikielten kaltaisia. 3.1 Kieli vaihtelee ja muuttuu Kieli muuttuu. Sen havaitsee kyllä, jos lukee useamman kymmenen vuoden takaista tekstiä. Monet sanat, kuten direktiivi ja kännykkä eivät olleet tuolloin tunnettuja, ja silloinen teksti vaikuttaa kenties huolitellummalta kuin nykyinen. Jos tekstissä lukee harakkata eikä harakkaa, voi arvata, ettei teksti ehkä ole aivan tuoretta (vaan esim. Juhani Ahoa). Jos taas tulee vastaan muoto sutea pro sutta, voi epäillä, että se on kirjoitettu lähiaikoina jossakin epämuodollisessa yhteydessä. Kielissä on myös alueellisia murteita ja toisaalta korkeasti koulutettu väki voi puhua ja kirjoittaa aika lailla eri tyylillä kuin vähemmän koulutettu. Chatissä ja tekstiviesteissä käytetään ja kirjoitetaan kieltä vapaammin kuin pysyvämpään käyttöön tarkoitetussa tekstissä. Kaikki tämä vaihtelu ja muutos asettaa omia vaatimuksiaan kieliteknologialle. Puhuttu kieli on vaihtelevampaa kuin kirjoitettu. Kirjoitetulla kielellä on yleensä varsin tarkat normit, jotka usein nimenomaisesti määräävät kullekin sanalle yhden ainoan kirjoitusasun oikeaksi (esim. pahoittaa eikä pahottaa) tai tietyille asioille yhden nimenomaisen suositellun ilmauksen. Puhekielille on aika lailla erilaiset kielioppisäännöt kuin kirjoitetuille kielille ja niillä on hieman eri lailla painotetut sanastonsa. Puhekielet ovat lause- ja muoto-opillisesti selvästi erilaista kuin kirjoitetut. Vain harvojen kielten puhutun muodon kielioppeja on kuitenkaan vielä laadittu, vaikka hyvin monien pienten kieliyhteisöjen kirjoitettujen kielten kieliopit ovat saatavilla. Puhutussa kielessä käytetään helpommin paikallisia murrepohjaisia muotoja tai sanojakin. Myös tyyliä ja huolittelun astetta saatetaan vaihdella mielialan ja tilanteen mukaan. Nopeasti puhuttaessa tietyt kohdat paitsi lyhenevät niin myös yksinkertaistuvat ja joitakin osia sanoista voi jäädä kokonaan ääntymättä. Osa puhutun kielen murrepohjaisista yksittäisten puhujien puheen eroista on tiedostamattomia. Usein puhuja luulee tietoisesti välttävänsä kaikkia kotimurteestaan muistuttavia piirteitä, muttei siinä kuitenkaan täysin onnistu. Vain harjaantunut ja murre-eroista tietoinen kuulija pystyy kuitenkin tunnistamaan tällaisia eroja. 3.2 Sananmuotojen moniselitteisyys Sananmuotojen moniselitteisyyttä syntyy usealla tavalla. Toisaalta jo perusmuoto voi olla moniselitteinen sanaluokkansa tai merkityksensä puolesta. Toisaalta taivutus, yhdyssanan muodostaminen tai sanajohto voi sattumalta aiheuttaa moniselitteisyyttä. Esimerkiksi englannin kielessä moniselitteisyys on runsasta, ehkä noin puolet juoksevan tekstin saneista 7
8 voitaisiin tulkita useammalla kuin yhdellä tavalla. Sananmuodot kuten hand voivat olla joko substantiiveja (my hand was hurt) tai verbejä (please, hand me that paper). Sanojen taivuttaminen voi tuottaa monitulkintaisuuksia eri tavoin. Suomen kielessä esim. hauista syntyy substantiivista hauki yksikön elatiivina, substantiivista haku monikon elatiivina ja sanasta hauis yksikön partitiivina. Sijapääte -ta sisältyy sijapäätteeseen -sta, jotenloppukirjainten puolesta elatiivimuodot voisivat olla partitiiveja jostakin toisesta sanasta. Lisäksi astevaihtelu voi muuttaa vartaloa toisen sanan kaltaiseksi, tässä pudottamalla hauki-sanan k-kirjaimen pois saadaan osa toisen sanan vartaloa. Yhteisvaikutuksena näistä ilmiöistä kieleen syntyy moniselitteisiä sananmuotoja. Suomen kielessä saneista kuitenkin vain pieni osa on moniselitteisiä noin 10 %, mikä johtuu kai osittain siitä, että sanojen vartalot ovat melko pitkiä englantiin tai ruotsiin verrattuna. Yhdyssana voi olla toisen sanan kaltainen, esim. sananmuodosta kuutamoilta on vaikea arvata, tarkoitetaanko yhdyssanaa kuutamo-ilta vaiko kuutamo-sanan monikon ablatiivia. Ruotsin kielessä sanojen vartalot ovat usein yksitavuisia ja saattavat alkaa useamman konsonantin yhdistelmällä tai vastaavasti päättyä siten. Tästä syntyy aika lailla periaatteellisia monitulkintaisuuksia kuten esim. sananmuoto frukosten, joka voidaan tulkita paitsi yksiosaisena frukost-sanan määrättymä muotona, myös useana erilaisena yhdyssanana kuten fru+ko+sten tai fru+kost-sanan määrättynä muotona jne. Sananmuotojen moniselitteisyys on aika petollista sikäli, että ihminen ei kovinkaan hyvin havaitse sitä. Ihminen arvaa useimmiten sananmuotojen oikean tulkinnan huomaamattaan asiayhteyden ja odotustensa perusteella. Esimerkiksi virkkeessä Ahdin luo pääsi kuusi alamaista jokainen sane on moniselitteinen, mutta sen havaitakseen täytyy virkettä katsoa aivan toisella silmällä. Koeta harjoituksen vuoksi itse päätellä seuraavien sananmuotojen kaikki tulkinnat (perusmuoto ja sanaluokka kustakin tulkinnasta): (a) alusta, (b) koneista. 3.3 Lauserakenteen moniselitteisyys Saneista muodostuu lauseita ja lauseista virkkeitä, mutta mitä lauseiden rakenne oikein on? Yksittäisten saneiden rooleja lauseessa voidaan kuvata esimerkiksi seuraavasti: (jäljessä seuraavan substantiivin) genetiiviattribuutti tai adjektiiviattribuutti, (lauseita yhdistävä) alistuskonjunktio, (lauseen) adverbiaali, tai toisaalta esim. (lauseen) subjekti, objekti tai predikaatti. Tällainen kuvaustapa on ns. klassillisessa lauseenjäsennyksessä. Kielitieteellisissä teorioissa ja sittemmin myös tietokoneen ohjelmointikielissä on käytetty nk. lausekerakennetta (phrase structure), jota kuvataan usein puurakenteella. Puurakenne on eräs tapa kuvata vietekkäisten saneiden tai niistä koostuvien laajempien kokonaisuuksien yhteenkuuluvuutta. Puun osa, ns. alipuu edustaa lauseketta, jonka osat kuuluvat läheisemmin toisiinsa kuin alipuun ulkopuolella oleviin sanoihin. Kuvan 2 rakenne ilmaisisi siten, että predikaatti loves ja objekti Mary kuuluvat tiukemmin yhteen kuin subjekti näihin kumpaankaan. S NP John V VP NP loves Mary Kuva 2: Lauseen puurakenne 8
9 Kielissä on erilaisia kieliopillisia keinoja lauseen rakenteen ilmaisemiseksi. Englannin kielessä sanan tai lausekkeen sijaintipaikka lauseessa on tärkeä keino, sillä irrallisista sanoista ei juurikaan näe, ovatko ne verbejä, substantiiveja vai adjektiiveja, esim.: they paint the wall this paint is wet Paitsi yksittäisten sanojen sanaluokat, riippuvat englannissa saneiden roolit lauseenjäsennyksessä niiden keskenäisestä järjestyksestä, esim.: the elephant killed the snake the snake killed the elephant Suomen kielessä puolestaan saneen sijainti lauseessa ei kerro kovinkaan paljon, mutta sanojen taivutuspäätteet sitäkin enemmän: jänis söi porkkanat porkkanat söi jänis Sijamuodoilla, prepositioilla ja saneiden järjestyksellä tms. näkyviin merkitty lauserakenne ei kuitenkaan koodaa kaikkea, mikä tarvittaisiin merkityksen täsmällistä päättelemistä varten. Esimerkiksi ilmauksessa: punainen tupa ja perunamaa ei ole minkäänlaista näkyvää kieliopillista merkintää siitä, olisiko kyseinen perunamaa punainen vai ei. Ei perunamaa luultavasti punainen ole, mutta se tieto ei tule tuosta ilmauksesta vaan siitä, mitä maailmassa olevista asioista muuten tiedämme. Jossakin toisessa lauseessa kuten seuraavassa: ylväs ryhti ja käytös voimme hyvin arvata, että on kyse myös ylväästä käytöksestä, vaikka tästäkään ei ole näkyvää merkintää. Aina ei oikea tulkinta selviä, kieliopillisten kriteerien, sanakirjan tai edes meitä ympäröivän fysikaalisen maailman tavanomaisilla ominaisuuksilla. Joskus tarvitaan lisänä yhteiseksi oletettua tietoa historiasta ja kulttuurista kuten seuraavassa: Sen hän teki hyvällä syyllä, sillä Cortesin nimi oli meidän päivinämme yhtä kuuluisa kuin Caesarin roomalaisten keskuudessa tai Hannibalin kartagolaisten parissa. Caesarin nimi oli kuuluisa roomalaisten keskuudessa, mutta Cortesin nimi ei voinut olla kuuluisa Caesarin roomalaisten keskuudessa, vaan kyseessä on vertailu... yhtä kuuluisa kuin Caesarin nimi oli roomalaisten keskuudessa tai... Tässä nimi-sanan pois jättäminen houkuttelee lukijaa väärälle polulle virkkeen tulkinnassa. Seuraavan virkkeen tulkinta on yhtä lailla pulmallinen: Kun näemme surkeiden alkuasukkaiden veren punaaman käden kohoavan pyytämään taivaan siunausta asialle, tunnemme tämä teon yhteydessä jotakin inhon tapaista. 9
10 Irrallinen lause ei sisällä tarpeeksi tietoa yksiselitteistä tulkintaa varten. Ollaksemme varmoja, tarvitsisimme tietoa niiden tapahtumien kulusta, joihin virkkeen tekstissä viitataan. Tässä tapauksessa käsi oli konkistadorin käsi, jonka alkuasukasparkojen veri oli punannut, sulutuksen avulla ilmaistuna ((surkeiden alkuasukkaiden) veren) punaaman käden. Kielioppi ei tässä auta sulkemaan pois toista tulkintaa, jossa kohoava käsi olisi ollut alkuasukkaiden (yhteinen) käsi, sulkujen avulla esitettynä (surkeiden alkuasukkaiden) (veren punaaman käden). Rakenteellisesti kyse on siitä, että peräkkäiset genetiivimuotoiset substantiivit voidaan yhdistää erilaisissa järjestyksissä. 3.4 Merkityksen moniselitteisyys Edellä on puhuttu siitä, että tietty sananmuoto voi olla moniselitteinen, eli sananmuoto voi tyypillisesti olla kahden tai useamman eri lekseemin taivutusmuoto. Vaikka olisimme osanneet päätellä, mistä lekseemistä on kyse, ei moniselitteisyys lopu siihen. Monet lekseemitkin ovat monimerkityksisiä eli hakusanalla on useampia alamerkityksiä. Otetaan esimerkisi suomen kielen laskea-verbi, jota voidaan käyttää erilaisissa merkityksissä: päästää joku jonnekin, liukua jotakin alas, suorittaa aritmetiikkaa jne. Tämäkään moniselitteisyys, eli ns. polysemia ei ole kielen käyttäjälle kovin ilmeinen. Kussakin käyttöyhteydessä yleensä vain yksi näistä sanan alamerkityksistä tuntuu mahdolliselta, eivätkä muut tule edes mieleen, esim.: karja laskettiin laitumelle, hän laski jyrkän mäen alas yhdellä suksella, mutta pysyi pystyssä, laske nämä luvut yhteen. 3.5 Kieli on epätäsmällistä Ihmisten kieli sanoin kuin ihmisten ajattelu on aivan eri tavalla epätäsmällistä, kuin mihin mikään matemaattinen epätäsmällisyyden kuvaustapa on varautunut. Nämä täsmälliset kuvaustavat pyrkivät palauttamaan epätäsmällisyyden joko todennäköisyyksiksi (eli luvuiksi välillä [0,1] tai muulle asteikolle. Jos pohdimme vaikka yksinkertaisen substantiivin, tuoli, merkitystä tai sitä, mitä voi kutsua tuoliksi, huomaamme, että tuoleja ovat kaikenlaiset istumiseen tarkoitetut huonekalut tai sellaisia muistuttavat. Käytännössä tuolit voivat olla monenlaisia, eikä niille voida antaa fysikaalista tai geometristä määritelmää. Muotoiljan luomus voi paljastua tuoliksi vasta, kun kuulemme selityksen. Totuttujen tuolien kaltaisuus on vielä subjektiivisempi ja sattumanvaraisempi käsite. Ehkä tällaisia asioita on joskus helpompi lähestyä vuorovaikutteisen keskustelun viitekehyksessä. Epätäsmällisyys ei useissa tilanteissa haittaa, koska melko viitteellinen vuorosana riittää viemään keskustelua hyvin eteenpäin. Erityisesti vielä keskustelun eteneminen voidaan ymmärtää vedoten puhujan ja kuulijan mentaaliseen malliin keskustelun senhetkisestä tilasta. Myös sellaiset kielen käsitteet kuin hyvä tai nopea ovat suhteellisia, kelluvia ja vuosien kuluessa muuttuvia. Nopea tietokone ei esimerkiksi tarkoita samaa nyt kuin joitakin vuosia sitten, jos arvioimme nopeutta koneen yhden sekunnin aikana suorittamien käskyjen määrällä. Sen sijaan kunakin ajanhetkenä tavanomaista tehokkaampaa tietokonetta voidaan pitää nopeana. 3.6 Onko moniselitteisyys ja epätäsmällisyys rakennevirhe? Olemme havainneet, että luonnollinen kieli on kovin moniselitteistä ja epämääräistä. Onko se virhe? Voitaisiinko ajatella, että kieli olisi näissä suhteissa korjattavissa? Jotkut asiat voisivat olla kai paremminkin, esimerkiksi keinotekoinen kieli esperanto on taivutukseltaan paljon yksinkertaisempi kuin pääosa luonnollisista kielistä (ellei peräti yksinkertaisempi kuin kaikki 10
11 luonnolliset kielet). Kaikki substantiivit päättyvät o-kirjaimeen ja kaikkien sanojen taipuminen on säännöllistä, myös olla-verbin vastineen. Tällainen säännöllisyys helpottaisi joitakin kieliteknologisia tehtäviä ja vähentäisi toki myös moniselitteisyyttä. Sanojen taipumisen kuvaaminen täsmällisillä säännöillä ja jäsennysmenetelmillä onnistuu helpommin näin säännölliselle luonnolliselle kielelle, mutta tämä osa on kuitenkin niitä, jotka onnistuvat luonnollisille kielille kuitenkin. Esperantossakin ja sen puoleen missä tahansa kuviteltavissa olevassa keinotekoisessakin kielessä on hakusanoilla alamerkityksiä. Näiden ratkaiseminen lienee esperantossa jokseenkin yhtä vaikeata kuin muissakin kielissä. Syntaktiset moniseliteisyydet lienevät läsnä ihmisen tietoisesti kehittämissä kielissä suunnilleen yhtä vakavina kuin alkuperäisemmissä luonnollisissa kielissä. Moniselitteisyyksiä ei siten oikein pääse karkuun, vaikka vaihtaisi keinotekoiseen kieleen. Matemaattisten tai muiden ankaraa formalismia noudattavien kaavojen käyttö voisi olla yksiselitteisempää, mutta luultavasti niiden käyttö olisi ihmisille niin vaivalloista ja hidasta, että niistä tuskin on kilpailijoiksi luonnollisen kielen tekstille tiedon tallennusmuotona. Luonnollisen kielen moniselitteisyyttä ja epämääräisyyttä voidaan siten pitää enimmäkseen kielten hyödyllisenä ominaisuutena, jonka ansiosta kielet kehittyvät tarpeitten ja maailman mukana ja säilyvät käyttökelpoisina. Muuttuvassa maailmassa epätarkka ja moniselitteinen kieli toimii joustavasti ja hyvin, kun taas yksiselitteinen ja tarkka kieli helpommin lakkaa kokonaan toimimasta. Viitteet Daniel G. Bobrow, Ronald M. Kaplan, Martin Kay, Donald A. Norman, Henry S. Thompson and Terry Winograd, GUS, A Frame-Driven Dialog System, Artificial Intelligence 8(2), pp , Jonathan Harrington and Steve Cassidy, Techniques in Speech Acoustics, Kluwer Academic Publishers, Daniel Jurafsky and James H. Martin, Speech and Language Processing, Prentice Hall, NJ, Timo Lahtinen, Automatic indexing: an approach using an index term corpus and combining linguistic and statistical evidence, Publications, No. 34, Department of General Linguistics, University of Helsinki, Michael F. McTear, Spoken Dialogue Technology: Enabling the Conversational User Interface, ACM Computing Surveys, Vol 34, No. 1, March 2002, pp Michael F. McTear, Spoken Dialogue Technology: Towards the Conversational User Interface, Springer, Ruslan Mitkov (ed.), The Oxford Handbook of Computational Linguistics, Oxford University Press, Lawrence Rabiner and Biing-Hwang Juang, Fundamentals of Speech Recognition, Prentice Hall, NJ,
Johdatus kieliteknologiaan Luku 1: Johdanto
Johdatus kieliteknologiaan Luku 1: Johdanto Kimmo Koskenniemi 31. lokakuuta 2005 Sisältö 1 Mitä kieliteknologia on ja mihin sitä tarvitaan? 1 2 Kielen järjestelmä 3 2.1 Kieltä ei tiedosteta.....................................
KIMMO KOSKENNIEMI JOHDATUS KIELITEKNOLOGIAAN, SEN MERKITYKSEEN JA SOVELLUKSIIN
KIMMO KOSKENNIEMI JOHDATUS KIELITEKNOLOGIAAN, SEN MERKITYKSEEN JA SOVELLUKSIIN NYKYKIELTEN LAITOKSEN OPPIMATERIAALIA 1 Helsingin yliopiston nykykielten laitos 2013 NYKYKIELTEN LAITOKSEN OPPIMATERIAALIA
Johdatus kieliteknologiaan Luku 6: Kielenoppimisen ja -opettamisen kieliteknologia
Johdatus kieliteknologiaan Luku 6: Kielenoppimisen ja -opettamisen kieliteknologia Kimmo Koskenniemi 25. marraskuuta 2007 Sisältö 1 Taustaa 1 2 Tavanomainen tietokoneavusteinen kielenopiskelu 2 3 Ymmärtävämpää
Suomen kielioppi: Harjoitukset - Harjoituslista. Aakkoset ja äänteet
Suomen kielioppi: Harjoitukset - Harjoituslista Sivu 1 / 13 Suomen kielioppi: Harjoitukset - Harjoituslista Kolmannen sarakkeen merkit ilmaisevat harjoituksen vaikeustasoa seuraavasti: A = alkeet, K =
ISO SUOMEN KIELIOPPI S2- OPETUKSESSA. Muutama havainto
ISO SUOMEN KIELIOPPI S2- OPETUKSESSA Muutama havainto Maisa Martin Alumnipäivä 26.9.2009 KOLME ASIAA Uusia termejä S2-alan näkökulmasta ja muutenkin Hyödyllisiä erotteluja Ope, mitä eroa on Mikä on tavallista?
Lausuminen kertoo sanojen määrän
Sivu 1/5 Lausuminen kertoo sanojen määrän Monta osaa Miten selvä ero Rinnasteiset ilmaisut Yhdyssana on ilmaisu, jossa yksi sana sisältää osinaan kaksi sanaa tai enemmän. Puhutussa kielessä tätä vastaa
Lukumummit ja -vaarit Sanavaraston kartuttamista kaunokirjallisuuden avulla
Kuka lukisi minut seminaari, Tampere 10.11.2017 Hanna Pöyliö, Niilo Mäki Instituutti Lukumummit ja -vaarit Sanavaraston kartuttamista kaunokirjallisuuden avulla @lukumummit 1 Hyvä sanastoharjoitus Sanasto
9.2.3. Englanti. 3. luokan keskeiset tavoitteet
9.2.3. Englanti Koulussamme aloitetaan A1 kielen (englanti) opiskelu kolmannelta luokalta. Jos oppilas on valinnut omassa koulussaan jonkin toisen kielen, opiskelu tapahtuu oman koulun opetussuunnitelman
Lapsen tyypillinen kehitys. -kommunikaatio -kielellinen kehitys
Lapsen tyypillinen kehitys -kommunikaatio -kielellinen kehitys Kielellinen kehitys Vauvalla on synnynnäinen kyky vastaanottaa kieltä ja tarve olla vuorovaikutuksessa toisen ihmisen kanssa Kielellinen kehitys
Kielioppi Harjoituskirja - suomi 3 - harjoituslista
Kielioppi Harjoituskirja - suomi 3 - harjoituslista Päätaso Alataso Harjoituksen nimi Tyyppi Taso 1 Aakkoset ja äänteet Aakkoset 1 Aakkosjärjestys 1 Aukko A 2 Aakkosjärjestys 2 Aukko A 3 Aakkosjärjestys
815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset
815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 2 vastaukset Harjoituksen aiheena on BNF-merkinnän käyttö ja yhteys rekursiivisesti etenevään jäsentäjään. Tehtävä 1. Mitkä ilmaukset seuraava
Kielen ymmärtäminen kieliteknologian näkökulmasta. Kimmo Koskenniemi täysinpalvellut kieliteknologian professori Helsingin yliopisto
Kielen ymmärtäminen kieliteknologian näkökulmasta Kimmo Koskenniemi täysinpalvellut kieliteknologian professori Helsingin yliopisto Tietää vai ymmärtää? Ymmärtää eli saada järkensä avulla itselleen selväksi,
Kieli merkitys ja logiikka. 4: Luovuus, assosiationismi. Luovuus ja assosiationismi. Kielen luovuus. Descartes ja dualismi
Luovuus ja assosiationismi Kieli merkitys ja logiikka 4: Luovuus, assosiationismi Käsittelemme ensin assosiationismin kokonaan, sen jälkeen siirrymme kombinatoriseen luovuuteen ja konstituenttimalleihin
8. Kieliopit ja kielet
8. Kieliopit ja kielet Suomen kielen sanoja voidaan yhdistellä monella eri tavalla. Kielioppi määrää sen, milloin sanojen yhdistely antaa oikein muodostetun lauseen. "Mies räpyttää siipiään" on kieliopillisesti
Alkukartoitus Opiskeluvalmiudet
Alkukartoitus Opiskeluvalmiudet Päivämäärä.. Oppilaitos.. Nimi.. Tehtävä 1 Millainen kielenoppija sinä olet? Merkitse rastilla (x) lauseet, jotka kertovat sinun tyylistäsi oppia ja käyttää kieltä. 1. Muistan
Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat
Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet
Johdatus kieliteknologiaan Luku 5: Vuorovaikutus luonnollisella kielellä ihmisen ja koneen välillä
Johdatus kieliteknologiaan Luku 5: Vuorovaikutus luonnollisella kielellä ihmisen ja koneen välillä Kimmo Koskenniemi 21. marraskuuta 2005 Sisältö 1 Yleistä 1 1.1 Miksi ylipäätänsä keskustella koneen kanssa?.......................
osassa III max-pist pistem pistemäärä osan III maksimista III:N MAX 30 Z Y X (X/Y)xZ=Å Åx0,3 TEHTÄVÄ
Helsingin yliopiston humanistinen tiedekunta/valintakoe 19.5.2017 Kotimaisten kielten ja kirjallisuuksien kandiohjelma/suomen kieli ja kulttuuri MALLIKAAVAKE KOKELAAN NIMI Meikäläinen, Maija KOKELAAN TUNNISTE
YKSIKKÖ Pääte on aina -N. Se liittyy sanan taipuneeseen vartaloon. Kenen auto tuo on? - Aleksanterin - Liian. Minkä osia oksat ovat?
GENETIIVI yksikkö -N KENEN? MINKÄ? monikko -DEN, -TTEN, -TEN, -EN YKSIKKÖ Pääte on aina -N. Se liittyy sanan taipuneeseen vartaloon. Kenen auto tuo on? - Aleksanterin - Liian Minkä osia oksat ovat? puu
Johdatus kieliteknologiaan Luku 3: Tiedon haku ja siihen liittyvät sovellukset
Johdatus kieliteknologiaan Luku 3: Tiedon haku ja siihen liittyvät sovellukset Kimmo Koskenniemi 5. marraskuuta 2005 Sisältö 1 Tekstimuotoisen tiedon hallinnan eri lajeja 1 1.1 Tiedon haku.........................................
Yhdyssana suomen kielessä ja puheessa
Yhdyssana suomen kielessä ja puheessa Tommi Nieminen Jyväskylän yliopisto Anna Lantee Tampereen yliopisto 37. Kielitieteen päivät Helsingissä 20. 22.5.2010 Yhdyssanan ortografian historia yhdyssanan käsite
11.4. Context-free kielet 1 / 17
11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä
Sijoista ja kieliopillisista funktioista
Sijoista ja kieliopillisista funktioista Sijajärjestelmästä Suomessa 15 sijaa kieliopilliset ja muut, semanttiset, obliikvisijat tjs. kieliopilliset sijat : nominatiivi (pallo, hattu) genetiivi (pallon,
Kielellisen datan käsittely ja analyysi tutkimuksessa
Kielellisen datan käsittely ja analyysi tutkimuksessa Kimmo Koskenniemi 4.4.2007 Yleisen kielitieteen laitos Humanistinen tiedekunta Kielidataa on monenlaista Tekstiä erilaisista lähteistä kirjoista, lehdistä,
Kulttuuritaidot Oppilas oppii tuntemaan Ranskaa ja ranskankielisiä alueita ranskankielisille kulttuureille ominaisia tapoja ja kohteliaisuussääntöjä
Ylöjärven opetussuunnitelma 2004 B2 RANSKA VUOSILUOKKA: 8 VUOSIVIIKKOTUNTEJA: 2 Tavoitteet ymmärtämään erittäin selkeästi puhuttuja tai kirjoitettuja lyhyitä viestejä viestintää tavallisimmissa arkielämän
Johdatus kieliteknologiaan Luku 5: Kielen kääntämisen apuvälineet ja automaattinen kielen kääntäminen
Johdatus kieliteknologiaan Luku 5: Kielen kääntämisen apuvälineet ja automaattinen kielen kääntäminen Kimmo Koskenniemi 3. joulukuuta 2006 Sisältö 1 Monikielisyys ja kääntämisen tarve 1 2 Kielen kääntämisen
Johdatus kieliteknologiaan Luku 5: Kielen kääntämisen apuvälineet ja automaattinen kielen kääntäminen
Johdatus kieliteknologiaan Luku 5: Kielen kääntämisen apuvälineet ja automaattinen kielen kääntäminen Kimmo Koskenniemi 2. joulukuuta 2004 Sisältö 1 Monikielisyys ja kääntämisen tarve 1 2 Kielen kääntämisen
Oulun murteessa on käytössä myös nää-pronomini, joka tarkoittaa sinä. Sää on kuitenkin enemmän käytetty.
Puhekieli Kirjoitettu kieli ja puhuttu kieli eroavat aika paljon suomen kielessä. Katsomme, miten puhekieli toimii. Keskitymme Oulun alueen puhekieleen, mutta osa puhekielen piirteistä on sellaisia, että
Kieli merkitys ja logiikka
Kielentutkimuksen eri osa-alueet Kieli merkitys ja logiikka Luento 3 Fonetiikka äänteiden (fysikaalinen) tutkimus Fonologia kielen äännejärjestelmän tutkimus Morfologia sananmuodostus, sanojen rakenne,
SUOMEN KIELEN VALINTAKOE 20.5.2013 klo 9-12 salissa L4 Oulun yliopisto. Suomen kielen valintakoe jakaantuu kahteen osioon:
SUOMEN KIELEN VALINTAKOE 20.5.2013 klo 9-12 salissa L4 Oulun yliopisto Suomen kielen valintakoe jakaantuu kahteen osioon: 1. Essee, jonka pohjana on teos Kielemme kohtalo. 2. Tehtävät, joiden pohjana on
Johdatus kieliteknologiaan Luku 3: Tiedon haku ja siihen liittyvät sovellukset
Johdatus kieliteknologiaan Luku 3: Tiedon haku ja siihen liittyvät sovellukset Kimmo Koskenniemi 25. marraskuuta 2007 Sisältö 1 Tekstimuotoisen tiedon hallinnan eri lajeja 1 1.1 Tiedon haku.........................................
Sisällys. Esipuhe Aakkoset ja koulussa Torilla 80
Sisällys Esipuhe.... 6 0. Aakkoset ja koulussa 8 Aakkoset Koulusanat Mikä sinun nimi on? Tavaaminen 4. Torilla 80 Isot numerot Mitä maksaa? Ruokia ja juomia Millainen? Partitiivi Negatiivinen verbi ko/kö-kysymys
Tavoite Opiskelija osaa käyttää englannin kielen rakenteita, hallitsee kielen perusilmaukset ja ymmärtää opiskelijan arkielämään liittyvää kieltä
Kuvaukset 1 (6) Englanti, Back to basics, 1 ov (YV3EN1) Tavoite osaa käyttää englannin kielen rakenteita, hallitsee kielen perusilmaukset ja ymmärtää opiskelijan arkielämään liittyvää kieltä Teemat ja
Monikossa: talojen, koirien, sinisten huoneitten / huoneiden
Teidän talonne on upouusi. MINKÄ? KENEN? MILLAISEN? = talon, teidän, sinisen huoneen= GENETIIVI Monikossa: talojen, koirien, sinisten huoneitten / huoneiden Genetiivi ilmaisee omistusta Laurin koira, minun
Verbien morfosyntaksista, osa 2
Verbien morfosyntaksista, osa 2 Finiittiverbi ja sen rakenne mitä verbin finiittimuotoon sisältyy muodon ja merkityksen kannalta? kokonaisuuden ytimenä on verbin vartalo: LEKS aikamuoto (tempus) ja tapaluokka
Verbin valenssi määrää, minkälaisia argumentteja ja komplementteja verbi odottaa saavansa millaisissa lauseissa verbi voi esiintyä.
Valenssista Valenssi saksalaisessa ja venäläisessä kieliopintutkimuksessa käytetty nimitys, joka tavallisesti tarkoittaa verbin ominaisuutta: sitä, kuinka monta ja millaisia nomineja obligatorisesti ja
PUHU MINULLE KUUNTELE MINUA
Helsingin terveyskeskus poliklinikka Puheterapeutit: K. Laaksonen, E. Nykänen, R. Osara, L. Piirto, K. Pirkola, A. Suvela, T. Tauriainen ja T. Vaara PUHU MINULLE KUUNTELE MINUA Lapsi oppii puheen tavallisissa
Oppilas keskustelee ryhmässä ja tuo esille mielipiteitään. Oppilas osallistuu luokan ja koulun ilmaisuesityksiin. Oppilas harjoittelee
AI 6. lk Arvioitavat tavoitteet Vuorovaikutustilanteissa toimiminen (T1, T2, T3, T4) Tekstien tulkitseminen (T5, T6, T7, T8) Hyväksytty (5) Välttävä (6-7) Oppilas saa arvosanan 6, Oppilas saa arvosanan
8. Kieliopit ja kielet 1 / 22
8. Kieliopit ja kielet 1 / 22 Luonnollinen kieli Suomen kielen sanoja voidaan yhdistellä monella eri tavalla. Kielioppi määrää sen, milloin sanojen yhdistely antaa oikein muodostetun lauseen. "Mies räpyttää
4. Lausekielinen ohjelmointi 4.1
4. Lausekielinen ohjelmointi 4.1 Sisällys Konekieli, symbolinen konekieli ja lausekieli. Lausekielestä konekieleksi: - Lähdekoodi, tekstitiedosto ja tekstieditorit. - Kääntäminen ja tulkinta. - Kääntäminen,
+ 3 2 5 } {{ } + 2 2 2 5 2. 2 kertaa jotain
Jaollisuustestejä (matematiikan mestariluokka, 7.11.2009, ohjattujen harjoitusten lopputuloslappu) Huom! Nämä eivät tietenkään ole ainoita jaollisuussääntöjä; ovatpahan vain hyödyllisiä ja ainakin osittain
Eväspussi. Onko lähipiirissä esiintynyt hitautta tai vaikeutta lukemaan ja kirjoittamaan oppimisessa? Millaista?
Liite Pienten Kielireppuun. Eväspussi Oman äidinkielen vahva hallinta tukee kaikkea oppimista. Tämän vuoksi keskustelemme kielten kehityksestä aina varhaiskasvatuskeskustelun yhteydessä. Kopio Kielirepusta
Kerta 2. Kerta 2 Kerta 3 Kerta 4 Kerta 5. 1. Toteuta Pythonilla seuraava ohjelma:
Kerta 2 Kerta 3 Kerta 4 Kerta 5 Kerta 2 1. Toteuta Pythonilla seuraava ohjelma: 2. Tulosta Pythonilla seuraavat luvut allekkain a. 0 10 (eli, näyttää tältä: 0 1 2 3 4 5 6 7 8 9 10 b. 0 100 c. 50 100 3.
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla Nykykielten laitos FIN-CLARIN-seminaarissa 4. marraskuuta 2010 Sanaluokkajäsennys Mr. Gelbert also has fun with language. NNP NNP RB VBZ NN IN NN. Sanaluokkajäsennin
Berlitzin taitotaso 1 CEF-taso A 1
t Berlitzin taitotaso 1 CEF-taso A 1 Ymmärtää ja osaa käyttää tuttuja, jokapäiväisiä ilmauksia ja yksinkertaisia lauseita. Osaa esitellä itsensä ja kysyä muilta perustietoja kuten asuinpaikkaa, vointia
Lausekkeiden rakenteesta (osa 2) & omistusliitteistä
Lausekkeiden rakenteesta (osa 2) & omistusliitteistä Adjektiivi- ja adverbilausekkeet AP ja AdvP: paljon yhteistä monet AP:t voi jopa suoraan muuttaa AdvP:ksi -sti-johtimella: Ihan mahdottoman kaunis Ihan
Johdatus kieliteknologiaan Luku 5: Vuorovaikutus luonnollisella kielellä ihmisen ja koneen
Johdatus kieliteknologiaan Luku 5: Vuorovaikutus luonnollisella kielellä ihmisen ja koneen välillä Kimmo Koskenniemi 18. marraskuuta 2007 Sisältö 1 Yleistä 1 1.1 Miksi ylipäätänsä keskustella koneen kanssa?.......................
Suomen kielen Osaamispyörä -työkalu
Suomen kielen Osaamispyörä -työkalu Tavoitteet Kohderyhmät Käyttö Suomen kielen Osaamispyörän tavoitteena on tehdä näkyväksi maahanmuuttajataustaisten työntekijöiden suomen kielen osaamista. Osaamispyörä
7.LUOKKA. Tavoitteisiin liittyvät sisältöalueet. Laaja-alainen osaaminen. Opetuksen tavoitteet
7.LUOKKA Opetuksen tavoitteet Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen T1 edistää oppilaan taitoa pohtia englannin asemaan ja variantteihin liittyviä ilmiöitä ja arvoja antaa oppilaalle
PARTISIIPP PREESEEʹNS RAAJJÂM PARTISIIPIN PREESENSIN MUODOSTAMINEN. lääddas suomeksi
PARTISIIPP PREESEEʹNS RAAJJÂM PARTISIIPIN PREESENSIN MUODOSTAMINEN A) Veeʹrb, koin lij tääʹssmuuttâs Verbit, joissa on astevaihtelu -ad infinitiiv -ad sâjja ǩieʹčč -ai infinitiivin -ad:n tilalle pääte
LUKUSANOJEN TAIVUTUS. Heljä Uusitalo
LUKUSANOJEN TAIVUTUS Heljä Uusitalo PERUSLUVUT JA JÄRJESTYSLUVUT Lukusanat ovat numeroita Lukusanat voivat olla peruslukuja tai järjestyslukuja. Perusluvut ja järjestysluvut taipuvat kaikissa sijamuodoissa.
Muodolliset kieliopit
Muodolliset kieliopit Luonnollisen kielen lauseenmuodostuksessa esiintyy luonnollisia säännönmukaisuuksia. Esimerkiksi, on jokseenkin mielekästä väittää, että luonnollisen kielen lauseet koostuvat nk.
Vieraan kielen B1-oppimäärän opetuksen tavoitteisiin liittyvät keskeiset sisältöalueet vuosiluokalla 6
B1- RUOTSI VL.6-9 6.LUOKKA T1 auttaa oppilasta jäsentämään käsitystään kaikkien osaamiensa kielten keskinäisestä suhteesta T2 auttaa oppilasta hahmottamaan opiskeltavan kielen asemaa maailmassa ja sen
Automaattinen semanttinen annotointi
Automaattinen semanttinen annotointi Matias Frosterus, Reetta Sinkkilä, Katariina Nyberg Semantic Computing Research Group (SeCo) School of Science and Technology, Department of Media Technology and University
Suomen kielen substantiivilla on noin 2000 erilaista muotoa vai onko sittenkään? Kimmo Kettunen, Tampereen yliopisto, informaatiotutkimuksen laitos
Suomen kielen substantiivilla on noin 2000 erilaista muotoa vai onko sittenkään? Kimmo Kettunen, Tampereen yliopisto, informaatiotutkimuksen laitos Tausta Suomen kielen erilaisten sanamuotojen määrä esitetään
C++ Ohjelmoijan käsikirja. Johdanto
Johdanto C++ Ohjelmoijan käsikirja Johdanto Tervetuloa Inside C++-kirjan pariin. Tämä on opaskirja standardi C++:n käyttöön. Käsittelemme kirjassa kaikki syntaksin, kieliopin, olio-ohjelmoinnin ja standardikirjastojen
luonnonilmiölauseessa paikan tai ajan ilmaus täyttää subjektin paikan: tunnekausatiivilauseissa subjektin paikan perii partitiivimuotoinen kokija:
Sanajärjestys ja subjektin paikka subjektittomat lauseet jättävät subjektin normaalin, finiittiverbiä edeltävän paikan tyhjäksi ellipsi- ja pronominin poisjättötapauksissa paikka jää tyhjäksi: Ø Lähdemme
JOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ
Matematiikan tukikurssi
Matematiikan tukikurssi Kurssikerta 1 1 Matemaattisesta päättelystä Matemaattisen analyysin kurssin (kuten minkä tahansa matematiikan kurssin) seuraamista helpottaa huomattavasti, jos opiskelija ymmärtää
Euroopan unioni ja monikielisyys Verkkojen Eurooppa Automaattinen käännösalusta. Kimmo Rossi European Commission, CNECT.G3
Euroopan unioni ja monikielisyys Verkkojen Eurooppa Automaattinen käännösalusta Kimmo Rossi European Commission, CNECT.G3 Euroopan unioni ja monikielisyys EU on monikielinen 24 virallista EU-kieltä noin
Täydentäviä muistiinpanoja laskennan rajoista
Täydentäviä muistiinpanoja laskennan rajoista Antti-Juhani Kaijanaho 10. joulukuuta 2015 1 Diagonaalikieli Diagonaalikieli on D = { k {0, 1} k L(M k ) }. Lause 1. Päätösongelma Onko k {0, 1} sellaisen
SUBSTANTIIVIT 1/6. juttu. joukkue. vaali. kaupunki. syy. alku. kokous. asukas. tapaus. kysymys. lapsi. kauppa. pankki. miljoona. keskiviikko.
SUBSTANTIIVIT 1/6 juttu joukkue vaali kaupunki syy alku kokous asukas tapaus kysymys lapsi kauppa pankki miljoona keskiviikko käsi loppu pelaaja voitto pääministeri päivä tutkimus äiti kirja SUBSTANTIIVIT
Pikapaketti logiikkaan
Pikapaketti logiikkaan Tämän oppimateriaalin tarkoituksena on tutustua pikaisesti matemaattiseen logiikkaan. Oppimateriaalin asioita tarvitaan projektin tekemisessä. Kiinnostuneet voivat lukea lisää myös
Pinoautomaatit. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 6. lokakuuta 2016 TIETOTEKNIIKAN LAITOS
.. TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 6. lokakuuta 2016 Sisällys. Harjoitustehtävätilastoja Tilanne 6.10.2016 klo 8:28 passed potential redo submitters
How to prepare for the 7th grade entrance exam? Kuinka lukea englannin linjan soveltuvuuskokeisiin?
How to prepare for the 7th grade entrance exam? Kuinka lukea englannin linjan soveltuvuuskokeisiin? When? Milloin? Tärkeitä päivämääriä: - 12.1. 2017 Infotilaisuus Helsingin Uudessa Yhteiskoulussa - 19.1.
Predikaattilogiikkaa
Predikaattilogiikkaa UKUTEORIA JA TO- DISTAMINEN, MAA11 Kertausta ogiikan tehtävä: ogiikka tutkii ajattelun ja päättelyn sääntöjä ja muodollisten päättelyiden oikeellisuutta, ja pyrkii erottamaan oikeat
Laskelmia uudenvuodenpuheista
Laskelmia uudenvuodenpuheista Kotimaisten kielten tutkimuskeskuksessa on laskettu uudenvuodepuheista joitakin seikkoja, joiden avulla on mahdollista tarkastella mm. presidenttien välisiä eroja. Laskelmat
Suomen kielen sijamuodot ja sanatyypit Nominit Sijamuodot Tyyppi 1 Yhteen vokaaliin päättyvät sanat a, ä, o, ö, u, y, i Yksikkö Monikko Muita
1 Suomen kielen sijamuodot ja sanatyypit Nominit Sijamuodot nominatiivi kännykkä keitin partitiivi kännykkää keitintä genetiivi kännykän keittimen akkusatiivi kännykän/kännykkä keittimien/keitin illatiivi
Sana rakenteen kategoriana (A. Radford: Transformational Grammar. A First Course)
Sanaluokista Lauseet eivät ole mitä tahansa äännejonoja; niillä on hierarkkinen konstituenttirakenne, jossa äänteet muodostavat sanoja, sanat lausekkeita ja lausekkeet lauseita. konstituentit kuuluvat
LAUSEPANKKI luokkien lukuvuosiarviointiin
LAUSEPANKKI 1.-2. luokkien lukuvuosiarviointiin SUOMEN KIELI JA KIRJALLISUUS Mekaaninen lukeminen -Harjoittelet äänteitä ja kirjaimia. -Olet oppinut uusia äänteitä ja kirjaimia. -Osaat äänteet ja kirjaimet.
Puhumaan oppii vain puhumalla.
Puhumaan oppii vain puhumalla. Maisa Martin Jyväskylän yliopisto suomenkielisanootervetuloa.fi Toisto-menetelmän periaatteet ja selkopuhe oppijoiden tukena Luetaan yhdessä -verkoston syysseminaari Paasitorni
Oppilas pystyy nimeämään englannin kielen lisäksi myös muita vieraita kieliä niitä kohdatessaan.
Englanninkielisen aineiston löytäminen Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen Kielellinen päättely Kielellisen ympäristön hahmottaminen Arvioinnin kohde Englannin kielen arviointikriteerit
Kieli merkitys ja logiikka
Tieto kielestä Kieli merkitys ja logiikka! Kielen biologinen olemus! Kielen kulttuurinen olemus! Kielen normatiivinen olemus Luento 2! Kognitiotieteen tutkimuskohteena on kielen biologinen olemus: " Kielen
Kielen hyvän osaamisen taso on 6. luokan päättyessä taitotasokuvauksen mukaan:
Luokat 3-6 A2-espanja AIHEKOKONAISUUDET luokilla 4-6 Ihmisenä kasvaminen korostuu omien asioitten hoitamisessa, ryhmässä toimimisessa ja opiskelutaitojen hankkimisessa. Kulttuuri-identiteetti ja kansainvälisyys
- Kummalla on vaaleammat hiukset? - Villellä on vaaleammat hiukset.
MAI FRICK KOMPARAATIO ELI VERTAILU 1. Komparatiivi -mpi -mpa, -mma monikko: -mpi, -mmi - Kumpi on vanhempi, Joni vai Ville? - Joni on vanhempi kuin Ville. - Kummalla on vaaleammat hiukset? - Villellä on
Genetiivi vastaa kysymykseen kenen, minkä. Yksikössä genetiivin tunnus on -n (koulun, opettajan, kirjan). Nyt opiskelemme monikon genetiivin.
Monikon genetiivi Genetiivi vastaa kysymykseen kenen, minkä. Yksikössä genetiivin tunnus on -n (koulun, opettajan, kirjan). Nyt opiskelemme monikon genetiivin. Monilla sanoilla voi olla useampi erilainen
RANSKAN KIELI B2 RANSKAN KIELI B2 8 LUOKKA
RANSKAN KIELI B2 Opetuksen tavoitteena on totuttaa oppilas viestimään ranskan kielellä suppeasti konkreettisissa arkipäivän tilanteissa erityisesti suullisesti. Opetuksessa korostetaan oikeiden ääntämistottumusten
Koulussamme opetetaan näppäilytaitoa seuraavan oppiaineen yhteydessä:
TypingMaster Online asiakaskyselyn tulokset Järjestimme toukokuussa asiakkaillemme asiakaskyselyn. Vastauksia tuli yhteensä 12 kappaletta, ja saimme paljon arvokasta lisätietoa ohjelman käytöstä. Kiitämme
Kirjaimet. Jakso "Kirjaimiin ja äänteisiin tutustuminen" Jakso "Vokaalit ja konsonantit" Mäkiset harjoituslista
Mäkiset Sivu 1 / 13 Mäkiset harjoituslista Kirjaimet Jakso "Kirjaimiin ja äänteisiin tutustuminen" 1. Suomen kielen kirjaimet ja äänteet Tutustuminen 2. Suomen kielen äänteitä 1 Osuma 3. Suomen kielen
Vasen johto S AB ab ab esittää jäsennyspuun kasvattamista vasemmalta alkaen:
Vasen johto S AB ab ab esittää jäsennyspuun kasvattamista vasemmalta alkaen: S A S B Samaan jäsennyspuuhun päästään myös johdolla S AB Ab ab: S A S B Yhteen jäsennyspuuhun liittyy aina tasan yksi vasen
T3 ohjata oppilasta havaitsemaan kieliä yhdistäviä ja erottavia ilmiöitä sekä tukea oppilaan kielellisen uteliaisuuden ja päättelykyvyn kehittymistä
A2-VENÄJÄ vl.4-6 4.LUOKKA Opetuksen tavoitteet Kasvu kulttuuriseen moninaisuuteen ja kielitietoisuuteen T1 ohjata oppilasta havaitsemaan lähiympäristön ja maailman kielellinen ja kulttuurinen runsaus sekä
Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet
TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 24. toukokuuta 2013 Sisällys Formaalit kielet On tapana sanoa, että merkkijonojen joukko on (formaali) kieli. Hieman
Avoimen lähdekoodin kaksitasokielioppikääntäjä
Avoimen lähdekoodin kaksitasokielioppikääntäjä Miikka Silfverberg miikka piste silfverberg at helsinki piste fi Kieliteknologia Helsingin yliopisto Avoimen lähdekoodin kaksitasokielioppikääntäjä p.1/23
Sukupolvien välistä vuorovaikutusta
Luetaan yhdessä verkoston syysseminaari 29.10. Hanna Pöyliö, KM Sanaston oppiminen kaunokirjallisuuden avulla Sukupolvien välistä vuorovaikutusta Lukumummi ja -vaari -toiminnassa vapaaehtoiset seniorit
Matematiikan tukikurssi
Matematiikan tukikurssi Kurssikerta 4 Jatkuvuus Jatkuvan funktion määritelmä Tarkastellaan funktiota f x) jossakin tietyssä pisteessä x 0. Tämä funktio on tässä pisteessä joko jatkuva tai epäjatkuva. Jatkuvuuden
Tiedonhaku. Esim. kymenlaakso muutosjohtami* Laila Hirvisaari Tuntematon sotilas Ruksi tyhjentää hakukentän.
Tiedonhaku Kirjoita hakukenttään teoksen nimi, tekijä, aihe tai muita asiaan liittyviä hakusanoja. Tarvittaessa katkaise hakusana tähdellä *. Tällöin haku löytää kaikki niin alkavat sanat. Esim. hakusana
Negatiiviset luvut ja laskutoimitukset
7.lk matematiikka Negatiiviset luvut ja laskutoimitukset Hatanpään koulu Syksy 2017 Janne Koponen Negatiiviset luvut ja laskutoimitukset 2 Negatiiviset luvut ja laskutoimitukset Sisällys 1. Negatiiviset
Äi 10 Tunti 3. Pilkkusäännöt
Äi 10 Tunti 3 Pilkkusäännöt Perussääntö Virkkeen lauseet erotetaan toisistaan pilkulla. Tähän sääntöön ovat tarkennuksia kaikki seuraavat pilkkusäännöt. Eli pilkku tulee lauseiden väliin aina, jos mikään
Humanistiset tieteet
Humanistiset tieteet 2013-15 Kielet kuuluvat humanistisiin tieteisiin, joten aluksi tarkastellaan humanistisia tieteitä yleensä. Kielissä on todistusvalinnan kannalta peräti 17 vaihtoehtoa, joista monet
Kieli ja viestinnän kokonaisuus
Kieli ja viestinnän kokonaisuus viesti verbaalinen nonverbaalinen kielioppi sanasto parakieli ekstralingv. keinot proksemii kka kinemiikk a 1 Pakieli l. paralingvistiset keinot sävelkulku äänenpaino vokalisaatiot
Miten opetan suomea? luento 19.8.2011 CIMO:ssa Comenius-apulaisopettajiksi lähteville Emmi Pollari
Miten opetan suomea? luento 19.8.2011 CIMO:ssa Comenius-apulaisopettajiksi lähteville Emmi Pollari Suomen kielestä 1/2 erilainen kieli kuinka eroaa indoeurooppalaisista kielistä? o ei sukuja, ei artikkeleita,
KERHOPAKETIN OHJELMA JA TAVOITTEET ( ARABIAN KIELI )
KERHOPAKETIN OHJELMA JA TAVOITTEET ( ARABIAN KIELI ) OPETTAJA : FARID BEZZI OULU 2013 1/5 Ohjelman lähtökohdat Arabian kieli kuuluu seemiläisiin kieliin, joita ovat myös heprea ja amhara. Äidinkielenä
Ei-yhteydettömät kielet [Sipser luku 2.3]
Ei-yhteydettömät kielet [Sipser luku 2.3] Yhteydettömille kielille pätee samantapainen pumppauslemma kuin säännöllisille kielille. Siinä kuitenkin pumpataan kahta osamerkkijonoa samaan tahtiin. Lause 2.25
Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä
Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä olevilla komponenteilla? Voisiko jollakin ohjelmointikielellä
Ensimmäinen Johanneksen kirje 4. osa
Ensimmäinen Johanneksen kirje 4. osa 1 opettaja- Isak Penzev 21.0.3.2013 Jatkamme Johanneksen kirjeen tutkimista. Tämä oppitunti kuuluu opetussarjaan, jossa me tutkimme Uutta testamenttia. Kun me tutkimme
2. Olio-ohjelmoinnin perusteita 2.1
2. Olio-ohjelmoinnin perusteita 2.1 Sisällys Esitellään peruskäsitteitä yleisellä tasolla: Luokat ja oliot. Käsitteet, luokat ja oliot. Attribuutit, olion tila ja identiteetti. Metodit ja viestit. Olioperustainen
Käyttää pinsettiotetta, liikelaajuus rajoittunut, levoton. Suositellaan toimintaterapiaa, jonka tavoitteena on parantaa silmän-käden yhteistyötä ja
Leikkiä oppia liikkua harjoitella syödä nukkua terapia koulu päiväkoti kerho ryhmä haluta inhota tykätä jaksaa ei jaksa Käyttää pinsettiotetta, liikelaajuus rajoittunut, levoton. Suositellaan toimintaterapiaa,
Rekursiolause. Laskennan teorian opintopiiri. Sebastian Björkqvist. 23. helmikuuta Tiivistelmä
Rekursiolause Laskennan teorian opintopiiri Sebastian Björkqvist 23. helmikuuta 2014 Tiivistelmä Työssä käydään läpi itsereplikoituvien ohjelmien toimintaa sekä esitetään ja todistetaan rekursiolause,
1 Kannat ja kannanvaihto
1 Kannat ja kannanvaihto 1.1 Koordinaattivektori Oletetaan, että V on K-vektoriavaruus, jolla on kanta S = (v 1, v 2,..., v n ). Avaruuden V vektori v voidaan kirjoittaa kannan vektorien lineaarikombinaationa:
Kuva 1. Jokaisen tavallisen kuvan tasotyökalussa näkyy vain yksi taso, tässä nimellä tausta.
Gimp alkeet XII 9 luokan ATK-työt/HaJa Sivu 1 / 6 GIMP:in tasotyökalu Lue ensin nämä ohjeet! Harjoitus lopussa! GIMP:in tasotyökalu on nimensä mukaisesti työkalu, jolla hallitaan tasoja, niiden läpinäkyvyyttä,