CLT131: Tekstityökalut 2010, ensimmäinen luento

Samankaltaiset tiedostot
Asialista. hippu ja.bashrc. Asialista. Tutkimusongelma: tekstin morfologisen jäsennyksen selvittely

CLT131: Tekstityökalut 2010, toinen luento

CLT131: Tekstityökalut 2011, viides luento

CLT131: Tekstityökalut 2011, toinen luento

CLT131: Tekstityökalut 2011, kuudes luento

CLT131: Tekstityökalut 2011, seitsemäs luento

Asialista. CLT131: Tekstityökalut 2010, kolmas luento. Laskuharjoitusaikataulut. Harjoituksissa havaitut virheet. Käytännön asiat/kertaus

CLT131: Tekstityökalut 2011, kahdeksas luento

Asialista. CLT131: Tekstityökalut 2011, kahdeksas luento. Merkistöistä ja kalvostoista. Asialista. Tommi A Pirinen

CLT131: Tekstityökalut 2010, kolmas luento

CLT131: Tekstityökalut 2010, kuudes luento

HAHMONTUNNISTUKSEN PERUSTEET

Kieliteknologian ATK-ympäristö Toinen luento

Asialista. CLT131: Tekstityökalut 2012, kymmenes luento. 2. frekvenssien muunnos todennäköisyyksiksi. 1. taulukkohaut

CLT131: Tekstityökalut 2012, kymmenes luento

Tilastollinen päättely II (MAT22003), kevät 2019

Asialista. CLT131: Tekstityökalut 2010, kuudes luento. Tuleva ohjelma. Kurssipalaute. Käytännön asiat Tuleva ohjelma Havaitut virheet ja korjaukset

Kurssiesite Lausekielinen ohjelmointi II Syksy Jorma Laurikkala Tietojenkäsittelytieteet Informaatiotieteiden yksikkö Tampereen yliopisto

Korkealämpötilakemia

Palautekysely tilastollisen signaalinkäsittelyn kurssiin

Korkealämpötilakemia

HAHMONTUNNISTUKSEN PERUSTEET

Agenda. Läpäisyvaatimukset Henkilökunta Luennot ja aikataulu Kurssimateriaali Harjoitustyöt Demoharjoitus Tentti ja arvostelu Muuta?

A&O:n käyttöohje. 1. Rekisteröityminen ja kurssille ilmoittautuminen. 2. Sisäänkirjautuminen. (Lisää löydät osoitteesta:

Näkökulmia monimuoto-opetukseen

Kurssijärjestelyt. ME-C2300 Verkkojulkaisemisen perusteet (5 op) Mari Hirvi Informaatioverkostot / Mediatekniikan laitos

Kurssiesite Lausekielinen ohjelmointi I Kesä Jorma Laurikkala Tietojenkäsittelytieteet Luonnontieteiden tiedekunta Tampereen yliopisto

KÄYTTÖOHJE / Ver 1.0 / Huhtikuu Martat - KÄYTTÖOHJE Yhdistyksille 2017

Internet-pohjaisen oppimisympäristön laadinta

Korpusten käsittely clt131, P Luento 4

Kurssiesite Lausekielinen ohjelmointi Syksy Jorma Laurikkala Tietojenkäsittelytieteet Informaatiotieteiden yksikkö Tampereen yliopisto

Tervetuloa! Matematiikka tutuksi

ELEC-C7230 Tietoliikenteen siirtomenetelmät. Yleistä

TU-C3010 Projektien suunnittelu ja ohjaus (5 op.)

ELEC-C1210 Automaatio 1 ELEC-C1220 Automaatio 2. Kurssien esittely lukukausi

Markkinoitten mallintaminen ja Internet-markkinat

Kieliteknologian ATK-ympäristö Kolmas luento

AVOIMEN YLIOPISTON MOODLE-OPAS OPISKELIJALLE SISÄLLYS

Kurssin käytännön järjestelyt. Tuotantotalous 1 Joel Kauppi

T DATASTA TIETOON

Vastuuopettaja. Kurssiesite Lausekielinen ohjelmointi Syksy Tavoitteet ja keinot. Lausekielinen ohjelmointi (10 op)

Korpusten käsittely clt131, P Luento 1

T Multimediatekniikka

Talousmatematiikan perusteet: Johdanto. Kurssin tavoitteet Käytännön järjestelyt Suosituksia suorittamiseen

YHTEYDEN OTTAMINEN CSC:N KONEELLE HIPPU

ELEC-C7230 Tietoliikenteen siirtomenetelmät

ELEC-C1210 Automaatio 1 ELEC-C1220 Automaatio 2. Kurssien esittely lukukausi

Anarâškielâ máttááttâs

Kurssin käytännön järjestelyt. Tuotantotalous 1 Tuomo Tanila

TU-C3010 Projektien suunnittelu ja ohjaus (5 op.)

ABTEKNILLINEN KORKEAKOULU Tietoverkkolaboratorio

KJR-C2002 Kontinuumimekaniikan perusteet Kurssiesite

T Johdatus tietoliikenteeseen ja multimediatekniikkaan 5 op. Kevät 2013

Ohjelmointi II. Erkki Pesonen Luennot ja harjoitukset. Itä-Suomen yliopisto Tietojenkäsittelytieteen laitos 2015

ELEC-C1210 Automaatio 1 ELEC-C1220 Automaatio 2. Kurssien esittely lukukausi

Kieliteknologian ATK-ympäristö Kuudes luento

PHYS-A3132 Sähkömagnetismi (ENG2) ( )

Hittitoimiston Forte-kotisivujen päivitysohje

Googlen pilvipalvelut tutuksi / Google Drive

Kieliteknologian ATK-ympäristö Viides luento

Kieliteknologian ATK-ympäristö Viides luento

Kurssin käytännön järjestelyt. Tuotantotalous 1 Tuomo Tanila

MICROSOFT PUBLISHER 2010

Kurssin sisältö. Kurssilla vähemmän. Johdatus ohjelmistotekniikkaan. Mitä on ohjelmistotekniikka? Miten ohjelmistoja suunnitellaan ja toteutetaan?

Kurssijärjestelyt. CS-1180 Verkkojulkaisemisen perusteet (5 op) Hanna Hämäläinen Informaatioverkostot / Mediatekniikan laitos

Projektien suunnittelu ja ohjaus TU-C3010

811393A JOHDATUS TUTKIMUSTYÖHÖN


ELEC-C1210 Automaatio 1 ELEC-C1220 Automaatio 2. Kurssien esittely lukukausi

Sarjat ja integraalit, kevät 2015

EDUBOX opetusvideopalvelu

Perusohje vi-editorin käyttöön

AVOIMEN YLIOPISTON MOODLE-OPAS OPISKELIJALLE

AB TEKNILLINEN KORKEAKOULU

CLT131 Korpusten käsittely (3op)

ABTEKNILLINEN KORKEAKOULU Tietoverkkolaboratorio

PLA Mobiiliohjelmointi. Mika Saari

Googlen pilvipalvelut tutuksi / Google Drive

Ohjelmoinnin perusteet Y Python

AB TEKNILLINEN KORKEAKOULU

NOPSA TM järjestelmä. Kulunvalvonta Käyttöohje, konttori. Käyttötuki: LogiNets Oy. All rights reserved.

KJR-C2004 Materiaalitekniikka. Käytännön järjestelyt, kevät 2017

Tähtitieteen käytännön menetelmiä Kevät 2009

Ohjelmistoprosessit ja ohjelmistojen laatu Ohjelmistoprosessit ja ohjelmistojen laatu (4op)

ELEC-C1210 Automaatio 1 ELEC-C1220 Automaatio 2. Kurssien esittely lukukausi

Kurssin aloitus. AS XML-kuvauskielten perusteet Janne Kalliola

Harjoitustyöinfo kevät TU-A1100 Tuotantotalous 1

C-ohjelmoinnin peruskurssi. Pasi Sarolahti

Pikaohjeet A&O oppimisympäristön käytön aloittamiseen

T harjoitustehtävät, syksy 2011

OPAS KULTA2 -JÄRJESTELMÄN KÄYTTÖÖN

Tieteellinen laskenta I (Scientific Computing I)

ohjeita kirjautumiseen ja käyttöön

Harjoitustyöinfo kevät TU-A1100 Tuotantotalous 1

KVANTITATIIVISET TUTKIMUSMENETELMÄT MAANTIETEESSÄ

Tilastollinen päättely II (MAT22003), kevät 2018

CLT131: Tekstityökalut 2010, neljäs luento

Kaislanet-käyttöohjeet

Ctl160 Tekstikorpusten tietojenkäsittely

TT00AA Ohjelmoinnin jatko (TT10S1ECD)

Transkriptio:

CLT131: Tekstityökalut 2010, ensimmäinen luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-11-04 (päivitetty: 2010-11-08)

Asialista Käytännön asiat Kurssin motivaatio ja sisältö Perustyökaluja Kirjallisuusvihjeet

Asialista Käytännön asiat Kurssin motivaatio ja sisältö Perustyökaluja Kirjallisuusvihjeet

Yleistä: Osoitteet luennoitsija Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi kurssiassistentti Pinja Pennala pinja.pennala@helsinki.fi käyttäkää sähköpostin otsikossa aina muotoa CLT131: jotain jotain

Yleistä: Osoitteet luennoitsija Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi kurssiassistentti Pinja Pennala pinja.pennala@helsinki.fi käyttäkää sähköpostin otsikossa aina muotoa CLT131: jotain jotain kurssisivut http: //www.ling.helsinki.fi/kit/2010s/clt131/ kurssin kuvaus, kalenteri, luentokalvot ja tehtävät

Yleistä: Osoitteet luennoitsija Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi kurssiassistentti Pinja Pennala pinja.pennala@helsinki.fi käyttäkää sähköpostin otsikossa aina muotoa CLT131: jotain jotain kurssisivut http: //www.ling.helsinki.fi/kit/2010s/clt131/ kurssin kuvaus, kalenteri, luentokalvot ja tehtävät wikisivut https://kitwiki.csc.fi/twiki/bin/ view/kitwiki/hyclt131s2010 Opiskelijoiden muistiinpanot ja yhteistyö

Yleistä: Osoitteet luennoitsija Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi kurssiassistentti Pinja Pennala pinja.pennala@helsinki.fi käyttäkää sähköpostin otsikossa aina muotoa CLT131: jotain jotain kurssisivut http: //www.ling.helsinki.fi/kit/2010s/clt131/ kurssin kuvaus, kalenteri, luentokalvot ja tehtävät wikisivut https://kitwiki.csc.fi/twiki/bin/ view/kitwiki/hyclt131s2010 Opiskelijoiden muistiinpanot ja yhteistyö kurssin shellipalvelin ssh:hippu.csc.fi

Yleistä: kurssin suoritus laajuus 3 op luennot perjantaisin 12 14, laskuharjoitukset torstaisin 10 12 (ellei muuta sovita) 4.11.2010 11.3.2011

Yleistä: kurssin suoritus laajuus 3 op luennot perjantaisin 12 14, laskuharjoitukset torstaisin 10 12 (ellei muuta sovita) 4.11.2010 11.3.2011 yleinen arvosteluasteikko 1 5 (48 % pisteistä hyväksytty 1, 96 % tai enemmän 5) viikottaiset laskuharjoitukset 50 % ja harjoitustyö 50 %, tai laajempi harjoitustyö 100 % pisteistä

Yleistä: kurssin suoritus laajuus 3 op luennot perjantaisin 12 14, laskuharjoitukset torstaisin 10 12 (ellei muuta sovita) 4.11.2010 11.3.2011 yleinen arvosteluasteikko 1 5 (48 % pisteistä hyväksytty 1, 96 % tai enemmän 5) viikottaiset laskuharjoitukset 50 % ja harjoitustyö 50 %, tai laajempi harjoitustyö 100 % pisteistä harjoitustöistä ja etäsuorituksesta on aina sovittava kurssiassistentin tai luennoitsijan kanssa

Yleistä: Laskuharjoitukset tehtävät kurssisivujen yksityisessä osiossa http://www.ling.helsinki.fi/kit/2010s/ clt131/priv/index.shtml käyttäjätunnuksen ja salasanan saa luennoitsijalta tai kurssiassistentilta laskuharjoitukset palautetaan laskuharjoitustilaisuutta edeltävänä päivänä ennen puoltapäivää (11.59) sähköpostitse

Yleistä: Laskuharjoitukset tehtävät kurssisivujen yksityisessä osiossa http://www.ling.helsinki.fi/kit/2010s/ clt131/priv/index.shtml käyttäjätunnuksen ja salasanan saa luennoitsijalta tai kurssiassistentilta laskuharjoitukset palautetaan laskuharjoitustilaisuutta edeltävänä päivänä ennen puoltapäivää (11.59) sähköpostitse laskuharjoitustilaisuudessa käsitellään palautettuja harjoituksia ja laajennetaan niihin liittyviä aiheita, esim. esitellään parempia ratkaisuja laskuharjoitustilaisuudet ei pakollisia mutta niissä käytäviä asioita ei kerrata luennoilla laskuharjoitustilaisuus dokumentoidaan enintään wikissä, siis jos tehtävien sisältö ei auennut, kannattanee tulla

Yleistä: Harjoitustyö laajempi harjoitustehtävä joka toteuttaa kokonaisen toiminnon oikeassa tai keksityssä kieliteknologiasovelluksessa sisältää vapaamuotoisen kirjoitelman joka kuvailee lingvistisen ongelman ja ratkaisun toteutuksen sekä käyttöohjeen

Yleistä: Harjoitustyö laajempi harjoitustehtävä joka toteuttaa kokonaisen toiminnon oikeassa tai keksityssä kieliteknologiasovelluksessa sisältää vapaamuotoisen kirjoitelman joka kuvailee lingvistisen ongelman ja ratkaisun toteutuksen sekä käyttöohjeen deadline 31.3.2011

Yleistä: Harjoitustyö laajempi harjoitustehtävä joka toteuttaa kokonaisen toiminnon oikeassa tai keksityssä kieliteknologiasovelluksessa sisältää vapaamuotoisen kirjoitelman joka kuvailee lingvistisen ongelman ja ratkaisun toteutuksen sekä käyttöohjeen deadline 31.3.2011 harjoitustyötä voi aloittaa työstää kurssin edetessä kun keksii mielenkiintoisia aiheita, kannattaa kuitenkin varmistaa aihe assistentilta tai luennoitsijalta

Yleistä: Käyttöympäristö csc:llä Kopioidaan nämä asetukset koneella hippu.csc.fi tiedostoon.bashrc (esim. kurssimateriaaleista copy-pastella): export LANG=fi_FI.UTF-8 export LC_ALL=fi_FI.UTF-8 export LESSCHARSET=utf-8 export GREP_OPTIONS=- -colour=auto module load gcc/4.4.4 openfst/1.2 libtool hfst/2.4 python/3.1.1-gcc omorfi

Asialista Käytännön asiat Kurssin motivaatio ja sisältö Perustyökaluja Kirjallisuusvihjeet

Kielitiede ja tekstit tyypillisesti (lähes) kaikki kielitiede tarvitsee tekstiaineistoja josta poimitaan havaintoja

Kielitiede ja tekstit tyypillisesti (lähes) kaikki kielitiede tarvitsee tekstiaineistoja josta poimitaan havaintoja kirjojen sisältötekstejä, sanomalehtien vuosikertoja Internet-sivustoja, pikaviestinkeskusteluja puheaineistojen transskriptiot

Kielitiede ja tekstit tyypillisesti (lähes) kaikki kielitiede tarvitsee tekstiaineistoja josta poimitaan havaintoja kirjojen sisältötekstejä, sanomalehtien vuosikertoja Internet-sivustoja, pikaviestinkeskusteluja puheaineistojen transskriptiot isojen (tilastollisesti merkittävien) havaintojen vahvistaminen vaatii enemmän aineistoa kuin on käsin viihtyisää käydä läpi

Kurssin sisältö opitaan erilaisia tekstiaineistojen tyyppejä, tekstikorpuksia tekstikorpuksista hakujen, yhteenvetojen ym. kokonaisuuksien automatisointi

Kurssin sisältö opitaan erilaisia tekstiaineistojen tyyppejä, tekstikorpuksia tekstikorpuksista hakujen, yhteenvetojen ym. kokonaisuuksien automatisointi eri tekstitiedostotyyppien ja koodausten ym. käytännön ongelmien hallinta

Kurssin sisältö opitaan erilaisia tekstiaineistojen tyyppejä, tekstikorpuksia tekstikorpuksista hakujen, yhteenvetojen ym. kokonaisuuksien automatisointi eri tekstitiedostotyyppien ja koodausten ym. käytännön ongelmien hallinta lingvistisesti mielenkiintoisten tekstiaineistojen luonti ja jäsennys

Mihin lingvitsit käyttävät tekstityökaluja? sanan/sanamuodon/sanaluokan X tyypilliset/poikkeukselliset käytöt yleensä (morfologia, morfosyntaksi jne.) sanojen käyttö ja käyttöympäristö (semantiikka) sanojen suhteet; synonymia, antonymia, hyponymia,...

Mihin lingvitsit käyttävät tekstityökaluja? sanan/sanamuodon/sanaluokan X tyypilliset/poikkeukselliset käytöt yleensä (morfologia, morfosyntaksi jne.) Esim: sanotaanko omenoita, omenoja vai omenia; missä yhteyksissä ja minkä takia? sanojen käyttö ja käyttöympäristö (semantiikka) sanojen suhteet; synonymia, antonymia, hyponymia,...

Mihin lingvitsit käyttävät tekstityökaluja? sanan/sanamuodon/sanaluokan X tyypilliset/poikkeukselliset käytöt yleensä (morfologia, morfosyntaksi jne.) Esim: sanotaanko omenoita, omenoja vai omenia; missä yhteyksissä ja minkä takia? Esim: onko puuro tuli mustaa oikeasti hyvä kieliopillinen rakenne tai käytössä? sanojen käyttö ja käyttöympäristö (semantiikka) sanojen suhteet; synonymia, antonymia, hyponymia,...

Mihin lingvitsit käyttävät tekstityökaluja? sanan/sanamuodon/sanaluokan X tyypilliset/poikkeukselliset käytöt yleensä (morfologia, morfosyntaksi jne.) Esim: sanotaanko omenoita, omenoja vai omenia; missä yhteyksissä ja minkä takia? Esim: onko puuro tuli mustaa oikeasti hyvä kieliopillinen rakenne tai käytössä? sanojen käyttö ja käyttöympäristö (semantiikka) Esim: mitä eroa on kauniilla ja komealla sanojen suhteet; synonymia, antonymia, hyponymia,...

Mihin lingvitsit käyttävät tekstityökaluja? sanan/sanamuodon/sanaluokan X tyypilliset/poikkeukselliset käytöt yleensä (morfologia, morfosyntaksi jne.) Esim: sanotaanko omenoita, omenoja vai omenia; missä yhteyksissä ja minkä takia? Esim: onko puuro tuli mustaa oikeasti hyvä kieliopillinen rakenne tai käytössä? sanojen käyttö ja käyttöympäristö (semantiikka) Esim: mitä eroa on kauniilla ja komealla sanojen suhteet; synonymia, antonymia, hyponymia,... Esim: lintujen ryhmittäminen luokiksi Wikipedia-aineistosta

Asialista Käytännön asiat Kurssin motivaatio ja sisältö Perustyökaluja Kirjallisuusvihjeet

Tekstinmuokkaimet cat ei varsinaisesti muokkain, mutta helppo luoda pieniä tiedostoja tai lisätä tiedoston loppuun nano (pico) helppo perusmuokkain pikkuhommiin

Tekstinmuokkaimet cat ei varsinaisesti muokkain, mutta helppo luoda pieniä tiedostoja tai lisätä tiedoston loppuun nano (pico) helppo perusmuokkain pikkuhommiin gedit, jedit, kate graafiset perusmuokkaimet aina kun X-yhteys toimii

Tekstinmuokkaimet cat ei varsinaisesti muokkain, mutta helppo luoda pieniä tiedostoja tai lisätä tiedoston loppuun nano (pico) helppo perusmuokkain pikkuhommiin gedit, jedit, kate graafiset perusmuokkaimet aina kun X-yhteys toimii vi, vim, gvim perinteinen tehokäyttäjien muokkain vim lopetetaan komennolla (esc):q

Tekstinmuokkaimet cat ei varsinaisesti muokkain, mutta helppo luoda pieniä tiedostoja tai lisätä tiedoston loppuun nano (pico) helppo perusmuokkain pikkuhommiin gedit, jedit, kate graafiset perusmuokkaimet aina kun X-yhteys toimii vi, vim, gvim perinteinen tehokäyttäjien muokkain vim lopetetaan komennolla (esc):q emacs toinen perinteinen tehokäyttäjien muokkain emacsista tarkemmin ks. johdantokurssin monisteet

Avun ja sopivien sovellusten haeskelu fgrep hakee merkkijonoja tiedostoista ja tulosteista apropos hakee sanoja ohjehakemistoista esim. apropos owner fgrep (1)

Avun ja sopivien sovellusten haeskelu fgrep hakee merkkijonoja tiedostoista ja tulosteista apropos hakee sanoja ohjehakemistoista esim. apropos owner fgrep (1) man näyttää ohjesivun

Avun ja sopivien sovellusten haeskelu fgrep hakee merkkijonoja tiedostoista ja tulosteista apropos hakee sanoja ohjehakemistoista esim. apropos owner fgrep (1) man näyttää ohjesivun info näyttää laajoja mutta valitettavan sekavia ja hankalakäyttöisiä ohjekirjasia

Avun ja sopivien sovellusten haeskelu fgrep hakee merkkijonoja tiedostoista ja tulosteista apropos hakee sanoja ohjehakemistoista esim. apropos owner fgrep (1) man näyttää ohjesivun info näyttää laajoja mutta valitettavan sekavia ja hankalakäyttöisiä ohjekirjasia http://www.google.fi suosittu www-pohjainen hakukone (googlellahan löytää mm. käyttökelpoiset versiot info-sivuista)

Mitä mä nyt tein kun se toimi...? history kertoo mitä aiemmin on tehty!{numero} toista historiasta

Mitä mä nyt tein kun se toimi...? history kertoo mitä aiemmin on tehty!{numero} toista historiasta script tallentaa mitä tehdään, hyvin tarkasti. Tätä käytetään toisinaan tehtäväpalautuksissa!

Asialista Käytännön asiat Kurssin motivaatio ja sisältö Perustyökaluja Kirjallisuusvihjeet

Vapaaehtoista, syventävää, lukemista (ei siis kurssilukemisto) Vim-kirja (978-0596529833) emacs-kirja (978-0596006488) Jantunen, J.: Synonymia ja käännössuomi 952-458-479-4 Nikolaev, Niemi: Suomen nominien taivutuksesta (Virittäjä 2005: 482)