CLT131: Tekstityökalut 2010, kolmas luento

Koko: px
Aloita esitys sivulta:

Download "CLT131: Tekstityökalut 2010, kolmas luento"

Transkriptio

1 CLT131: Tekstityökalut 2010, kolmas luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos

2 Asialista Käytännön asiat/kertaus Ongelman kuvaus Menetelmät ja aineistot Työkalut Viitteitä

3 Laskuharjoitusaikataulut 2. harjoituksista omorfi-tehtävät (2 ja 3) voi palauttaa ensi viikollakin ensi keskiviikkona siis laskareissa vain omorfi- ja hippuasiaa, jotta kaikki saisivat riittävän suoritusympäristön lopputehtävien ja harjoitustyön tekoon seuraavat harjoitukset tarvitsee palauttaa vasta joulukuun 14. nämä harjoitukset ovat siis laajemmat ja sisältävät säännöllisiin lausekkeisiin liittyvän kokonaisuuden itse tehtävät pyritään saamaan verkkoon jo ensi viikolla

4 Harjoituksissa havaitut virheet hipun less ei perusasetuksilla toista värikoodeja, pitää olla less -r tehtävän 3 haussa +? täsmää myös yhdyssanarajan merkintään; haettavan sarjan olisi pitänyt olla joko sarkain+? (useimmille komennoille sarkain = \t) tai käyttää esim. sane-hakua (esim. grepissä valitsin -w)

5 Yhteenvetoja kitwiki-sivuille? jos haluaa systemaattista referenssiä kurssilla käytyihin komentoihin, ja esim. nyt käytäviin säännöllisten lausekkeiden merkintöihin, nämä kalvostot eivät ole mikään paras aineisto siihen kitwiki-sivuille voisi esim. tehdä yhteenvetoja, lyhyitä taulukoita tai listauksia asioista

6 Asialista Käytännön asiat/kertaus Ongelman kuvaus Menetelmät ja aineistot Työkalut Viitteitä

7 Tutkimusongelma: Etunimien automatisoitu keruu aineistosta Tehtäväkuvaus: Lähtökohdat: Ongelma:

8 Tutkimusongelma: Etunimien automatisoitu keruu aineistosta Tehtäväkuvaus: halutaan kerätä etunimiä sanaston laajentamiseksi käyttämällä kirjallisuusaineistoa Lähtökohdat: Ongelma:

9 Tutkimusongelma: Etunimien automatisoitu keruu aineistosta Tehtäväkuvaus: halutaan kerätä etunimiä sanaston laajentamiseksi käyttämällä kirjallisuusaineistoa Lähtökohdat: gutenbergin laaja kirja-aineisto perustekstityökalut ja hakumenetelmät morfologinen analysaattori? Ongelma:

10 Tutkimusongelma: Etunimien automatisoitu keruu aineistosta Tehtäväkuvaus: halutaan kerätä etunimiä sanaston laajentamiseksi käyttämällä kirjallisuusaineistoa Lähtökohdat: gutenbergin laaja kirja-aineisto perustekstityökalut ja hakumenetelmät morfologinen analysaattori? Ongelma: mikä määrittää sanan etunimeksi (Named entity recognition) millaisissa yhteyksissä etunimiä käytetään miten saadaan nimistä perusmuoto? Tiedetään, että morfologinen analysaattorimme ei osaa perusmuotoista nimiä, joita ei ole sanastossa juuri niitä mitä etsimme!

11 Asialista Käytännön asiat/kertaus Ongelman kuvaus Menetelmät ja aineistot Työkalut Viitteitä

12 Aineisto: Gutenbergin kirjat Ladataan yksi ja selvitetään miltä etunimet näyttävät: Tolstoin Ylösnousemus

13 Aineisto: Gutenbergin kirjat Ladataan yksi ja selvitetään miltä etunimet näyttävät: Tolstoin Ylösnousemus Havaintoja lähtöoletuksia: (Nimet kirjoitetaan isolla alkukirjaimella helpottaa hakemista)

14 Aineisto: Gutenbergin kirjat Ladataan yksi ja selvitetään miltä etunimet näyttävät: Tolstoin Ylösnousemus Havaintoja lähtöoletuksia: (Nimet kirjoitetaan isolla alkukirjaimella helpottaa hakemista) sisältää paljon harvinaisempiakin etunimiä (esim. Maslova)

15 Aineisto: Gutenbergin kirjat Ladataan yksi ja selvitetään miltä etunimet näyttävät: Tolstoin Ylösnousemus Havaintoja lähtöoletuksia: (Nimet kirjoitetaan isolla alkukirjaimella helpottaa hakemista) sisältää paljon harvinaisempiakin etunimiä (esim. Maslova) nimet esiintyvät samoissa konteksteissa: repliikit: sanoi X tai X sanoi muut ihmissubjektiverbit: X epäili/x kuuli,... paljon muitakin...

16 Säännölliset lausekkeet Säännölliset lausekkeet/ilmaukset (Regular expressions) hyvin ilmaisuvoimainen menetelmä kuvata merkkijonojen sisältöjä: hakuja ja korvauksia säännöllisiä lausekkeita voi käyttää melkein kaikkien tekstiä käsittelevien ohjelmien hakulausekkeina kaikki yleiset ohjelmointikielet sisältävät säännöllisten lausekkeiden tuen

17 Säännölliset lausekkeet Säännölliset lausekkeet/ilmaukset (Regular expressions) hyvin ilmaisuvoimainen menetelmä kuvata merkkijonojen sisältöjä: hakuja ja korvauksia säännöllisiä lausekkeita voi käyttää melkein kaikkien tekstiä käsittelevien ohjelmien hakulausekkeina kaikki yleiset ohjelmointikielet sisältävät säännöllisten lausekkeiden tuen matemaattisessa formaalien kielten teoriassa, kuvaa säännöllisiä kieliä kielitietellisessä hierarkiassa oletetaan että vastaava ilmaisuvoima on morfologialla siis: kieliteknologiasovellukset, joilla ohjelmoidaan morfologioita, käyttävät tyypillisesti jonkinlaisia säännöllisiä ilmauksia

18 Menetelmä: säännöllisten lausekkeiden haku ja grep grep -F tai fgrep haki pelkkiä merkkijonoja grep -E tai egrep hakee eräitä säännöllisiä lausekkeita

19 Menetelmä: säännöllisten lausekkeiden haku ja grep grep -F tai fgrep haki pelkkiä merkkijonoja grep -E tai egrep hakee eräitä säännöllisiä lausekkeita valitsin -colour=auto värittää löytyneet kohdat (ks. myös ensimmäiset kalvot / aineistosivun.bashrc)

20 Menetelmä: säännöllisten lausekkeiden haku ja grep grep -F tai fgrep haki pelkkiä merkkijonoja grep -E tai egrep hakee eräitä säännöllisiä lausekkeita valitsin -colour=auto värittää löytyneet kohdat (ks. myös ensimmäiset kalvot / aineistosivun.bashrc) valitsin -o tulostaa vain täsmätyn kohdan (normaalisti grep tulostaa rivin jolta täsmäys löytyy)

21 Menetelmä: säännöllisten lausekkeiden haku ja grep grep -F tai fgrep haki pelkkiä merkkijonoja grep -E tai egrep hakee eräitä säännöllisiä lausekkeita valitsin -colour=auto värittää löytyneet kohdat (ks. myös ensimmäiset kalvot / aineistosivun.bashrc) valitsin -o tulostaa vain täsmätyn kohdan (normaalisti grep tulostaa rivin jolta täsmäys löytyy) valitsimella -C N voi tarkastella N riviä ympäristöstä

22 Menetelmä: säännöllisten lausekkeiden haku ja grep grep -F tai fgrep haki pelkkiä merkkijonoja grep -E tai egrep hakee eräitä säännöllisiä lausekkeita valitsin -colour=auto värittää löytyneet kohdat (ks. myös ensimmäiset kalvot / aineistosivun.bashrc) valitsin -o tulostaa vain täsmätyn kohdan (normaalisti grep tulostaa rivin jolta täsmäys löytyy) valitsimella -C N voi tarkastella N riviä ympäristöstä kokeillaan: fgrep -o jotain

23 Säänöllisten lausekkeiden teoriaa: eri tyypit ja sovellukset Riippuen sovelluksista säännöllisissä lausekkeissa eri asioita kuvataan hieman eri merkinnöillä (=syntakseilla) man-sivu: man 7 regex (melko tekninen)

24 Säänöllisten lausekkeiden teoriaa: eri tyypit ja sovellukset Riippuen sovelluksista säännöllisissä lausekkeissa eri asioita kuvataan hieman eri merkinnöillä (=syntakseilla) man-sivu: man 7 regex (melko tekninen) POSIX extended: erikoismerkeillä +?(){} on erikoismerkitys; sovellukset: grep -E tai egrep lessin haku (näppäin / ) sed -r awk

25 Säänöllisten lausekkeiden teoriaa: eri tyypit ja sovellukset Riippuen sovelluksista säännöllisissä lausekkeissa eri asioita kuvataan hieman eri merkinnöillä (=syntakseilla) man-sivu: man 7 regex (melko tekninen) POSIX extended: erikoismerkeillä +?(){} on erikoismerkitys; sovellukset: grep -E tai egrep lessin haku (näppäin / ) sed -r awk POSIX basic: erikoismerkit muodostetaan merkin takavinoviivan \kanssa; sovellukset: grep vimin haku (näppäin / ) sed

26 Säänöllisten lausekkeiden teoriaa: eri tyypit ja sovellukset Riippuen sovelluksista säännöllisissä lausekkeissa eri asioita kuvataan hieman eri merkinnöillä (=syntakseilla) man-sivu: man 7 regex (melko tekninen) POSIX extended: erikoismerkeillä +?(){} on erikoismerkitys; sovellukset: grep -E tai egrep lessin haku (näppäin / ) sed -r awk POSIX basic: erikoismerkit muodostetaan merkin takavinoviivan \kanssa; sovellukset: grep vimin haku (näppäin / ) sed Muut: Perl: grep -P tai perl Xerox: lexc, twolc, xfst (kieliteknologian kurssit CLT260, CLT270 jne.)

27 Asialista Käytännön asiat/kertaus Ongelman kuvaus Menetelmät ja aineistot Työkalut Viitteitä

28 Työsuunnitelma Alku kuten viimeksikin 1. haetaan kirja gutenbergistä hipulle: wget 2. (uudelleennimetään järkevämmin (mv pg12379.txt ylosnousemus.txt)) 3. korjataan rivinvaihdot (dos2unix ylosnousemus.txt) 4. hankiudutaan eroon englanninkielisistä osioista (tail -n +28 ylosnousemus.txt head -n -400 > ylosnousemus-siistitty.txt)

29 Työsuunnitelma 1. haetaan kirja gutenbergistä hipulle: wget 2. (uudelleennimetään järkevämmin (mv pg12379.txt ylosnousemus.txt)) 3. korjataan rivinvaihdot (dos2unix ylosnousemus.txt) 4. hankiudutaan eroon englanninkielisistä osioista (tail -n +28 ylosnousemus.txt head -n -400 > ylosnousemus-siistitty.txt) 5. haetaan nimet... ( egrep) 6. pitää siis formuloida egrepille se mitä sanottiin nimistä aiempana: oikeat verbit, isot alkukirjaimet...

30 Säännöllisten lausekkeiden syntaksia: yksinkertaiset saneet ja vaihtoehdot haluttiin etsiä (luonnollisen kielen) lausekkeet (phrase) tyyppiä X sanoi: kuten fgrepillä: egrep sanoi

31 Säännöllisten lausekkeiden syntaksia: yksinkertaiset saneet ja vaihtoehdot haluttiin etsiä (luonnollisen kielen) lausekkeet (phrase) tyyppiä X sanoi: kuten fgrepillä: egrep sanoi lisäksi muita sopivia verbejä sisältävät lausekkeet X epäili, X kuuli säännöllisissä lausekkeissa tai merkitään putkella eli pystyviivalla : egrep sanoi epäili kuuli

32 Säännöllisten lausekkeiden syntaksia: yksinkertaiset saneet ja vaihtoehdot haluttiin etsiä (luonnollisen kielen) lausekkeet (phrase) tyyppiä X sanoi: kuten fgrepillä: egrep sanoi lisäksi muita sopivia verbejä sisältävät lausekkeet X epäili, X kuuli säännöllisissä lausekkeissa tai merkitään putkella eli pystyviivalla : egrep sanoi epäili kuuli vielä tulee virheellisiä tuloksia: esim. sanoilla. sananrajaa voisi merkitä \b: egrep \bsanoi\b \bepäili\b \bkuuli\b = egrep \b(sanoi epäili kuuli)\b : sanarajat voi yhdistää ryhmittämällä sanat sulkeilla

33 Säännöllisten lausekkeiden syntaksia: merkkiluokat haluttiin etsiä aiempiin lausekkeisiin liittyviä nimiä: isolla kirjaimella alkavia sanoja säännöllisissä lausekkeissa mitä tahansa yhtä merkkiä titeystä joukosta voi ilmaista hakasulkeilla: [abcdefghijklmnopqrstuvwxyzåäö] on suomen pienten kirjainten joukko

34 Säännöllisten lausekkeiden syntaksia: merkkiluokat haluttiin etsiä aiempiin lausekkeisiin liittyviä nimiä: isolla kirjaimella alkavia sanoja säännöllisissä lausekkeissa mitä tahansa yhtä merkkiä titeystä joukosta voi ilmaista hakasulkeilla: [abcdefghijklmnopqrstuvwxyzåäö] on suomen pienten kirjainten joukko kulmasulkeiden sisällä voi käyttää joitakin nimettyjä joukkoja, jotka myös ilmoitetaan kulmasulkeilla ja lisäksi kaksoispisteillä: [[:lower:]] on sama kuin edellinen kulmasulkeissa voi myös käyttää välejä: [a-ö] on lähes sama kuin edellinen (saattaa sisältää isoja kirjaimia)

35 Säännöllisten lausekkeiden syntaksia: merkkiluokat haluttiin etsiä aiempiin lausekkeisiin liittyviä nimiä: isolla kirjaimella alkavia sanoja säännöllisissä lausekkeissa mitä tahansa yhtä merkkiä titeystä joukosta voi ilmaista hakasulkeilla: [abcdefghijklmnopqrstuvwxyzåäö] on suomen pienten kirjainten joukko kulmasulkeiden sisällä voi käyttää joitakin nimettyjä joukkoja, jotka myös ilmoitetaan kulmasulkeilla ja lisäksi kaksoispisteillä: [[:lower:]] on sama kuin edellinen kulmasulkeissa voi myös käyttää välejä: [a-ö] on lähes sama kuin edellinen (saattaa sisältää isoja kirjaimia) mutta vain jos asetukset ovat suomen kielellä!: locale kieliasetukset egrep \b(sanoi epäili kuuli)\b [[:upper:]] hakee isolla kirjaimella alkavia sanoja näiden jäljestä

36 Säännöllisten lausekkeiden syntaksia: toisto nimestä puuttuu enää ison kirjaimen jälkeinen osa; mielivaltainen määrä pieniä kirjaimia mielivaltainen toisto on säännöllisissä lausekkeissa asteriski eli tähti * : egrep \b(sanoi epäili kuuli)\b [[:upper:]][[:lower:]]*

37 Säännöllisten lausekkeiden syntaksia: toisto nimestä puuttuu enää ison kirjaimen jälkeinen osa; mielivaltainen määrä pieniä kirjaimia mielivaltainen toisto on säännöllisissä lausekkeissa asteriski eli tähti * : egrep \b(sanoi epäili kuuli)\b [[:upper:]][[:lower:]]* nyt meillä on tarvittavat sanat ja nimet perässä: voidaan sanoa egrep -o niin saadaan melkein listaus nimistä... Loppuun?

38 Säännöllisten lausekkeiden syntaksia: yhteenveto 1 merkkijonot vastaavat hakulausekkeita, pystyviivalla merkitään tai-tyypin ehto ja kaarisulkeilla ryhmitellään hakasulkeilla määritellään erilaisia joukkoja: luettelemalla [abc...] väleinä [a-z] luokkina [[:lower:]] (nimet esim. man-sivulla) merkkien ja joukkojen jälkeen voi merkitä toistoja: tähdellä a * miten monta vain 0 plussalla a+ ainakin yksi 1 kysymysmerkillä a? ehkä yksi 0 1 kaarisulkeilla raja-arvoin a{1,5} 1 5

39 Asialista Käytännön asiat/kertaus Ongelman kuvaus Menetelmät ja aineistot Työkalut Viitteitä

40 Kirjallisuus ja linkit Säännöllisistä lausekkeista on paljon kirjoja: Mastering Regular Expressions ( ) Regular Expression Pocket Reference ( ) ja verkkosivuja: Languages/Regular_Expressions/

Asialista. CLT131: Tekstityökalut 2010, kolmas luento. Laskuharjoitusaikataulut. Harjoituksissa havaitut virheet. Käytännön asiat/kertaus

Asialista. CLT131: Tekstityökalut 2010, kolmas luento. Laskuharjoitusaikataulut. Harjoituksissa havaitut virheet. Käytännön asiat/kertaus CLT131: Tekstityökalut 2010, kolmas luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-11-19 Laskuharjoitusaikataulut Harjoituksissa

Lisätiedot

CLT131: Tekstityökalut 2010, neljäs luento

CLT131: Tekstityökalut 2010, neljäs luento CLT131: Tekstityökalut 2010, neljäs luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-11-26 Asialista Käytännön asiat Kertausta shelliskriptien

Lisätiedot

Asialista. CLT131: Tekstityökalut 2010, neljäs luento. Lähiaikataulu. Asialista. Käytännön asiat

Asialista. CLT131: Tekstityökalut 2010, neljäs luento. Lähiaikataulu. Asialista. Käytännön asiat CLT131: Tekstityökalut 2010, neljäs luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-11-26 Lähiaikataulu ensi viikon luennoilla Hissu

Lisätiedot

CLT131: Tekstityökalut 2010, toinen luento

CLT131: Tekstityökalut 2010, toinen luento CLT131: Tekstityökalut 2010, toinen luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-11-12 päivitetty: 2010-11-14 Asialista Käytännön

Lisätiedot

Asialista. hippu ja.bashrc. Asialista. Tutkimusongelma: tekstin morfologisen jäsennyksen selvittely

Asialista. hippu ja.bashrc. Asialista. Tutkimusongelma: tekstin morfologisen jäsennyksen selvittely Asialista CLT131: Tekstityökalut 2010, toinen luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-11-12 päivitetty: 2010-11-14 Laskuharjoitukset:

Lisätiedot

CLT131: Tekstityökalut 2011, kuudes luento

CLT131: Tekstityökalut 2011, kuudes luento CLT131: Tekstityökalut 2011, kuudes luento Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 7. joulukuuta 2011 tommi.pirinen+clt131@helsinki.fi

Lisätiedot

CLT131: Tekstityökalut 2011, viides luento

CLT131: Tekstityökalut 2011, viides luento CLT131: Tekstityökalut 2011, viides luento Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 30. marraskuuta 2011 tommi.pirinen+clt131@helsinki.fi

Lisätiedot

CLT131: Tekstityökalut 2011, kahdeksas luento

CLT131: Tekstityökalut 2011, kahdeksas luento CLT131: Tekstityökalut 2011, kahdeksas luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2011-02-04 2011-02-04 1 / 17 Asialista 1 Käytännön

Lisätiedot

Asialista. CLT131: Tekstityökalut 2011, kahdeksas luento. Merkistöistä ja kalvostoista. Asialista. Tommi A Pirinen

Asialista. CLT131: Tekstityökalut 2011, kahdeksas luento. Merkistöistä ja kalvostoista. Asialista. Tommi A Pirinen CLT131: Tekstityökalut 2011, kahdeksas luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2011-02-04 2011-02-04 1 / 17 2011-02-04 2 / 17

Lisätiedot

CLT131: Tekstityökalut 2011, toinen luento

CLT131: Tekstityökalut 2011, toinen luento CLT131: Tekstityökalut 2011, toinen luento Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 9. marraskuuta 2011 tommi.pirinen+clt131@helsinki.fi

Lisätiedot

CLT131: Tekstityökalut 2011, seitsemäs luento

CLT131: Tekstityökalut 2011, seitsemäs luento CLT131: Tekstityökalut 2011, seitsemäs luento Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 14. joulukuuta 2011 tommi.pirinen+clt131@helsinki.fi

Lisätiedot

CLT131: Tekstityökalut 2010, kuudes luento

CLT131: Tekstityökalut 2010, kuudes luento CLT131: Tekstityökalut 2010, kuudes luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-12-16 Asialista Käytännön asiat Tuleva ohjelma

Lisätiedot

Korpusten käsittely clt131, P Luento 3

Korpusten käsittely clt131, P Luento 3 Korpusten käsittely clt131, P2 2006 Luento 3 Nicholas Volk 17.11.2006 Humanistinen tiedekunta Merkkijonon poiminen syötteestä, fgrep Monessa ohjelmassa on etsi/find-toiminto Tätä

Lisätiedot

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 19. tammikuuta 2012

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 19. tammikuuta 2012 TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 19. tammikuuta 2012 Sisällys Sisällys Muistathan A B -konstruktion 0 k 1 i 2 s 3 s 4 a 5 0 k 1 o 2 i 3 r 4

Lisätiedot

Asialista. CLT131: Tekstityökalut 2010, kuudes luento. Tuleva ohjelma. Kurssipalaute. Käytännön asiat Tuleva ohjelma Havaitut virheet ja korjaukset

Asialista. CLT131: Tekstityökalut 2010, kuudes luento. Tuleva ohjelma. Kurssipalaute. Käytännön asiat Tuleva ohjelma Havaitut virheet ja korjaukset Asialista CLT131: Tekstityökalut 2010, kuudes luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-12-16 Kurssipalaute Kerätään kurssin

Lisätiedot

CLT131: Tekstityökalut 2012, kymmenes luento

CLT131: Tekstityökalut 2012, kymmenes luento CLT131: Tekstityökalut 2012, kymmenes luento Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 1. helmikuuta 2012 tommi.pirinen+clt131@helsinki.fi

Lisätiedot

Asialista. CLT131: Tekstityökalut 2012, kymmenes luento. 2. frekvenssien muunnos todennäköisyyksiksi. 1. taulukkohaut

Asialista. CLT131: Tekstityökalut 2012, kymmenes luento. 2. frekvenssien muunnos todennäköisyyksiksi. 1. taulukkohaut Asialista CLT131: Tekstityökalut 2012, kymmenes luento Tommi A Pirinen tommi.pirinen+clt131@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 1. helmikuuta 2012 tommi.pirinen+clt131@helsinki.fi

Lisätiedot

CLT131: Tekstityökalut 2010, ensimmäinen luento

CLT131: Tekstityökalut 2010, ensimmäinen luento CLT131: Tekstityökalut 2010, ensimmäinen luento Tommi A Pirinen tommi.pirinen@helsinki.fi Helsingin yliopisto Kieliteknologian oppiaine, Nykykielten laitos 2010-11-04 (päivitetty: 2010-11-08) Asialista

Lisätiedot

Korpusten käsittely clt131, P Luento 5

Korpusten käsittely clt131, P Luento 5 Korpusten käsittely clt131, P2 2006 Luento 5 Nicholas Volk 1.12.2006 Humanistinen tiedekunta Perl Perl niminen ohjelmointikieli mahdollistaa tekstin monipuolisen muokkaamisen helposti

Lisätiedot

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 31. maaliskuuta 2011

TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho. 31. maaliskuuta 2011 TIEA241 Automaatit ja kieliopit, kevät 2011 (IV) Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 31. maaliskuuta 2011 Sisällys Sisällys Chomskyn hierarkia kieli säännöllinen kontekstiton kontekstinen rekursiivisesti

Lisätiedot

Luento 5. Timo Savola. 28. huhtikuuta 2006

Luento 5. Timo Savola. 28. huhtikuuta 2006 UNIX-käyttöjärjestelmä Luento 5 Timo Savola 28. huhtikuuta 2006 Osa I Shell-ohjelmointi Ehtolause Lausekkeet suoritetaan jos ehtolausekkeen paluuarvo on 0 if ehtolauseke then lauseke

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15

Ctl160 Tekstikorpusten tietojenkäsittely p.1/15 Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/15 Lisää säännöllisistä lausekkeista Aikaisemmin esityt * ja + yrittävät osua mahdollisimman pitkään merkkijonoon

Lisätiedot

[Jnix näyttökoe. o ei ole sallittua käyttää mitään verkkolevyjakoa tai mitään siihen rinnastettavaa järjestelmdä.

[Jnix näyttökoe. o ei ole sallittua käyttää mitään verkkolevyjakoa tai mitään siihen rinnastettavaa järjestelmdä. v1 081213 DTEK 1043 Opiskelun ja työelämän tietotekniikka [Jnix näyttökoe Tärkeää Naytt«ikokee(ssa/n) o saa hakea ohjeita Internetistä. o ei saa käyttää kurssimateriaaleja. o ei saa käyttää kirjallisia

Lisätiedot

CLT131 Korpusten käsittely

CLT131 Korpusten käsittely CLT131 Korpusten käsittely Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto CLT131 Korpusten käsittely p.1/16 Syöterivien järjestäminen (sort) sort-komento järjestää syöterivin (aakkosjärjestykseen)

Lisätiedot

Komentotulkki. Kysymyksiä

Komentotulkki. Kysymyksiä Komentotulkki Komentotulkki ja avustustoiminnot Tux-pingviinin kuva: Larry Ewing, Simon Budig ja Anja Gerwinski Kysymyksiä 1. Miten työskentelen komentotulkilla? 2. Miten komennot annetaan ja käsitellään?

Lisätiedot

Säännöllisistä lausekkeista

Säännöllisistä lausekkeista Säännöllisistä lausekkeista Panu A. Kalliokoski Date: 2004/02/05 20:18:37 Sisältö 1 Yleistä 1 1.1 Mitä SL:t sitten ovat ja mihin niitä käytetään?.......... 2 1.2 SL:ista teoreettisemmin.......................

Lisätiedot

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 16. marraskuuta 2015

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 16. marraskuuta 2015 ja ja TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho NFA:ksi TIETOTEKNIIKAN LAITOS 16. marraskuuta 2015 Sisällys ja NFA:ksi NFA:ksi Kohti säännöllisiä lausekkeita ja Nämä tiedetään:

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely p.1/28

Ctl160 Tekstikorpusten tietojenkäsittely p.1/28 Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/28 Emacs-editori Ikkunoinnin toimiessa Emacs-editorin käynnistyskäskyn perään kannattaa lisätä &-merkki

Lisätiedot

Johdatus Ohjelmointiin

Johdatus Ohjelmointiin Johdatus Ohjelmointiin Syksy 2006 Viikko 2 13.9. - 14.9. Tällä viikolla käsiteltävät asiat Peruskäsitteitä Kiintoarvot Tiedon tulostus Yksinkertaiset laskutoimitukset Muuttujat Tiedon syöttäminen Hyvin

Lisätiedot

Luento 3. Timo Savola. 7. huhtikuuta 2006

Luento 3. Timo Savola. 7. huhtikuuta 2006 UNIX-käyttöjärjestelmä Luento 3 Timo Savola 7. huhtikuuta 2006 Osa I Käyttöoikeudet Käyttöoikeudet Monen käyttäjän järjestelmä Prosessit kuuluvat eri käyttäjille Tiedostot kuuluvat

Lisätiedot

Kieliteknologian ATK-ympäristö Neljäs luento

Kieliteknologian ATK-ympäristö Neljäs luento Kieliteknologian ATK-ympäristö Neljäs luento Miikka Silfverberg Nykykielten laitos 27. syyskuuta 2010 Miikka Silfverberg (Nykykielten laitos) Kieliteknologian ATK-ympäristö: Luento 3 27. syyskuuta 2010

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely Kolmas luento

Ctl160 Tekstikorpusten tietojenkäsittely Kolmas luento Ctl160 Tekstikorpusten tietojenkäsittely 490160-0 Kolmas luento Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 Tekstikorpusten tietojenkäsittely490160-0kolmas luento p.1/26 Lisää

Lisätiedot

Korpusten käsittely clt131, P Luento 4

Korpusten käsittely clt131, P Luento 4 Korpusten käsittely clt131, P2 2006 Luento 4 Nicholas Volk 24.11.2006 Humanistinen tiedekunta Säännölliset lausekkeet: ryhmittely Sulkujen avulla voidaan osoittaa määrällistäjille

Lisätiedot

Aloitus. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 9. lokakuuta 2016 TIETOTEKNIIKAN LAITOS. Aloitus. Meta.

Aloitus. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 9. lokakuuta 2016 TIETOTEKNIIKAN LAITOS. Aloitus. Meta. TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 9. lokakuuta 2016 Sisällys Opettajat Vastuuopettaja (luennot, ohjaukset, tehtäväpalaute) Antti-Juhani Kaijanaho,

Lisätiedot

Datatähti 2019 alku. task type time limit memory limit. A Kolikot standard 1.00 s 512 MB. B Leimasin standard 1.00 s 512 MB

Datatähti 2019 alku. task type time limit memory limit. A Kolikot standard 1.00 s 512 MB. B Leimasin standard 1.00 s 512 MB Datatähti 2019 alku task type time limit memory limit A Kolikot standard 1.00 s 512 MB B Leimasin standard 1.00 s 512 MB C Taulukko standard 1.00 s 512 MB D Ruudukko standard 1.00 s 512 MB E Sanalista

Lisätiedot

Tehtävä 2: Säännölliset lausekkeet

Tehtävä 2: Säännölliset lausekkeet Tehtävä 2: Säännölliset lausekkeet Kun tietokoneohjelmalla luetaan käyttäjän syötettä, olisi syöte aina syytä tarkistaa. Syötteessä voi olla vääriä merkkejä tai merkkejä väärillä paikoilla (syntaktinen

Lisätiedot

Ctl160 Tekstikorpusten tietojenkäsittely

Ctl160 Tekstikorpusten tietojenkäsittely Ctl160 490160-0 Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto Ctl160 490160-0 p.1/23 Kurssibyrokratiaa Luennoitsija: Nicholas Volk nvolk ling.helsinki.fi Luennot: keskiviikkoisin 19.1.-2.3.

Lisätiedot

Kieliteknologian ATK-ympäristö Kolmas luento

Kieliteknologian ATK-ympäristö Kolmas luento Kieliteknologian ATK-ympäristö Kolmas luento Miikka Silfverberg Nykykielten laitos 20. syyskuuta 2010 Miikka Silfverberg (Nykykielten laitos) Kieliteknologian ATK-ympäristö: Luento 3 20. syyskuuta 2010

Lisätiedot

Sisällys. Johdatus Linux/Unixiin: Osa 2. Prosessin tilat. Prosessien hallinta. Prosessien monitorointi

Sisällys. Johdatus Linux/Unixiin: Osa 2. Prosessin tilat. Prosessien hallinta. Prosessien monitorointi Sisällys Johdatus Linux/Unixiin: Osa 2 Prosessien hallinta Syöttö ja tulostus Säännölliset lausekkeet Tiedostojen käsittelyä Eero Hyvönen Tietojenkäsittelytieteen laitos Helsingin Yliopisto 13.9.2000 E.

Lisätiedot

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 29. toukokuuta 2013

TIEA241 Automaatit ja kieliopit, kesä Antti-Juhani Kaijanaho. 29. toukokuuta 2013 TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 29. toukokuuta 2013 Sisällys Chomskyn hierarkia (ja muutakin) kieli LL(k) LR(1) kontekstiton kontekstinen rekursiivisesti

Lisätiedot

Kieliteknologian ATK-ympäristö Toinen luento

Kieliteknologian ATK-ympäristö Toinen luento Kieliteknologian ATK-ympäristö Toinen luento Miikka Silfverberg Nykykielten laitos 12. syyskuuta 2011 Miikka Silfverberg (Helsingin yliopisto) Kieliteknologian ATK-ympäristö: Luento 2 12. syyskuuta 2011

Lisätiedot

Opetustapahtumien hakeminen (Hae - Opetustapahtuma)

Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Helsingin yliopisto WinOodi 1 (5) Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Opetustapahtumien hakua tarvitaan sekä opetustapahtumien käsittelyssä että raporttien tulostamisessa. Ohjeessa käsitellään

Lisätiedot

Opetustapahtumien hakeminen (Hae - Opetustapahtuma)

Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Helsingin yliopisto WinOodi 1 (5) Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Opetustapahtumien hakua tarvitaan sekä opetustapahtumien käsittelyssä että raporttien tulostamisessa. Ohjeessa käsitellään

Lisätiedot

Pauliina Munter/Suvi Junes Tampereen yliopisto / Tietohallinto Valitse muokkaustila päälle kurssialueen etusivun oikean yläkulman painikkeesta.

Pauliina Munter/Suvi Junes Tampereen yliopisto / Tietohallinto Valitse muokkaustila päälle kurssialueen etusivun oikean yläkulman painikkeesta. Sanasto Sanasto -työkalulla voi laatia sanakirjan tapaisen sanaston, jonka hakusanoja (käsitteitä ja niiden määritelmiä) voidaan selata ja opettajan niin halutessa myös kommentoida. Sekä opettaja että

Lisätiedot

Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet

Säännölliset kielet. Sisällys. Säännölliset kielet. Säännölliset operaattorit. Säännölliset kielet TIEA241 Automaatit ja kieliopit, kesä 2013 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 24. toukokuuta 2013 Sisällys Formaalit kielet On tapana sanoa, että merkkijonojen joukko on (formaali) kieli. Hieman

Lisätiedot

SELECT-lauseen perusmuoto

SELECT-lauseen perusmuoto SQL: Tiedonhaku SELECT-lauseen perusmuoto SELECT FROM WHERE ; määrittää ne sarakkeet, joiden halutaan näkyvän kyselyn vastauksessa sisältää

Lisätiedot

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset

815338A Ohjelmointikielten periaatteet Harjoitus 2 vastaukset 815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 2 vastaukset Harjoituksen aiheena on BNF-merkinnän käyttö ja yhteys rekursiivisesti etenevään jäsentäjään. Tehtävä 1. Mitkä ilmaukset seuraava

Lisätiedot

Säännöllisten kielten sulkeumaominaisuudet

Säännöllisten kielten sulkeumaominaisuudet Säännöllisten kielten sulkeumaominaisuudet Osoitamme nyt, että säännöllisten kielten joukko on suljettu yhdisteen, konkatenaation ja tähtioperaation suhteen. Toisin sanoen jos A ja B ovat säännöllisiä,

Lisätiedot

Korpusten käsittely clt131, P Luento 1

Korpusten käsittely clt131, P Luento 1 Korpusten käsittely clt131, P2 2006 Luento 1 Nicholas Volk 3.11.2006 Humanistinen tiedekunta CLT131 Korpusten käsittely (syksy 2006) Luennoitsija FM Nicholas Volk Kurssiassistentti

Lisätiedot

TIEDONHALLINTA - SYKSY Luento 8. Saapumisryhmä: Pasi Ranne /9/13 Helsinki Metropolia University of Applied Sciences

TIEDONHALLINTA - SYKSY Luento 8. Saapumisryhmä: Pasi Ranne /9/13 Helsinki Metropolia University of Applied Sciences TIEDONHALLINTA - SYKSY 2011 Kurssikoodi: Saapumisryhmä: Luento 8 XX00AA79-3013 TU12S2 Pasi Ranne 25.9.2013 25/9/13 Helsinki Metropolia University of Applied Sciences 1 Harjoitustyö Harjoitustöiden tilanne

Lisätiedot

PERL. TIE Principles of Programming Languages. Ryhmä 4: Joonas Lång & Jasmin Laitamäki

PERL. TIE Principles of Programming Languages. Ryhmä 4: Joonas Lång & Jasmin Laitamäki PERL TIE-20306 Principles of Programming Languages Ryhmä 4: Joonas Lång & Jasmin Laitamäki 1. Johdanto Perl on ohjelmointikielten perhe, johon kuuluu Perl 5 ja Perl 6. Kielet ovat kuitenkin erilliset ohjelmointikielet

Lisätiedot

Tekstin etsiminen ja korvaaminen

Tekstin etsiminen ja korvaaminen KSAO Liiketalous 1 Tekstin etsiminen ja korvaaminen Etsi ja korvaa toiminnolla voit etsiä ja korvata nopeasti asiakirjan osia esimerkiksi tekstiä, grafiikkaa, alaviitteitä, jne. Voit esimerkiksi: etsiä

Lisätiedot

Opetustapahtumien hakeminen (Hae - Opetustapahtuma)

Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Helsingin yliopisto WinOodi Sivu 1/5 Opetustapahtumien hakeminen (Hae - Opetustapahtuma) Opetustapahtumien hakua tarvitaan sekä opetustapahtumien käsittelyssä että raporttien tulostamisessa. Ohjeessa käsitellään

Lisätiedot

Kon Konepajojen tuotannonohjaus: ILOG CPLEX Studion käyttö

Kon Konepajojen tuotannonohjaus: ILOG CPLEX Studion käyttö Kon-15.4199 Konepajojen tuotannonohjaus: ILOG CPLEX Studion käyttö 22.1.2016 Harjoituksessa 1. Varmistetaan että kaikilla on pari! Ilmoittautukaa oodissa etukäteen! 2. Tutustutaan ensimmäiseen tehtävään

Lisätiedot

Muodolliset kieliopit

Muodolliset kieliopit Muodolliset kieliopit Luonnollisen kielen lauseenmuodostuksessa esiintyy luonnollisia säännönmukaisuuksia. Esimerkiksi, on jokseenkin mielekästä väittää, että luonnollisen kielen lauseet koostuvat nk.

Lisätiedot

Pythonin Kertaus. Cse-a1130. Tietotekniikka Sovelluksissa. Versio 0.01b

Pythonin Kertaus. Cse-a1130. Tietotekniikka Sovelluksissa. Versio 0.01b Pythonin Kertaus Cse-a1130 Tietotekniikka Sovelluksissa Versio 0.01b Listat 1/2 esimerkkejä listan peruskäytöstä. > lista=['kala','kukko','kissa','koira'] ['kala','kukko','kissa','koira'] >lista.append('kana')

Lisätiedot

Tiedostonhallinta. Yleistä

Tiedostonhallinta. Yleistä Tiedostonhallinta Tiedostonhallinnan kautta voi muokata kaikkia näkymän tiedostoja. Sitä tarvitaan näkymien räätälöintiin ja joidenkin asetusten muuttamiseen. Yleistä Tiedostojen tarkastelu ja muokkaus

Lisätiedot

Automaatit. Muodolliset kielet

Automaatit. Muodolliset kielet Automaatit Automaatit ovat teoreettisia koneita, jotka käsittelevät muodollisia sanoja. Automaatti lukee muodollisen sanan kirjain kerrallaan, vasemmalta oikealle, ja joko hyväksyy tai hylkää sanan. Täten

Lisätiedot

file Opetettavissa omilla säännöillä tiedostossa /etc/magic -k tulosta kaikki useista mahdollisuuksista -L/-h seuraa/älä seuraa symbolisia linkkejä

file Opetettavissa omilla säännöillä tiedostossa /etc/magic -k tulosta kaikki useista mahdollisuuksista -L/-h seuraa/älä seuraa symbolisia linkkejä file file [optiot] tiedosto[t] Yrittää tunnistaa tiedoston tyypin (tiedostonimestä välittämättä) Paljon optioita tulostuksen muotoiluun ym, usein hyödyllisiä: -k tulosta kaikki useista mahdollisuuksista

Lisätiedot

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python Ohjelmoinnin perusteet Y Python T-106.1208 14.2.2011 T-106.1208 Ohjelmoinnin perusteet Y 14.2.2011 1 / 55 Kännykkäpalautetteen antajia kaivataan edelleen! Ilmoittaudu mukaan lähettämällä ilmainen tekstiviesti

Lisätiedot

Hahmon etsiminen syotteesta (johdatteleva esimerkki)

Hahmon etsiminen syotteesta (johdatteleva esimerkki) Hahmon etsiminen syotteesta (johdatteleva esimerkki) Unix-komennolla grep hahmo [ tiedosto ] voidaan etsia hahmon esiintymia tiedostosta (tai syotevirrasta): $ grep Kisaveikot SM-tulokset.txt $ ps aux

Lisätiedot

Harjoitustyön testaus. Juha Taina

Harjoitustyön testaus. Juha Taina Harjoitustyön testaus Juha Taina 1. Johdanto Ohjelman teko on muutakin kuin koodausta. Oleellinen osa on selvittää, että ohjelma toimii oikein. Tätä sanotaan ohjelman validoinniksi. Eräs keino validoida

Lisätiedot

MITÄ JAVASCRIPT ON?...3

MITÄ JAVASCRIPT ON?...3 JavaScript MITÄ JAVASCRIPT ON?...3 YLEISTÄ JAVASCRIPTIN SYNTAKSISTA...3 KÄSKYSANAT JA MUUT VARATUT SANAT...3 MUUTTUJIEN, FUNKTIOIDEN JA LUOKKIEN NIMISSÄ...3 HTML-TAGEIHIN VIITTAAVISSA METODINIMISSÄ...3

Lisätiedot

Opettajan pedagogiset opinnot 2017 Ainedidaktiikan opetusjakso syyskuun viikolla 36 (15.8./JS)

Opettajan pedagogiset opinnot 2017 Ainedidaktiikan opetusjakso syyskuun viikolla 36 (15.8./JS) Opettajan pedagogiset opinnot 2017 Ainedidaktiikan opetusjakso syyskuun viikolla 36 (15.8./JS) Jakson tavoitteena on kielididaktiikan perusteisiin sekä tunnin suunnittelun perusperiaatteisiin tutustuminen.

Lisätiedot

Kieliteknologian ATK-ympäristö Kuudes luento

Kieliteknologian ATK-ympäristö Kuudes luento Kieliteknologian ATK-ympäristö Kuudes luento Miikka Silfverberg Nykykielten laitos 11. lokakuuta 2010 Miikka Silfverberg (Nykykielten laitos) Kieliteknologian ATK-ympäristö: Luento 6 11. lokakuuta 2010

Lisätiedot

Apuja ohjelmointiin» Yleisiä virheitä

Apuja ohjelmointiin» Yleisiä virheitä Apuja ohjelmointiin» Yleisiä virheitä Ohjelmaa kirjoittaessasi saattaa Visual Studio ilmoittaa monenlaisista virheistä "punakynällä". Usein tämä johtuu vain siitä, että virheitä näytetään vaikket olisi

Lisätiedot

Automaattinen semanttinen annotointi

Automaattinen semanttinen annotointi Automaattinen semanttinen annotointi Matias Frosterus, Reetta Sinkkilä, Katariina Nyberg Semantic Computing Research Group (SeCo) School of Science and Technology, Department of Media Technology and University

Lisätiedot

Perusohje vi-editorin käyttöön

Perusohje vi-editorin käyttöön Perusohje vi-editorin käyttöön Aapo Rista 22.9.2000 Sisältö 1 Johdanto 1 2 vi:n komento- ja kirjoitustilat 2 3 vi:n käynnistäminen ja siitä poistuminen 2 4 Liikkuminen tekstissä 3 5 Merkkien lisääminen

Lisätiedot

Tutoriaaliläsnäoloista

Tutoriaaliläsnäoloista Tutoriaaliläsnäoloista Tutoriaaliläsnäolokierroksella voi nyt täyttää anomuksen läsnäolon merkitsemisestä Esim. tagi ei toiminut, korvavaltimon leikkaus, yms. Hyväksyn näitä omaa harkintaa käyttäen Tarkoitus

Lisätiedot

Java-kielen perusteet

Java-kielen perusteet Java-kielen perusteet Tunnus, varattu sana, kommentti Muuttuja, alkeistietotyyppi, merkkijono, literaalivakio, nimetty vakio Tiedon merkkipohjainen tulostaminen 1 Tunnus Java tunnus Java-kirjain Java-numero

Lisätiedot

Tiedonhaku Nelli-portaalissa

Tiedonhaku Nelli-portaalissa Tiedonhaku Neli-portaalissa 1 (10) Nelli-portaali Tiedonhaku Nelli-portaalissa SISÄLTÖ Monihaku... Monihaku -sanahaku... Monihaku -tarkennettu... Monihaun tulokset... Monihaku: Lista... Monihaku: Koko

Lisätiedot

Kontekstittomien kielten jäsentäminen Täydentäviä muistiinpanoja TIEA241 Automaatit ja kieliopit, syksy 2016

Kontekstittomien kielten jäsentäminen Täydentäviä muistiinpanoja TIEA241 Automaatit ja kieliopit, syksy 2016 Kontekstittomien kielten jäsentäminen äydentäviä muistiinpanoja IA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho 19. lokakuuta 2016 1 Yksiselitteiset operaattorikieliopit 1.1 Aritmeettiset

Lisätiedot

Korpusten käsittely clt131, P Luento 6

Korpusten käsittely clt131, P Luento 6 Korpusten käsittely clt131, P2 2006 Luento 6 Nicholas Volk 8.12.2006 Humanistinen tiedekunta Syöterivien lukemista while () { käsky1; käsky2; käskyn; } continue { print $_; }

Lisätiedot

Täydentäviä muistiinpanoja kontekstittomien kielioppien jäsentämisestä

Täydentäviä muistiinpanoja kontekstittomien kielioppien jäsentämisestä Täydentäviä muistiinpanoja kontekstittomien kielioppien jäsentämisestä Antti-Juhani Kaijanaho 30. marraskuuta 2015 1 Yksiselitteiset operaattorikieliopit 1.1 Aritmeettiset lausekkeet Tällä kurssilla on

Lisätiedot

4. Lausekielinen ohjelmointi 4.1

4. Lausekielinen ohjelmointi 4.1 4. Lausekielinen ohjelmointi 4.1 Sisällys Konekieli, symbolinen konekieli ja lausekieli. Lausekielestä konekieleksi: - Lähdekoodi, tekstitiedosto ja tekstieditorit. - Kääntäminen ja tulkinta. - Kääntäminen,

Lisätiedot

1.1 Tekstinprosessointiohjelmien yleinen toimintatapa (1)

1.1 Tekstinprosessointiohjelmien yleinen toimintatapa (1) 1 Tekstinprosessointiohjelmat 1.1 1.1 Tekstinprosessointiohjelmien yleinen toimintatapa (1) Useimmat tekstinprosessointiohjelmat (cat, grep,... ) toimivat kahdella erilaisella tavalla. Jos niille annetaan

Lisätiedot

Python-ohjelmointi Harjoitus 2

Python-ohjelmointi Harjoitus 2 Python-ohjelmointi Harjoitus 2 TAVOITTEET Kerrataan tulostuskomento ja lukumuotoisen muuttujan muuttaminen merkkijonoksi. Opitaan jakojäännös eli modulus, vertailuoperaattorit, ehtorakenne jos, input-komento

Lisätiedot

Q 17.1/27/74/7 R. Puranen GEOLOGINEN TUTKIMUSLAITOS. Geofysiikan osasto NÄYTETUNNUSTEN LÄVISTYS (PINTAN~YTTEET) HP 9820 A-OHJELMASELOSTE

Q 17.1/27/74/7 R. Puranen GEOLOGINEN TUTKIMUSLAITOS. Geofysiikan osasto NÄYTETUNNUSTEN LÄVISTYS (PINTAN~YTTEET) HP 9820 A-OHJELMASELOSTE Q 17.1/27/74/7 R. Puranen 1974-05-14 GEOLOGINEN TUTKIMUSLAITOS Geofysiikan osasto NÄYTETUNNUSTEN LÄVISTYS (PINTAN~YTTEET) HP 9820 A-OHJELMASELOSTE Q 17.1/27/74/7 R. Puranen 1974-05-14 GEOLOGINEN TUTKIMUSLAITOS

Lisätiedot

TIEDONHAKU INTERNETISTÄ

TIEDONHAKU INTERNETISTÄ TIEDONHAKU INTERNETISTÄ Internetistä löytyy hyvin paljon tietoa. Tietoa ei ole mitenkään järjestetty, joten tiedonhaku voi olla hankalaa. Tieto myös muuttuu jatkuvasti. Tänään tehty tiedonhaku ei anna

Lisätiedot

tään painetussa ja käsin kirjoitetussa materiaalissa usein pienillä kreikkalaisilla

tään painetussa ja käsin kirjoitetussa materiaalissa usein pienillä kreikkalaisilla 2.5. YDIN-HASKELL 19 tään painetussa ja käsin kirjoitetussa materiaalissa usein pienillä kreikkalaisilla kirjaimilla. Jos Γ ja ovat tyyppilausekkeita, niin Γ on tyyppilauseke. Nuoli kirjoitetaan koneella

Lisätiedot

S-114.2720 Havaitseminen ja toiminta

S-114.2720 Havaitseminen ja toiminta S-114.2720 Havaitseminen ja toiminta Heikki Hyyti 60451P Harjoitustyö 2 visuaalinen prosessointi Treismanin FIT Kuva 1. Kuvassa on Treismanin kokeen ensimmäinen osio, jossa piti etsiä vihreätä T kirjainta.

Lisätiedot

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 8. maaliskuuta 2012

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 8. maaliskuuta 2012 TIEA241 Automaatit ja kieliopit, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 8. maaliskuuta 2012 Sisällys Ongelma-analyysiä Sisällys Ongelma-analyysiä Hypoteettinen ongelma The Elite Bugbusters

Lisätiedot

Sangen lyhyt L A T E X-johdatus

Sangen lyhyt L A T E X-johdatus Sangen lyhyt L A T E X-johdatus Lari Koponen ja Eetu Ahonen 23.1.2013 Koulutuksen tavoitteet Koulutuksen jälkeen pystyy kirjoittamaan työselostuksen L A T E X:illa, eli Dokumentin rakenne tutuksi Tekstin

Lisätiedot

Henkilökohtaisen Wilma-tunnuksen luominen avainkoodin avulla

Henkilökohtaisen Wilma-tunnuksen luominen avainkoodin avulla GRADIA OPPILAITOKSET 1 Henkilökohtaisen Wilma-tunnuksen luominen avainkoodin avulla Avainkoodin avulla huoltaja voi tehdä itselleen Wilma-tunnuksen, tai yhdistää olemassa olevaan tunnukseensa lisää huollettaviaan

Lisätiedot

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 19. syyskuuta 2016

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 19. syyskuuta 2016 TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 19. syyskuuta 2016 Sisällys Neuvoja opintoihin tee joka päivä ainakin vähän uskalla mennä epämukavuusalueelle en

Lisätiedot

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python Ohjelmoinnin perusteet Y Python T-106.1208 4.3.2009 T-106.1208 Ohjelmoinnin perusteet Y 4.3.2009 1 / 35 Tiedostot Tiedostojen käsittelyä tarvitaan esimerkiksi seuraavissa tilanteissa: Ohjelman käsittelemiä

Lisätiedot

Kulttuuritaidot Oppilas oppii tuntemaan Ranskaa ja ranskankielisiä alueita ranskankielisille kulttuureille ominaisia tapoja ja kohteliaisuussääntöjä

Kulttuuritaidot Oppilas oppii tuntemaan Ranskaa ja ranskankielisiä alueita ranskankielisille kulttuureille ominaisia tapoja ja kohteliaisuussääntöjä Ylöjärven opetussuunnitelma 2004 B2 RANSKA VUOSILUOKKA: 8 VUOSIVIIKKOTUNTEJA: 2 Tavoitteet ymmärtämään erittäin selkeästi puhuttuja tai kirjoitettuja lyhyitä viestejä viestintää tavallisimmissa arkielämän

Lisätiedot

Lähdeviitteiden merkintä (Kielijelppi)

Lähdeviitteiden merkintä (Kielijelppi) Lähdeviitteiden merkintä (Kielijelppi) Copyright 2004 2010, Kielijelppi Palvelun tekijänoikeuksia suojaa Creative Commons -lisenssi Lähdeviitteiden merkitsemiseksi on olemassa useita tapoja. Viitteet voidaan

Lisätiedot

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python Ohjelmoinnin perusteet Y Python T-106.1208 2.3.2009 T-106.1208 Ohjelmoinnin perusteet Y 2.3.2009 1 / 28 Puhelinluettelo, koodi def lue_puhelinnumerot(): print "Anna lisattavat nimet ja numerot." print

Lisätiedot

Luento 4. Timo Savola. 21. huhtikuuta 2006

Luento 4. Timo Savola. 21. huhtikuuta 2006 UNIX-käyttöjärjestelmä Luento 4 Timo Savola 21. huhtikuuta 2006 Osa I Shell Lausekkeet Komentoriville kirjotettu komento on lauseke echo "foo" echo $USER MUUTTUJA=1 ls -l Rivinvaihto

Lisätiedot

metsän kieli Luonnon aakkoset Adjektiivijahti Vastakohtien etsintä Sanakäärme Sana-arvoitus Narujuoksu Tiedän ja näen

metsän kieli Luonnon aakkoset Adjektiivijahti Vastakohtien etsintä Sanakäärme Sana-arvoitus Narujuoksu Tiedän ja näen metsän kieli Luonnon aakkoset Adjektiivijahti Vastakohtien etsintä Sanakäärme Sana-arvoitus Narujuoksu Tiedän ja näen Luonnon aakkoset YM, AI, kielet pareittain tai pienissä ryhmissä aakkoskortit, pyykkipojat

Lisätiedot

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos: 8 Kanta Tässä luvussa tarkastellaan aliavaruuden virittäjävektoreita, jotka muodostavat lineaarisesti riippumattoman jonon. Merkintöjen helpottamiseksi oletetaan luvussa koko ajan, että W on vektoreiden

Lisätiedot

Kirjastoinfo TaY Pori Porin tiedekirjasto

Kirjastoinfo TaY Pori Porin tiedekirjasto Kirjastoinfo TaY Pori Porin tiedekirjasto www.tut.fi/kirjasto/pori kirjasto-pori@tut.fi 040 826 2780 Kalvot www-sivuilla: Porin tiedekirjasto > Koulutus Sisältö: Porin tiedekirjaston kotisivu www.tut.fi/kirjasto/pori

Lisätiedot

C-ohjelmoinnin peruskurssi. Pasi Sarolahti

C-ohjelmoinnin peruskurssi. Pasi Sarolahti C! C-ohjelmoinnin peruskurssi Pasi Sarolahti Mitä haluan oppia C-kurssilla? ja miksi? Tutustu lähimpään naapuriin Keskustelkaa miksi halusitte / jouduitte tulemaan kurssille 3 minuuttia è kootaan vastauksia

Lisätiedot

11.4. Context-free kielet 1 / 17

11.4. Context-free kielet 1 / 17 11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä

Lisätiedot

7/20: Paketti kasassa ensimmäistä kertaa

7/20: Paketti kasassa ensimmäistä kertaa Ohjelmointi 1 / syksy 2007 7/20: Paketti kasassa ensimmäistä kertaa Paavo Nieminen nieminen@jyu.fi Tietotekniikan laitos Informaatioteknologian tiedekunta Jyväskylän yliopisto Ohjelmointi 1 / syksy 2007

Lisätiedot

Luonnolliset vs. muodolliset kielet

Luonnolliset vs. muodolliset kielet Luonnolliset vs. muodolliset kielet Luonnollisia kieliä ovat esim. 1. englanti, 2. suomi, 3. ranska. Muodollisia kieliä ovat esim. 1. lauselogiikan kieli (ilmaisut p, p q jne.), 2. C++, FORTRAN, 3. bittijonokokoelma

Lisätiedot

Kertausta 1. kurssikokeeseen

Kertausta 1. kurssikokeeseen Kertausta. kurssikokeeseen. kurssikoe on to 22.0. klo 9 2 salissa A (tai CK2). Koealueena johdanto ja säännölliset kielet luentokalvot 3 ja nämä kertauskalvot harjoitukset 6 Sipser, luvut 0 ja Edellisvuosien.

Lisätiedot

CLT131 Korpusten käsittely Viides luento

CLT131 Korpusten käsittely Viides luento CLT131 Korpusten käsittely 490160-0 Viides luento Nicholas Volk Yleisen kielitieteen laitos, Helsingin yliopisto CLT131 Korpusten käsittely490160-0viides luento p.1/19 Syötteen lukemisesta Aikaisemmin

Lisätiedot

https://njr.yap.fi/cgi-bin/soj2/dispat.exe

https://njr.yap.fi/cgi-bin/soj2/dispat.exe Jäsenrekisteriin kirjautuminen Avaa internet ja kirjoita selaimen osoitekenttään: https://njr.yap.fi/cgi-bin/soj2/dispat.exe Kirjoita käyttäjätunnus ja salasana, ja paina Sisäänkirjaus. Kirjauduttua avautuu

Lisätiedot