1: Korpukset ja ohjelmat" [7, ]).

Samankaltaiset tiedostot
Avoimen lähdekoodin kaksitasokielioppikääntäjä

Integration of Finnish web services in WebLicht Presentation in Freudenstadt by Jussi Piitulainen

Kielipankki ja FIN-CLARIN. Mietta Lennes Nykykielten laitos, Helsingin yliopisto

General studies: Art and theory studies and language studies

Laskelmia uudenvuodenpuheista

Oppijansuomen piirteitä korpusvetoisesti

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

Kielitieteellisten aineistojen käsittely

3 9-VUOTIAIDEN LASTEN SUORIUTUMINEN BOSTONIN NIMENTÄTESTISTÄ

Yleisen kielitieteen opetus

KIELIPANKKI JA LEMMIE-OHJELMISTO

Englannin kielen ja viestinnän ja ammattiaineiden integrointiyhteistyö insinöörikoulutuksessa

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

Suomen kielen substantiivilla on noin 2000 erilaista muotoa vai onko sittenkään? Kimmo Kettunen, Tampereen yliopisto, informaatiotutkimuksen laitos

Humanististen alojen aineistojen erityispiirteet ja aineistonhallinta METODIFESTIVAALI

Tutkimuksen huippuyksiköt. Maiju Gyran tiedeasiantuntija

Kielipankki ja FIN-CLARIN

(1) a. auto-n osta-minen b. auto-n ost-o c. Hän osta-a auto-n. ( ) (S)HE.NOM BUY-3SG CAR-ACC

XML-tutkimus Jyväskylän yliopistossa

RANS0002 P2. Phonetics and Pronunciation (Fonetiikka ja ääntäminen), O, 2 ECTS. RANS0010 P3. Translation Exercise (Käännösharjoitukset) s, O, 3 ECTS

punainen lanka - Kehitysjohtaja Mcompetence Oy markokesti.com Työhyvinvoinnin kohtaamispaikka Sykettätyöhön.

Group 2 - Dentego PTH Korvake. Peer Testing Report

Bruttokansantuotteen kehitys Development of Gross Domestic Product

Kansainvälisesti ainutlaatuinen lääkeinformaatioverkosto järkevän lääkehoidon tukena

Suomi 101. Heidi Toivonen

RANTALA SARI: Sairaanhoitajan eettisten ohjeiden tunnettavuus ja niiden käyttö hoitotyön tukena sisätautien vuodeosastolla

ISSRC Information Systems Security Research Center. University of Oulu, Department of Information Processing Science T.Wiander, M.

Lähdekielen vaikutuksen tutkimus korpusten pohjalta. Esitelmä Kielitieteen päivillä Oulussa Annekatrin Kaivapalu Tallinnan yliopisto

Faculty of Agriculture and Forestry. Forestry

Faculty of Economics and Administration

Kielen opintopolut/ Language study paths

VBE2 Työpaketit Jiri Hietanen / TTY

TIETEEN PÄIVÄT OULUSSA

Information on Finnish Language Courses Spring Semester 2017 Jenni Laine

Ice navigation training in Rauma, Finland as a basis for ensuring safe and sustainable shipping in changing arctic environment

1. Koskinen S, Koskenniemi J, Leino-Kilpi H & Suhonen R Ikääntyneiden osallisuus palveluiden kehittämisessä. Pro terveys 41 (2),

Ubicom tulosseminaari

Benchmarking Controlled Trial - a novel concept covering all observational effectiveness studies

Matti Sarvimäki. July /2009 Senior Researcher Government Institute for Economic Research, Helsinki

KYSELYLOMAKE: FSD3101 KANSALAISKESKUSTELU RUOTSIN KIELESTÄ: KONTROLLI- KYSELY 2014

Suomen ja korkeatasoisen tutkimuksen kohtalonyhteys. Raimo Sepponen, prof. Elektroniikan laitos Sähkötekniikan korkeakoulu Aalto yliopisto

CLT131 Korpusten käsittely Viides luento

Ei-manuaalisuus. Tommi Jantunen, SVKS112,

Export Demand for Technology Industry in Finland Will Grow by 2.0% in 2016 GDP growth 2016/2015, %

DIPLOMITYÖ ARI KORHONEN

Käyttöliittymät II. Käyttöliittymät I Kertaus peruskurssilta. Keskeisin kälikurssilla opittu asia?

Information on Finnish Courses Autumn Semester 2017 Jenni Laine & Päivi Paukku Centre for Language and Communication Studies

Suomenkielisten tekstien morfologinen analysointi

Teollisuustuotanto. Industrial Production. Kehittyvät maat / Emerging countries. Maailma / World. Kehittyneet maat / Advanced countries.

Infrastruktuurin asemoituminen kansalliseen ja kansainväliseen kenttään Outi Ala-Honkola Tiedeasiantuntija

Tarvitsetko kansainvälisiä tutkimuksia yhteiskuntatieteiden aloilta? klo 9:00-10:00 Maarit Putous & Tuula Rissanen

Esittäisin tavoitteeksi että siirto toteutetaan lokaluun alussa, mikäli corpus3.csc.fi on jo onnistuttu ajamaan sisään.

ehealth Solutions across the Northern Periphery OULU, Finland

2017/S Contract notice. Supplies

The CCR Model and Production Correspondence

Kielipankin analyysityökalut ja aineistot Työmarkkinatilanteen tutkiminen lehtiaineiston avulla

KORPUSANALYYSI OPPIJANSUOMEN EPÄTYYPILLISISTÄ KONTEKSTUAALISTA RAKENTEISTA

HITSAUKSEN TUOTTAVUUSRATKAISUT

Teollisuustuotannon määrä kuukausittain

Camilla Wikström-Grotell, prefekt, prorektor DIAK to be Arcada s new neighbour A new sports hall is being planned

Supplies

HUMAN RESOURCE DEVELOPMENT PROJECT AT THE UNIVERSITY OF NAMIBIA LIBRARY

Building Information Model (BIM) promoting safety in the construction site process. SafetyBIM research project 10/2007 2/2009. (TurvaBIM in Finnish)

Yrityksen informaatio- ja toimintoprosessien optimointi

Laatu yritystoiminnan ytimessä. Junnu Lukkari

Laajuus (op)/ Omfattning (sp) / Scope (cr)

WAMS 2010,Ylivieska Monitoring service of energy efficiency in housing Jan Nyman,

toukokuu 2011: Lukion kokeiden kehittämistyöryhmien suunnittelukokous

Publications of Fred Karlsson

5 Yksityiskohtaiset laskentatulokset Aurajoelle

Sisällysluettelo Table of contents

BOOKLIST FOR THE IB SECTION AT KUOPION LYSEON LUKIO

Älykkäät yhteydet satamatoimijoiden välillä. Älyliikenne , Markku Koskinen

HAKEMUS Sivu 1

Social and Regional Economic Impacts of Use of Bioenergy and Energy Wood Harvesting in Suomussalmi

Standard Business Reporting (SBR) and diminishing the Administrative Burden for companies

Jatko-opintovaihtoehdot/ Further studies

Supplies

APA-tyyli. Petri Nokelainen

UHLCS:n hakemistot ja ryhmät. Tämä on päivitetty versio ryhmiä koskevasta osuudesta ( ).

Viittomakielen korpusaineisto ja sen käyttö

Paikkatiedon semanttinen mallinnus, integrointi ja julkaiseminen Case Suomalainen ajallinen paikkaontologia SAPO

Making use of BIM in energy management

Tekes the Finnish Funding Agency for Technology and Innovation. Copyright Tekes

Lab SBS3.FARM_Hyper-V - Navigating a SharePoint site

Kielen opintopolut- Courses and Proficiency Levels Kielikeskus/Language Centre, Saimaan amk ja LUT Saksa/German

SFS/SR315 Tekoäly Tekoälyn standardisointi

WP6: Actor-specific Services & New Technologies. Jyri Rajamäki & Timo Timonen

TKK 100 vuotta -merkki

Euromaat kehittyvät epäyhtenäisesti / Euro Countries Are Developing Unevenly

Capacity utilization

Teuvo Peltoniemi: Journalistic activities

Käytettävyyslaatumallin rakentaminen web-sivustolle. Oulun yliopisto tietojenkäsittelytieteiden laitos pro gradu -suunnitelma Timo Laapotti 28.9.

VIRTA julkaisutietopalvelu

Aihe, aineisto ja argumenf. Viitekehys RINNASTUKSEN PROSODIAA SUOMALAISESSA VIITTOMAKIELESSÄ. Lauserinnastustutkimuksen videoaineisto

VAASAN YLIOPISTO Humanististen tieteiden kandidaatin tutkinto / Filosofian maisterin tutkinto

Innovative teaching practices

University Teacher in Multilingual Translation Studies, University of Turku

Onnistuuko hakkerien ja artistien yhteistyö?

Erasmus-liikkuvuuden tilastoja Anni Kallio

Transkriptio:

81:001.103](480).. ( ) )*,,.. 40,. ( ),.,, 60 [1, 2].,, ([3, 4, 5, 6]:. "Korpuslingvistiikan työpaja 1: Korpukset ja ohjelmat" [7,. 126 134])., [8; 1,. 50 54, 62 64].,,.,. ( ),., ( Unix, Unix,, "F Secure SSH Client").,,...,,,...,...,. ISSN 0548 0027... 2... 2003. 6 37

" ".,,., " " (, "a running text"),. "So a corpus in modern linguistics, in contrast to being simply any body of text, might more accurately be described as a finite sized body of machine readable text, sampled in order to be maximally representative of the language variety under consideration" [9, c. 24].,, " " (.. )..,,, (,,..).,. ( ).,,,,.,,,. FINNISH IT CENTER FOR SCIENCE (CSC) http://www.csc.fi CSC,,,., 2. (,,.),, CSC,,., CSC 60,. CSC "Kielipankki" " " (http://www.csc.fi/kielipankki),,,.. 747 236, 210539150. 86% ( 179602389 ). (, CSC, [10]). Suomen kielen tekstipankki (SKTP) ) http://www.csc.fi/sktp 2001. SKTP 180 ( 35 2000.). SGML TEI :,, (1990 2000.)., TEXTMORFO SWESG. http: //www.csc.fi/sktp/sktp tekstit.html. http://www.csc.fi/ kielipankki/aineistot/naytaaineistot.phtml SKTP LT ("Suomen kielen tekstipankin leksikaalinen tietokanta")., (,,,,, ( ), ). LEMMIE (. [11]). Oulun korpus ( ) [12] http://www.csc.fi/kielipankki/julkaisut/opas/c623. phtml#aen625 80 XX 2 Cedar,. 128, 76.8, 160. (http://www.csc.fi/metacomputer/laitetiedot.html.en). 38 ISSN 0548 0027... 2... 2003. 6

429058 5800,,,,. 1997 SGML CSC. CQP (Corpus Query Processor). Suomen murteiden morfologinen digitaaliarkisto ) http://www.joensuu.fi/fld/methodsxi/abstracts/ kukkola.html 1967. 2., 1000. SGML... Keskiranskan korpus ) http://www.csc.fi/kielipankki/julkaisut/opas/ x693.phtml, XIV XVI. 29 1.. CSC 14 (430. ). :,,.. LE PAROLE http://www.hltcentral.org/usr docs/prqject source/ parole/parolefinal.pdf,, 11. 20.,. PAROLE FI,, CSC (PAROLE GE).,, CSC,.. Susanne corpus (http://www.cogs.susx.ac. uk/users/geoffs/suedoc.html). CHILDES (http://childes.psy.cmu.edu/). The Oxford Text Archive (http://ota.ahds. ac.uk/) ISSN 0548 0027... 2.. Le Monde (http://www.icp.inpg.fr/elra/) WordNet (http://www.cogsci.princeton.edu/ The university of Helsinki language corpus server (UHLCS) http://www.ling.helsinki.fi/uhlcs.,. 1980.,., HKV (. [13]). 80, ("Databank for endangered Finno Ugric languages", "LENCA group project", "A Finland Swedish Corpus (FISC)".),,. " " (Two level Grammar;. [14]) " " (Constraint Grammar;. [15]). http://www.lingsoft.fi/doc/).,,,.. (,, ),. " ", ( ) (,,,,, ). UHLCS 50 (,, http; //www.hng.helsinki.fi/uhlcs/data/languages.html). 2000.., (. http://www.ling.helsmki.fi/uhlcs/tools/tools.html)., UHLCS, : Helsinki Corpora I Helsinki Corpora II. Helsinki Corpora I http://www.ling.helsinki.fi/uhlcs/data/helsinkicorpora I.html (, ); (,. 2003. 39

); ( );,,,,. Helsinki Corpora II http://www.ling.helsinki.fi/uhlcs/data/helsinkicorpora II.html,. (,, (, )),,, )., "Databank for endangered Finno Ugric languages" (, ;. [16]).,. UHLCS, (http: // www.ling.helsinki.fi / uhlcs/readme all / README Russian.html). SGML. 1999 2000.,.., RUSTWOL [17]., Lingsoft. 200.. ). SGML... ). 3. ( ", " ", " "). 100.. Ryscard,.. 400..., 1,5. http://www.kotus.fi/inenglish/ (Kotimaisten kielten tutkimuskeskus, KOTUS).,,,.,,.., 76. CSC (. ),,. [18],,,,. 1987., ( SGML) 100.. ( 2100 000, ) ( 50 80. ). XIX, 1810 1900. ( http://www.kotus.fi/aineistot/18qo/180qsahkoisetaineistot.shtml). XVI XVIII 3,2 ( http://www.kotus.fi/ ameistot/vks sahkoinenaineisto.shtml).., [19]., ( 1100 000, 200. ).. (http: //www.utu.fi/hum/suomi/kokoeima.htm#la) 250. 40, 10% [20]. KWIC, AGREP. http://www.eng.helsmki.fi/mdex.htm. 40 ISSN 0548 0027... 2... 2003.

,,. The Helsinki Corpus of English Texts: Diachronic Part [21],,,. ( 750.) XVIII (1710.). 1984..., 25 " " (,,,,,.)., ( ) [22]. The Helsinki Corpus of English Texts: the Dialect Corpus (HD) [23], 1970 80. [24]. 800.,.,,,. The Corpus of Early English Correspondence (CEEC) [25, 26, 27] 1993 2000. 2.7, 1417 1681. XVII XVIII., "Sociolinguistics and Language History", (,,..).. The Corpus of Early English Medical Writing [28] 1375 1750. 1.5.... The Helsinki Corpus of Older Scots (HCOS) [29] 1450 1700., ISSN 0548 0027... 2... 2003., :,,,,,,. 830... ) [30] http://www.utu.fi/hum/sgr/volgapalvengl. htm (,, ), (,, )..,. MORMULA ( ) 200.,. MARKO ( ) 1.. ONCHYKO " " 1996 1999. 16, ( XIX ). The Neo Assyrian Text Corpus Project http://www.helsinki.fi/science/saa/cna.html (. ) " " ( G, State Archives of Assyria).,,, ANSII 3358547. The Corpus of 19th century English (CONCE) [31].. ( ). (1800 1830,1830 1870, 1870 1900), " ":,,,,,. 1 41

.. Suomen Kansan Vanhat Runot (SKVR) http://www.oszk.hu/ujdonsag/firm/eng/klemettinen. html. "Suomen kansan vanhat runot, SKVR" (" "). ). XML,. 150.,,. The Electronic Corpus of Ingrian Finnish http://helmer.hit.uib.no/ingrisk/ingrian.html,. [32].. Corpus Cyrillo Methodianum Helsingiense http://www.slav.helsinki.fi/ccmh/.. (,,.).,,.. The Tampere Bilingual Corpus of Finnish and English [33]. "Sinuhe egyptiläinen"., ( )... PARRU S [34],.,.,,. 5.,,.. http://www.slav.helsinki.fi/hanko... ).,. 100..,,. 1. Kieliteknologia Suomessa. / Ed. by M. Miettinen. Helsinki, 1998. 2. The History of Linguistics in the Nordic Countries. / Ed. by C. Henriksen, E. Hovdhaugen, F. Karlsson, B. Siguurd. Helsinki, 2000. 3. Koskenniemi K. Tietokonelingvistiikan vaihteet Suomessa. Tietoyhteys 1997, 3, 7 8. 4. Miettinen M. Kieliteknologia tarvitsee Kielipankkia. Tietoyhteys 1997, 3, 5 6. 5. Lehtinen M. Tietokoneet sanakirjatyössä. Tieto yhteys 1997, 3, 9 10. 6. Lehtinen M., Karvonen P., Rahikäinen T. Raportti tekstikorpusten koostamisperiaatteista ja ny kysuomen tekstiaineistojen tarpeellisuudesta Kotimaisten kielten tutkimuskeskuksessa. Helsinki, 1995. 7. XXIX Kielitieteen päivät. Helsinki, 2002. 8. Arppe A. No Single Path Finnish Lessons in the Commercialisation of language engineering Research. 2002 [ : http://www.csc.fi/ euromap / artikkelit / arppe.phtml.en]. 9. McEnery T. and Wilson A. Corpus Linguistics. Edinburgh, 1996. 10. Miettinen M. Kielipankin asiakkaan opas, Espoo, 2000. [ : http://www.csc.fi/ kielipankki/julkaisut/opas/index.phtml]. 11. Grönroos M. The Lexical Database of the Bank of Finnish. Helsinki, 2000. 12. Oulun korpus: 1960 luvun suomen yleiskielen tut kimusmateriaali / ed. by P. Saukkonen, Oulu, 1982. 13. Hakulinen A., Karlsson F., Vilkuna M. Suomen tekstilauseiden piirteitä, kvantitatiivinen tutki mus. Helsinki, 1980. [=Publications 6. Department of General Linguistics]. 14. Koskenniemi K. Two Level Morphology, A General Computational Model for Word Form Recogni tion and Production. Helsinki, 1983. [^Publications 11. Department of General Linguistics]. 15. Constraint Grammar: A Language Independent Framework for Parsing Unrestricted Tex. / Ed. by F. Karlsson, A. Voutilainen, J. Heikkilä, A. Anttila. Berlin: Mouton de Gruyter, 1995. 16. Suihkonen P. Documentation of the Computer Corpora of the Uralic Languages at the University of Helsinki. Helsinki. Department of General Linguistics. [Technical Reports TR 2], 1998. 17. Viikki L. RUSTWOL, A System for Automatic Recognition of Russian words, 1997. [ : www.lingsoft.fi/doc/rustwol/rustwol.txt]. 42 ISSN 0548 0027.. CEP. 2... 2003.

18. Suomen kielen perussanakirja. Helsinki, 1990 1994, I III. 19. Suomen murteiden sanakirja. Helsinki, 1985. 20. Miikkulainen R. The Database of Finnish Toponyms, Proceedings of the XIXth International Congress of Onomastic Sciences (Aberdeen, August 4 11, 1996), 2. P. 248 255. Aberdeen, 1998. [ : http://www.kotus.fi/aineistot/ nirniarkisto/paikannirnet/toponyins.shtrnl]. 21. Manual to the Diachronic Part of the Helsinki Corpus of English Texts. Coding Conventions and Lists of Source Texts. / Kytö M. (.), 3rd ed. Helsinki, 1996. [Available at http://khnt.hit.uib.no/ icame/manuals/hc/index.htm]. 22. Kytö M. and Rissanen M. English Historical Corpora, Report on Developments in 1999, ICAME JOURNAL, Computers in English Linguistics 2000, P. 24, 159 175. 23. P ei t sara K. and Vasko A. The Helsinki Dialect Corpus, Characteristics of Speech and Aspects of Variation. Helsinki English Studies, The Electronic Journal of the Department of English at the University of Helsinki 2002, 2 [ : http://www.eng.helsinki.fi/hes/corpora/ helsinki dialect corpus.htm]. 24. Orton H. Survey of English Dialects. Leeds, 1962. 25. Nevalainen T. & Raumolin Brunberg H. Sociolinguistics and language history, The Helsinki Corpus of Early English Correspondence, Hermes: Journal of Linguistics 1994, 13. P. 135 143. 26. Manual for the Corpus of Early English Corres pondence Sampler CEECS / ed. by Nurmi A. Helsinki, 1998. [ : http://www.hit.uib.no/ icame/ceecs/index, htm]. 27. Laitinen M. Extending the Corpus of Early English Correspondence to the 18th Century, Helsinki English Studies, The Electronic Journal of the Department of English at the University of Helsinki 2002, 2 : http://www.eng.helsinki.fi/ hes/corpora/extending the_ corpus.htm]. 28. Taavitsainen I. and Pahta P. Corpus of Early English Medical Writing 1375 1750, ICAME JOURNAL, Computers in English Linguistics 1997, 21. P. 71 79. 29. Meurman Solin A. A New Tool, the Helsinki Corpus of Older Scots (1450 1700), ICAME JOURNAL, Computers in English Linguistics 1995, 19. P. 49 63. 30. Moisio A. and Luutonen J. Turun yliopiston volgakielten korpukset, XXIII Kielitieteen päivät, 123. Helsinki, 1996. 31. Kytö M., Rudanko J., Smitterberg E. Building a Bridge between the Present and the Past, a Corpus of 19th century English, ICAME JOURNAL, Computers in English Linguistics 2000, 24. P. 85 97. 32. Cooper W. R. The Tampere Bilingual Corpus of Finnish and English, Development and Applications, Compare or Contrast? Current Issues in Crosslanguage Research. Tampere, 1998. 33. Savijärvi I.: Western Ingria Where Languages and Dialects Meet. [ : http; //helmer.hit.uib.no/ingrisk/western.html]. 34. Mikhailov M. and Tommola H. Compiling Parallel Text Corpora, towards Automation of Routine Procedures, International Journal of Corpus Linguistics 2001, 6. P. 69 77. ISSN 0548 0027.. CEP. 2... 2003. 43