Tilastotieteen johdantokurssi (TJK) 3 tai 5 op Introduction to Statistics

Samankaltaiset tiedostot
UEF Statistics Teaching Bulletin, Fall 2017

UEF Statistics Teaching Bulletin, Spring 2018

UEF Statistics Teaching Bulletin, Spring 2017

Tilastotieteen aihehakemisto

Constructive Alignment in Specialisation Studies in Industrial Pharmacy in Finland

TILASTOTIEDE. Perusopinnot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Efficiency change over time

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Kysymys 5 Compared to the workload, the number of credits awarded was (1 credits equals 27 working hours): (4)

MS-A0504 First course in probability and statistics

Information on Finnish Language Courses Spring Semester 2018 Päivi Paukku & Jenni Laine Centre for Language and Communication Studies

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

The CCR Model and Production Correspondence

Information on preparing Presentation

Sisällysluettelo Table of contents

Network to Get Work. Tehtäviä opiskelijoille Assignments for students.

Capacity Utilization

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Information on Finnish Language Courses Spring Semester 2017 Jenni Laine

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

OP1. PreDP StudyPlan

Windows Phone. Module Descriptions. Opiframe Oy puh Espoo

Hallintotieteiden opinto-opas lkv / Yleisopintoja Yleisopinnot

Statistical design. Tuomas Selander

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Information on Finnish Courses Autumn Semester 2017 Jenni Laine & Päivi Paukku Centre for Language and Communication Studies

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Other approaches to restrict multipliers

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

HAHMONTUNNISTUKSEN PERUSTEET

Ohjelmien kehittämisstudiot varmistavat laadukkaat ja linjakkaat maisteriohjelmat Maire Syrjäkari ja Riikka Rissanen

MTTTP5, luento Luottamusväli, määritelmä

Heisingin kaupungin tietokeskus Helsingfors stads faktacentral City of Helsinki Urban Facts 0N THE EFFECTS 0F URBAN NATURAL AMENITIES, ARCHITECTURAL

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

toukokuu 2011: Lukion kokeiden kehittämistyöryhmien suunnittelukokous

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Hallintotieteiden opinto-opas lkv , Yleisopinnot ok Yleisopinnot

Lab SBS3.FARM_Hyper-V - Navigating a SharePoint site

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Matematiikka ja tilastotiede. Orientoivat opinnot /

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Research plan for masters thesis in forest sciences. The PELLETime 2009 Symposium Mervi Juntunen

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

ECVETin soveltuvuus suomalaisiin tutkinnon perusteisiin. Case:Yrittäjyyskurssi matkailualan opiskelijoille englantilaisen opettajan toteuttamana

Savonia: ECB4000 Karelia: XYZ UEF:

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

General studies: Art and theory studies and language studies

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

Gap-filling methods for CH 4 data

Liite B. Suomi englanti-sanasto

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

Kandidaatintutkielman aineistonhankinta ja analyysi

Tentin materiaali. Sivia: luvut 1,2, , ,5. MacKay: luku 30. Gelman, 1995: Inference and monitoring convergence

Osa 2: Otokset, otosjakaumat ja estimointi

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Tuotantotalouden aineopinnot. Ville Tuomi

SPSS ohje. Metropolia Business School/ Pepe Vilpas

HAHMONTUNNISTUKSEN PERUSTEET

Hallintotieteiden opinto-opas lkv / Yleisopinnot Yleisopinnot

ELEC-C5210 Satunnaisprosessit tietoliikenteessä

812336A C++ -kielen perusteet,

TIEKE Verkottaja Service Tools for electronic data interchange utilizers. Heikki Laaksamo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Land-Use Model for the Helsinki Metropolitan Area

16. Allocation Models

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

Alternative DEA Models

Master's Programme in Life Science Technologies (LifeTech) Prof. Juho Rousu Director of the Life Science Technologies programme 3.1.

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

4.2 Useampi selittävä muuttuja (kertausta)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

T Statistical Natural Language Processing Answers 6 Collocations Version 1.0

Valuation of Asian Quanto- Basket Options

Returns to Scale II. S ysteemianalyysin. Laboratorio. Esitelmä 8 Timo Salminen. Teknillinen korkeakoulu

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Basic Flute Technique

MTTTP1, luento KERTAUSTA

Bioinformatics in Laboratory of Computer and Information Science

TIETEEN METODIIKKA MODUULIN YHTEISEN OSUUDEN KURSSILISTA LV Kurssikuvaukset

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Perusnäkymä yksisuuntaiseen ANOVAaan

Työelämäkysymykset osaksi tohtoriopintojen opetussuunnitelmia kehitteillä valtakunnallinen digitaalinen koulutuspaketti

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Teacher's Professional Role in the Finnish Education System Katriina Maaranen Ph.D. Faculty of Educational Sciences University of Helsinki, Finland

MTTTP1, luento KERTAUSTA

How to handle uncertainty in future projections?

Johdatus regressioanalyysiin

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Vertaispalaute. Vertaispalaute, /9

Transkriptio:

Tilastotieteen johdantokurssi (TJK) 3 tai 5 op 3622230 Introduction to Statistics Osaamistavoitteet: Tutustua havaintoaineiston hankintamenetelmiin ja sen problematiikkaan. Perehtyä havaintoaineiston kuvailumenetelmiin. Tutustua tilastollisen päättelyn periaatteisiin. 5 op:n laajuinen kurssi antaa edellytykset jatkaa 5op:n laajuiselle tilastotieteen peruskurssille. Learning outcomes: Become familiar with the data collection methods and its problematics. To study various data description methods. Become familiar with the principles of statistical inference. The 5 credit course provides basics to the 5-credit course Basics in statistics. Sisältö: Kurssilla opiskelija oppii kuvailemaan havaintoaineiston tunnuslukujen ja kuvioiden avulla sekä tarkastelemaan kahden muuttujan välistä riippuvuutta ristiintaulukon ja hajontakuvion avulla. Kurssilla tutustutaan myös havaintoaineiston hankintaan liittyen erilaisiin tutkimusasetelmiin, tilastollisen koesuunnittelun periaatteisiin ja otantatutkimuksen perusmenetelmiin. Edelleen käydään läpi aikasarjojen perusterminologia. Kurssin lopuksi käsitellään tilastollisen testauksen perusteita t-testien avulla. Näiden lisäksi 5 op kurssilla käsitellään todennäköisyyslaskennan perusteita ja todennäköisyysjakaumia. Content: Description of a data with sample statistics and graphs. Dependence of two variables are considered via two-way tables and scatter plots. Some sampling techniques. Basic concepts of time series are considered. The course covers also basic of statistical testing, as examples we use t-tests. Basics of probability and probability distributions are studied on 5 cr course. Suoritustavat: Kirjallinen kuulustelu. Modes of study: Written examination Tyyppi: Monimuoto-opetus Type: Multi-modal teaching Toteustavat: Aloitusluennot (6 h), pienryhmäopetus 18 h. Opiskelu tapahtuu opiskelijajohtoisesti. Ennen pienryhmää opiskelija opiskelee Moodlessa jaetun viikkokohtaisen materiaalin (mm. moniste ja luentovideot). Pienryhmissä opiskelija tekee ennalta opiskeltuun materiaaliin liittyviä tehtäviä. Pienryhmässä opiskelijalla on myös mahdollisuus esittää kysymyksiä ennalta opiskeltuun materiaaliin liittyen. Kurssilla on myös viikoittaisia harjoitustehtäviä, jotka palautetaan Moodleen. Teaching methods: Lectures 6 h, tutorials 18 h. Student prepares for the weekly tutorials by reading given material and watching videos at moodle. In tutorial student solves given exercise problems. In tutorials there is also possibility to make some questions on weekly topics. In addition there is weekly exercises which are returned in Moodle. Oppimateriaalit: Kurssimoniste ja materiaalit Moodle-sivustolla. Study material: Handout and material in Moodle. Arvosteluperusteet: 0-5 Evaluation criteria: 0-5

Tilastotieteen peruskurssi (TPK) 3 tai 5 op 3622231 Basics in Statistics Osaamistavoitteet: Opiskelija oppii analysoimaan havaintoaineistoa ja tulkitsemaan yleisimpien yksinkertaisten tilastollisten analyysien tuloksia. Opiskelija tutustuu erilaisiin regressiomenetelmiin. 5 op:n laajuinen kurssi antaa edellytykset jatkaa tilastotieteen aineopintotason kursseille ja datatieteen kursseille. Learning outcomes: Student learns to analyse data and to interpret the results of commonly used statistical methods including different regression methods. The 5-credit course gives sufficient background knowledge for intermediate courses in statistics and for data science. Sisältö: Moniuloitteinen jakauma, estimointi, hypoteesien testaus (riippumattomuustesti, Mann- Whitneyn testi, Wilcoxonin testi), regressiomenetelmien alkeet (regressioanalyysi, 1- ja 2- suuntainen varianssianalyysi, logistinen regressio logistinen regressio, yhden ja useamman selittävän muuttujan regressioanalyysi ja sekamalli). 3 opintopisteen kurssilla ei käsitellä moniulotteista jakaumaa eikä sekamallia. Content: Multivariate distribution, estimation, hypothesis testing (independence test, Mann- Whitney test, Wilcoxon test), introduction to regression methods (regression analysis, 1- and 2-way analysis of variance, logistic regression and mixed model). On the 3 cr course we do not study multivariate distributions and mixed models. Suoritustavat: Kirjallinen kuulustelu. Modes of study: Writen examination Toteustavat: Monimuoto-opetus. Luennot 2 h, pienryhmäopetus 16 h. Opiskelu tapahtuu opiskelijajohtoisesti. Ennen pienryhmää opiskelija opiskelee Moodlessa jaetun viikkokohtaisen materiaalin (mm. moniste ja luentovideot). Pienryhmissä opiskelija tekee ennalta opiskeltuun materiaaliin liittyviä tehtäviä. Pienryhmässä opiskelijalla on myös mahdollisuus esittää kysymyksiä ennalta opiskeltuun materiaaliin liittyen. Kurssilla on myös viikoittaisia harjoitustehtäviä, jotka palautetaan Moodleen. Teaching methods: Multi-modal teaching. Lectures 2 h, tutorial 16 h. Student prepares for the weekly tutorials by reading given material and watching videos at moodle. In tutorial student solves given exercise problems. In tutorials there is also possibility to make some questions on weekly topics. In addition there is weekly exercises which are returned in Moodle. Oppimateriaalit: Kurssimoniste, Moodlessa jaettava materiaali. Study materials: Handout and material in the Moodle. Arvosteluperusteet: 0-5 Evaluation criteria: 0-5 Esitietovaatimukset: Tilastotieteen johdantokurssi Prerequisites: Introduction to statistics

Tilastotieteen perusteet englanniksi, 5 op (BCS) 3622111 Basic statistics in English Osaamistavoitteet: Opiskelija ymmärtää tilastollisen analyysin ja päättelyn perusideat ja hallitsee yksinkertaisimmat analyysimenetelmät. Opiskelijalla on edellytykset omaksua vaativampia tilastotieteen ja datatieteen menetelmiä. Learning outcomes: The student understands the basic ideas of statistical analysis and inference, and is able to use the most simple analysis methods. The students has the basic knowledge to learn more advanced methods of statistics and data science. Sisältö: Todennäkösyyslaskennan perusteet. Otantajakaumat. Johdanto estimointiin ja hypoteesien testaukseen. Populaation keskiarvoon (=odotusarvo) ja osuuteen liittyvä päättely. Kaksiulotteisten taulukoiden analyysi. Regressiomenetelmien alkeet (Regressioanalyysi, varianssianalyysi, logistinen regressio ja sekamalli) Content: Basics of probability. Sampling distributions. Introduction to estimation and hypothesis testing. Inference on population mean and proportion. Analysis of two-way tables. Introduction to regression methods (Regression analysis, analysis of variance, logistic regression and mixed-effect models) Suoritustavat: Tentti Modes of study: Exam Toteutustavat: Monimuoto-opetus. Luennot (2 h), pienryhmä (16h) Teaching Methods: Multi-modal teaching. Lectures (2 h), tutorial (16 h) Oppimateriaali: Moore, McCabe and Craig (2012): Introduction to the practice of statistics, 7 th edition. Valitut osat luvuista 4-15. Study materials: Moore, McCabe and Craig (2012): Introduction to the practice of statistics, 7 th edition. Selected parts of chapters 4-15. Arvosteluperusteet: 0-5 Evaluation criteria: 0-5 Edellytykset: Tilastollisen kuvailun ja otannan perusteet. Opiskelijat joilla ei ole näitä pohjatietoja voivat lukea etukäteen esim. kurssikirjan ensimmäisen osan Looking at data Prerequisites: Basics of descriptive statistics and sampling. Students without these knowledge should read e.g. the first part of the textbook (Part 1 Looking at data, chapters 1-3).

3622233 Tilastollinen koesuunnittelu, 5 op 3622233 Statistical Experimental Design, 5 Cp Osaamistavoitteet: Opiskelija ymmärtää koesuunnittelun perusperiaatteet. Osaa analysoida perusasetelmista peräisin olevan aineiston (ainakin R ohjelmalla). Osaa tulkita analyysin tulokset ja ymmärtää asetelmiin liittyvien mallien diagnostiikan periaateet. Learning outcomes: The aim is that after the course, the student understands the basic concepts of experimental design. He/She should also be able to analyze data from di erent designs (at least with R-software), interpret and utilize the results, and explore the validity of the inherent assumptions or at least understand the assumptions that have been made. Sisältö: Koesuunnittelun perusperiaatteet: Lohkominen, satunnaistaminen ja toistaminen. Voimakkuuslaskennan perusteet. Täydellisesti satunnaistettu koe (faktorikoe), täydellisesti satunnaistettu lohkokoe, sisäkkäinen koeasetelma, split-plot asetelma, satunnaiset tekijät faktorikokeessa, toistomittaukset Content: Basic principles of experimental design: Blocking, randomization, repetition. Basics of power calculation, factorial experiment, random factors in factorial experiment, nested design, split-plot design, repeated measurements Suoritustavat: Näyttökoe tai kirjallinen kuulustelu. Modes of study: Exemption exam or Writen examination Toteustavat: Monimuoto-opetus. Luennot 2 h, pienryhmäopetus 14 h Teaching methods: Multi-modal teaching. Lectures 2 h, tutorial 14 h Oppimateriaalit: Kurssimoniste, Moodlessa jaettava materiaali. Study materials: Handout and material in the Moodle. Arvosteluperusteet: 0-5 Evaluation criteria: 0-5 Esitietovaatimukset: Tilastotieteen johdantokurssi ja tilastotieteen peruskurssi. Prerequisites: Introduction to statistics and Basics in statistics

Data-analyysin todennäköisyyspäättely 1 5 op, 3622352 Probabilistic inference for data science Sisältö: Kurssilla tutustutaan data-analyysissä tarvittavaan todennäköisyyslaskentaan. Todennäköisyyden käsite. Yksiulotteiset jakaumat, muunnokset ja niiden jakauma, odotusarvo, varianssi, keskihajonta. Kaksiulotteinen jakauma, ehdollinen jakauma, marginaalijakauma, kovarianssi, korrelaatio ja riippumattomuus. Matriisilaskentaa. Moniulotteinen jakauma, sen odotusarvo, varianssi-kovarianssimatriisi sekä ehdolliset ja marginaalijakaumat. Moniulotteinen normaalijakauma ja sen keskeiset ominaisuudet. Contents: The course covers the essential probability calculus for data science. Univariate distributions, transformations and their distribution, expected value, variance and standard deviation. Bivariate distributions, conditional distributions, marginal distributions, covariance, correlation and independence. Matrix calculus. Multivariate distribution, its expected value, variance-covariance matrix and conditional and marginal distributions. Multivariate normal distribution and its essential properties. Tavoitteet: Kurssin tavoitteena on oppia data-analyysissä tarvittavan todennäköisyyslaskennan perusteita, erityisesti yksi- ja moniulotteisten satunnaismuuttujien matemaattista käsittelyä ja siihen tarvittavaa matriisilaskentaa. Objectives Goal of the course is to learn basics of probability calculus for data science, especially mathematical formulation of univariate and multivariate random variables and the required matrix calculus. Oppimateriaali: Casella-Berger 2002, Statistical inference (chapters 1-4) tai DeGroot and Schervish, Probability and Statistics (Chapters 1-4) Study materials: Casella-Berger 2002, Statistical inference (chapters 1-4) or DeGroot and Schervish, Probability and Statistics (Chapters 1-4) Toteutustavat: Opetusta 32 t ja harjoituksia 16t. Teaching methods: Lectures 32 h and exercises 16h. Suoritustapa: Harjoitustehtävät ja tentti. Modes of study: Exercises and exam. Arviointi: 0-5 Assessments: 0-5 Edellytykset: Tilastotieteen peruskurssi, R-kurssi Prerequisites: Basic course in statistics, R-course

Data-analyysin todennäköisyyspäättely 2 (3622353, 5 op) Probabilistic Inference for Data Science 2 Tavoiteet: Opiskelija hallitsee tilastollisen estimoinnin ja päättelyn perusteet riippumattoman ja riippuvan datan analyysissä. Objectives: The student knows basics of statistical estimation and inference in the analysis of independent and dependent data. Sisältö: Satunnaisotoksen yhteisjakauma, statistiikka, otoskeskiarvo, otosvarainssi ja -kovarianssi ja niiden ominaisuudet, estimaattorin käsite ja sen keskeiset ominaisuudet (harha, varianssi, keskineliövirhe ja tehokkuus). Suurten lukujen laki ja keskeinen raja-arvolause. Estimointimenetelmiä: suurimman uskottavuuden (Maximum likelihood) estimointi, pienimmän neliösumman estimointi, momenttimenetelmä ja Bayesilainen-estimointi. Väliestimointi ja hypoteesien testaus. Contents: The joint distribution of a random sample, statistic, sample mean, sample variance and sample covariance and their properties. The concept of estimator and its central properties (bias, variance, root mean square error and efficiency). Law of large numbers and the central limit theorem. Estimation methods: maximum likelihood, least squares, the method of moments, and Bayesian estimation. Interval estimation and hypothesis testing. Oppimateriaali: Morris H. DeGroot ja Mark J. Schervish 2012, Probability and statistics (4 painos), osia luvuista 5-10 tai Casella& Berger 2001. Statistical Inference (2. painos), osia luvuista 5-10 Study materials: Morris H. DeGroot ja Mark J. Schervish 2012, Probability and statistics (4 painos), parts of chapters 5-10 or Casella& Berger 2001. Statistical Inference (2. painos), parts of chapters 5-10 Toteutustavat: Opetusta 32 h luentoja ja 16 h harjoituksia. Teaching methods: Lectures 32 h lectures and 16 h exercises. Suoritustapa: Harjoitustehtävät ja tentti. Modes of study: Exercises and exam. Arviointi: 0-5 Assessments: 0-5 Edellytykset: Data-analyysin todennäköisyyspäättely 1 Prerequisites: Probabilistic inference for data science 1

Johdatus tilastolliseen päättelyyn 2 (3622323, 5 op) Introduction to Statistical Inference 2 Tavoiteet: Opiskelija hallitsee tilastollisen estimoinnin ja päättelyn perusteet riippumattoman ja riippuvan datan analyysissä. Objectives: The student knows basics of statistical estimation and inference in the analysis of independent and dependent data. Sisältö: Satunnaisotoksen yhteisjakauma, statistiikka, otoskeskiarvo, otosvarainssi ja -kovarianssi ja niiden ominaisuudet, estimaattorin käsite ja sen keskeiset ominaisuudet (harha, varianssi, keskineliövirhe ja tehokkuus). Suurten lukujen laki ja keskeinen raja-arvolause. Estimointimenetelmiä: suurimman uskottavuuden (Maximum likelihood) estimointi, pienimmän neliösumman estimointi, momenttimenetelmä ja Bayesilainen-estimointi. Väliestimointi ja hypoteesien testaus. Contents: The joint distribution of a random sample, statistic, sample mean, sample variance and sample covariance and their properties. The concept of estimator and its central properties (bias, variance, root mean square error and efficiency). Law of large numbers and the central limit theorem. Estimation methods: maximum likelihood, least squares, the method of moments, and Bayesian estimation. Interval estimation and hypothesis testing. Oppimateriaali: Morris H. DeGroot ja Mark J. Schervish 2012, Probability and statistics (4 painos), osia luvuista 5-10 tai Casella& Berger 2001. Statistical Inference (2. painos), osia luvuista 5-10 Study materials: Morris H. DeGroot ja Mark J. Schervish 2012, Probability and statistics (4 painos), parts of chapters 5-10 or Casella& Berger 2001. Statistical Inference (2. painos), parts of chapters 5-10 Toteutustavat: Opetusta 32 h luentoja ja 16 h harjoituksia. Teaching methods: Lectures 32 h lectures and 16 h exercises. Suoritustapa: Harjoitustehtävät ja tentti. Modes of study: Exercises and exam. Arviointi: 0-5 Assessments: 0-5 Edellytykset: Data-analyysin todennäköisyyspäättely 1 Prerequisites: Probabilistic inference for data science 1

Bayes päättely 1 (BAY1) (3622347, 5 op) Bayesian inference 1 Osaamistavoitteet: Opiskelija ymmärtää Bayes päättelyn perusteet ja pystyy soveltamaan niitä erillaisissa tilastollisen päättelyn tilanteissa. Learning outcomes: The student understands the basics of Bayesian inference and is able to apply this knowledge to different inferential problems. Sisältö: Ehdolliseen todennäköisyyteen perustuvan Bayes-päättelyn perusperiaatteet, esimerkkejä konjugaattisista jakaumaperheistä ja regressioanalyysistä. Gibbs-otannan sekä Metropolis-Hastings algortimin soveltaminen. Content: Starting from conditional probability, basic principles of Bayesian inference are derived Conjugate families of distributions and regression analysis are considered as examples. The use of Gibbs and Metropolis-Hastings sampling. Oppimateriaali: Marin-Robert, Bayesian Core, A Practical Approach to Computational Bayesian Statistics, 2007. Study materials: Marin-Robert, Bayesian Core, A Practical Approach to Computational Bayesian Statistics, 2007. Lisämateriaali: Bishop, Machine Learning and Pattern Recognition, 2007, Springer Verlag. Murphy, Machine Learning a Probabilistic Perspective, 2012, The MIT Press. Geisser, Predictive Inference: An Introduction, 2 painos, 1993, CRC press. Additional material: Bishop, Machine Learning and Pattern Recognition, 2007, Springer Verlag. Murphy, Machine Learning a Probabilistic Perspective, 2012, The MIT Press. Geisser, Predictive Inference: An Introduction, 2 painos, 1993, CRC press. Toteutustavat: Luentoja (28 h), harjoitukset (12 h) Teaching Methods: Lectures (28 h), exercises (12 h) Suoritustavat: Harjoitustehtävät Modes of study: Exercises Arvostelu: 0-5 Assessment: 0 5 Edellytykset : Suositeltavat kurssit ovat johdatus tilastolliseen päättelyyn 1 & 2 tai vastaavat tiedot. Prerequisites: Recommended previous courses are introduction to statistical inference 1 & 2 or complementary knowledge.

Bayes päättely 2 (BAY2) (3622348, 5 op) Bayesian inference 2 Sisältö: Bayes päättely koneoppimisessa. Prediktiivinen päättely ja Bayesilaiset luokittelu menetelmät (logistinen ja multinomi regressio). Graafiset mallit ja niiden soveltaminen erillaisiin tilastollisiin mallinnustehtäviin. Posterior -jakauman estimointia deterministisillä menetelmillä. Content: Bayesian inference in machine learning. Predictive inference and Bayesian classification methods (logistic and multinomial regression). Graphical models and applications to different statistical modeling tasks. Estimating posterior distributions with different deterministic techniques. Oppimateriaali: Bishop, Machine Learning and Pattern Recognition, 2007, Springer Verlag. Study materials: Bishop, Machine Learning and Pattern Recognition, 2007, Springer Verlag. Lisämateriaali: Marin-Robert, Bayesian Core, A Practical Approach to Computational Bayesian Statistics, 2007. Murphy, Machine Learning a Probabilistic Perspective, 2012, The MIT Press. Geisser, Predictive Inference: An Introduction, 2nd edition, 1993, CRC press. Additional material: Marin-Robert, Bayesian Core, A Practical Approach to Computational Bayesian Statistics, 2007. Murphy, Machine Learning a Probabilistic Perspective, 2012, The MIT Press. Geisser, Predictive Inference: An Introduction, 2nd edition, 1993, CRC press. Toteutustavat: Luentoja (28 h), harjoitukset (12 h) Teaching Methods: Lectures (28 h), exercises (12 h) Suoritustavat: Harjoitustehtävät Modes of study: Exercises Arvostelu: 0-5 Assessment: 0 5 Edellytykset : Suositeltavat kurssit ovat johdatus tilastolliseen päättelyyn 1 & 2 tai vastaavat tiedot ja Bayes päättely 1. Prerequisites: Recommended previous courses are introduction to statistical inference 1 & 2 or complementary knowledge and Bayes inference 1.

Ryhmittyneiden aineistojen analyysi (RAA) 5 op 3622350 Analysis of grouped data Sisältö: Lineaariset sekamallit ovat lineaarisen mallin laajennus sellaisiin ryhmittyneisiin aineistoihin, joissa saman ryhmän havainnot ovat keskenään korreloituneita. Esimerkkejä tällaisista aineistoista ovat mm opiskelijat koululuokan sisällä, puut metsikkökoealalla ja toistomittaukset (henkilöistä tms). Olennaista on, että käsiteltävät ryhmät (luokat, metsikkökoealat, henkilöt) ovat otos ryhmien populaatiosta. Kurssilla käsitellään lineaarisia yhden tason sekamalleja sekä monimutkaisempia ryhmittelyjä, erityisesti sisäkkäisesti ryhmittyneitä aineistoja ja ristikkäisesti ryhmittyneitä aineistoja. Luennot englanniksi. Content: Linear mixed-effects models provide extension of linear models into such grouped datasets, where observations within the group are correlated. Examples about such datasets are pupils within school class, trees on a forest sample plot, and repeated measurements of persons. Essentially, the groups (school classes, sample plots, persons) are a sample from a population of groups. The course covers linear mixedeffects models with one level of hierarchy. At the end of the course, we will discuss about extensions to more complicated groupings, such as nested groupings and crossed groupings. Lectures in English. Tavoitteet: Opiskelija ymmärtää ryhmittyneiden aineistojen erityispiirteet mallinnuksen kannalta. Osaa mallintaa ryhmittyneitä aineistoja niihin soveltuvilla menetelmillä. Objectives: To understand the special properties of grouped datasets from modeling point of view. To be able to model such datasets using theoretically justified means. Oppimateriaali: Luentomoniste. Pinheiro and Bates 2000. Mixed-effects models in S and S-Plus. Springer. Luettavissa kirjaston kautta sähköisesti. Stroup, W. 2013. Generalized linear Mixed models. Modern concepts, methods and applications. CRC Press. Galecki and Burzykowski. Linear mixed-effects models using R : a step-by-step approach. Springer, 2013. Study materials: Lecture notes. Pinheiro and Bates 2000. Mixed-effects models in S and S-Plus. Springer. Available at UEF library in electronic form. Stroup, W. 2013. Generalized linear Mixed models. Modern concepts, methods and applications. CRC Press. Galecki and Burzykowski. Linear mixed-effects models using R : a step-by-step approach. Springer, 2013. Toteutustavat: Monimuoto-opetus. Luennot (2 h), pienryhmät (16 h). Opiskelu tapahtuu opiskelijajohtoisesti. Ennen pienryhmää opiskelija opiskelee Moodlessa jaetun viikkokohtaisen materiaalin (mm. moniste ja luentovideot) ja tekee ko. viikon harjoituksia. Pienryhmässä opiskelijalla on mahdollisuus esittää kysymyksiä ennalta opiskeltuun materiaaliin ja harjoituksiin liittyen. Pienryhmän jälkeen harjoitustehtävät palautetaan Moodleen, ja opiskelija tekee niistä itsearvioinnin annettujen ohjeiden perusteella. Teaching methods: Multi-modal teaching. Lectures (2 h), tutorials (16 h). Student prepares for the weekly tutorials by reading given material, watching videos at moodle, and working on the weekly exercises. In the tutorials, the student has a possibility to make questions on weekly topics and exercises. After the tutorials, the solutions are returned in Moodle, and students do a selfevaluation of them based on given instructions. Suoritustavat: Harjoitukset ja tentti Modes of study: Exercises and exam Arvostelu / Assessment: 0-5 Edellytykset: Tilastollinen data-analyysi tai Regressioanalyysi 1 ja 2, R-kurssi Prerequisites: Statistical data analysis or Regression analysis 1 and 2, R-course

Spatiaalinen tilastotiede, 5 op (SPT) 3622349 Spatial statistics Sisältö: Johdatus geostatistiikassa ja spatiaalisten pisteprosessien analyysissä käytettäviin malleihin ja menetelmiin. Todellisiin datoihin perustuvia esimerkkejä ja harjoituksia R- ohjelmalla. Content: Introduction to the models and methods used for geostatistics and analysis spatial point patterns. Real-data examples and exercises using R-software. Tavoitteet: Ymmärtää spatiaalisen aineiston erityispiirteet mallintamisen näkökulmasta. Oppia miten spatiaalisen datan erityispiirteitä voidaan ottaa huomioon mallintamisessa. Spatiaalisen ilmiön ennustaminen. Objectives: To understand the special properties of spatial datasets from the modeling point of view. To learn how the special features of spatial can be taken into account in modeling. Prediction of a spatial phenomena. Oppimateriaali: Luentomoniste, joka pohjautuu pääosin oppikirjoihin Illian, Penttinen, Stoyan & Stoyan 2008. Statistical Analysis and Modelling of Spatial Point Patterns ja Diggle, P.J. and Ribeiro, P.J. Jr. 2007. Model-based geostatistics. Study materials: Lecture material based on selected parts of Illian, Penttinen, Stoyan & Stoyan 2008. Statistical Analysis and Modelling of Spatial Point Patterns and Diggle, P.J. and Ribeiro, P.J. Jr. 2007. Model-based geostatistics. Diggle, P.J. and Ribeiro, P.J. Jr. 2007. Model-based geostatistics. Toteutustavat: Luennot (28 h), harjoitukset (14 h) Teaching Methods: Lectures (28h), exercises (14 h) Suoritustavat: Harjoitukset ja tentti Modes of study: Exercises and exam Arvostelu: 0-5 Assessment: 0-5 Edellytykset: Johdatus tilastolliseen päättelyyn 1 ja 2, R-kurssi Prerequisites: Introduction to statistical inference 1 and 2, R-course

Tilastollinen data-analyysi (3622351, 6 op) Statistical data analysis Tavoitteet: Opiskelija hallitsee lineaarisen mallin ja sen tärkeimpien yleistysten perusteet sekä osaa toteuttaa ne R-ohjelmalla. Objectives: The student understands the linear model and its most important extensions and is able to do these analyses using R-software. Sisältö: Yhden selittäjän lineaarinen regressio ja usean selittäjän lineaarinen regressio matriisilaskennan merkinnöin, kun jäännökset ovat riippumattomia ja niillä on vakiovarianssi. Luokitteluasteikollisten ja jatkuvien selittävien käyttö mallissa ja parametrien tulkinta. Muunnosten käyttö. Pienimmän neliösumman (PNS) estimointi ja PNS estimaattorien ominaisuudet. Hypoteesien testaus, mallin diagnostiikka ja ennustaminen. t-testit, varianssianalyysi ja kovarianssianalyysi regressiomallin erikoistapauksina. Lineaarisen mallin muotoilu kun vakiovarianssi- ja riippumattomuusoletukset eivät toteudu (ns. yleinen lineaarinen malli). Yleistetty pienemmän neliösumman menetelmä (GLS), suurimman uskottavuuden menetelmä (ML) ja rajoitettu suurimman uskottavuuden menetelmä (REML). Katsaus yleistettyihin lineaarisiin malleihin (GLM, esim. binäärinen logistinen regressio). Content: Simple linear regression and multiple linear regression using matrix notations, when residual errors are independent and they have constant variance. Use of categorical and continuous predictors in the model and interpretation of model parameters. Use of transformations. Estimation using ordinary least squares (OLS) and the properties of the estimator. Test of hypothesis, model diagnostics and prediction. t-test, analysis of variance and analysis of covariance as special cases of the model. Model formulation if the assumption of constant error variance and independence is not met (so called general linear model). Generalized least squares (GLS), maximum likelihood (ML), and restricted maximum likelihood. Review of generalized linear models (GLM, e.g. binary logistic regression). Oppimateriaali / Study materials: Fahrmeir, L., Kneib, T., Lang, S. and Marx, Brian 2013. Regression models, methods and applications. Springer. Luvut 3-5. Toteutustavat: Lectures (36 h) and exercises (18 h) Teaching Methods: Lectures (36 h) and exercises (18 h) Suoritustavat: Harjoitustehtävät ja kirjallinen kuulustelu Modes of study: Exercises and written exam Arvostelu / Assessment: 0-5 Edellytykset : Tilastotieteen peruskurssi, R- kieli. Suositellaan myös kursseja Data-analyysin todennäköisyyspäättely 1 ja 2/Johdatus tilastolliseen päättelyyn 1 ja 2, Matriisilaskennasta järjestetään tarvittaessa erillisiä ohjaustilaisuuksia. Prerequisites: Basic course in statistics, R-language. Probabilistic inference for data science 1 and 2 / Introduction to statistical inference 1 and 2 are also suggested. Special tutorials on matrices will be arranged if needed.

Todennäköisyysmallit, päättely ja epäparametriset menetelmät (3622212, 2-5 op) Probability Models, Inference and Nonparametric Methods Vastuuhenkilö: Esko Valtonen Sisältö: Todennäköisyyslaskennan peruskäsitteitä; satunnaismuuttuja ja sen jakauma, yhteisjakauma ja riippumattomuus, odotusarvo. Tilastollisessa päättelyssä ja mallinnuksessa käytettäviä jakaumia. Estimoinnin ja hypoteesintestauksen käsitteistöä. Epäparametrisia testejä populaatioiden keskiarvojen ja jakaumien vertailuun. Content: Basic concepts of probability theory: random variable and distribution, joint distribution and independence. Some common distributions for statistical inference and modelling. Basic concepts of estimation and testing. Nonparametric tests to compare location of population distributions. Tavoite: Opiskelija tutustuu todennäköisyyslaskennan käsitteistöön ja laskusääntöihin, tilastollisessa päättelyssä usein käytettäviin jakaumiin sekä yksinkertaisiin epäparametrisiin päättelymenetelmiin. Objectives: To introduce some key concepts in probability theory and computation, some probability distributions used in statistical inference and non-parametric testing. Oppimateriaali: Luentomoniste. DeGroot M.H., Probability and statistics, 4th edition. Valittuja kohtia Noether E., Introduction to statistics the nonparametric way. 1990. Valittuja kohtia. Study materials: Lecture notes DeGroot M.H., Probability and statistics, 4th ed, Selected topics. Noether E., Introduction to statistics the nonparametric way. 1990. Selected topics. Toteutustavat: Luentoja 28 t ja harjoituksia 14 t. Teaching methods: Lectures 28 h, exercises 14 h. Suoritustavat: tentti (5 op) tai kirjalliset harjoitustyöt ( 2 op) Modes of study: exam ( 5 cr) or written exercises ( 2 cr) Arvostelu: 0-5 ( 5 op), hyv / hyl ( 2 op) Assessment: 0-5 ( 5 cr), pass / fail ( 2 cr) Edellytykset: Kuvaileva tilastotiede ja Tilastolliset mallit ja testaus tai Tilastotieteen johdantokurssi ja Tilastotieteen peruskurssi. Prerequisites: Descriptive Statistics and Data Acquisition and Statistical Models and Testing or Introduction to Statistics and Basics in Statistics

Regressiotekniikat (3622213, 4 op) Regression Techniques Vastuuhenkilö: Esko Valtonen Sisältö: Yhden ja useamman selittäjän lineaarinen regressio; logistinen regressio. Yksi- ja kaksisuuntainen varianssianalyysi. Content: Simple linear regression, multiple regression and logistic regression. One-way analysis of variance and two-way analysis of variance. Tavoitteet: Opiskelija tutustuu muutamiin tilastollisiin malleihin, joissa analyysi tehdään varianssitai regressioanalyysin avulla. Objectives: To give an introduction to some statistical models for analysis of variance and for regression analysis Oppimateriaali: Moore-McCabe, Introduction to practice of statistics, 5 th edition, 2006. Luvut 10-13,16. Moore-McCabe-Craig, Introduction to practice of statistics, 7 th edition, 2012. Luvut 10-13,14. Study materials: Moore-McCabe, Introduction to practice of statistics, 5 th edition, 2006. Chapters10-13,16. Moore-McCabe-Craig, Introduction to practice of statistics, 7 th edition, 2012. Chapters 10-13, 14. Toteutustavat: Luentoja 28 t Teaching methods: Lectures 28 h Suoritustavat: Kirjalliset harjoitustyöt ja tentti Modes of study: Written exercises and exam. Arvostelu: 0-5 Assessment: 0-5 Edellytykset: Kuvaileva tilastotiede ja aineiston hankinta, Tilastolliset mallit ja testaus sekä Todennäköisyysmallit, päättely ja epäparametriset menetelmät. Prerequisites: Descriptive Statistics and Data Acquisition, Statistical Models and Testing, Probability Models and Nonparametric Methods

Perusopintojen harjoitustyö (tilastotiede), 1-2 op (PEH) 3622217 Project in Basic Studies in Statistic Osaamistavoitteet: Tavoitteena on oppia soveltamaan tilastotieteen perusopintotason menetelmiä empiirisen aineiston kuvailuun, mallintamiseen ja päättelyyn. Learning outcomes: The goal is to learn to apply basic methods of descriptive statistics, of statistical modeling and of statistical inference to empirical data. Sisältö: Kurssilla opiskelija analysoi empiiristä tutkimusaineistoa ja kokoaa analyysin eri vaiheiden tulokset kirjalliseksi raportiksi. Content: Student analyses an empirical data and reports methods and results of the analysis. Suoritustavat: Kirjallinen harjoitustyö Modes of study: Written exercise Toteutustavat: itseopiskelu Teaching Methods: self-study course Oppimateriaali: Tilastotieteen perusopintojen kurssien materiaali Study materials: Material on the basic courses of statistics Arvosteluperusteet: Evaluation criteria: hyväksytty/hylätty pass/fail Edellytykset: Tilastotieteen perusopintojen tasoiset tiedot hypoteesintestauksesta ja varianssi- ja regressiosanalyysistä sekä taito käyttää tilastollista ohjelmistoa kuten SPSS, R-kieli tai SAS. Prerequisites: Studies in testing hypotheses, analysis of variance and regression modeling on the level of basic studies of statistics. Skills to use a statistical program, e.g. SPSS, R-language or SAS.

SPSS-kurssi (3622224, 1 op) Basic Course in SPSS Vastuuhenkilöt: Esko Valtonen Sisältö: SPSS-ohjelmiston käytön alkeita yksinkertaisten esimerkkien avulla. Content: Introduction to SPSS-program. Tavoitteet: Tutustuttaa SPSS-ohjelmistoon tilastollisten analyysien apuvälineenä. Objectives: The course gives introduction to SPSS as a tool to do statistical analysis. Oppimateriaali: verkkosivut Study materials: web pages Toteutustavat: itseopiskelu web-kurssina Teaching methods: self-study web course Suoritustavat: testit verkossa Modes of study: tests on web Arviointi: hyväksytty/hylätty Assessment: pass/fail Edellytyksenä: Kuvaileva tilastotiede ja aineiston hankinta sekä Tilastolliset mallit ja testaus Prerequisites: Descriptive Statistics and Data Acquisition, Statistical Models and Testing

R-kieli, 2op (R) 3622223 Basic Course in R Osaamistavoitteet: Opiskelija saavuttaa riittävät R-ohjelman käyttötaidot osallistuakseen tilastotieteen aineopintokursseille. Learning outcomes: The student has sufficiently good skills in the use of R to participate intermediate courses in statistics. Sisältö: R- ohjelman peruskäyttö, yksinkertaiset kuvat, aineiston lukeminen ja yksinkertaisten analyysien tekeminen, matriisinen ja vektorien käyttö, ehtolauseet, silmukat ja funktiot. Content: Basic R-usage, simple graphs, reading data and doing simple analyses, use of matrices and vectors, conditional expressions, loops and functions. Suoritustavat: Opintojakso suoritetaan itsenäisesti opiskellen käyttäen Moodlesta löytyvää itseopiskelupakettia. Kurssin voi suorittaa suomeksi tai englanniksi. Kurssin suoritusohjeet ja materiaalit ovat Moodlessa sivulla http://moodle.uef.fi/course/view.php? id=3749. Kurssille ei tarvitse ilmoittautua WebOodissa Modes of study: This is a self-study course in Moodle that is studied using the self-study package. The course can be taken in Finnish or in English. General instructions and materials can be found from the Moodle page of the course http://moodle.uef.fi/course/view.php?id=3749. You don't need to register for the course in WebOodi. Toteutustavat: Itseopiskelukurssi Teaching Methods: Itseopiskelukurssi Oppimateriaali: Venables, Smith and the R core team. An introduction to R. Luettavissa https://cran.r-project.org/doc/manuals/r-release/r-intro.pdf Study materials: Venables, Smith and the R core team. An introduction to R. Available at https://cran.r-project.org/doc/manuals/r-release/r-intro.pdf Arvosteluperusteet: Hyv / Hyl Evaluation criteria: Pass/Fail Edellytykset: - Prerequisites: -