o välttämätön mutta ei riittava edellytys validiudelle



Samankaltaiset tiedostot
i l.arvioinnilleasetettavatlaatuvaatimukset

Otannasta ja mittaamisesta

Mittaamisen maailmasta muutamia asioita. Heli Valkeinen, erikoistutkija, TtT TOIMIA-verkoston koordinaattori

TOIMIVAN NÄYTÖN JA TYÖSSÄ OPPIMISEN ARVIOINTI JA KEHITTÄMINEN

Ellei tutkijalla ole käsitystä mittauksensa validiteetista ja reliabiliteetista, ei johtopäätöksillä

Mittaustekniikka (3 op)

Move! laadun varmistus arvioinnissa. Marjo Rinne, TtT, erikoistutkija UKK instituutti, Tampere

Käsitteistä. Reliabiliteetti, validiteetti ja yleistäminen. Reliabiliteetti. Reliabiliteetti ja validiteetti

Kvantitatiiviset menetelmät

1 Hankkeen toteutus Arvioijien arviointia koskevia tuloksia Validiutta koskevia tuloksia Taitotasojen asettamisesta...

Mittariston laatiminen laatutyöhön

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

Opiskelijan lähtötason arviointi. Testipiste / Janne Laitinen ja Eveliina Sirkeinen Osallisena arvioinnissa , Helsinki

Tiivistelmä yhteiskunnalliset aineet

Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi

Itsemääräämiskyvyn arviointi Turku. Esa Chydenius Johtava psykologi, psykoterapeutti VET Rinnekoti-Säätiö

ICF / VAT toimintakyvyn arviointi. Kumppaniksi ry, Tuomas Leinonen

Havainto ja sen kirjaaminen sekä Itsearvioinnin ja ulkopuolisen havainnoinnin sudenkuoppia. C: Tuomas Leinonen

Pienin askelin snadein stepein -väline oman työn kehittämiseen arjessa

Ajatuksia arvioinnista. Marja Asikainen ja työpajaan osallistujat Yhteinen tuotos julkaistaan HYOL:n sivuilla

t osatekijät vaikuttavat merkittävästi tuloksen epävarmuuteen Mittaustulosten ilmoittamiseen tulee kiinnittää kriittistä

ENG3043.Kand Kandidaatintyö ja seminaari aloitusluento Tutkimussuunnitelman laatiminen

OHJE 2(5) Dnro LIVI/4495/05.00/ KITKAN MITTAAMISEN MENETELMÄ... 3

Arviointi ja mittaaminen

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Jatkuvat satunnaismuuttujat

VAIKUTTAAKO ARVIOINTI?

Lukutaitotutkimukset arviointiprosessina. Sari Sulkunen Koulutuksen tutkimuslaitos, JY

OSAAMISEN ARVIOINTI. Petri Haltia

Savonlinnan kaupunki 2013

VESI-SEMENTTISUHDE, VAATIMUKSET JA MÄÄRITTÄMINEN

Oppijan itsearviointitaidot

Haku ammattikorkeakouluihin ja yliopistoihin

Alkukartoitus Opiskeluvalmiudet

Sosiaalisten verkostojen data

Yksilöllisen oppimisen menetelmä. Ville

Testaajan eettiset periaatteet

Sisällönanalyysi. Sisältö

Sukunimi Kutsumanimi Ryhmä Hetu Sähköpostiosoite. OPINTOKOKONAISUUS / OPINTOJAKSO, JOSTA AHOT menettelyä haetaan. Opiskelija täyttää

YRKK18A Agrologi (ylempi AMK), Ruokaketjun kehittäminen, Ylempi AMK-tutkinto

TARKASTUSVALIOKUNTA Minna Ainasvuori JHTT, Liiketoimintajohtaja BDO-konserni

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

EVTEK/ Antti Piironen & Pekka Valtonen 1/6 TM01S/ Elektroniikan komponentit ja järjestelmät Laboraatiot, Syksy 2003

Onko TOIMIA-tietokannasta apua vammaissosiaalityössä mittarit päätöksen teon tukena?

Mittausepävarmuuden laskeminen ISO mukaisesti. Esimerkki: Campylobacter

2. luentokrt KOTITEHTÄVÄ: VASTAA UUDELLEEN KAHTEEN KYSYMYKSEESI TÄMÄN PÄIVÄN TIEDON PERUSTEELLA

Mat Investointiteoria Laskuharjoitus 3/2008, Ratkaisut

OSAAMISKARTOITUKSEN ESITTELY

Sanallinen arviointi ja hyviä normien mukaisia arviointikäytänteitä. Pirjo Koivula Opetusneuvos

Kokeessa: 15 tehtävää, joista valitaan 10 ja vain kymmenen - valintaan kannattaa kiinnittää huomiota!!! (Tehtävien valintaa olemme harjoitelleet!

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mittausepävarmuudesta. Markku Viander Turun yliopisto Lääketieteellinen mikrobiologia ja immunologia

Monitasomallit koulututkimuksessa

Kasvatustieteellinen tiedekunta 11/12/

Videotoisto Nexus 7 tableteilla: Android 4.4 KitKat selvästi edellistä versiota heikompi

LÄKSYT TEKIJÄÄNSÄ NEUVOVAT

Aino Kääriäinen Aino Kääriäinen yliopistonlehtori Helsingin yliopisto

ALTEn toimintaohjeisto

Kompleksisuus ja kuntien kehittäminen

LIITE 1 VIRHEEN ARVIOINNISTA

Sovellettu todennäköisyyslaskenta B

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

Testausselosteiden vaatimukset

Evidence based medicine näyttöön perustuva lääketiede ja sen periaatteet. Eeva Ketola, LT, Kh-päätoimittaja Suomalainen Lääkäriseura Duodecim

Kielikokeiden uudistamisesta

Arvioinnin l Arvioinn uonne ja ylei in l set uonne ja ylei periaat set teet periaat Käsitteet marraskuun hautomo 2014

YLEISKUVA - Kysymykset

Sovellettu todennäköisyyslaskenta B

Mittaaminen projektipäällikön ja prosessinkehittäjän työkaluna

Harjoitus 7: NCSS - Tilastollinen analyysi

Kohti sähköisiä kielikokeita

Pro gradu -tutkielmien arvostelu maantieteessä

Laadukas arvionti. On jotakin paljon harvinaisempaa, jotakin arvokkaampaa kuin kyvykkyys. Se on kyky tunnistaa kyvykkyys.

Valtakunnallinen kielikoe Lenita Pihlaja

Johdantoa. Jokaisen matemaatikon olisi syytä osata edes alkeet jostakin perusohjelmistosta, Java MAPLE. Pascal MathCad

Suomalainen siideriomena mitattavan tiedon näkökulmasta. Johannes Vuorinen, Terissaari Oy Suomalaisen Aidon Siiderin Seuran seminaari

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

LAADULLISESTA SISÄLLÖNANALYYSISTÄ

1. Palkkahinnoittelu. 2. Tehtäväkohtainen palkka TYÖN VAATIVUUDEN ARVIOINTI/KVTES

Kielitaito. Suomalaisen koulujärjestelmän kieliopinnot

Suomen koulutustaso kansainvälisessä vertailussa

Yleisiä kommentteja kokeesta.

NÄYTÖN ARVIOINTI: SYSTEMAATTINEN KIRJALLISUUSKATSAUS JA META-ANALYYSI. EHL Starck Susanna & EHL Palo Katri Vaasan kaupunki 22.9.

Kontrollipolkujen määrä

Monivalintatehtävät matematiikassa

YHTEISKUNTATIETEIDEN, LIIKETALOUDEN JA HALLINNON ALA

Jutta Kosola, suomen kielen kouluttaja, Axxell MKK, Testipiste

Yhteisöllisen toimintatavan jalkauttaminen!

TIETO HALTUUN ERILAISIN ARVIOINTIMENETELMIN

Kielten opetuksen haasteet korkeakouluissa

Opinnäytetyöhankkeen työseminaarin avauspuhe Stadiassa Hoitotyön koulutusjohtaja Elina Eriksson

Sosiaalialan AMK verkosto

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Mittausten jäljitettävyysketju

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Katja Arro Sonograaferijaoston koulutuspäivä

Miten tehdä onnistunut projektisuunnitelma 10 vinkkiä

KOGNITIIVISTEN TESTIEN PISTEMÄÄRIEN SANALLISET KUVAUKSET

Testauksen tuki nopealle tuotekehitykselle. Antti Jääskeläinen Matti Vuori

PIKAKÄYTTÖOHJE V S&A Matintupa

Transkriptio:

AMKKIA2 - Kielitnidon araioinnin yhdenmuknistsminen smmsttikorkeakouluisso Sauli Takala2002 RELIAABELIUS JA VALIDIUS KIELITAIDON TESTAAMISESSA Reliaabelius o luotettawus, johdonmukaisuus r ei oikeastaan voida arvioida yhden mittauksen perusteella (mutta yhden mittauksen mittarin johdonmukaisuus/sisäinen konsistenssi/homogeenisuus on kyllä järkevä likiarvo). laskennallinenkerroinmahdollinen o vaihteluväli normaalisti 0.00-1.00. kyseessä on ensisijaisesti tulosten luotettavuus (ei mittavälineen). on tilannekohtainen - ei yleispätevä, yleinen - ominaisuus; arvioitava joka tilanteessa ja aineistossa erikseen o välttämätön mutta ei riittava edellytys validiudelle Validius o pätevyys, "osumus". ei yleensä voi ilmaista laskennallisesti (tosin reliaabeliuden neliötä voidaan pitää validiuden maksimaalisena arvona), vaan edellyttaa validiusväitettä tukevien perusteiden pohdiskelua; validiusdiskurssi on parhaimmillaan uskottavaa monipuolista argumentointia testauksen osuluudesta/kyvystä testata mitä halutaan o kyseessä on fuloksien pohjalla tehtävien johtopäätösten, ratkaisujen ja päätösten päter,1ys; Arviointi on validia, jos sen perusteella voidaan tehdä oikeaan osuvia tulkintoja, päätöksiä tai ratkaisuja. Validiuspäätelmä edellyttää koko arviointijärjestelmän laadun pohtimista. o validius on reliaabeliuden tapaan kontekstisidonnainen, ei yleispätevii/yleinen ominaisuus; se riippuu arviointitarkoituksesta, kielitaitokäsityksestä, kohderyhmästä ja mittaustavasta Erottelul<ylgt o jos kaikkien tulisi osata jokin asia ja näin voidaan kohtuudella odottaakin, erottelukyky ei ole keskeinen vaatimus; ihannetilanne olisi että kaikki osaisivat kaiken; koska tämä on harvoin tuskin koskaan realistinen odotus, erottelukyky on käytännössä - ja ylioppilaskokeessa - hyvin tärkeä vaatimus o erottelukyky tarkoittaa osiorvtehtävän kykyä erotella kokeensuorifiajia eri suoritustasoilla. tehtävien kyky erotella kokeen suorittajia (erottelukyky) on PAIKALLINEN ominaisuus: helppo mutta hyvin tehty tehtävä pystyy erottelemaan heikoimmat muista ja hyvin tehty vaikea tehtävä puolestaan erottelee parhaat muista: keskivaikea osio (ratkaisuprosentti 50) erottelee tehokkaimmin KOKO taitotasolla. o Siksi yleensä on järkevää sijoittaa kokeeseen eniten keskivaikeita tehtäviä ja kohtalainen määrä helppoja ja vaikeita tehtäviä. o erotteluindeksi voi vaihdella teoriassa -ll+l; se perustuu tavallisesti osion ja kokeen summapistemäärän väliseen korrelaatioon, ts. siihen missä määrin osio erottelee samansuuntaisesti kuin kaikki muut tehtävät yhdessä o erotteluindeksin tulee o11a positiivinen ja mielellään ainakin.20 mutta t1,ytryäisiä voidaan olla vain osioihin, joiden erotteluindeksi on vähintään.30 Kokeet ja arviointi ovat siten aina enemmän tai vähemmän reliaabeleja ja valideja, ja niihin sisältyy väistämättä tiettyä virhettä. Arvioinnin seuraamusten merkittävyyden perusteella voidaan ratkaista, kuinka tarkkaan arviointiin olisi pyrittävä ja toisaalta kuinka suuri virhemarginaali voidaan hyväksyä.

Reliaabeliuteen vaikuttavia tekij öitä r tehtävien/osioidenmäärä yleensä suurempi tehtävämäärä on eduksi reliaabeliudelle, koska saadaan parempi näyte = mitattavasta taido sta; satunn ai svai kutus vähenee. Tähän liitfyy kysymys monivalintatehtävien vaihtoehtojen määrästä. Jos "päätön" alvaus on yleistä, vaihtoehtojen määrä on eduksi, koska se merkitsee, että päättömällä arvaamisella ei saada kovin korkeaa pistemäärällä. Koska päätön arvaaminen on kuitenkin aika harvinaista, vaihtoehtojen määrä ei ole yhta tarkeaä, kuin niiden toimil.uus, oikeansuuntainen erotteler.rrus. Vaihtoehtojen laafu on tärkeämpää kuin niiden määrä. Huonosti toimivat vaihtoehdot itse asiassa alentavat osion laatua ja siten kokeen reliaabeliutta. r osioiden vaikeustaso koko taitotasoaluetta ajatellen paras tulos saal.utetaan, kun noin puolet osaa ratkaista sen o = pistemäärien hajonta = yleensä - mita suurempi hajonta, sitä korkeampi reliaabelius. Jos testi järjestettäisiin uudelleen, vähäisiä eroja sisältävässä testissä yksilöiden järlestys vaihtelee enemmän suurihajontaisessa kokeessa, jossa yksilöiden järjestys säilyy paremmin samana, ja tämä näkyy edellisessä tapauksessa alhaisempana reliaabeliutena. objektiivisuus, eli arvioinnin yksimielisyys = avoimissa tehtävissä voi objektiivisuutta lisätä tehtävän huolellisella ja selkeällä muotoilulla ja selkeillä arviointiohjeilla; testausolosuhteiden vakioiminen Mitä johtopäätöksiä edellä esitetystä voidaan tehdä kielikokeen laadinnalle? l) Ratkaisevan tärkeää on yksittäisten osioiden laatu: niiden erottelukyvyn tulisi olla mahdollisimman korkea. Jokaisen osion laadintaan, arviointiin ja muokkaamiseen (1a jos suinkin mahdollista - esitestaamiseen) kannattaa kiinnittaa suurta huomiota. Hyvä esityo kannattaa aina. 2) Osioita tulisi olla mahdollisimman paljon, koska pidempi koe on lyhyttä luotettavampi ja virheen osuus pienenee yleensä pituuden kasvaessa ja näytön kasvaessa. Kannattaa miettiä keinoja, jolla saadaan mahdollisimman paljon nä)tteitä osaamisesta. Sellainen arviointi ei ole järkevää, jossa joudutaan käyttämään paljon aikaa ja kuitenkin saadaan vähän näytettä osaamisesta. Kannattaa harkita (mahdollisimman) lyhyitä ja monia tehtäviä laajojen ja harvojen tehtävien sij asta. Testi on, laajasti ymmärrettynä: r joukko tehtäviä, jotka "elisitoivat" testattavien kaytäytymistä tietyllä sisältöalueella, tai o skaala (esim. asenneväittämälista), joka kuvaa käyttäytymistä tietyllä sisältöalueella, tai o järjestelmä, jolla kootaan nä)tteitä yksilön työskentelystä tietyllä sisältöalueella. Pisteitys/arviointimenetelmä: voidaan kvantifioida (antaa numeeriset arvot), arvioida ja tulkita osaamisnäytteet. Reliaabelius viittaa tällaisten menetelmien johdonmukaisuuteen, kun testaus toistetaan yksilöillä tai ryhmillä. o yksilöiden ja ryhmien käyttäytymisen oltava tietyssä määrin pysyvää, vaikka tuloksissa esiintyykin luonnollisesti j os sakin määrin vaihtelua. vaihtelu johtuu yksilöistä itsestään, testeistä ja testausolosuhteista. Perinteellisesti on käytetty 3 reliaabeliuskerrointa : 1. rinnakkaistesteihin perustuva reliaabelius 2. uudelleentestaukseen perustuva reliaabelius (stabilisuus) 3. testin osioiden sisäinen johdonmukaisuus

Usein sisäinen konsistenssi (alfa) antaa varsin samanlaisen tuloksen kuin rinnakkaistestaus ja uudelleentestaus, ja on siksi varsin käyttökelpoinen tapa arvioida reliaabeliutta yhdellä mittauksella. 3 Arviointia sisältävässä mittauksessa kä)tetään tavallisesti 4) arvostelijoiden johdonmukaisuutta kuvaavia indikaattoreita. Mittaukseen sisältyy aina virhettä. Mittausvirhe voi olla: o satunnaista ja ennustamatonta, mikä on tavallinen tapa hahmottaa mittausvirhettä, ja se alentaa reliaabeliutta.. Koska satunnaisvirheet ovat epäjohdonmukaisia ja ennustamattomia, niita ei saada erotettua havaituista aloista, mutta niiden suuruutta voidaan kuvata eri tavoilla.. systemaattista: systemaattisen virheen katsotaan yleisesti merkitsevän konstruktin kannalta irrelevanttiatulosten vaihtelua ja siten heikentävän validiutta fopetus. oppiminen. kypsyminenl L- Mittausvirhe: '-z r heikentää mittalukujen hyödyllisyyttä ';'o 'i: n< t *"L't\ '. rajoiltaa tulosten yleistettävyytä "3-d!, _'./f oheikentääluottamustayksittäiseenmittaukseen o voi vaihdella asteikon eri kohdissa o tieto siitä on oleellisen tärkeätä mittavälineen arvioinnille Mittausvirhe on usein mielekkäämpi kuin reliaabeliuskeroin, kun tuloksia tulkitaan. Siksi reliaabeliuskerrointa olisi hyvä - ainakin futkintojärjestelmien puitteissa - täydentää ilmoittamalla kuinka tarkasti mittaus tapahtuu eri taitotasoilla. Pistemäärien tulkinta voi olla: o suhteellista o absoluuttista Mittauksen tarkkuus ja johdonmukaisuus ovat aina toivottavia: o Tarkkuuden vaatimus lisääntyy, kun mittauksen seuraukset kasvavat. Jos aiheettomia seurauksia ei voida helposti korjata, mittaustarkkuudelle asettavat vaatimukset kasvavat. o Silloin kun mittaaminen merkitsee luokittelua, mittausvirheen tärkeys vaihtelee. Taitotasorajojen lähivyöhykkeessä mittaustarkkuus on paljon merkiffävämpää kuin etääilä niistä. Tästä syystä olisi h1vä olla tietoinen mittausvirheestä juuri rajojen kohdalla. Yleiset tutkinnoill e asetettavat vaatimukset : o Reliaabelius- ja mittauksen keskivirhe tulee aina ilmoittaa. o Testin suorittajien tulisi tietää, missä määrin suoritusnopeus vaikuttaa arvioon. o Kun käytetään subjektiivista arviointia, tulee raportoida arvioitsijoiden välinen johdonmukaisuus. r Jos mittaustarkkuuden ei voida olettaa olevan vakio, tulee raportoida mittausvirhe useilla suoritustasoilla. Erityisesti tulee kiinnittaa huomiota katkaisukohtien mittaustarkkuuteen.

AMKKIA2 - Kielitnidon nrcioinnin rlhdenmuknistaminen stnmattikorkenkouluissct Sauli Takala2002 RELIAABELIUS JA VALIDIUS KIELITAIDON TESTAAMISESSA Reliaabelius o luotettal.uus, johdonmukaisuus. ei oikeastaan voida arvioida yhden mittauksen perusteella (mutta yhden mittauksen mittarin johdonmukaisuus/sisäinen konsistenssiihomogeenisuus on kyllä järkevä likiarvo) o laskennallinenkerroinmahdollinen. vaihteluväli normaalisti 0.00-1.00 r kyseessä on ensisijaisesti tulosten luotettamus (ei mittavälineen) o on tilannekohtainen - ei yleispätevä, yleinen - ominaisuus; arvioitava joka tilanteessa ja aineistossa erikseen r välttämätön mutta ei riittäva edellytys validiudelle Validius r pätevyls, "osu\.uus". ei yleensä voi ilmaista laskennallisesti (tosin reliaabeliuden neliötä voidaan pitää validiuden maksimaalisena aryona), vaan edellyttää validiusväitettä tukevien perusteiden pohdiskelua; validiusdiskurssi on parhaimmillaan uskottavaa monipuolista argumentointia testauksen osul.uudesta/kyvystä testata mitä halutaan. kyseessä on tuloksien pohjalla tehtävien johtopäätösten, ratkaisujen ja päätösten pätevyys; Arviointi on validia, jos sen perusteella voidaan tehdä oikeaan osuvia tulkintoja, päätöksiä tai ratkaisuja. Validiuspäätelmä edellytaa koko arviointijärjestelmän laadun pohtimista.. validius on reliaabeliuden tapaan kontekstisidonnainen, ei yleispätevivyleinen ominaisuus; se riippuu arviointitarkoituksesta, kielitaitokäsityksestä, kohderyhmästä ja mittaustavasta Erottelukyl<y r jos kaikkien tulisi osata jokin asia ja näin voidaan kohtuudella odottaakin, erottelukyky ei ole keskeinen vaatimus; ihannetilanne olisi että kaikki osaisivat kaiken; koska tämä on harvoin tuskin koskaan realistinen odotus, erottelukyky on käytännössä - ja ylioppilaskokeessa - hyvin tärkeä vaatimus r erottelukyky tarkoittaa osion/tehtävän kykyä erotella kokeensuorittajia eri suoritustasoilla o tehtävien kyky erotella kokeen suorittajia (erottelukyky) on PAIKALLINEN ominaisuus: helppo mutta hyvin tehty tehtävä pystly erottelemaan heikoimmat muista ja hyvin tehty vaikea tehtävä puolestaan erottelee parhaat muista: keskivaikea osio (ratkaisuprosentti 50) erottelee tehokkaimmin KOKO taitotasolla. r Siksi yleensä on järkevää sijoittaa kokeeseen eniten keskivaikeita tehtavia ja kohtalainen määrä helppoja ja vaikeita tehtäviä. o erotteluindeksi voi vaihdella teoriassa -ll+l; se perustuu tavallisesti osion ja kokeen summapistemäärän väliseen korrelaatioon, ts. siihen missä määrin osio erottelee samansuuntaisesti kuin kaikki muut tehtävät yhdessä r erotteluindeksin tulee olla positiivinen ja mielellään ainakin,20 mutta tyfyväisiä voidaan olla vain osioihin, joiden erotteluindeksi on vähintään.30 Kokeet ja arviointi ovat siten aina enemmän tai vähemmän reliaabeleja ja valideja, ja niihin sisäl[y väistämättä tiettyä virhettä. Arvioinnin seuraamusten merkittävyyden perusteella voidaan ratkaista, kuinka tarkkaan arviointiin olisi pyrittävä ja toisaalta kuinka suuri virhemarginaali voidaan hyväksyä.

/ AMKKIA2 - Kielitaidon aruioinnin yhdenmuknistsminen ammsttikorkeakouluissa Sauli Taka\a2002 TESTIEN LAADINTA JA MUOKKAAMINEN Testin laadinta on prosessi, jonka kuluessa tuotetaan mittaluku henkilön jostakin tiedon, taidon, asenteiden, persoonallisuuden jne. jostakin piirteestä kehittämä11ä osioita ja yhdistelemä11ä niitä testiksi tietyn suunnitelman mukaisesti. Testien laadinnassa on tavallisesti neljä vaihetta: 1) testauksen tarkoituksen ja testattavan asian ("konstruktin") rajaaminen 2) testispesifikaatioiden laadinta ja arviointi 3) osioiden/tehtävien laadinta, esitestaaminen, arviointi ja valinta; arviointiohjeiden ja - menetelmien laadinta 4) käyttöön tulevan testin koostaminen ja arviointi Testin viitekehyksen laadinnassa käytetään hyväksi teoreettista tietoa sekä sisältöalueen tai työtehtävien analysointia. Viitekehys on kaiken muun toiminnan lähtökohta ja ohjenuora.! Testityyppien valinnassa on kolme päätyyppiä: o vastauksen valinta (selected response). lyhyet vastaukset (tuotokset) o pitkät vastaukset (tuotokset) Kaikkiin on kehitettävä arviointiohjeet (pisteitysohjeet). Arviointi voi olla holistista tai analyyttistä. Suoritusarvioinnissa (performance assessment) tehtävät muistuttavat läheisesti todellisen elämän tilanteita. Sen koespesifikaatioissa on kiinnitettävä paljon huomiota tehtävien analysointiin. Tässä käytetään sekä loogista että empiiristä analyysia. Portfoliot ovat erityinen suoritusarvioinnin muoto. Portfoliot ovat systemaattinen kokoelma: työnäytteitä, "opinnäytteitä" pitkähkölta tai pitkältä ajanjaksolta. Portfolioiden tarkoituksena voi olla: o dokumentoida työssä tai opinnoissa tapahtunut kehitys/edistyminen r auttaa valinta- ja ylennystilanteessa.- r dokumentoida tutkinnon valmistumista/pätevyyden saawttamista Porftfolio voi sisältää: o edustavan nä1.tteen suorituksia r parhaat näytteet o edistyksen nä1'tönp o sisällönvalintojenperusteleminen Portfolion koostumuksena voi olla: kirjallista, kuvallista, äänitettyä, videoitua aineistoa, demonstraatioita, simulaatioita jne. Portfoliolle asetettavia vaatimuksia: o niiden pohjana tulee olla selkeät spesihkaatiot.. niiden muotoutumiseen vaikuttavien osapuolten osuudet ja vastuut tulee määritellä spesifikaatioissa. Iiliille aseteiaan samat testaustekniset laatuvaatimukset kuin muille testeille. o koska portfoliot tavallisesti perustuvat pitkille vastauksille/tuotoksille, niiden arviointikriteereiden laadintaan tulee kiinnittää paljon huomiota r portfolioiden laatijat tarvitsevat riittävästi tietoa ennen työhönsä ryhtymista.

AMKKIA2 - Kielitaidon arvioinnin yhdenmukaistaminen ammattikorkeakouluissa Sauli Takala2002 TASAPUOLISUUS Tasapuolisuus on tärkeää kaikissa testausvaiheissa, mutta on mahdotonta saavuttaa täydellistä tasapuolisuutta jo pelkästään siitä slystä, että mittaamisen reliaabelius ja validius ei koskaan ole täydellistä missään tilanteessa. Testaustilanteet ovat I'uorovaikutustilanteita. Testaaian vuorovaikutuksen testattavien kanssa tulee olla: o ammatillista. kohteliaanasiallista e testattavistavälittävää o testattaviakunnioittavaa Tämä on erityisen tärkeätä, koska testaajan ja testattavien statukset eivät ole samantasoisia. Tasapuolisuutta on hahmotettu usein neljcillä eri tavalla: ei ole "puolueellisuutta" l) Harhaisuuden (bias) - 2) Testattavien tasapuolinen kohtelu testaustilanteessa 3) Testitulosten yhtäläisyys eri osaryhmissä 4) Saawtustestauksessa kaikilla on ollut tasapuolinen tilaisuus oppia testattavat asiat. Harhaisuus (bias) on tekninen termi: testituloksilla on erilainen merkitys eri osaryhmissä. Osioharhaisuus (DIF) : esimerkiksi jotkut tehtävät suosivat erityisesti naisia tai miehiä. Kohtelu on tasapuolista, testaustarkoituksesta riippumatta, kun kaikilla testattavilla on tasapuoliset mahdollisuudet osoittaa miten he hallitsevat testattavat asiat. Tcimä merkitsee, että; o testausolosuhteet ovat asianmukaiset. on ollut samanlaiset mahdollisuudet tutustua testaustapaan tai muuhun materiaaliin (esim. koemallit) o ideaalisessa tilanteessa testattavilla on myös ollut tasapuoliset mahdollisuudet valmistautua testiin. Tasapuolisuus koskee myös tulosten mahdollista julkisuutta. Testauskirjallisuudessa EI yleensci katsota, että tasapuolisuus edellyttäri samankaltaisia tuloksia eri ryhmissci. Jos on valintatilanne, tasapuolisuus edellyttää, että samanlaisen tuloksen saaneilla on kaikilla yhtäläiset mahdollisuudet tulla valituksi riippumatta siitä, minkä ryhmän jäseniä he ovat. Useimmat testausasiantuntijat ovat sitä mieltä, että jos harhaisuutta ei esiinny ja kohtelu testaustilanteessa on ollut tasapuolista, tasapuolisuuden vaatimukset on täytetty. Tasapuolinen mahdollisuus oppia testiin sisältyvät asiat koskee saavutustestausta. Testaustulos saattaa heijastaa tarkasti osaamistasoa, mutta tilanne on erilainen, jos ei ole ollut tilaisuuffa oppia ja jos on ollut tilaisuus oppia mutta ei ole oppinut. Sertifioinnissa ja työhön valinnassa puolestaan katsotaan tasapuolisuuden tulleen tältettyä, kun testi kattaahyvin tarvittavat tiedot ja taidot. Testin harhaisuus voi johtua sisällöstö ja vastausprosessista (konstruktin kannalta irrelevantit seikat). Testin sisällön asianmukaisuutta voidaan varmistaa asiantuntijapaneelin al.ulla, tutkimalla saatuja tuloksia, opetussuunnitelmaa, testiohjeiden selkeyttä. Jotkut osiot voivat saada aikaan odottamattomia vastauksia. Testitulos voi esimerkiksi johtua osittain kielellisestä kyvykkyydestä,

o6 hienomotoriikasta jne. Näitä mahdollisuuksia voidaan tutkia asiantuntijoiden arvioilla, DIF:illä, korrelaatiota tarkastelemalla jne. Testiin osallistuvien tasapuolinen kohtelu ei merkitse vain tasapuolisuuden edistämistä vaan edistää myös testisuorituksista tehtävien johtopäätösten reliaabeliutta ja validiutta. Tes tiin o s allis tuj at v oiv at oikeutetus ti edellytt tici monia as i oita : o heillä on oikeus tulla arvioiduksi testeillä, jotka täyttävät nykyaikaiset ammatilliset vaatimustasot: reliaabelius, validius, tasapuolisuus, testijärjestelyt ia tulosten raportointi. o heillä on oikeus etukäteen tietoonsa muutamia tärkeitä asioita: testin luonne ja sisältö, testin käyttötarkoitus, tulosten julkisuus/luottamuksellisuus. heillä tulee olla mahdollisuus kysyä ja ilmaista huolenaiheensa ja saada kohtuullisessa ajassa vastaukset kysymyksiinsä. o heillä voi o11a mahdollisesti myös oikeus saada tietoa ja materiaalia, joka auttaa testin suorittamisessa: opinto-opas, testausvaihtoehdot, mallikysymyksiä, mallikoe, ohjeita testin suorittamiseksi (esim. ajankäytö, arvaaminen, vastaamatta jättäminen, uusintamahdollisuus.