Usaldusväärsus kui testi üks põhiomadusi. Usaldusväärsuse tüübid

Testi usaldusväärsus on üks psühholoogiliste mõõtmiste täpsusega seotud testi kvaliteedi kriteeriume. Mida suurem on testi usaldusväärsus, seda suhteliselt vabam on see mõõtmisvigadest. Testi usaldusväärsust käsitletakse ühes lähenemisviisis: tulemuste stabiilsusena (stabiilsusena) korduva testimise ajal; teisalt kahe vormilt ja otstarbelt identse (paralleelse) testi samaväärsuse astme ilminguna.

Testi usaldusväärsust

Testi usaldusväärsus on testi põhiomadus, mis näitab, mil määral on testi tulemused korduvate uuringute puhul stabiilsed. Testi usaldusväärsust saab määrata korduva testimise teel (pärast rangelt määratletud ajavahemikku) ning arvutades esimese ja korduva testimise tulemuste vahelise korrelatsioonikoefitsiendi. Testi usaldusväärsust saab määrata ka sama testi mitut versiooni testides, testi kaheks pooleks jagades jne. Testi tulemuste usaldusväärsus ei sõltu mitte ainult testi enda kvaliteedist, vaid ka testimise protseduurist (esimesel ja teisel juhul peab see olema absoluutselt identne), valimi sotsiaalpsühholoogilisest homogeensusest (see on erinev lapsed, mehed, naised, esimese aasta sõdurid - teenistus, vanaaja sõdurid jne). Ja võib selguda, et olles ühe inimrühma jaoks usaldusväärne, osutub test teise jaoks ebausaldusväärseks ja viimasel juhul on testi tulemused valed. Seega sunnib NT, väljendades ebatäpsuse astet, eksimisvõimalust, mis paratamatult tekib igasuguse testimise käigus, otsima võimalusi selle vea vähendamiseks, testi täpsemaks, eesmärgipärasemaks rakendamiseks. Parimate testide usaldusväärsus on 0,8 - 0,9.

Katse usaldusväärsus

katsetulemuste stabiilsus, kui see viiakse läbi teise, kolmanda, neljanda jne jaoks. üks kord.

Psühholoogilise testi objektiivsust saab saavutada, kui on täidetud järgmised tingimused:

1) katseprotseduuri ühtsus normiga võrreldavate tulemuste saamiseks (vt allpool);

2) testi sooritamise hindamise ühtsus;

3) testimistulemuste standardi määramine, et võrrelda nendega testimisandmete töötlemise tulemusel saadud näitajaid (vt siit “standardiseerimise kolmas etapp”).

Neid kolme tingimust nimetatakse standardimise etapid psühholoogiline test.

Standardimise etapid

Testi arendamise etapis, nagu ka mis tahes muu meetodi puhul, viiakse läbi standardimisprotseduur, mis hõlmab kolme etappi.

Psühholoogilise testi standardimise esimene samm on ühtse testimisprotseduuri loomine. See hõlmab diagnostilise olukorra järgmiste aspektide kindlaksmääramist:

1) testimistingimused (ruum, valgustus ja muud välistegurid). Ilmselgelt on parem lühimälu mahtu mõõta (näiteks numbrikorduste alamtesti abil Wechsleri testis), kui puuduvad välised stiimulid, nagu kõrvalised helid, hääled jne.

3) Standardse stiimulimaterjali olemasolu. Näiteks sõltub saadud tulemuste usaldusväärsus oluliselt sellest, kas vastajale pakutakse isetehtud G. Rorschachi kaarte või standardseid - kindla värvilahenduse ja värvivarjunditega.

4) Selle testi sooritamise ajapiirangud. Näiteks antakse täiskasvanud vastajale Raveni testi täitmiseks aega 20 minutit.

5) Selle testi sooritamise standardvorm. Standardvormi kasutamine lihtsustab töötlemisprotseduuri.

6) Olukorramuutujate mõju arvessevõtmine testimisprotsessile ja tulemusele. Muutujate all mõeldakse katsealuse seisundit (väsimus, ülepinge jne), ebastandardseid testimistingimusi (halb valgustus, ventilatsiooni puudumine jne), testimise katkemist.

7) Diagnostiku käitumise mõju arvessevõtmine testimise protsessile ja tulemusele. Näiteks võib vastaja tajuda katsetaja heakskiitvat ja julgustavat käitumist testimise ajal vihjena “õigele vastusele” jne.

8) Võttes arvesse vastaja kogemuse mõju testimisel. Loomulikult sai vastaja, kes läbis testimisprotseduuri mitte esimest korda, ebakindlustundest ja kujundas teatud hoiaku testisituatsiooni suhtes. Näiteks kui vastaja on juba Raveni testi täitnud, siis suure tõenäosusega ei tasu talle seda teist korda pakkuda.

Psühholoogilise testi standardimise teine ​​etapp seisneb testi tulemuslikkuse ühtse hinnangu loomises: saadud tulemuste standardne tõlgendus ja standardne eeltöötlus. See etapp hõlmab ka saadud näitajate võrdlemist selle testi sooritamise normiga teatud vanuse (näiteks intelligentsuse testides), soo jne kohta. (vt allpool).

Psühholoogilise testi standardimise kolmas etapp on testi sooritamise normide määramine.

Normid töötatakse välja erineva vanuse, elukutse, soo jne jaoks. Siin on mõned olemasolevad normitüübid:

Kooli normid - on välja töötatud koolisaavutuste testide või koolisobivuse testide alusel. Need on kehtestatud iga kooliastme jaoks ja kehtivad kogu riigis.

Kutsestandardid kehtestatakse testide alusel erinevatele erialarühmadele (näiteks erineva profiiliga mehaanika, masinakirjutajad jne).

Kohalikud standardid on kehtestatud ja rakendatud kitsastele inimeste kategooriatele, mida eristavad ühise tunnuse olemasolu – vanus, sugu, geograafiline piirkond, sotsiaalmajanduslik staatus jne. Näiteks Wechsleri intelligentsuse testi puhul on normid vanusega piiratud.

Riiklikud standardid on välja töötatud antud rahvuse, rahvuse, riigi kui terviku esindajatele. Vajaduse selliste normide järele määrab iga rahvuse spetsiifiline kultuur, moraalinõuded ja traditsioonid.

Normatiivsete andmete (normide) olemasolu standardiseeritud psühhodiagnostika meetodites on nende põhiomadus.

Testi usaldusväärsus on üks psühholoogiliste mõõtmiste täpsusega seotud testi kvaliteedi kriteeriume. Mida suurem on testi usaldusväärsus, seda suhteliselt vabam on see mõõtmisvigadest. Testi usaldusväärsust käsitletakse ühes lähenemisviisis: tulemuste stabiilsusena korduva testimise ajal; teisalt kahe vormilt ja otstarbelt identse (paralleelse) testi samaväärsuse astme ilminguna.

Usaldusväärsus iseloomustab omaduste, kuid mitte olekute teste. Omadused:

  • 1. Uurimistulemuste reprodutseeritavus.
  • 2. Mõõtmise täpsus.
  • 3. Tulemuste jätkusuutlikkus.

Meetodite usaldusväärsuse aste sõltub paljudest põhjustest. Negatiivsete tegurite hulgas on kõige sagedamini nimetatud järgmised:

  • 1. diagnoositava vara ebastabiilsus;
  • 2. diagnostikameetodite ebatäiuslikkus (juhised on hooletult koostatud, ülesanded on olemuselt heterogeensed, meetodi uuritavatele esitamise juhised ei ole selgelt sõnastatud jne);
  • 3. muutuv uurimissituatsioon (erinevad kellaajad katsete läbiviimisel, erinevad valgustingimused ruumis, kõrvalise müra olemasolu või puudumine jne);
  • 4. erinevused katse läbiviija käitumises (katsest katsesse esitab ta juhiseid erinevalt, stimuleerib erinevalt ülesannete täitmist jne);
  • 5. katsealuse funktsionaalse seisundi kõikumised (ühes katses on tervis hea, teises - väsimus jne);
  • 6. subjektiivsuse elemendid tulemuste hindamise ja tõlgendamise meetodites (katsealuste vastuste salvestamisel hinnatakse vastuseid terviklikkuse, originaalsuse jms järgi).

K.M. Gurevich tõlgendab usaldusväärsust järgmiselt:

  • 1. Mõõtevahendi enda töökindlus (usaldusväärsuse koefitsient);
  • 2. Uuritava tunnuse stabiilsus (stabiilsuse koefitsient);
  • 3. Püsivus, s.o. tulemuste suhteline sõltumatus eksperimenteerija isiksusest (konstantsuse koefitsient).

Mõõtevahendit iseloomustavat indikaatorit soovitatakse nimetada usaldusväärsuse koefitsiendiks; mõõdetava omaduse stabiilsust iseloomustav näitaja - stabiilsuskoefitsient; ja katsetaja isiksuse mõju hindamise näitaja on püsivuse koefitsient. Just selles järjekorras on soovitatav kontrollida metoodikat: kõigepealt on soovitatav kontrollida mõõtevahendit. Kui saadud andmed on rahuldavad, saame asuda mõõdetava omaduse stabiilsuse mõõdiku määramisse ja seejärel vajadusel arvestada püsivuse kriteeriumiga. (Usaldusväärsus: test-retest, paralleelvormid, kehaosad, sisemine konsistents, faktoriaalne dispersioon).

Meetodit peetakse väga usaldusväärseks, kui meetod mõõdab täpselt seda omadust, mida see on mõeldud mõõtma. Märkida võib järgmisi täpsuskriteeriume:

Kui meetodit korratakse samadel katsealustel samadel tingimustel teatud ajaintervalli järel, ei erine mõlema testi tulemused üksteisest oluliselt.

Juhuslike kõrvaliste tegurite toimel ei ole testitulemustele olulist mõju. Kõrvaliste teguritena võib käsitleda: emotsionaalset seisundit ja väsimust, kui need ei kuulu uuritavate tunnuste hulka, temperatuuri, ruumi valgustust jne. Selliseid kõrvalisi juhuslikke tegureid nimetatakse ka mõõtmisprotseduuri ebastabiilsuse teguriteks.

Kui meetodit korratakse samadel katsealustel teatud ajaintervalli järel muudetud tingimustes, ei erine mõlema testi tulemused üksteisest oluliselt. Muudetud all mõeldakse järgmisi tingimusi: teine ​​katsetaja, vastaja seisund jne.

Usaldusväärsuse hindamiseks on erinevaid meetodeid:

Kordustesti meetod – katsealuste valimi korduv testimine sama testiga teatud ajaintervalli järel samadel tingimustel. Ajavahemik sõltub vanusest (näiteks väikelastel võivad muutused toimuda ühe kuu jooksul), samuti katsealuse elus toimuvatest sündmustest.

TESTINTERVALRETESTI

Usaldusväärsuse indeks on kahe testi tulemuste vaheline korrelatsioonikordaja. Sellest tulenev kõrge korrelatsioon võib tuleneda katsealuse koolitusest seda tüüpi ülesannete täitmisel; madal korrelatsioon võib olla testi tegija muutuste tulemus ja võib viidata ka testi ebausaldusväärsusele.

Vahetatavate vormide usaldusväärsus – katsealuste valimi korduv testimine paralleelse testivormiga minimaalse ajaintervalli järel samadel tingimustel.

TEST "AINTERVALTEST A"

Usaldusväärsuse indeksiks loetakse korrelatsioonikoefitsienti kahe paralleelse testivormi testitulemuste vahel. Kõrge korrelatsioonikoefitsient ja suur intervall kahe testi vahel viitavad testi suurele usaldusväärsusele.

Katsealuse võimalik pettus, tema keerukus, katsete vahelisel intervallil aset leidnud sündmused ei oma erilist mõju (nagu kordustesti meetodil) testi usaldusväärsuse astmele. Kui paralleelvormidega testimisel treeningfaktorit vähendatakse, siis tekib sageli ülesannete põhimõtte ülekandmise efekt. Rööpvormide konstrueerimisel tuleks arvestada ülekandeefektiga.

Nõuded paralleelvormide koostamiseks:

  • 1. Paralleelsed vormid peavad olema iseseisvalt konstrueeritud katsed, kuid vastama samadele nõuetele;
  • 2. peab sisaldama sama arvu sarnase raskusastmega ülesandeid;
  • 3. Paralleelvormide samaväärsust tuleb kontrollida korduskatse meetodil.

Konstantsuse definitsioon, s.o. tulemuste suhteline sõltumatus eksperimenteerija isiksusest. Kuna tehnikat arendatakse edasiseks kasutamiseks teistele psühhodiagnostikutele, on vaja kindlaks teha, mil määral mõjutab selle tulemusi eksperimenteerija isiksus. Konstantsuse koefitsient määratakse kahe sama prooviga, kuid erinevate katsetajate poolt tehtud katse tulemuste korrelatsiooni teel. Korrelatsioonikordaja ei tohiks olla väiksem kui 0,80.

Usaldusväärsus ja kehtivus

Enne kui psühhodiagnostilisi meetodeid saab praktilistel eesmärkidel kasutada, tuleb neid testida mitme formaalse kriteeriumi alusel, mis tõestavad nende kõrget kvaliteeti ja tõhusust. Need psühhodiagnostika nõuded on testide kallal töötamise ja nende täiustamise käigus aastate jooksul arenenud. Psühhodiagnostika tehnikate hindamise peamised kriteeriumid on usaldusväärsus ja kehtivus. Nende mõistete väljatöötamisel andsid suure panuse välismaised psühholoogid (A. Anastasi, E. Ghiselli, J. Guilford, L. Cronbach, R. Thorndike, E. Hagen jt). Nad töötasid välja nii formaalse-loogilise kui ka matemaatilis-statistilise aparatuuri (peamiselt korrelatsioonimeetodi ja faktoranalüüsi), et põhjendada meetodite vastavust märgitud kriteeriumidele.

Traditsioonilises testimises tähendab mõiste usaldusväärsus testitulemuste suhtelist püsivust, stabiilsust ja järjepidevust nii esmasel kui ka korduval kasutamisel samadel katsealustel. Usaldusväärsete tehnikate korduv rakendamine annab sarnaseid hinnanguid. Sel juhul võivad teatud määral kokku langeda nii tulemused ise kui ka subjekti järjekorrakoht (aste) rühmas. Mõlemal juhul on katse kordamisel võimalikud mõned lahknevused, kuid oluline on, et need oleksid ebaolulised, samas rühmas. Seega võime öelda, et tehnika usaldusväärsus on kriteerium, mis näitab psühholoogiliste mõõtmiste täpsust, s.t. võimaldab meil hinnata, kui usaldusväärsed on tulemused.

Meetodite usaldusväärsuse aste sõltub paljudest põhjustest. Seetõttu on praktilises diagnostikas oluliseks probleemiks mõõtmiste täpsust vähendavate tegurite väljaselgitamine. Nende hulgas on kõige sagedamini mainitud järgmisi:

1) diagnoositava vara ebastabiilsus;

2) diagnostikameetodite ebatäiuslikkus (juhised on hooletult koostatud, ülesanded on olemuselt heterogeensed, meetodi uuritavatele esitamise juhised pole selgelt sõnastatud jne);

3) muutuv uurimissituatsioon (erinevad kellaajad katsete läbiviimiseks, erinev ruumivalgustus, kõrvalise müra olemasolu või puudumine jne);

4) erinevused katse läbiviija käitumises (katsest katsesse esitab ta juhiseid erinevalt, stimuleerib erinevalt ülesannete täitmist jne);

5) katsealuse funktsionaalse seisundi kõikumised (ühes katses on hea tervis, teises - väsimus jne);



6) subjektiivsuse elemendid tulemuste hindamise ja tõlgendamise meetodites (katsealuste vastuste salvestamisel, vastuste täielikkuse, originaalsuse jms hindamisel).

Psühhodiagnostilise tehnika usaldusväärsuse tõstmise üheks olulisemaks vahendiks on eksamiprotseduuri ühtsus, selle range regulatsioon: sama keskkond ja töötingimused uuritavate valimi jaoks, sama tüüpi juhised, samad ajapiirangud. igaüks, uuritavatega kokkupuute meetodid ja tunnused, ülesannete esitamise järjekord jne d. Sellise uurimisprotseduuri standardiseerimisega on võimalik oluliselt vähendada kõrvaliste juhuslike tegurite mõju testitulemustele ja seeläbi suurendada nende usaldusväärsust.

Meetodite usaldusväärsuse karakteristikuid mõjutab suuresti uuritav valim. See võib seda näitajat kas vähendada või suurendada. Näiteks võib usaldusväärsus olla kunstlikult kõrge, kui valimis on väike tulemuste vahemik, s.t. kui tulemused on üksteisele lähedased. Sel juhul paiknevad kordusuuringu käigus ka uued tulemused lähigrupis. Võimalikud muutused katsealuste järjestuse kohtades on ebaolulised ja seetõttu on tehnika töökindlus kõrge. Samasugune põhjendamatu usaldusväärsuse ülehindamine võib ilmneda ka väga kõrgete tulemustega rühmast ja väga madalate testiskooridega rühmast koosneva valimi tulemuste analüüsimisel. Siis need laialt eraldatud tulemused ei kattu, isegi kui juhuslikud tegurid segavad katsetingimusi. Seetõttu kirjeldatakse juhendis tavaliselt valimit, mille põhjal määrati tehnika usaldusväärsus. Praegu määratakse usaldusväärsus üha enam kõige homogeensematel proovidel, s.t. soo, vanuse, haridustaseme, erialase ettevalmistuse jms osas sarnastel proovidel. Iga sellise valimi jaoks on antud oma usaldusväärsuse koefitsiendid. Esitatud usaldusväärsuse näitaja on rakendatav ainult rühmadele, mis on sarnased nendega, mille alusel see määrati. Kui proovile kasutatakse teist meetodit kui see, mille usaldusväärsust testiti, tuleb seda protseduuri korrata.



Meetodi usaldusväärsust on sama palju, kui on tingimusi, mis mõjutavad diagnostiliste testide tulemusi. Siiski leiavad praktilist rakendust vaid mõned töökindluse liigid.

Kuna kõik usaldusväärsuse tüübid peegeldavad kahe sõltumatult saadud näitajate seeria järjepidevuse astet, on matemaatiline ja statistiline tehnika, mille abil metoodika usaldusväärsust tuvastatakse, korrelatsioonid (Pearsoni või Spearmani järgi). Mida lähemal on saadud korrelatsioonikoefitsient ühtsusele, seda suurem on usaldusväärsus ja vastupidi.

K.M. Gurevitš tegi ettepaneku tõlgendada usaldusväärsust järgmiselt:

1) mõõtevahendi enda töökindlus;

2) uuritava tunnuse stabiilsus;

3) püsivus, s.o. tulemuste suhteline sõltumatus eksperimenteerija isiksusest.

Mõõtevahendit iseloomustavat indikaatorit soovitatakse nimetada usaldusväärsuse koefitsiendiks; mõõdetava omaduse stabiilsust iseloomustav näitaja - stabiilsuskoefitsient; ja katsetaja isiksuse mõju hindamise näitaja on püsivuse koefitsient.

Just sellises järjekorras on soovitatav kontrollida metoodikat: esmalt on soovitatav kontrollida mõõteriista; kui saadud andmed on rahuldavad, saame asuda mõõdetava omaduse stabiilsuse mõõdiku määramisse; pärast seda saate vajadusel töötada püsivuskriteeriumiga.

Mõõtevahendi töökindluse määramine. Mis tahes psühholoogilise mõõtmise täpsus ja objektiivsus sõltuvad sellest, kuidas metoodika on koostatud, kui õigesti on valitud ülesanded nende vastastikuse järjepidevuse seisukohalt ja kui homogeenne see on. Metoodika sisemine homogeensus näitab, et selle ülesanded aktualiseerivad sama omadust, märki.

Mõõteriista töökindluse kontrollimiseks, näidates selle homogeensust (või homogeensust), kasutatakse nn poolitusmeetodit. Tavaliselt jagatakse ülesanded paaristeks ja paarituteks, neid töödeldakse eraldi ning seejärel korreleeritakse kahe saadud seeria tulemused omavahel. Selle meetodi kasutamiseks on vaja katsealused panna sellistesse tingimustesse, et neil oleks aega kõigi ülesannete lahendamiseks (või proovida lahendada). Kui tehnika on homogeenne, siis selliste poolte puhul lahenduse õnnestumises suurt vahet ei ole ja seetõttu on ka korrelatsioonikoefitsient üsna kõrge.

Saate ülesandeid muul viisil jagada. Näiteks saab võrrelda testi esimest poolt teisega, esimest ja kolmandat veerandit teise ja neljandaga jne. Kõige sobivam tundub aga paaristeks ja paarituteks ülesanneteks jagamine, kuna just see meetod on kõige sõltumatum selliste tegurite mõjust nagu töövõime, treenitus, väsimus jne.

Meetodit peetakse usaldusväärseks, kui saadud koefitsient ei ole madalam kui 0,75–0,85. Parimad usaldusväärsuse testid annavad koefitsiendid suurusjärgus 0,90 või rohkem.

Kuid diagnostilise tehnika väljatöötamise algfaasis võib saada madalaid usaldusväärsuse koefitsiente, näiteks suurusjärgus 0,46-0,50. See tähendab, et väljatöötatud metoodika sisaldab teatud arvu ülesandeid, mis oma spetsiifilisuse tõttu toovad kaasa korrelatsioonikordaja vähenemise. Selliseid ülesandeid tuleb spetsiaalselt analüüsida ja kas ümber teha või üldse eemaldada.

Et oleks lihtsam tuvastada, milliste ülesannete tõttu korrelatsioonikoefitsiendid vähenevad, on vaja analüüsida korrelatsioonide jaoks koostatud kirjalike andmetega tabeleid. Tuleb märkida, et kõik muudatused metoodika sisus - ülesannete eemaldamine, ümberkorraldamine, küsimuste või vastuste ümbersõnastamine - nõuavad usaldusväärsuse koefitsientide ümberarvutamist.

Usaldusväärsuse koefitsientidega tutvudes ei tohiks unustada, et need sõltuvad mitte ainult ülesannete õigest valikust omavahelise kooskõla seisukohalt, vaid ka valimi sotsiaalpsühholoogilisest homogeensusest, mille alusel mõõtevahendi töökindlust testiti. .

Ülesanded võivad sisaldada mõisteid, mida üks osa õppeainetest tunneb vähe, aga teine ​​osa hästi. Usaldusväärsuse koefitsient sõltub sellest, kui palju selliseid mõisteid metoodikas on; selliste mõistetega esemeid võib juhuslikult paigutada nii testi paaris- kui paaritumasse poolde. Ilmselgelt ei tohiks usaldusväärsuse näitajat omistada ainult tehnikale kui sellisele ning ei saa loota, et see püsib muutumatuna olenemata sellest, millist valimit testitakse.

Uuritava tunnuse stabiilsuse määramine. Tehnika enda töökindluse kindlaksmääramine ei tähenda kõigi selle rakendamisega seotud küsimuste lahendamist. Samuti on vaja kindlaks teha, kui stabiilne on tunnus, mida uurija kavatseb mõõta. Oleks metodoloogiline viga loota psühholoogiliste omaduste absoluutsele stabiilsusele. Selles, et mõõdetud tunnus aja jooksul muutub, pole usaldusväärsuse jaoks midagi ohtlikku. Asi on selles, mil määral erinevad sama subjekti tulemused katseti, kas need kõikumised põhjustavad asjaolu, et katsealune satub teadmata põhjustel kas algusesse, seejärel keskele või proovi lõpp. Mõõdetava tunnuse esindatuse taseme kohta sellises subjektis konkreetseid järeldusi teha on võimatu. Seega ei tohiks märgi kõikumised olla ettearvamatud. Kui järsu kõikumise põhjused pole selged, ei saa sellist märki diagnostilistel eesmärkidel kasutada.

Diagnoositud tunnuse või omaduse stabiilsuse kontrollimiseks kasutatakse meetodit, mida nimetatakse test-retestiks. See seisneb ainete uuesti läbivaatamises, kasutades sama tehnikat. Tunnuse stabiilsust hinnatakse esimese ja teise uuringu tulemuste vahelise korrelatsioonikoefitsiendi järgi. See näitab, kas iga katseisik säilitab valimis oma järjekorranumbri või mitte.

Diagnoositud omaduse vastupidavuse astet ja stabiilsust mõjutavad erinevad tegurid. Nende arv on üsna suur. Oluline on järgida katseprotseduuri ühtsuse nõudeid. Näiteks kui esimene test viidi läbi hommikul, siis teine ​​test tuleks teha hommikul; kui esimese katsega kaasnes ülesannete esialgne kuvamine, siis teise katse ajal peab see tingimus ka täidetud olema jne.

Tunnuse stabiilsuse määramisel on suure tähtsusega ajavahemik esimese ja teise uuringu vahel. Mida lühem on ajavahemik esimesest testist teiseni, seda suurem on võimalus (kui muud asjaolud on võrdsed), et diagnoositav sümptom säilitab esimese testi taseme. Ajaintervalli suurenedes kaldub tunnuse stabiilsus vähenema, kuna suureneb seda mõjutavate kõrvaliste tegurite hulk. Järelikult viitab järeldus sellele, et soovitatav on korrata katseid vahetult pärast esimest. Siin on aga raskusi: kui esimese ja teise katse vaheline periood on lühike, võivad mõned katsealused oma varasemaid vastuseid mälust reprodutseerida ja seega ülesannete täitmise mõttest kõrvale kalduda. Sel juhul ei saa kahe tehnikaesitluse tulemusi enam iseseisvaks pidada.

Raske on selgelt vastata küsimusele, millist perioodi võib pidada korduva katse jaoks optimaalseks. Selle perioodi saab määrata ainult teadlane, lähtudes tehnika psühholoogilisest olemusest, selle läbiviimise tingimustest ja katsealuste valimi omadustest. Pealegi peab selline valik olema teaduslikult põhjendatud. Testoloogilises kirjanduses viidatakse kõige sagedamini mitmekuulistele (kuid mitte üle kuuekuulistele) ajavahemikele. Oluline on meeles pidada, et stabiilsuskoefitsienti ei tohiks vaadelda ainult selle kitsast formaalsest küljest, absoluutväärtuste mõttes. Kui tehnika uurib diagnostilise perioodi jooksul intensiivselt arenevat omadust (näiteks üldistuste tegemise võimet), siis võib stabiilsuskoefitsient osutuda madalaks, kuid seda ei tohiks tõlgendada puudusena. tehnikat. Sellist stabiilsuskoefitsienti tuleks tõlgendada kui uuritava vara teatud muutuste ja arengu näitajat. Hoopis teistsugune nõue seatakse stabiilsuskoefitsiendile, kui tehnika autori arvates on mõõdetav omadus juba tekkinud ja peaks olema piisavalt stabiilne. Stabiilsuse koefitsient peaks sel juhul olema üsna kõrge (mitte madalam kui 0,80).

Seega ei ole mõõdetava omaduse stabiilsuse küsimus alati üheselt lahendatud. Otsus sõltub diagnoositava vara olemusest.

Konstantsuse definitsioon, s.o. tulemuste suhteline sõltumatus eksperimenteerija isiksusest. Konstantsuse koefitsient määratakse kahe katse tulemuste korrelatsiooni teel, mis viidi läbi suhteliselt identsetes tingimustes sama katsealuste valimiga, kuid erinevate katsetajate poolt. Korrelatsioonikordaja ei tohiks olla väiksem kui 0,80.

Alustuseks määratleme selle probleemi arengu ulatuse ja loetleme lühidalt teadlased.

Teadlased, kes tegelesid psühhodiagnostika meetodite usaldusväärsuse ja kehtivuse probleemiga: A. Anastasi et al.

Definitsioon

Tehnika usaldusväärsus seisneb tulemuste stabiilsuses mitme läbivaatuse ajal.

Tehnika valiidsus on teatud vaimse omaduse mõõtmise usaldusväärsus, mis allub mõõtmisele.

Testi usaldusväärsust

Vaatleme mitut tüüpi psühhodiagnostiliste testide usaldusväärsust.

  1. Sisemise järjepidevuse usaldusväärsus. Testi muudetud osa mõõdab muutujat, mida testi muutmata osad ei mõõda.
  2. Testi-kordustesti usaldusväärsus. Katsealuste korduv testimine koos järgneva esmase ja lõpueksami tulemuste korrelatsiooniga.
  3. Paralleeltesti vormide usaldusväärsus. Samaväärse küsimustiku koostamine ja selle esitamine samadele katsealustele tulemuste hilisemaks korrelatsiooniks.
  4. Katseosade töökindlust saab määrata küsimustiku jagamine osadeks; seejärel korreleerige saadud tulemused.

Joonis 1. "Testi usaldusväärsuse näitajad"

Katse usaldusväärsuse kindlaksmääramisel tuleks tehnikat läbi viia märkimisväärsete ajavahemike järel. Samuti on soovitatav test läbi viia vähemalt 200 katsealuse proovidega.

Testi kehtivus

Vaatleme mõnda tüüpi testi kehtivust psühhodiagnostikas.

  1. Selge kehtivus. Katsealuse ideed testi kohta.
  2. Samaaegne kehtivus. Korrelatsioon sarnaste testidega.
  3. Ennustav kehtivus. Algsete ja hilisemate testitulemuste korrelatsioon.
  4. Täiendav kehtivus.
  5. Diferentsiaalne kehtivus.
  6. Sisu kehtivus. Testiobjektide kajastamine konkreetse õppevaldkonna aspektide kohta.
  7. Empiiriline kehtivus. Selle tehnika tulemuste korrelatsioon samade ainete sarnaste tehnikate tulemustega.
  8. Kriteeriumi kehtivus. Saadud tulemuste seos väliste kriteeriumidega.
  9. Konstruktsiooni kehtivus.

Üks oluline erinevus psühhomeetriliste testide vahel on see, et need standardiseeritud, ja see võimaldab võrrelda ühe subjekti saadud näitajaid üldkogumi või vastavate rühmade näitajatega. Testide standardiseerimine on kõige olulisem juhtudel, kui võrreldakse katsealuste sooritust.

See tutvustab kontseptsiooni normid, või standardnäitajad. Standardnormide saamiseks tuleb hoolikalt valida suurem hulk aineid vastavalt selgelt määratletud kriteeriumidele. Standardimisvalimi moodustamisel tuleks arvestada selle suurust ja esinduslikkust.

Mõnel juhul on vaja moodustada mitu standardimisrühma või stratifitseerida standardimisrühm selliste parameetrite osas nagu vanus, sugu, sotsiaalne staatus. Standardite kehtestamine pole alati vajalik. Psühholoogiliste testide kasutamisel teadusuuringutes ei ole normid nii olulised ja piisab ka toortestide tulemustest. Iga rühma normid tuleks esitada keskmiste väärtuste ja standardhälbe kujul.

Joonis 2. "Kehtivuse raamistik"

Inglise testi usaldusväärsus) - statistilises mõttes - selle abil saadud tulemuste püsivus, stabiilsus. N. t. määratakse katse esmakordse ja korduva rakendamise tulemuste korrelatsioonide tuvastamisega (N. t. koefitsient) või testi käigus saadud andmete võrdlemisel samaväärse testi kasutamise tulemustega. Vt Mõõtmise usaldusväärsus, Psühhodiagnostika. (V.I. Lubovski.)

TESTI USALDUSVÄÄRSUST

mõõtmistulemuste täpsuse ja stabiilsuse indikaator testi abil korduval kasutamisel. Iseloomustab testi peegelduse adekvaatsuse astet vastavale ülesannete üldkogumile.

testi usaldusväärsus

testi põhiomadus, mis näitab, mil määral on testitulemused korduvate uuringute puhul stabiilsed. N.t. saab määrata korduva testimise teel (pärast rangelt määratletud ajavahemikku) ning arvutades esimese ja korduva testimise tulemuste vahelise korrelatsioonikoefitsiendi. N.t. saab määrata ka testides, kasutades sama testi mitut varianti, jagades testi kaheks pooleks jne. Testi tulemuste usaldusväärsus ei sõltu mitte ainult testi enda kvaliteedist, vaid ka testimise protseduurist (esimesel ja teisel juhul peab see olema absoluutselt identne), valimi sotsiaalpsühholoogilisest homogeensusest (see on erinev lapsed, mehed, naised, esimese aasta sõdurid - teenistus, vanaaja sõdurid jne). Ja võib selguda, et olles ühe inimrühma jaoks usaldusväärne, osutub test teise jaoks ebausaldusväärseks ja viimasel juhul on testi tulemused valed. Seega sunnib NT, väljendades ebatäpsuse astet, eksimisvõimalust, mis paratamatult tekib igasuguse testimise käigus, otsima võimalusi selle vea vähendamiseks, testi täpsemaks, eesmärgipärasemaks rakendamiseks. Parimate testide usaldusväärsus on umbes.8, umbes.9.

TESTI USALDUSVÄÄRSUST

üks psühholoogiliste mõõtmiste täpsusega seotud testi kvaliteedikriteeriume. Mida suurem on N. t., seda suhteliselt vabam on see mõõtmisvigadest. Ühes lähenemisviisis käsitletakse N. t. kui tulemuste stabiilsust (stabiilsust) korduva testimise ajal. Teise lähenemise korral on N. t. kahe vormilt ja eesmärgi poolest identse (paralleelse) testi samaväärsuse aste. N.-i t-i definitsioon on seotud ka testi sisemise järjepidevuse mõistega. See väljendub testi jagamises osadeks ja seejärel osade tulemuste võrdlemises. N. t määratakse ka dispersioon- ja faktoranalüüsi meetoditega. Konfliktihalduses kasutatakse peamiselt psühholoogilisi teste (K. Thomase, T. Leary test, modulaarne sotsiotest jne). N. t probleem on osa laiemast probleemist – tehnika töökindlusest. Usaldusväärsus on tehnika stabiilsus mõõtmisvigade suhtes: konkreetne testimise olukord, testitavate omadused, uurija valmisoleku tase jne.

TESTI USALDUSVÄÄRSUST

üks testi kvaliteedikriteeriume, mis iseloomustab selle abil saadud tulemuste järjepidevust ja stabiilsust. Mida suurem on N.t., seda suhteliselt vabam on see mõõtmisvigadest. Seetõttu määrab N. t täpsusastme, millega ta teatud isiksuseomadust mõõdab; see on selle kui mõõtevahendi täpsuse, häirekindluse (nii välise kui ka sisemise) omadus. N. t.-i empiiriline määratlus on kohustuslik tingimus selle kasutamiseks praktilises tegevuses, näiteks erialase valiku eesmärgil. N. t määramiseks kasutatakse järgmisi meetodeid. 1. Korduva testimise meetod (test-retest method). Usaldusväärsuse hindamiseks esitatakse test mõne aja pärast kaks korda samale katsealuste rühmale. Ajaperioodi kestuse määrab testi olemus või eesmärgid. N. mõõt t on testi esmasel ja sekundaarsel kasutamisel saadud tulemuste korrelatsioonikordaja. 2. Katsemeetod paralleelse või samaväärse katsevormiga. Meetodi rakendamisel jagatakse uuritavad kahte võrdsesse rühma. Esimene rühm esitatakse seejärel põhivormiga, teine ​​​​rühm esitatakse samaväärse vormiga. Mõne aja pärast vahetatakse vorme katseainete rühmade vahel ja testid viiakse uuesti läbi. Pärast seda arvutatakse kogu katsealuste valimi kohta tulemused iga vormi kohta, mille jaoks määratakse seejärel korrelatsioonikoefitsient, mille väärtust kasutatakse N. T. hindamiseks. 3. Testi osadeks jagamise meetod (for näiteks paaris ja paaritu) koos järgneva osade tulemuste võrdlemisega . Selle meetodi eeliseks võrreldes eelmistega on selle suurem täpsus, kuna see hõlmab vaid ühekordset testimist.

Seotud väljaanded