Klassik test nazariyasi va Rash modeli

Komil Jalilov

Testologiya nuqtayi nazaridan, baholash - bu o'lchash. Faqat bunda uzunlik, bo'y yoki og'irlik singari tegishli asboblar (chizg'ich, tarozi va hokazo) yordamida bevosita o'lchasa bo'ladigan xususiyatlar emas, balki bilim, ko'nikma, layoqat, psixologiya kabi latent (yashirin) xususiyatlar bilvosita o'lchanadi. Bu o'lchov natijalari ishonarli bo'lishi uchun o'lchashda qo'llaniladigan voositalar (ya'ni testlar) ham, o'lchov (ya'ni testni o'tkazish) jarayonining o'zi ham, uning natijalarini qayta ishlash jarayoni ham ma'lum bir talablarga javob bermog'i lozim.

Testologiyada ikkita asosiy yondashuvni ajratib ko'rsatish mumkin: klassik test nazariyasi va savol-javob nazariyasi.

Klassik test nazariyasi (Classical test theory, CRT)

Klassik test nazariyasiga ko'ra, har qanday test topshiruvchining har qanday testda qayd etgan natijasi ikki narsaning yig'indisidan iborat: uning haqiqiy bilimi va o'lchov xatosi.

X = T + E,

bunda:

X = test topshiruvchining testda qayd etgan natijasi,

T = test topshiruvchining haqiqiy bahosi (true score),

E = o'lchov xatosi (measurement error).

O'lchov xatosini yo'qotish imkonsiz, lekin uni minimallashtirish mumkin. Testologning vazifasi -

1) testning ma'lum bir talablarga javob berishini ta'minlash orqali uning validligi va ishonchligini oshirib, o'lchov xatosini kamaytirish;

2) o'lchov xatosini aniqlash.

Klassik test nazariyasida odatda test topshiruvchining barcha to'g'ri javoblariga bir xil ball (1), noto'g'ri javoblariga esa 0 ball berish orqali test topshiruvchining xom balli (raw score) aniqlanadi va u tegishli formulalar yordamida shkalalangan ballga (scaled score) aylantiriladi. Ayniqsa ko'p variantli test tizimida xom ballni bir xil shkalaga keltirish muhim, chunki test variantlarining qiyinlik darajasi va boshqa muhim xususiyatlari (masalan, standart og'ish - standard deviation) bir xil bo'lishini ta'minlash amalda imkonsiz, bu esa testning turli variantlarini yechgan test topshiruvchilar natijalarini solishtirishda adolatsizlikka olib keladi. Bu xuddiki, deylik, bir sportchi 100 kg, ikkinchi sportchi esa 120 funt og'irlikdagi toshni ko'tarsa, bu toshlarning og'irligini umumiy shkalaga keltirmay turib, 120 funt ko'targanni g'olib deb e'lon qilishday gap.

(Ha, to 'g'ri angladingiz: sobiq DTM - hozirgi Bilimlarni baholash agentligining har xil test variantlarini yechgan test topshiruvchilarning natijalarini yagona shkalaga keltirmay turib (amalda to'g'ri javoblar sonini 3,1, 2,1 yoki 1,1 koeffitsiyentga ko'paytirish orqali hisoblangan xom ballar orqali) ularning natijalarini solishtirishi va kim o'tgan yoki o'tmaganligini belgilashi - testologiya ilmi nuqtayi nazaridan adolatsizlikdir.)

Klassik test nazariyasining muhim xususiyati - testning ishonchligiga ta'sir qiladigan muhim psixometrik xususiyatlari (qiyinlik darajasi, diskriminatsiya indeksi, ya'ni bilimlini bilimsizdan ajrata olishi va h.z.) test topshiruvchilar kontingentiga bog'liq.

Savol-javob nazariyasi (Item-Response Theory, IRT)

Ushbu nazariya ba'zan "zamonaviy test nazariyasi" deb ham ataladi. Ushbu nazariya yuqorida aytilgan holat - testning ishonchliligi uni topshirgan kontingentga bog'liqligini bartaraf qilish uchun ilgari surilgan. Zamonaviy test nazariyasida ham bir qancha yondashuvlar bor, shulardan biri - Rashning bir parametrli modeli (daniyalik olim Georg Rash - Georg Rasch nomidan). Ushbu model test topshiruvchining testga javobi orqali uning qobiliyat darajasini aniqlashga asoslangan.

Ushbu modelni tushunish uchun bir vaziyatni ko'rib chiqaylik. Tasavvur qiling: ikki sportchining balandlikka sakrash bo'yicha turli musobaqalarda qayd etgan natijalarini qayd etib boryapmiz. Tahlillar shuni ko'rsatadi, ma'lum bir balandlikkacha (deylik, 165 cm gacha) sakray olish ehtimoli har ikki sportchida ham har doim 100%ga teng. Shundan keyin esa bu ehtimol kamayib boradi, faqat A sportchida bu ehtimol sekinroq pasayadi, B sportchida esa - tezroq (grafikka qarang).

Agar biz faqat bitta sport musobaqasi natijasida, deylik, B sportchi A sportchidan kuchliroq ekan, degan xulosaga kelsak, xulosamiz noto'g'ri bo'lishi mumkin, chunki aynan shu kuni A sportchi turli sabablarga ko'ra o'zini ko 'rsata olmagan bo'lishi mumkin. Demak, xulosamiz to'g'ri bo'lishi uchun ikki sportchining turli balandliklarga sakray olish ehtimolini hisoblashimiz kerak.

Shunga o'xshab, test topshiruvchilarni bir-birlari bilan solishtirish uchun ularning turli qiyinlik darajasidagi test topshiriqlariga javob bera olish ehtimolini solishtirish kerak.

Agar test topshiruvchining bilim darajasini x deb olsak va test topshirig'ining qiyinlik darajasini y deb olsak, x=y bo'lganda (ya'ni test topshiruvchiga uning darajasidagi savol berilganda) uning bu savolga to'g'ri javob berish ehtimoli 0,5 ga teng (ya'ni test topshiruvchi to'g'ri javobni yoki beradi, yoki bermaydi). Agar x>y bo'lsa, bu ehtimol 0,5 dan katta va agar x<y bo'lsa, 0,5 dan kichik, ya'ni:

agar y xdan 1 shartli birlikka (Rash modelida bu birlik logit deyiladi) katta bo'lsa, bu ehtimol har doim 0,27 ga teng va teskari bo'lsa (x ydan 1 shartli birlikka katta bo'lsa) - 0,73;
agar y xdan 2 shartli birlikka katta bo'lsa, bu ehtimol har doim 0,88 ga teng va teskari bo'lsa (x ydan 1 shartli birlikka katta bo'lsa) - 0,12.

Ko'rib turibmizki, test topshiruvchining test topshirig'iga to'g'ri javob berish ehtimolini bilish uchun test topshiruvchining bilim darajasi va test topshirig'ining qiyinlik darajasini o'rtasidagi farqni bilishimiz kerak. Test topshiruvchining berilgan test topshiriqlariga javoblarini solishtirish orqali har bir test topshirig'ining xarakteristikalari egri chizig'i (Item Characteristics Curve - ICC) chiziladi. Bu egri chiqiq yordamida test topshirig'ining qiyinlik darajasini aniqlash mumkin (klassik test nazariyasidan farqli ravishda, bu daraja test topshirganlar kontingentiga bog'liq emas).

Test topshirig'ining xarakteristikalari egri chizig'i namunasi, bunda x o'qi - test topshiruvchilarning bilim darajasi (-3dan 3gacha shkalada), y o'qi - ushbu test topshirig'iga to'g'ri javob berish ehtimoli (0dan 1gacha shkalada). Misol uchun ikkinchi test topshirig'iga bilim darajasi -2 bo'lgan test topshiruvchining to'g'ri javob berish ehtimoli 0,12ga va bilim darajasi 2 bo'lgan test topshiruvchining to'g'ri javob berish ehtimoli 0,88ga teng. Bilim darajasi 0 bo'lgan test topshiruvchining to'g'ri javob berish ehtimoli esa 0,5ga teng. Demak, bu test topshirig'ining qiyinlik darajasi 0ga teng.

Zamonaviy test nazariyasida test ballarini hisoblashning ham turli yo'llari bor. Shulardan biri - tendensiyagaga asoslangan baholash (pattern scoring). Bunda test topshiruvchining aynan qaysi savollarga to'g'ri javob berganligi tahlil qilinadi va uning javoblari tendensiyasi aniqlanadi. Test topshiruvchining balli "maksimum ehtimollik" (maximum likelihood) statistik tamoyili asosida - ehtimolligi eng yuqori bo'lgan pattern asosida hisoblanadi. Bunda bir xil sondagi test topshiriqlarini yechgan test topshiruvchilarining ballar har xil bo'lishi ham mumkin. Masalan, A va B test topshiruvchi har biri 5tadan to'g'ri javobni topgan bo'lsa ham, aynan qaysi test topshiriqlariga to'g'ri javob berganiga qarab, ularning ballari har xil chiqishi mumkin.

Bunda ham turli test variantlarini yechganlarning natijalari yagona shkalaga keltirilishi kerak.

Klassik test nazariyasi va Rash modeli

Klassik test nazariyasi (Classical test theory, CRT)

Savol-javob nazariyasi (Item-Response Theory, IRT)

Report Page