тний дати необхідні результати. У західній літературі традиційно розглядається два основних критерії якості: валідність і надійність.
Валідність означає придатність тестових результатів для тієї мети, заради чого проводилося тестування. Найголовніша загроза для зниження валідності результатів - це формулювання двох і більше цілей застосування якого методу оцінки рівня підготовленості випробуваних. Теза ... ніколи не слід використовувати системи оцінювання, розроблені в одних цілях, для інших цілей; неможливий ефективно досягти одразу двох цілей [26] прямо відноситься до анонімних авторам неякісного ЄДІ. [27]
Валідність залежить від якості завдань, їхнього числа, від ступеня повноти і глибини охоплення змісту навчальної дисципліни (по темах) у завданнях тесту. Крім того, валідність результатів залежить також від балансу і розподілу завдань за труднощі, від методу відбору завдань у тест із загального банку завдань, від інтерпретації тестових результатів, від організації збору даних, від підбору вибіркової сукупності випробуваних.
Об'єктивність педагогічного вимірювання означає не стільки абсолютне досягнення цієї мети, що бажано, але неможливо, скільки установку тестологов на максимальну об'єктивність процесу створення та застосування тестів. Об'єктивності сприяють однакові інструкції для всіх випробовуваних, однакова система оцінки результатів тестування, автоматизований підрахунок балів випробовуваних і все інше, що підвищує якість тестування.
Умовами підвищення об'єктивності тестування є підвищення рівня наукової обгрунтованості як самих тестів, так і методів їх розробки, використання сучасної техніки зберігання та передачі тестових матеріалів, захист інформації від недозволеного доступу, послідовна робота з усунення можливостей навмисного спотворення результатів та інших компонентів тестового процесу. Визначення статистичних характеристик є головним (після експертної перевірки змісту) засобом діагностики якості тесту з будь-якої навчальної дисципліни.
Принцип паралельності завдань. Паралельними називається завдання, які засновані на принципі варіативності і однорідності, але, крім того, мають приблизно однакову емпіричну міру труднощі всіх варіантів завдання та корелюється результати. З даного визначення видно, другий принцип випливає з принципу варіативності і однорідності завдань, але за змістом він ширший, включає в себе формальні критерії і спирається на емпіричні дані результатів піддослідних. Різний і статус цих принципів. Перший і все інші принципи є здебільшого логічними і змістовно-методичними, в той час як принцип паралельності завдань є загальнотеоретичних, що спирається на статистику, а тому використовується у всіх формальних теоріях педагогічних вимірювань. Треба підкреслити, що паралельність за змістом є тільки однією з необхідних умов паралельності тестових завдань.
Ідея розробки та існування паралельних варіантів тестових завдань є фундаментальною ...