Надежность теста

критерий измерения постоянства (стабильности) теста (или метода психологической оценки).

Основным показателем надежности теста является воспроизводимость полученных результатов, т. е. повторное проведение теста должно давать приемлемо схожие результаты или оценки.

Количественное постоянство метода определяется коэффициентом ретестовой надежности (А. Анастази, 1988). Обычно коэффициент ретестовой надежности равен корреляции между результатами, полученными на одних и тех же испытуемых в каждом из двух случаев проведения теста и в абсолютных значениях выше +0,70. Чем ближе величина коэффициента надежности к единице, тем более надежен метод.

Другой вид надежности определяют путем коррелирования параллельных форм теста. Для этого тест делят на две сопоставимые части (например, четные и нечетные пункты), затем по каждой половине рассчитывают суммарные баллы и между двумя рядами баллов по испытуемым рассчитывают допустимые коэффициенты корреляции. Полученный таким образом коэффициент называют коэффициентом внутренней согласованности. Внутренняя согласованность отражает внутреннее постоянство теста. Если обе части теста измеряют одно и то же качество личности, то испытуемые, получившие высокие оценки по нечетным пунктам, должны также получить высокие оценки и по четным, соответственно, и наоборот.

Еще один тип надежности основывается на корреляции между двумя сопоставимыми вариантами одного и того же теста (состоящими из аналогичных вопросов), проведенных на одной и той же группе испытуемых. Если по этим разным формам теста получены примерно одинаковые оценки, тест обладает надежностью параллельных форм. Положительная корреляция между двумя взаимозаменяемыми формами означает, что буквы обоих вариантов теста измеряют одно и то же.

Кроме того, надежность касается согласованности оценок экспертов между собой при подсчете результатов одного и того же теста. Этот тип надежности называется надежностью субъективных оценок. Надежность субъективных оценок обязательно учитывается, если методика предполагает субъективные интерпретации, например в персонологии при оценке результатов проективных тестов. Однако этот тип надежности имеет особенно низкие значения в отношении любых качественных методов, таких как интервью, анализ сновидений и других форм свободных ответов, не поддающихся качественной экспертизе. Чтобы устранить эти недостатки, необходимо разработать для экспертов руководства, содержащие четкие правила оценки и инструкции для анализа данных.

Похожие книги из библиотеки