Валидность или достоверность
важнейший критерий качества измерений, обозначающий, что метод, методика или тест измеряет то, для чего он предназначен, т. е. меру соответствия использованного инструментария и полученных результатов поставленным задачам. Данный критерий используется в теории и практике психологических и педагогических измерений с целью определения, действительно ли измеряется то, что задумал исследователь или что-то другое.
Валидность является одним из критериев (наряду с надежностью, нормированием и стандартизацией), который процедурно необходим, чтобы тот или иной способ измерения или оценивания получил право считаться научно приемлемым методом измерения индивидуальных различий. Валидность основывается на критериях объективности и надежности.
Существует несколько видов установления валидности.
1. Содержательная валидность подразумевает определение степени соответствия стимульного материала методики (вопросов, рисунков, заданий и т. д.), измеряемой области свойств объекта, т. е. метод включает такие пункты, содержание которых выявляет необходимые признаки, раскрывает соответствующие характеристики и аспекты поведения и деятельности. Таким образом, валидная по содержанию методика для выявления застенчивости должна оценивать каждый из компонентов, входящих в понятие «застенчивость», обнаруживать полный набор заданий для измерения черты. В педагогической практике тест достижения может считаться валидным по содержанию, если а) на основе экспертизы учебного плана были определены задания, которые охватывают важнейшие аспекты подлежащего усвоению материала; б) содержание заданий соотнесено с тематическим описанием учебного материала и поставленными задачами (что должны знать, уметь, быть способны делать, чем владеть); в) проведено отслеживание возможности влияния других факторов (помимо содержания) на результат, например трудность понимания инструкции.
2. Критериальная валидность, которую часто обозначают как эмпирическую валидность, включает два подвида: прогностическую и текущую (или иначе валидность соответствия). Прогностическая валидность характеризует степень точности предсказания методикой (тестом) некоторых будущих критериально-ориентированных измерений и позволяет вычислить взаимосвязь между данными, полученными в ходе ранее проведенного исследования и поведением, результатами деятельности, наблюдаемыми позже. Так тест измерения интеллекта прогностически валиден, если точно предсказывает успеваемость в школе, правда, при условии, если эти оценки минимально субъективны. Текущая валидность отражает степень корреляции теста (методики) с независимым измерением той же самой переменной, полученной в то же самое время с использованием других методов. Например, результаты учащегося по тесту школьной тревожности Филлипса или агрессивности Басса – Дарки положительно коррелируют с оценками выраженности тревожных или агрессивных тенденций, выставленных педагогами или психологами по карте наблюдений Стотта, но при условии, что они заранее не знают о результатах диагностики.
3. Конструктивная валидность отражает степень репрезентации исследуемого конструкта в результатах измерения. Поскольку большинство конструктов, которые оцениваются посредством измерений – это производные, абстрактные, недоступные для непосредственного наблюдения латентные комплексные признаки, то их фиксация придает результатам неопределенность. Для них не существует твердо установленных критериальных величин. Это ставит исследователя перед необходимостью создания гипотетического конструкта – некоего теоретического описания измеряемого феномена, посредством имеющихся в науке и практике данных, допущений, долгосрочных проявлений в поведении характеристик, их взаимосвязей с другими конструктами и условиями проявления. Таким образом, исследователь стоит перед необходимостью сбора доказательств того, что выведенный из теории или практики гипотетический конструкт, ставший основанием теста или методики, существует и включает именно те характеристики, которые были заложены в него исследователем. Например, с помощью анкеты можно оценить чувство страха перед экзаменами. Степень валидности этого оценивания можно определить лишь в том случае, если проверить возможность подтверждения позитивных или негативных реакций, предсказываемых теоретически.
Для валидизации конструкта используются разнообразные статистические методы. Первый вариант заключается в установлении корреляций между тестовыми оценками конструкта и показателями другого теста (методики), который предположительно измеряет те же признаки. Эта процедура обычно обозначается как конвергентная валидность. Другой вариант – обнаружить, что разработанная измерительная процедура не коррелирует с показателями, для измерения которых эта процедура не предназначена, т. е. не выявляет никакой черты, с которой теоретически не должно быть связи. Этот подход известен как дивергентная валидность. Третий вариант – факторный анализ, обобщающий однородные, согласованные признаки в целостную группу. В случае, если найденные отношения в значительной мере соответствуют теоретической модели, можно говорить, что инструментарий обладает конструктивной валидностью.