Второй вопрос: каким способом измерять интеллект? Производится теоретический анализ достоинств и недостатков существующих методов, и, если методы, созданные до сих пор, не удовлетворяют автора по некоторым теоретическим или практическим соображениям, он берется за создание собственной методики.
Ответ на вопрос «для чего?» и сама его постановка от автора не зависят, а определяются той научно-практической задачей, которую он может модифицировать, но не в силах игнорировать.
На втором этапе происходит собственно работа по созданию теста. Главными инструментами здесь служат авторская интуиция, опыт предшественников и знание специфики некоторой интеллектуальной деятельности. Психолог обычно исходит из интуитивного представления об изоморфизме внутреннего (ментального) и внешнего (моторно-перцептивного) планов действия и аналогии между ними.
Любая психологическая методика, направленная на диагностику интеллекта или парциальных способностей, есть задача (игровая, учебная или трудовая), некоторая модель ситуации, встречающейся в обычной человеческой жизни. Внешняя валидность теста (ее еще можно назвать «экологическая валидность») – это соответствие тестовой задачи той реальной жизненной задаче, которая служила прототипом теста.
Что касается внутренней валидности, которая, как известно, заключается в соответствии процедуры измерения измеряемому свойству, то она зависит от интуиции исследователя, который предположил, что решение именно данной задачи определяется уровнем развития у человека определенного психического свойства.
Чтобы «измерить» это свойство, мы можем лишь вооружить испытуемого средствами («внешними» и «внутренними», проводя обучение или инструктируя). Кроме того, исследователь может воздвигать на пути правильного решения препятствия, затрудняя первичный анализ материала и условий задачи, повышать уровень трудности, вводить дополнительные помехи («внешние» и «внутренние»), изменять «обратную связь» и так далее. Но все затруднения мы вводим лишь на основе глубинной аналогии между «внешними» и «внутренними» планами поведения.
Единственное, что варьирует экспериментатор, – это трудность задания, а у испытуемого есть лишь одно средство ее преодолеть – проявить свои способности. Предположение о независимости объективного уровня трудности задания от способностей испытуемого являлась основной предпосылкой при создании в 1952 году датским математиком Г. Рашем [2, 3] модели теста, на основе которой было создано семейство вероятностных моделей Раша.
Модель имеет две основные версии: мультипликативную и аддитивную.
В соответствии с этой моделью правильность решения теста определяется либо высоким уровнем развития способности, либо низким уровнем трудности задания.
В специальной литературе описаны компьютерные алгоритмы и программы, позволяющие на основе эмпирических результатов рассчитать как объективную трудность задания, так и «способность» каждого испытуемого [2, 3].
Сам Г. Раш использовал свою модель при создании критериальных тестов и ввел единицу измерения, называемую логит, которая измеряет в одной шкале как трудность задания, так и способность испытуемого.
В. С. Аванесов [4] предложил использовать несколько модификаций модели Раша: модель, учитывающую вероятность угадывания правильного ответа, и более сложную модель, учитывающую влияние на успешность решения теста других способностей.
Как бы там ни было, интуитивно психологи при создании тестов всегда строили задания таким образом, чтобы они варьировали по трудности и были направлены на измерение не более чем одной способности.
Третий этап конструирования теста является этапом отбраковки непригодных заданий, а не творческим процессом их создания. Но именно этот этап традиционно считается конструированием теста. Для него разработан весь существующий в настоящее время аппарат эмпирико-статистической теории теста, предназначенный для оценки валидности и надежности теста и отдельных его заданий.
Процедура валидизации и проверки на надежность, гомогенность (однородность), дифференцирующую силу, прогностичность и т. д. сводится к отбору заданий теста и представляет собой итерационную процедуру доведения теста до требуемого уровня качества за счет замены заданий, их модификации, а также изменения процедуры проведения и интерпретации данных тестирования.