1. Определение понятия психологического теста [8]
В отечественной и зарубежной литературе представлено огромное разнообразие определений понятия психологического теста. Ниже приведены некоторые из них. "Психологический тест в сущности есть объективное и стандартизованное измерение выборки поведения" (2, с. 31). "Тест стандартизованное, часто ограниченное во времени испытание, предназначенное для установления количественных (и качественных) индивидуально психологических различий" (1, с.139). "Под тестом понимается специфический инструмент для оценивания психологических качеств личности. Он состоит из совокупности заданий или вопросов, предлагаемых в стандартных условиях и предназначенных для выявления частичных типов поведения" (7, с. 13). Все определения содержат следующие общие моменты:
во-первых,тест один из методов измерения в психодиагностике наряду с такими, как проективные методы (см. Тема 5), стандартизованные самоотчеты (см. Тема 4), интервью, аппаратурные методы и др.;
во-вторых,это метод измерения свойств личности и особенностей интеллекта;
в-третьих,это метод измерения, который характеризуется высокой степенью объективности, надежности и валидности.
Объективность, валидность и надежность требования, которым должен удовлетворять каждый тест. Рассмотрению этих понятий посвящены следующие параграфы.
2. Психологический тест как объективное измерение [9]
Объективность психологического теста означает, что первичные показатели, их оценка и интерпретация не зависят от поведения и субъективных суждений экспериментатора. Первичными называют показатели, полученные после обработки данных выполнения респондентом тестовых заданий. Выражаются первичные показатели в так называемых "сырых баллах".
Разработка заданий, процедура проведения, обработка результатов теста осуществляется согласно определенным стандартным правилам.
Добиться объективности психологического теста можно при выполнении следующих условий:
Эти три условия называют этапами стандартизации психологического теста.
Этапы стандартизации
На этапе разработки теста, а также любого другого метода проводится процедура стандартизации, которая включает три этапа.
Первый этап стандартизации психологического теста состоит в создании единообразной процедуры тестирования. Она включает определение следующих моментов диагностической ситуации:
- условия тестирования (помещение, освещение и др. внешние факторы). Очевидно, что объем кратковременной памяти лучше измерять (например, с помощью субтеста повторения цифровых рядов в тесте Векслера), когда нет внешних раздражителей, таких как посторонние звуки, голоса и т.д.
- Содержание инструкции и особенности ее предъявления (тон голоса, паузы, скорость речи и т.д.). Например, в тесте "10 слов" каждое слово должно предъявляться через определенный интервал времени в секундах.
- Наличие стандартного стимульного материала. Например, достоверность полученных результатов существенно зависит от того, предлагаются ли респонденту изготовленные самодельные карты Г.Роршаха или стандартные с определенной цветовой гаммой и цветовыми оттенками.
- Временные ограничения выполнения данного теста. Например, для выполнения теста Равена взрослому респонденту дается 20 минут.
- Стандартный бланк для выполнения данного теста. Использование стандартного бланка облегчает процедуру обработки.
- Учет влияния ситуационных переменных на процесс и результат тестирования. Под переменными подразумевается состояние испытуемого (усталость, перенапряжение и т.д.), нестандартные условия тестирования (плохое освещение, отсутствие вентиляции и др.), прерывание тестирования.
- Учет влияния поведения диагноста на процесс и результат тестирования. Например, одобрительно-поощряющее поведение экспериментатора во время тестирования может восприниматься респондентом как подсказка "правильного ответа" и др.
- Учет влияния опыта респондента в тестировании. Естественно, что респондент, который уже не в первый раз проходит процедуру тестирования, преодолел чувство неизвестности и выработал определенное отношение к тестовой ситуации. Например, если респондент уже выполнял тест Равена, то, скорее всего, не стоит предлагать ему его во второй раз.
Второй этап стандартизации психологического теста состоит в создании единообразной оценки выполнения теста: стандартной интерпретации полученных результатов и предварительной стандартной обработки. Этот этап предполагает также сравнение полученных показателей с нормой выполнения этого теста для данного возраста (например, в тестах интеллекта), пола и т.д. (см. ниже).
Третий этап стандартизации психологического теста состоит в определении норм выполнения теста [10].
Нормы разрабатываются для различных возрастов, профессий,
полов и др. Вот некоторые из существующих видов норм:
Школьные нормы |
разрабатываются на основе тестов школьных достижений или тестов школьных способностей. Они устанавливаются для каждой школьной ступени и действуют на всей территории страны. |
Профессиональные нормы |
устанавливаются на основе тестов для разных профессиональных групп (например, механиков разного профиля, машинисток и др.). |
Локальные нормы |
устанавливаются и применяются для узких категорий людей, отличающихся наличием общего- признака возраста, пола, географического района, социо-экономического статуса и др. Например, для теста Векслера на интеллект нормы ограничены возрастными рамками. |
Национальные нормы |
разрабатываются для представителей данной народности, нации, страны в целом. Необходимость таких норм определяется конкретной культурой, моральными требованиями и традициями каждой нации. |
Наличие нормативных данных (норм) в стандартизованных методах психодиагностики является их существенной характеристикой.
Нормы необходимы при интерпретации тестовых результатов (первичных показателей) в качестве эталона, с которым сравниваются результаты тестирования. Например, в тестах интеллекта получаемый первичный показатель IQ соотносится с нормативным IQ (43, 44, 45 баллов в тесте Равена). Если полученный IQ респондента выше нормативного, равен 60 баллам (в тесте Равена), можно говорить об уровне развития интеллекта этого респондента как высоком. Если полученный IQ ниже, то низком; если полученный IQ равен 43, 44 или 45 баллам, то среднем.
Определение норм для теста
На этапе создания теста формируется некоторая группа испытуемых, на которой проводится данный тест. Средний результат выполнения этого теста в данной группе принято считать нормой. Средний результат это не единственное число, а диапазон значений (см. рис. 1: зона средних значений 43, 44, 45 баллов). Существуют определенные правила формирования такой группы испытуемых, или, как ее иначе называют, выборки стандартизации.
Правила формирования выборки стандартизации:
Распределение результатов, полученных при тестировании испытуемых выборки стандартизации, можно изобразить с помощью графика кривой нормального распределения. Этот график показывает, какие значения первичных показателей входят в зону средних значений (в зону нормы), а какие выше и ниже нормы. Например, на рис.1 изображена кривая нормального распределения для теста "Прогрессивные матрицы Равена".
Чаще всего в руководствах к тому или иному тесту можно встретить выражения нормы не в виде сырых баллов, а в виде стандартных производных показателей. То есть нормы к данному тесту могут быть выражены в виде Т-баллов, децилей, процентилей, станайнов, стандартных IQ и др. [11] Перевод сырых значений (первичных показателей) в стандартные (производные) делается для того, чтобы результаты, полученные по разным тестам, можно было сравнивать между собой.
Производные показатели получаются путем математической обработки первичных показателей.
Первичные показатели по разным тестам нельзя сравнивать между собой по причине того, что тесты имеют различное внутреннее строение. Например, IQ, полученный с помощью теста Векслера, нельзя сравнивать с IQ, полученным с помощью теста Амтхауэра, так как эти тесты исследуют разные особенности интеллекта и IQ как суммарный показатель по субтестам складывается из показателей разных по строению и содержанию субтестов.
"Любая норма, в чем бы она ни выражалась, ограничивается конкретной совокупностью людей, для которых она вырабатывалась... Применительно к психологическим тестам они (нормы) никоим образом не абсолютны, не универсальны и не постоянны. Они просто выражают выполнение теста испытуемыми из выборки стандартизации"
А.Анастази
3. Валидность [12]
Все методы психологической диагностики, начиная со стандартизованных и заканчивая нестандартизованными, направлены на измерение свойств личности и особенностей интеллекта.
Каждый метод предназначен для измерения какого-либо свойства, что и определяет содержание этого метода. Сведения о степени, в которой тест действительно измеряет то, для чего он предназначен, входят в понятие валидности . Например, методика "Кольца Ландольта" предназначена для измерения таких свойств внимания, как концентрация, переключаемость. В психологии существуют определения понятий концентрации внимания и его переключаемости. Считается, что выводы, сформулированные на основании результатов тестирования с помощью "Колец Ландольта", вполне отражают содержание определений этих свойств внимания. Значит, эта методика действительно измеряет то, для чего она предназначена.
Помимо общего значения в понятие валидности входят многие другие сведения. Существуют разные типы и виды валидности, в которых отражены эти сведения. Ниже приведены некоторые типы.
Эффективная методика может быть создана, если она прошла все этапы валидации, то есть когда приняты меры для придания ей как содержательной валидности (см. общее значение понятия валидности выше), так и практической.
4. Надежность [13]
О высокой надежности метода говорят в том случае, когда метод точно измеряет то свойство, для измерения которого он предназначен. В качестве критериев точности можно отметить следующие:
Существуют различные методы оценки надежности:
Ретестовый метод повторное тестирование выборки испытуемых одним и тем же тестом через определенный интервал времени при одних и тех же условиях. Временной интервал зависит от возраста (например, у маленьких детей изменения могут произойти в течение одного месяца), а также событий, происходящих с испытуемым в жизни.
ТЕСТ ИНТЕРВАЛ РЕТЕСТ
За индекс надежности принимается коэффициент корреляции между результатами двух тестирований. Полученная высокая корреляция может быть результатом тренированности испытуемого на заданиях подобного типа; низкая корреляция может быть результатом происшедших изменений с испытуемым, а также может свидетельствовать о ненадежности теста.
Надежность взаимозаменяемых форм повторное тестирование выборки испытуемых параллельной формой теста через минимальный интервал времени при одних и тех же условиях.
ТЕСТ А ИНТЕРВАЛ ТЕСТ А'
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя параллельными формами теста. Высокий коэффициент корреляции и большой интервал между двумя испытаниями свидетельствуют о высокой надежности теста.
Возможный обман со стороны испытуемого, его искушенность, события, происшедшие в интервале между тестированиями, не оказывают особого влияния (как в ретестовом методе) на степень надежности теста. Если фактор тренировки снижен при тестировании параллельными формами, то эффект переноса принципа заданий часто имеет место. Эффект переноса следует учитывать при построении параллельных форм.
Требования к построению параллельных форм:
Метод расщепления состоит в том, что тест разбивают на две сопоставимые части. Респондент выполняет задания этих двух частей в течение одного сеанса с получением двух результатов (например, тест Равена содержит две части: четные и нечетные задания).
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя этими частями. Он называется коэффициентом внутренней согласованности теста .
Валидность и надежность. Тест может быть надежен,
но не валиден. Это означает, что он измеряет какое-то свойство
очень точно, но какое именно остается под вопросом. В такой
ситуации необходима более точная валидизация теста, как содержательная,
так и практическая.
5. Виды психологических тестов
Тесты интеллекта
Понятие интеллекта. Проблемы тестирования интеллекта. [14] Тесты интеллекта, или тесты общих способностей, предназначены для измерения уровня интеллектуального развития человека. Понятие интеллекта еще со времен первых интеллектуальных тестов претерпевало различные изменения со стороны подходов к тестированию интеллекта как психической реальности. Еще в 20-х гг. возникла кризисная ситуация в психологии интеллекта. Встал вопрос о существовании термина "интеллект" в статусе психологической категории.
Интеллект традиционно исследовался в рамках двух основных направлений: тестологического и экспериментально-психологического. Суть тестологического направления заключается в том, что под интеллектом понимается то, что измеряют тесты интеллекта, а именно совокупность познавательных способностей.
Кризис в этом направлении заключается в том, что понятие ''интеллект''' было подменено понятием "способность к учению". Неотестологические теории интеллекта признают IQ-концепцию, где за IQ стоят внутренние когнитивные процессы: восприятие, память, мышление и т.д. (см. ниже).
Экспериментально-психологическое направление как реакция на неконструктивность тестологических теорий представлено теориями Ж.Пиаже (идея генетического объяснения интеллекта на основе учета закономерностей его онтогенетического развития) и Л.С.Выготского (влияние социально-культурных факторов на развитие интеллекта).
Кроме вышеназванных существует структурный подход к исследованию интеллекта (8) как пример отечественного исследования, направленного на изучение интеллекта как психической реальности.
Полученные с помощью тестов интеллекта результаты выражаются количественно в виде коэффициента интеллекта (IQ).
Итак, под интеллектом как объектом измерения в психодиагностике понимается структура познавательных свойств человека, возникающая на основе наследственно закрепленных задатков, формирующаяся во взаимодействии с ними.
Понятие IQ [15] Тесты интеллекта состоят из нескольких субтестов, направленных на измерение интеллектуальных функций (логического мышления, смысловой и ассоциативной памяти, др.). Например, в Гамбургской версии теста Векслера для исследования интеллекта у детей (версия 1983 года), когда весь тест проведен, его результаты представляются в виде 11-балльных значений, по одному значению на каждый субтест (11 субтестов). Количественная информация по тесту представляется в виде профиля результатов, состоящего из результатов по каждому субтесту, выраженных в балльных значениях. Мерой оценки теста в целом может быть сумма этих значений или среднее значение данных всех субтестов. Как правило, тестологи ограничиваются тем, что представляют результаты субтестов в виде баллов. Векслер предложил общий результат представить в виде значения IQ.
IQ количественный показатель интеллектуального развития. Он высчитывается по формуле:
умственный возраст
IQ = ------------------------------------ *100
хронологический возраст
По мере развития математико-статистического аппарата интеллектуальных тестов количественный показатель IQ был заменен стандартным IQ показателем. Векслер первым вводит шкалу стандартных IQ.
При интерпретации общего результата нельзя целиком полагаться на соответствующий общий показатель IQ. Существенную информацию дает интерпретация профиля результатов по субтестам.
Следует отметить тот факт, что область средних значений шкалы IQ не дает представления о том, в каких субтестах результаты выше среднего, а в каких ниже. Так, например, показатель IQ в 100 баллов может быть получен и в случае однородного профиля достижений (то есть когда по всем субтестам результаты выше среднего значения), и в случае, когда по одним субтестам достигнуты результаты выше среднего, а по другим ниже среднего.
IQ или любой другой показатель следует всегда приводить вместе с названием теста, в котором они получены. Тестовые показатели нельзя интерпретировать в отрыве от конкретного теста.
"IQ не является постоянной величиной и изменяется под воздействием окружающей среды. IQ является отражением как предшествующих, так и последующих достижений в обучении. Интеллект не есть единая и однообразная способность, он складывается из нескольких функций. Этим термином обычно обозначается комплекс способностей, необходимых для выживания и достижения успехов в определенной культуре".
А. Анастази
Фактор "G". Двухфакторная и многофакторная теории интеллекта. [16] В исследованиях Ч.Спирмана и сотр. (автора двухфакторной теории интеллекта) было установлено, что между любыми тестами интеллекта существуют положительные корреляции. Ч.Спирман считал, что эти положительные корреляции обусловлены тем, что всякая интеллектуальная деятельность содержит единый общий фактор. Этот фактор он назвал генеральным , или фактором "G" . Он полагал также существование других факторов, свойственных только одному виду деятельности (S-факторы).
В исследованиях Л. Терстоуна (автора многофакторной теории) было установлено, что корреляции между тестами не могут быть объяснены наличием в них только одного фактора ("G"). Им было выделено 12 факторов, которые он назвал "первичные умственные способности", существующие помимо генерального.
Именно Л. Терстоун доказывал, что нет оснований для использования коэффициента интеллекта. Интеллект, считал он, необходимо представлять в виде профиля оценок по первичным факторам, в чем и состоит суть многофакторной теории интеллекта.
Тесты способностей. [17]
Понятие способности. Способностями называют индивидуально-психологические
особенности человека, которые способствуют его успеху в какой-либо
деятельности. Способности проявляются в деятельности, формируются
в деятельности и существуют относительно определенной деятельности.
Выделяют общие и частные способности. Общие и частные делятся
на элементарные и сложные.
.
СПОСОБНОСТИ |
ЭЛЕМЕНТАРНЫЕ |
СЛОЖНЫЕ |
ОБЩИЕ |
присущие всем людям основные формы психического отражения способности : ощущать
|
в большей или меньшей степени присущие всем людям способности к общечеловеческим видам деятельности : игре
|
ЧАСТНЫЕ |
присущие не всем людям способности : музыкальный слух
|
присущие не всем людям способности : профессиональные
|
Критерием наличия способностей можно считать уровень успешности
в какой-либо деятельности по сравнению с другими, например,
меньшая затрата сил, быстрота. Если уровень успешности в
какой-либо деятельности одинаков у двух людей, то более способным
из них к этой деятельности будет тот, кто обладает оригинальностью
приемов, своеобразием способов действий.
Способность характеризуется успешностью в приобретении знаний, умений и навыков и их перенос с одного класса задач на другой.
Способность по сути не есть одно единственное качество, а составляет целостный комплекс качеств. Например, изобразительную способность составляют хорошая зрительная память, острота зрительного восприятия и др.
В тестировании способностей выделяют тесты специальных способностей, тесты общих способностей (тесты интеллекта), комплексные батареи способностей.
Тесты специальных способностей направлены на измерение способностей к определенным видам деятельности. Используются при решении задач в области профотбора и профориентации.
В зарубежной литературе принято квалифицировать специальные способности по двум основаниям:
Комплексные батареи способностей направлены на измерение относительно независимых способностей. Используются при решении задач в области образования и профориентации, особенно при консультировании по вопросам выбора специализации в образовании или профессии.
Тесты достижений [18]
Если "тесты способностей служат для предсказания последующего выполнения той или иной деятельности и применяются для оценки целесообразности прохождения индивидом того или иного курса специального обучения или для предсказания уровня его достижений в новой ситуации, например, в освоении профессии, то тесты достижений обычно дают конечную оценку достижений индивида по завершении обучения, в них основной интерес сосредоточен на том, что индивид может делать к настоящему времени".
Выделяют две группы тестов достижений: широкоориентированные тесты достижений , тесты достижений по конкретным учебным предметам.
Широкоориентированные тесты достижений ориентированы на оценку навыков по основным целям обучения (например, тесты на понимание научных принципов).
Тесты достижений по конкретным предметам (достижения в чтении и математике) ориентированы на оценку усвоения элементов учебных программ, конкретных тем, уровня владения навыками (например, счетными).
Такие тесты выполняют несколько функций:
Тесты личности [19]
В психологии выделяют следующие направления исследования
личности:
L данные (Life record data) |
информация о личности может быть получена путем регистрации реального поведения человека в повседневной жизни; |
Q данные (questionnaire data) |
информация о личности может быть получена с помощью опросников и др. методов самооценок (см. Тема 4); |
T данные (Tests data) |
информация о личности может быть получена с помощью объективных тестов. |
Следует также отметить проективный метод исследования личности, речь о котором пойдет в Теме 5.
Тесты личности делятся на тесты действия и ситуационные тесты . Тесты действия представляют собой процедуры, ориентирующие респондента на выполнение какой-либо задачи. То есть ему дается целевая задача что-то выполнить, и его не просят описать привычный способ поведения (как, например, в опросниках). Цель этих тестов замаскирована, индивид не осознает, какой аспект его действий оценивается. Задачи, предъявляемые испытуемому, структурированы: в этом их принципиальное отличие от задач, используемых в проективных методиках. Большинство тестов воспринимается испытуемым как проверка способностей, при которой он должен стараться дать "правильный" ответ (в отличие от проективных методик, в которых любой ответ "хорош").
Существует несколько подходов в рамках тестов действия: исследование когнитивного стиля (типичных способов восприятия, решения проблемных ситуаций, мышления, запоминания), исследование эстетических вкусов, юмора, оценка пословиц, оценка интересов и установок.
Ситуационные тесты предполагают помещение испытуемого в ситуацию, очень близкую к реальной жизни или имитирующую ее. Например, испытуемому предлагают ряд заданий, вызывающих тревожность, и объективно регистрируют выполнение этих заданий (в тестах на стресс).
Критериально-ориентированные тесты (КОТ) [20]
Критериально-ориентированные тесты отличаются от традиционных тестов тем, что в традиционных оценка осуществляется путем соотнесения индивидуальных результатов с групповыми (ориентация на статистическую норму), а в критериально-ориентированных оценка осуществляется путем соотнесения индивидуальных результатов с некоторым критерием. В качестве такого критерия выступает уровень владения навыком, умениями, знаниями.
КОТ используются в образовании. Цель тестирования с помощью КОТ оценка владения навыком. Итоговый показатель фиксирует степень владения навыком и не включает в себя индивидуальные различия, что является слабым местом КОТ. Поэтому их использование возможно для оценки элементарных навыков.
Отечественным примером КОТ является Школьный Тест Умственного Развития ШТУР (1).
Примечания:
[8] См. 2. С. 31-34; 4. С. 46; 7. С. 13; 11.
С. 19-20, 23-34
[9] См. 2. С. 33-34, 40-50
[10] См. 2. С. 75-88; 4. С. 51; 5. С. 121-126;
7. С. 67, 90-91; 11. С. 53-56
[11] См. 2. С. 75 85.
[12] См. 2. С. 136-148; 6. С. 108-118; 7.
С. 77-88; 11. С. 74-90.
[13] См. 2. С. 97-124; 7. С. 69-77; 11. С.
67-74
[14] См. 4. С. 232-241; 8. С. 121-128; 9.;
10.
[15] См. 2. С. 81-82, 308-316; 4. С. 232-241;
10.
[16] См. 3. С. 11-18.
[17] См. 3. С. 18-27; 11. С. 135-156.
[18] См. 3. С. 36-47.
[19] См. 3. С. 210-220.
[20] См. 3. С. 58-59; 13.; 2. С. 124-126.
Литература:
Дополнительная литература:
Аванесов В.С. Тесты в социологическом исследовании. М.: Наука, 1982.