Алексей Сергеевич Лучинин Психодиагностика
1. Экспериментальная психология. Работы В. Вундта, Ф. Гальтона, Г. Эббингауза, Д. Кеттелла
Психодиагностика как особая научная дисциплина прошла значительный путь развития и становления.
Психологическая диагностика выделилась из психологии и начала складываться на рубеже XX в. Ее возникновение было подготовлено несколькими направлениями в развитии психологии.
Психодиагностика выросла из экспериментальной психологии, а ее возникновение в 1850-1870-е гг. связано с возросшим влиянием естествознания на область психических явлений, с процессом «физиологизации» психологии. Первыми экспериментальными методами психологию снабдили другие науки, главным образом физиология.
Началом возникновения экспериментальной психологии условно считается 1878 г., так как именно в этом году Вильгельм Вундт (1832–1920) основал в Германии первую лабораторию экспериментальной психологии.
По образцу лаборатории Вундта создаются подобные экспериментальные лаборатории и кабинеты не только в Германии, но и в других странах (Франции, Голландии, Англии, Швеции, Америке).
Развивающаяся экспериментальная психология вплотную подошла к изучению таких психических процессов, как речевые ассоциации – метод свободных словесных ассоциаций Гальтона. Сразу же после публикации Ф. Гальтона в 1897 г. Вундт использовал ассоциативную методику в своей лаборатории.
Однако автором, создавшим первый, собственно психологический экспериментальный метод, был Герман Эббингауз (1850–1909), который изучал законы памяти, используя для этого наборы бессмысленных слогов. Этим методом Эббингауз открыл путь экспериментальному изучению навыков.
Американский психолог Джеймс Кеттелл (1860–1944) исследовал объем внимания и навыки чтения. С помощью тахистоскопа (прибора, позволяющего предъявлять испытуемому зрительные стимулы на краткие отрезки времени) он определял время, необходимое для того, чтобы воспринять и назвать различные объекты: формы, буквы, слова и т. д. Проводя эксперименты с чтением букв и слов на вращающемся барабане, Кеттелл зафиксировал феномен антиципации («забегания» восприятия вперед).
Так, на рубеже XX в. в психологии утвердился объективный экспериментальный метод, который начал определять характер психологической науки в целом. С внедрением в психологию эксперимента и появлением благодаря этому новых критериев научности ее представлений создались предпосылки для зарождения знаний об индивидуальных различиях между людьми.
2. Дифференциальная психология. Возникновение тестирования как результат практических запросов медицины, педагогики и индустриализации производства
Дифференциальная психология стала еще одним источником развития психодиагностики. Вне представлений об индивидуально-психологических особенностях, которые являются предметом дифференциальной психологии, невозможно было бы возникновение психодиагностики как науки о методах их измерения.
Но дифференциально-психологическое изучение человека не было простым логическим развитием экспериментально-психологического. Оно складывалось под воздействием запросов практики, сначала медицинской и педагогической, а затем и индустриальной. Одной из основных причин, обусловивших зарождение психодиагностики, нужно считать выдвинутую врачебной практикой потребность в диагностике и лечении умственно отсталых и душевнобольных людей.
Одна из ранних публикаций, посвященных вопросам умственной отсталости, принадлежит французскому врачу Ж. Е. Д. Эскиролю, стремившемуся дифференцировать разные степени умственной отсталости. Другой французский врач Э. Сеген первым уделил внимание обучению умственно отсталых детей с помощью особых методик. Их работы внесли определенный вклад в разработку методов, помогавших определить умственную отсталость.
Между теоретическими положениями, развиваемыми в рамках общей психологии, и основами психодиагностики прослеживается тесная внутренняя взаимосвязь. Представления о закономерностях развития и функционирования психики являются отправным пунктом при выборе психодиагностической методологии, конструировании психодиагностических методик, их использовании на практике.
История психодиагностики – это и история появления основных психодиагностических методик, и развитие подходов к их созданию на основе эволюционирования взглядов о природе и функционировании психического.
В этой связи интересно проследить, как формировались некоторые важные психодиагностические методы в рамках основных школ психологии.
3. Бихевиоризм как теоретическая основа тестирования. Поведение как совокупность реакций организма на стимулы. Работы Дж. М. Кеттела, А. Бине
Тестовые методы принято связывать с бихевиоризмом. Бихевиоризм ввел в психологию в качестве ведущей категорию поведения. Поведение, согласно бихевиористской концепции, является единственным объектом изучения психологии. Поэтому цель диагностики сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов (термин введен Ф. Гальтоном).
Первым исследователем, употребившим в психологической литературе термин интеллектуальный тест, был Дж. М. Кеттелл. Он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут одинаковыми. Так впервые была провозглашена необходимость стандартизации тестов для того, чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых. Вернувшись в Америку после работы в лаборатории Вундта и чтения лекций в Кембридже, он немедленно стал применять тесты в устроенной им при Колумбийском университете лаборатории (1891).
Вслед за Кеттеллом и другие американские лаборатории начали применять метод тестов. В 1895–1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам.
Метод тестов получил широкое распространение. Новый шаг в его развитии был сделан французским врачом и психологом А. Бине (1857–1911), создателем самой популярной серии тестов. Требовалась информации о высших психических функциях, обозначаемых обычно понятиями «ум», «интеллект».
В 1904 г. Министерство образования поручило Бине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению, но ленивых и не желающих учиться, от страдающих врожденными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей.
Бине в сотрудничестве с Анри Симоном провел серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с трех лет). Проведенные на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня.
4. Шкала Бине-Симона. Понятие «умственного возраста». Шкала Стэнфорд-Бине. Понятие об «интеллектуальном коэффициенте» (IQ). Работы В. Штерна
Первая шкала (серия тестов) Бине-Симона появилась в 1905 г. Бине исходил из представления о том, что развитие интеллекта происходит независимо от обучения, в результате биологического созревания.
Шкала А. Бине в редакциях (1908 и 1911) была переведена на немецкий и английский языки, отличалась тем, что в ней был расширен возрастной диапазон детей – до 13 лет, увеличено число задач и введено понятие умственного возраста.
Задания в шкалах Бине были сгруппированы по возрастам (от 3 до 13 лет). Детям до 6 лет предлагалось по четыре задания, а детям старше 6 лет – шесть заданий. Задания подбирались путем исследования большой группы детей (300 человек).
Показателем интеллекта в шкалах Бине был умственный возраст, который определялся по успешности выполнения тестовых заданий.
Вторая редакция шкалы Бине послужила основой работы по проверке и стандартизации, проведенной в Стэнфордском университете (США) коллективом сотрудников под руководством Л. М. Термена. Этот вариант был предложен в 1916 г., имел много серьезных изменений по сравнению с основным и был назван шкалой Стэнфорд-Бине. Основных отличий от тестов Бине было два: введение в качестве показателя по тесту коэффициента интеллектуальности (IQ), определяющегося отношением между умственным и хронологическим возрастом, и применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.
Коэффициент IQ был предложен В. Штерном, считавшим существенным недостатком показателя умственного возраста то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных ступеней имеет неодинаковое значение. Штерн предложил определять частное, получаемое при делении умственного возраста на хронологический. Этот показатель, умноженный на 100, он и назвал коэффициентом интеллектуальности. Так можно классифицировать нормальных детей по степени умственного развития.
Другим нововведением стэнфордских психологов явилось использование понятия «статистической нормы». Норма стала тем критерием, по которому можно было сравнивать индивидуальные тестовые показатели и тем самым оценивать их, давать им психологическую интерпретацию.
Шкала Стэнфорд-Бине была рассчитана на детей в возрасте от 2,5 до 18 лет. Она состояла из заданий разной трудности, сгруппированных по возрастным критериям.
5. Массовое обследование больших групп испытуемых. Работы А. С. Отиса. Появление армейских тестов «Альфа» и «Бета»
Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные люди, имевшие достаточно высокую психологическую квалификацию.
Практика требовала диагностировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Так в США в период Первой мировой войны появилась новая форма тестовых испытаний – групповое тестирование.
Необходимость как можно быстрее отобрать, распределить полуторамиллионную армию рекрутов по различного рода службам, школам и училищам заставила специально созданный комитет поручить А. С. Отису разработку новых тестов. Так появились две формы армейских тестов – «Альфа» и «Бета». Первая предназначалась для работы с людьми, знающими английский язык, вторая – для неграмотных и иностранцев. После окончания войны эти тесты продолжали широко применять.
Групповые тесты использовались преимущественно в системе образования, в промышленности, в армии.
1920-е гг. характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего ее направленностью на оперативное решение практических задач.
На протяжении первой половины XX в. специалистами в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили ее до совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, чтобы все они отличались высокой надежностью и хорошей валидностью.
Валидизация выявила ограниченные возможности тестов интеллекта: прогнозировать на их основе успешность выполнения конкретных, достаточно узких видов деятельности часто не удавалось. Требовалась, помимо знания общего уровня интеллекта, дополнительная информация об особенностях психики человека. Так возникло новое направление в тестологии – тестирование специальных способностей, которое вначале призвано было лишь дополнить оценки тестов интеллекта, а впоследствии выделилось в самостоятельную область.
6. Факторный анализ. Двухфакторная теория способностей Ч. Спирмена. Многофакторная теория способностей Т. Л. Килли и Л. Терстона
Тестовые батареи (комплекты) создавались для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Основой для построения комплексных батарей тестов способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляциях между ними – факторного анализа. Факторный анализ позволял точнее определить и классифицировать специальные способности.
Английский психолог Чарльз Спирмен в 1904 г. пришел к выводу, что положительная корреляция между тестами на различные способности выявляет некоторый общий генеральный фактор. Он обозначил его буквой g (от англ. general – «общий»). Также в каждой из них обнаруживается специфический фактор, свойственный только данному виду деятельности (S-фактор).
Теорию Ч. Спирмена называют двухфакторной: целью психологического тестирования должно быть измерение д у индивидов. Если такой фактор проявляется во всех изучаемых психических функциях, то его наличие является единственным основанием для предсказания поведения индивида в разных ситуациях. Измерение специфических факторов смысла не имеет, поскольку они могут обнаружить себя только в одной ситуации.
Терстон выделил 12 факторов, которые он обозначил как первичные умственные способности: словесное понимание, беглость речи, числовой фактор, пространственный фактор, ассоциативная память, скорость восприятия, индукция (логическое мышление) и др. Число когнитивных факторов на сегодняшний день – 120.
На основе факторных исследований создавались многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. Наиболее известна среди них – Батарея тестов общих способностей (GATB), включающая тесты способностей для конкретных профессий.
Сегодня факторный анализ – это высшая ступень линейных корреляций. Факторный анализ и добываемые посредством этого анализа факты не всегда верно отражают зависимости между психическими процессами.
Специальные способности трактуются не как индивидуальные особенности, возникшие в результате влияния требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает логические трудности.
К возможностям факторного анализа нужно относиться с осторожностью и не считать этот анализ универсальным инструментом изучения психики.
7. Тесты достижений. Опросники. Интроспекционизм как теоретическая основа метода. Работы Ф. Гальтона, А. Бине, Р. Вудвортса
Тесты достижений в отличие от тестов интеллекта отражают влияние специальных программ обучения на эффективность решения тестовых заданий. В Америке тесты достижений начали использоваться при отборе сотрудников на государственную службу уже с 1872 г.
Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэндфордский тест достижений (SAT)(1923). С его помощью оценивается уровень обученности в разных классах средних учебных заведений. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов.
Опросники являются самыми первыми психодиагностическими методами, заимствованными психологами из естествознания.
Опросники – это большая группа методик, задания которых представлены в виде вопросов или утверждений, а задачей испытуемого является самостоятельное сообщение некоторых сведений о себе в виде ответов. Теоретической основой этого метода можно считать интроспекционизм. Возникший в глубокой древности в рамках религиозной идеологии, он содержал тезис о непознаваемости духовного мира, о невозможности объективного изучения психических явлений. Отсюда вытекало предположение, что, кроме самонаблюдения нет иных способов изучения сознания человека.
Появление первых психодиагностических опросников связано с именем Ф. Гальтона, который использовал их не для изучения личностных качеств, а для оценки познавательной сферы человека (особенностей зрительного восприятия, умственных образов). В конце Х!Х в. с помощью метода опросников проводились исследования памяти (Бине, Куртье), общих понятий (Рибо), внутренней речи (Сен-Поль) и др. Напечатанные опросники обычно рассылались по адресам будущих респондентов, иногда их печатали в журналах.
Прототипом личностных опросников был разработанный американским психологом Робертом Вудвортсом в 1919 г. Бланк данных о личности. Опросник был предназначен для выявления, отсеивания с военной службы лиц с невротической симптоматикой. За прошедшие с того времени десятилетия опросники получили широчайшее распространение в качестве психодиагностического метода исследования личности.
8. Проективные техники. Ассоцианизм. Метод свободных словесных ассоциаций Ф. Гальтона. Психоанализ как теоретическая основа развития проективных методик
Родоначальником проективных техник считается метод словесных ассоциаций, возникший на базе ассоцианистских теорий. Ассоцианизм возник в XVIII в.
Впервые ассоциация превращается в универсальную категорию, объясняющую всю психическую деятельность, у английского врача Гартли (1705–1757). Согласно его теории, идеи связаны между собой в соответствии с порядком и связью материальных процессов, происходящих в нервной системе.
Также в XVIII в. развивался субъективно-идеалистический ассоцианизм в учениях Беркли и Юма. Согласно их представлениям, связь идей дана внутри самих элементов сознания и не требует никакой реальной основы.
Возникновение метода свободных словесных ассоциаций связано с именем Френсиса Гальтона
(1822–1911), который предлагал испытуемому отвечать на слово-раздражитель первой пришедшей в голову словесной ассоциацией. С помощью секундомера он фиксировал время ответа. Позднее эта методика получила развитие в исследованиях Э. Крепелина (1892), К. Юнга (1906), Г. Кента и А. Розанова (1910) и др.
Ассоциативный эксперимент стимулировал появление такой группы проективных методик, как «Завершение предложений». Впервые для изучения личности «завершение предложений» было использовано А. Пейном в 1928 г.
Одна из самых популярных проективных методик была разработана в 1921 г. швейцарским психиатром Германом Роршахом. Создавая эту методику, Роршах экспериментировал с большим количеством чернильных пятен, которые он предъявлял различным группам психически больных.
Тест тематической апперцепции – ТАТ. ТАТ был создан в 1935 г. X. Морган и Г. Мюрреем. Стимуль-ный материал ТАТ состоит из таблиц с изображениями неопределенных, допускающих неоднозначные толкования, ситуаций. Понятие проекции для обозначения подобных методик было впервые использовано Л. Франком в 1939 г.
Диагностика с помощью проективных методик занимает лидирующее положение в зарубежных исследованиях личности. Критические замечания в адрес этих методик сводятся к указаниям на их недостаточную стандартизацию, пренебрежение нормативными данными, неподатливость традиционным способам определения надежности и валидности.
9. Материалистическая основа в русской экспериментальной психологии. Труды И. М. Сеченова и И. П. Павлова. «Рефлексология» В. М. Бехтерева
Особенностью развития психологии в последней четверти XIX в. было внесение в нее экспериментальных методов исследования. Обычно в психологии период развития экспериментальных методов определяется работами Вундта и его школы. Между тем изучение истории русской психологии показывает, что и в ней развивались экспериментальные работы, причем шли преимущественно в материалистическом направлении. Этим отечественные исследования по экспериментальной психологии отличались от работ школы Вундта. В этой школе собственно психические явления предлагалось изучать при помощи самонаблюдения, а объективный экспериментальный метод прилагать только к физиологическим и низшим психическим процессам.
В противоположность вундтовской психологии многие экспериментальные исследования в русской психологии проводились под знаком материалистических идей. У истоков этого направления находились два величайших корифея науки – И. М. Сеченов (1829–1905) и И. П. Павлов (1849–1936).
В трудах Сеченова, начиная с 1863 г., последовательно формируется материалистическое понимание психической деятельности. Изучая материальный субстрат психических процессов – мозг, Сеченов предложил рефлекторную теорию психической деятельности. Продолжателем его дела был И. П. Павлов, создавший теорию условных рефлексов и проложивший путь от объективных исследований по функциональной физиологии центральной нервной системы к изучению материальных основ психических явлений. Взгляды Сеченова и Павлова оказали решающее воздействие на мировоззрение видного представителя естественно-научного направления в психологии В. М. Бехтерева. Вся рефлексология В. М. Бехтерева была реализацией рефлекторной теории Сеченова. Бехтерев стремился выявить связь психической деятельности с мозгом, с нервными процессами, называл психические процессы «невропсихикой». По его мнению, изучение психики не может быть ограничено одной ее субъективной стороной. Бехтерев утверждал, что «нет вообще ни одного сознательного или бессознательного процесса мысли, который не выражался бы рано или поздно объективными проявлениями» (Бехтерев В. М. Объективная психология и ее предмет// Вестник психологии. 1904. № 9-10. С. 730). Объективная психология должна пользоваться только объективным методом и характеризовать психический процесс только с его объективной стороны, утверждал он.
10. Первые в России лаборатории экспериментальной психологии
Первая в России экспериментальная психологическая лаборатория открылась в 1885 г. при клинике нервных и душевных болезней Харьковского университета; были устроены лаборатории опытной психологии в Петербурге, Дерпте. В 1895 г. по инициативе крупнейшего русского психиатра С. С. Корсакова была создана психологическая лаборатория при психиатрической клинике Московского университета. Заведовать ею стал ближайший помощник Корсакова – А. А. Токарский. Психологическая лаборатория в Новороссийском университете (в Одессе) была создана на историко-филологическом факультете профессором философии Н. Н. Ланге.
Во второй половине XIX в. в отечественную психологию был введен эксперимент. Первые отечественные работы по психологической диагностике выполнялись в первые десятилетия XX в.
Одна из первых значительных дореволюционных отечественных работ по психологическому тестированию была выполнена Г. И. Россолимо в 1909 г. в Московском университете. Он создал методику индивидуального психологического профиля, которая сводилась к определению 11 психических процессов, которые оценивались по десятибалльной системе. А. Ф. Лазурский создал новое направление в дифференциальной психологии – научную характерологию. Он стоял за создание научной теории индивидуальных различий. Основной целью дифференциальной психологии он считал «построение человека из его наклонностей», а также разработку возможно более полной естественной классификации характеров.
Он выступает за естественный эксперимент, при котором преднамеренное вмешательство исследователя в жизнь человека совмещается с естественной и сравнительно простой обстановкой опыта.
Важным в теории Лазурского было положение о теснейшей связи свойств характера с нервными процессами. Это было объяснение свойств личности нейроди-намикой корковых процессов. Научная характерология Лазурского строилась как опытная наука, опирающаяся на изучение нейродинамики корковых процессов. Не придавая вначале значения количественным методам оценки психических процессов, используя только качественные методы, он позднее ощутил недостаточность последних и попытался использовать графические схемы для определения способностей ребенка. Но работы в этом направлении были им не закончены, помешала кончина исследователя (1917).
11. Развитие психодиагностики и психотехники в советский период. «Измерительная шкала ума» А. П. Болтунова
Собственно психодиагностические работы в России начали развиваться в послереволюционный период. Много работ появилось в 1920-1930-е гг. в области педагогики, медицины, педологии.
«Измерительная шкала ума» Болтунова (1928), положившего в основу своей работы шкалу Бине-Симона, переведенную и адаптированную П. П. Соколовым, имеет специфические особенности: в ней модифицировано большинство заданий, введены совершенно новые задания, предложена новая инструкция, определено время решения тестовых заданий, разработаны показатели возрастных ступеней. Принципиальное отличие шкалы Болтунова от шкалы Бине-Симона состоит в возможности проводить групповые испытания.
Особое место в тестологических исследованиях занимают работы М. Ю. Сыркина, специально изучавшего проблему сопряженности показателей тестов одаренности и признаков социального положения (факт, установленный еще в первых работах Бине).
В 1920-е гг. в нашей стране значительное развитие получила психология труда и психотехника (труды И. Н. Шпильрейна, С. Г. Геллерштейна, Н. Д. Левитова, А. А. Толчинского и др.).
Во многих городах страны работали психотехнические лаборатории, готовились кадры психотехников, было создано Всесоюзное общество по психотехнике и прикладной психофизиологии, издавался журнал «Советская психотехника» (1928–1934), проводились психотехнические конференции и съезды.
Психотехника организационно оформляется к 1927–1928 гг. Ею много сделано в области поисков рациональных методов психотехнического и профессионального обучения, организации трудового процесса, формирования профессиональных навыков и умений.
Вместе с тем психотехника подвергалась критике, в особенности за формальное использование некоторых теоретически необоснованных тестов. Результатом этого стало прекращение работ по психотехнике к середине 1930-х гг.
В начале 1930-х гг. началась принципиальная критика многих положений педологии, завершившаяся постановлением ЦК ВКП(б) от 4 июля 1936 г. «О педологических извращениях в системе наркомпросов».
Развернувшаяся в этот период резкая критика педологии сопровождалась отрицанием всего положительного, что было сделано учеными, так или иначе связанными с педологией, в области психологии и психологической диагностики.
12. Операционализация и верификация – основные требования, предъявляемые к понятиям и методам психодиагностики
Признание права на существование новых научных понятий и соответствующих им явлений идет рука об руку с разработкой пригодных для их изучения психодиагностических средств. В начале XX в. в психологии были официально признаны и приняты требования к понятиям и методам исследования, предъявляемые наиболее развитыми современными науками. Это позволило психологии как науке развиваться дальше. Это требования операционализации и верификации.
Операционализация понимается как требование, согласно которому, при введении новых научных понятий обязательно необходимо четко указывать на конкретные процедуры, приемы и методы, с помощью которых можно практически удостовериться в том, что явление, описанное в понятии, действительно существует. Предполагает указание на практические действия или операции, которые может выполнить любой исследователь, чтобы убедиться в том, что определенное в понятии явление обладает именно теми свойствами, которые ему приписываются.
Требование верификации означает, что всякое новое понятие, вводимое в научный оборот и претендующее на получение статуса научного, обязательно должно пройти проверку на его непустоту. Последнее предполагает наличие методики экспериментальной диагностики того явления, которое описано в данном понятии. Слово «верификация» буквально обозначает «проверка». Эта проверка непустоты понятия, т. е. реальности существования явления, определяемого этим понятием; должна быть осуществлена при помощи соответствующей психодиагностической процедуры.
Если, например, мы вводим в научный оборот понятие «мотив», то сначала необходимо дать точное определение этого понятия через известные другие понятия и доступные способы диагностики явлений, входящих в содержание данного понятия операционализация). На следующем этапе операционализации понятия «мотив» мы обязаны были бы предложить психодиагностическую методику, с помощью которой можно было бы удостовериться в том, что то, что утверждается в определяющейся части данного понятия, действительно существует. На заключительном этапе мы должны были бы осуществить практическую проверку существования явления «мотив» во всех приписанных ему в определении свойствах. Таким образом, как операционализация, так и верификация понятий требуют обращения к психодиагностике, но только операционализация предполагает теоретический, а верификация – практический шаг на этом пути.
13. Бланковые, опросные, рисуночные и проективные психодиагностические методики
Бланковые методики – такие, в которых испытуемому предлагают серию суждений или вопросов, на которые он должен в устной или письменной форме дать ответ. По полученным ответам испытуемого в свою очередь судят о психологии того человека, который эти ответы предложил.
Опросные методики – такие методики, в процессе применения которых исследователь психологии человека задает испытуемому устные вопросы, отмечает и обрабатывает его ответы.
Эти методики хороши тем, что не требуют подготовки специальных бланков и позволяют психодиагносту вести себя в отношении испытуемого достаточно гибко. Недостатком опросных методик является субъективность, которая проявляется как в выборе самих вопросов, так и в интерпретации ответов на них. Кроме того, опросные методики трудно стандартизировать и, следовательно, добиться высокой надежности и сравнимости получаемых результатов.
Рисуночные психодиагностические методики – те методики, в которых для изучения психологии и поведения испытуемых используются созданные ими рисунки. Применяется прием интерпретации испытуемыми стандартных, готовых изображений. В содержании этих изображений в наглядной форме представлены задачи, которые испытуемый должен решить (например, матричный тест Равена).
Первый и третий из описанных типов методик могут иметь два варианта: ручной и компьютерный. При ручном варианте методика используется без применения средств электронно-вычислительной техники для презентации или обработки экспериментального материала. В компьютерном варианте на одном из указанных этапов психодиагностики применяется электронно-вычислительная техника. Например, текстовый и рисуночный материал можно предъявлять испытуемым через экран дисплея, а процессор машины использовать для производства количественных вычислений, вывода на печать получаемых результатов.
Проективные методики, в свою очередь могут быть бланковыми, опросными и рисуночными. Частота их практического использования также достаточно велика и из года в год возрастает по той причине, что методики этой группы наиболее валидные и информативные.
Следующая группа методик – объективно-манипуляционные. В них решаемые испытуемыми задачи предлагаются им в форме реальных предметов, с которыми предстоит что-нибудь сделать: собрать из данных материалов, изготовить, разобрать и т. п.
14. Общие критерии классификации психодиагностических методик. Понятие о научных и практических методиках
Критерии, в соответствии с которыми различные методы психодиагностики делятся на частные группы.
По типу применяемых тестовых заданий методики делятся на опросные (вопросы, адресуемые испытуемым), утверждающие (суждения или утверждения, с которыми испытуемый должен выразить свое согласие или несогласие), продуктивные (вид собственной творческой продукции испытуемого), действенные (комплекс практических действий), физиологические (анализ физиологических реакций организма человека).
По адресату тестового материала психодиагностические методики делятся на сознательные и бессознательные.
По форме представления тестового материала испытуемым методики делятся на бланковые (тестовый материал в письменной или какой-либо иной знаковой форме), технические (тестовый материал в аудио-, видео-или киноформе), сенсорные (материал в виде физических стимулов).
По характеру данных, используемых для психодиагностических выводов, методики подразделяются на объективные (показатели, не зависящие от желания испытуемого или экспериментатора) и субъективные (данные, зависящие от их желания).
По критерию наличия тестовых норм психодиагностические методики делятся на имеющие подобные нормы и не располагающие ими .
По внутренней структуре психодиагностические методики можно разделить на мономерные и многомерные. Первые характеризуются тем, что в них оценивается одно свойство, а вторые – тем, что предназначены для психодиагностики нескольких однотипных или разнотипных психологических качеств человека. Многомерные подразделяются на несколько частных методик – подшкалы, оценивающие отдельные психологические качества.
В отдельную группу выделяются психодиагностические методики, основанные на качественном и количественном анализе экспериментальных данных. В первом случае диагностируемое свойство описывается в научных понятиях, а во втором случае – через относительную степень его развития у данного человека по сравнению с другими людьми.
Все методы психодиагностики можно также разделить на научные и практические, хотя такое деление условно: большинство известных психодиагностических методик используется как в практической психодиагностике, так и в научно-исследовательском экспериментировании.
15. Ограничения, достоинства и недостатки различных типов психодиагностических методик
Существование множества психодиагностических методик объясняется тем, что практически все методики имеют ограничения в применении.
Рассмотрим в этой связи достоинства и недостатки некоторых типов методик.
Достоинство методик, обращенных к сознанию, заключается в том, что они позволяют судить о психологии человека непосредственно на основе того, что говорит он о себе или окружающие люди о нем. Сознательное субъективное искажение результатов тестирования – один из самых серьезных недостатков данной группы методик.
Преимущество объективных методик, опирающихся не на словесные ответы, самохарактеристики или самооценки, а на независящие от сознания человека непроизвольные действия и реакции, а также продукты его деятельности, заключается в том, что они позволяют избежать субъективности. Но объективные показатели не всегда отражают своими изменениями именно те психологические свойства, для оценивания которых они предназначаются. Для показателей подобного рода трудно разработать тонкую измерительную шкалу, позволяющую выявлять различные степени проявления диагностируемого качества и дифференцированно их оценивать.
Проективные методики имеют одно весьма существенное достоинство: они валидны и относительно надежны при высоком уровне профессиональной подготовки пользователя. Они менее субъективны и малоподвержены случайным, ситуативным влияниям.
Их недостаток – трудоемкость и значительные временные затраты.
Методики, позволяющие получать количественные данные, отражающие степень развитости изучаемого свойства, дают возможность использовать меры и методы количественной обработки результатов психодиагностики. Но с помощью таких методик невозможно отличить друг от друга качественно различные психологические свойства, имеющие одинаковые количественные показатели. Если с помощью Д. Маккелеланда, Дж. Аткинсона оценивают силу мотивации достижения успехов, то, получив те или иные показатели, невозможно судить о том, является ли мотивация достижения успехов различной у тех испытуемых, которые имеют количественно одинаковые данные. А между тем она может быть качественно различной. X. Хекхаузен показал, что в общем показателе силы мотивации достижения успехов по Д. Маккелеланду и другим на самом деле скрываются два качественно различных мотива: мотив – стремление к успехам и мотив – стремление избежать неудачи.
16. Достоинства метода тестов
Метод тестов является одним из основных в современной психодиагностике.
Под тестами следует понимать методики, которые состоят из серии заданий с выбором из готовых вариантов ответа. При подсчете баллов по тесту выбранные ответы получают однозначную количественную интерпретацию и суммируются. Суммарный балл сравнивается с количественными тестовыми нормами, и после этого сравнения формулируются стандартные диагностические заключения.
Популярность метода тестов объясняется следующими главными его достоинствами.
1. Стандартизация условий и результатов. Тестовые методики относительно независимы от квалификации исполнителя.
2. Оперативность и экономичность. Тест состоит из серии кратких заданий, на выполнение каждого из которых требуется полминуты, а весь тест занимает не более часа. Тестированию одновременно подвергается сразу группа испытуемых.
3. Количественный дифференцированный характер оценки. Дробность шкалы и стандартизованность теста позволяют рассматривать его как «измерительный инструмент», дающий количественную оценку измеряемым свойствам.
4. Оптимальная трудность. Профессионально сделанный тест состоит из заданий оптимальной трудности. При этом средний испытуемый набирает примерно 50 % из максимально возможного количества баллов.
5. Надежность. Любой грамотно построенный тест охватывает основные разделы учебной тестируемой области знаний или проявления какого-то умения или способности.
6. Справедливость. Ее следует понимать как защищенность от предвзятости экзаменатора.
7. Возможность компьютеризации. Компьютеризация – это мощный инструмент обеспечения информационной безопасности (достоверности диагностики).
Во многих странах внедрение метода тестов (равно как и сопротивление этому внедрению) тесно связано с социально-политическими обстоятельствами. Внедрение хорошо технически оснащенных тестовых служб в образование – важнейший инструмент в борьбе с коррупцией. На Западе тестовые службы работают независимо от «выпускающих» (школы) и «принимающих» (вузы) организаций и снабжают абитуриента независимым сертификатом о результатах тестирования, с которым он может отправляться в любое учреждение. Эта независимость службы тестирования от выпускающих и принимающих организаций является дополнительным фактором демократизации процесса селекции профессиональных кадров в обществе, дающая талантливому и просто работоспособному человеку дополнительный шанс проявить себя.
17. Недостатки метода тестов
Метод тестов обладает некоторыми весьма серьезными недостатками, не позволяющими свести всю диагностику способностей и знаний исключительно к тестированию.
1. Опасность «слепых» (автоматических) ошибок. Пользователь не должен подходить к тесту с «магической установкой», будто этот волшебный «черный ящик» должен всегда работать исправно без всякого контроля со стороны человека.
2. Опасность профанации. Профаны от тестирования агрессивно предлагают свои услуги всем и вся. Все проблемы предполагается решать с помощью 2–3 тестов – «на все случаи жизни».
3. Потеря индивидуального подхода, «стрессогенность». Тест – самая общая «гребенка», под которую подгоняют всех людей. Возможность упустить яркую индивидуальность нестандартного человека, к сожалению, довольно вероятна.
4. Потеря индивидуального подхода, «репродуктивность». Тесты знаний апеллируют прежде всего к стандартному применению готовых знаний.
5. Отсутствие возможности раскрыть индивидуальность при наличии стандартных, заданных ответов – ничем не восполнимый недостаток метода тестов. С точки зрения выявления творческого потенциала большинство тестов ограничены именно тем, что они не апеллируют к творческой, конструктивной деятельности.
6. Отсутствие доверительной обстановки. Бездушный и формализованный характер самой процедуры тестирования оборачивается тем, что испытуемый лишается ощущения того, что психолог заинтересован в нем лично, в том, чтобы помочь в его проблемах и трудностях.
7. Потеря индивидуального подхода, неадекватная сложность. Иногда неквалифицированные тестологи обрушивают на ребенка тесты, слишком сложные для него по возрасту. У него еще не сложились необходимые понятия и понятийные навыки, чтобы адекватно осмыслить как общую инструкцию к тесту, так и смысл отдельных вопросов.
Тесты нельзя делать единственным методом диагностики (и образовательно-профессиональной, и личностной) – они требуют параллельного использования свободных письменных работ (в личностной диагностике место сочинений занимают проективные тесты со свободным ответом), а также устного собеседования (интервью). Задача тестов – дополнять указанные выше традиционные методы. В этом качестве тесты незаменимы, так как не имеют многих недостатков, свойственных традиционным методам.
Спокойное осознание достоинств и недостатков метода тестирования освобождает всех как от чрезмерных упований на метод тестов, так и от пренебрежения к ним.
18. Надежность психодиагностических методик. Стандартная ошибка измерения. Понятие о методе измерения ретестовой надежности
Надежность – одно из трех главных психометрических свойств любой измерительной психодиагностической методики (теста).
Надежность – это помехоустойчивость теста, независимость его результата от действия всевозможных случайных факторов:
а) разнообразие внешних материальных условий тестирования, меняющихся от одного испытуемого к другому;
б) динамичные внутренние факторы, по-разному действующие на разных испытуемых в ходе тестирования;
в) информационно-социальные обстоятельства. Разнообразие и изменчивость этих факторов так велики, что они обусловливают появление у каждого испытуемого непрогнозируемого по размерам и направлению отклонения измеренного тестового балла от истинного тестового балла (который можно было бы, в принципе, получать в идеальных условиях). Величина этого отклонения определяется как «стандартная ошибка измерения» (Se).
Ошибка измерения (Se) и надежность измерения (R), согласно общепринятой психометрической теории, связаны следующей формулой:
R = 1 – Se2 / Sx2, (1)
где Sx – дисперсия тестовых показателей Х.
Метод измерения «ретестовой надежности».
На одной и той же выборке испытуемых проводят пер1вое тестирование Х, а затем повторное тестирование Y. Интервал – две недели. Затем для двух рядов значений Х и Y подсчитывает-ся линейный коэффициент корреляции, или ранговый коэффициент корреляции:
где Sx, Sy – стандартные отклонения X и Y;
Cov (X, Y) – ковариация двух переменных X и Y Для сути теории надежности методов важна возможность определить ошибку измерения, после того как подсчитана корреляция «тест-ретест» по формуле (3), полученной путем простого преобразования формулы (1):
Se = Sx x V1 – R. (3)
Таким образом, если стандартное отклонение в тесте составило 10 очков, а корреляция «тест-ретест» оказалась равной лишь 0,5, то ошибка измерения оказывается очень большой:
Se = 10 x V1 – 0,5 ~ 7,1.
Надежность – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. Надежность и валидность являются важнейшими характеристиками методики как инструмента исследования. Общий разброс (дисперсию) результатов тестового обследования можно представить как результат влияния двух групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измерительной процедуры.
19. Стандартизация процедуры обследования. Взаимосвязь надежности и валидности. Надежность параллельных форм
Важнейшим средством повышения надежности психодиагностических методик является стандартизация процедуры обследования. При строгой регламентации процедуры обследования существенно уменьшается дисперсия ошибки и повышается надежность теста.
Надежность – устойчивость процедуры относительно объектов исследования.
Валидность – однозначность, устойчивость относительно измеряемых свойств объекта. Устойчивость теста относительно объектов является необходимым, но недостаточным условием его устойчивости относительно измеряемых свойств объектов. Следовательно, надежность является необходимым, но недостаточным условием валидности. Это означает, что валидность теста не может качественно и количественно превышать надежность.
Надежность параллельных форм – характеристика надежности психодиагностической методики с помощью взаимозаменяемых форм теста. При этом одни и те же испытуемые в выборке определения надежности обследуются вначале с использованием основного набора заданий, а затем – с применением аналогичных дополнительных наборов. Коэффициент надежности по типу надежности параллельных форм может быть определен так: испытуемые делятся примерно на равные группы, затем одной из них предлагается форма А теста, а другой – форма Б. Через определенное время проводится повторное тестирование, но в обратном порядке.
Такая процедура обследования лишена значительной части недостатков способа определения надежности ретестовой. Основным показателем надежности параллельных форм является коэффициент корреляции между результатами первичного и повторного обследований, который позволяет оценить как временную стабильность теста, так и степень соответствия результатов обеих форм теста.
Отношения между параллельными формами теста имеет сложный характер. Оба набора заданий должны не только отвечать одним и тем же требованиям, измеряя идентичные показатели и давая сходные результаты, но вместе с тем быть относительно независимыми друг от друга. На практике эта задача осуществима далеко не для всех тестовых заданий (в особенности это касается личностных методик, опросников), что существенно ограничивает сферу применения надежности параллельных форм. Другим недостатком характеристики надежности по типу надежности параллельных форм является возможность усвоения испытуемым принципа решения, общего для основной и параллельной форм.
20. Надежность частей теста. Уравнение Спирмена-Брауна. Определение коэффициента надежности с помощью формул Фланагана и Рюлона
Надежность частей теста – характеристика надежности психодиагностической методики, получаемая путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных пунктов (заданий) теста. Наиболее простым и распространенным способом определения надежности частей теста является метод расщепления, суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста.
Разделение объема заданий теста на сопоставимые части достигается:
а) распределением заданий на четные и нечетные (в том случае, если задания в тесте строго ранжированы по степени субъективной трудности);
б) распределением пунктов по принципу близости или равенства значений индексов трудности. Такой принцип разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на все пункты;
в) распределением задач по времени решения каждой из частей (для тестов скорости).
Для испытуемых в выборке определения надежности вычисляются оценки успешности решений, среднеквад-ратические отклонения первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов.
Уравнение Спирмена-Брауна отражает влияние изменения количества заданий на коэффициент надежности теста:
rt = nr't / 1 + (n – 1) r't,
где rt – коэффициент надежности для полного объема заданий;
r't – его значение после изменения числа заданий;
n – отношение нового числа заданий к первоначальному (если число заданий полного теста – 100, а его части, полученной методом расщепления на половины, – 50, то n = 0,5). Отсюда для полного теста:
rt = 2r't / 1 + r't.
Приведенные формулы справедливы для случаев равных стандартных отклонений обеих половин теста (σxl = σх2). Если (σxl отличается от (σх2, для определения коэффициента надежности применяется формула Фланагана:
rt = 4σxlσх2r't / σxl+ σх2+ 2σxlσх2r't.
При определении rt целого теста можно воспользоваться формулой Рюлона:
rt = 1 −σ2Δ/ σ2x,
где σ2Δ – дисперсия разностей между результатами каждого испытуемого по двум половинам теста;
σ2x – дисперсия суммарных результатов. В данном случае коэффициент надежности рассчитывается как доля «истинной» дисперсии результатов теста.
Характеристика надежности по типу надежности частей теста имеет серьезные преимущества по сравнению с надежностью ретестовой и надежностью параллельных форм главным образом благодаря отсутствию необходимости в повторном обследовании.
21. Определения валидности. Важнейшие составляющие валидности
Валидность (англ. valid – «действительный, пригодный, имеющий силу») – комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.
В психодиагностике валидность – обязательная и наиболее важная часть сведений о методике, включающая данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретические ожидания, наблюдение, экспертные оценки, результаты других методик, достоверность которых установлена и т. д.), связь изучаемой области поведения или особенности личности с определенными психологическими конструктами.
Важнейшая составляющая валидности – определение области изучаемых свойств – имеет принципиальное теоретическое и практическое значение при выборе методики исследования и интерпретации ее данных.
В большей степени достоверность данных теста определяется набором измеряемых свойств. Различные категории этих сведений и способы их получения образуют типы валидности .
Диагностическая (конкурентная) валидность отражает способность теста дифференцировать испытуемых по изучаемому признаку. Сведения, характеризующие степени обоснованности и статистической надежности развития исследуемой психологической особенности в будущем, составляют прогностическую валидность методики.
Два этих типа валидности нередко объединяют в понятие эмпирической валидности. Здесь подчеркивается общность подхода к их определению, который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параметру, избранному в качестве валидизации критерия (см. валидности критериальная). Критерий валидности выступает в качестве меры, показателя исследуемых психологических особенностей.
Подтверждение гипотез свидетельствует о теоретической обоснованности методики, т. е. о степени ее конструктной валидности. Этот тип валидности является наиболее сложным и комплексным.
Валидность содержательная (внутренняя, логическая) – комплекс сведений о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям.
Наряду с перечисленными основными типами валид-ности (содержательной, критериальной и конструктной) на практике выделяют факторную, перекрестную (конвергентную) и дискриминантную валидности.
22. Основные типы валидности. Понятие «комплекса валидности». Обоснование необходимости периодической валидизации психодиагностических методик
Классификация типов валидности в достаточной мере условна, так как нередко для различных критериев валидности применяются общие методы определения, а с другой стороны, одни и те же исходные данные могут интерпретироваться с точки зрения различных типов валидности.
Классификация типов валидности:
1) конструктная;
2) дифференциальная;
3) конвергентная;
4) дискриминативная (дискриминантная);
5) факторная;
6) валидность по возрастной дифференциации;
7) критериальная;
8) диагностическая (конкурентная);
9) текущая;
10) прогностическая;
11) инкрементная;
12) синтетическая;
13) ретроспективная;
14) эмпирическая;
15) содержательная;
16) лицевая (очевидная). Другие виды валидности:
1) иллюзорная;
2) экологическая.
В психологической диагностике не существует универсального подхода к характеристике валидности.
Для валидизации каждого вида психодиагностических процедур и отдельных тестов могут применяться различные типы валидности. Сведения, входящие в комплекс валидности, можно оценить качественно и количественно (при помощи коэффициента валид-ности), нередко их можно описать. Однако в силу сложности, комплексности, ситуативности по отношению к конкретным условиям применения методики валидность в целом невозможно измерить, о ней можно лишь судить.
Реальная валидность раскрывается только в результате накопления значительного опыта работы с тестами. Получение новых, расширенных данных о валидности может радикально изменить представление о сфере применения и эффективности методики. Некоторые методики, разработанные для диагностики вербальных факторов интеллекта, с достаточной валидностью отражают лишь уровень осведомленности. Сфера применения теста в ходе его длительной валидизации может быть, напротив, расширена. В качестве примера можно привести прогрессивные матрицы Равена, которые оказались в значительной степени насыщены фактором, общим для тестов интеллекта. Реальная валидность ряда психодиагностических методик, особенно тестов интеллекта, достижений в обучении, профессиональной пригодности, личностных опросников, изменяется со временем. Это объясняется устареванием возрастных статистических норм, изменением социальных норм и образцов поведения, методов обучения и содержания заданий, требований к профессиям. Данное обстоятельство создает необходимость периодического контроля валидности методик.
23. Конструктная валидность. Конвергентная и дискриминантная валидности
Конструктная валидность – один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вербальный интеллект, эмоциональная неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Конструктная валидность определяет область теоретической структуры психологических явлений, измеряемых тестом.
Среди конкретных методов характеристики конст-руктной валидности в первую очередь необходимо назвать сопоставление исследуемого на предмет конструктной валидности теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по конструкту тестом указывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведения, способность, личностное качество, что и эталонная методика.
В отличие от критериальной валидизации при анализе конструктной валидности не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию, результатам и разрабатываемая методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с точки зрения создания параллельной формы теста.
Смысл процедуры конструктной валидности состоит в установлении одновременно как сходства, так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным.
Конвергентная и дискриминантная валидности. При анализе конструктной валидности методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с другими тестами, направленными на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми. При этом конструктная валидность характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная (проверка степени близости прямой или обратной связи) и дискриминантная (установление отсутствия связи) валидизации. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений конструктной валидности. В англоязычной психодиагностике такое операциональное определение конструктной валидности обозначается как «предполагаемая валидность» (assumed validity).
24. Факторная валидность
Факторная валидность. Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы сопоставляемых тестов факторы, степень их представленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид конструктной валидности – факторную валидность.
Важным аспектом конструктной валидности является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста.
При определении конструктной валидности важное место принадлежит изучению динамики измеряемого конструкта. При этом мы можем опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов является применение критерия возрастной дифференциации, что предусматривает согласование результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство в возрастной динамике при переходе на новый этап развития. Этот метод конструктной валидности особенно важен для валидизации тестов интеллекта, достижений в обучении.
В комплекс сведений о конструктной валидности методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, несут информацию, позволяющую раскрыть область поведения, качества, представленные в тесте в виде конструкта. Для характеристики конструктной валидно-сти необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако конструктная валидность является качественно более высоким и комплексным уровнем описания теста, характеризуя область измеряемого поведения в широких психологических понятиях. Благодаря данным конструктной валидности мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.
25. Дифференциальная валидность. Валидность по возрастной дифференциации
Дифференциальная валидность – вид конструктной валидности, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической методики. Содержание дифференциальной валидно-сти может быть проиллюстрировано на примере тестов интересов, которые в своем большинстве обычно умеренно коррелируют с показателями общей академической успеваемости, однако в различной степени связаны с успеваемостью по отдельным дисциплинам. Дифференциальная валидность особенно важна как показатель диагностической ценности методик, используемых в профотборе.
Валидность по возрастной дифференциации – один из компонентов конструктной валидности, связанный с возрастной динамикой изменений исследуемого качества. Характеристика валидности по конструкту здесь заключается в определении соответствия результатов теста теоретически ожидаемым и практически наблюдаемым возрастным изменениям данного конструкта или свойства.
Наибольшее значение валидность по возрастной дифференциации имеет для характеристики валидности тестов, направленных на измерение психологических свойств, функций, отличающихся быстрым изменением под воздействием индивидуального опыта, выраженной иерархичностью ступеней развития (осведомленность, навыки). Закономерное повышение результатов выполнения заданий теста в каждой последующей возрастной группе является основным психометрическим принципом диагностики уровня развития, базой для построения психометрической шкалы. Прослеживается связь валидности по возрастной дифференциации с текущей валидностъю за счет более точной дифференциации возрастных этапов развития исследуемых свойств. Большое значение валидность по возрастной дифференциации имеет для характеристики валидности тестов способностей, достижений, уровня образования, навыков, умений. Высокие показатели по этому критерию необходимы также для методик, применяемых в клинике в целях повышения точности дифференцированной диагностики изменений возрастного и патологического характера, психодиагностического обследования лиц пожилого и преклонного возраста.
Иногда валидность по возрастной дифференциации обнаруживает связь с прогностической валидностью методик. Наличие высоких показателей по этому критерию означает стабильное изменение исследуемых свойств в большой статистической выборке при переходе от одной возрастной группы к другой, повышает точность индивидуального прогноза.
26. Критериальная валидность
Критериальная валидность – комплекс характеристик, включающий текущую и прогностическую валидности методики и отражающий соответствие диагноза и прогноза определенному кругу критериев измеряемого явления. В качестве критерия валидиза-ции выступают независимые от результатов теста и непосредственные меры исследуемого качества, такие как уровень достижений в какой-либо деятельности, выраженность определенного свойства личности. Критериальная валидность может быть определена на основании сопоставления результатов теста с экспертными оценками хорошо знающих обследуемого лиц, с результатами наблюдения за проявлением этой особенности в его поведении, с объективными сведениями о круге общения.
Критериальная валидность включает как комплекс связей с текущим состоянием изучаемого явления, так и вероятность, обоснованность прогноза о его состоянии в будущем. Здесь в рамках критериальной валидности различаются текущая (диагностическая, конкурентная) и прогностическая валидности. В случае характеристики текущей критериальной валидности изучение корреляции результатов теста с независимыми критериями проводится параллельно с измерением. Показатели текущей критериальной валидности указывают на степень репрезентации характеристик изучаемого психического явления в результате теста.
Предсказательная критериальная валидность может отражать как соответствие прогноза, сделанного на основании данного теста, реальному состоянию измеряемого качества спустя некоторое время, так и временной интервал, в котором результат теста является валидным.
Валидизация по какому-либо критерию эффективно осуществляется методом контрастных групп. При этом, как правило, используют сложный критерий, в котором отражено комплексное влияние различных факторов. Например, при характеристике критериальной валидности теста интеллекта показатели умственно отсталых детей могут быть сопоставлены с показателями нормальных школьников того же возраста. Множество факторов, обусловивших помещение ребенка в специальное учреждение для детей с глубокой умственной отсталостью, составят критерий валидизации. Аналогично критериальной валид-ности личностного опросника, предназначенного для выявления «уровня невротизации», определяется критерий валидизации на основе сравнения его результатов у пациентов, страдающих неврозами, и практически здоровых людей. Такой критерий в силу его обобщенности, интегративности приближает критериальную ва-лидность к области конструктной валидности.
27. Синтетическая и инкрементная валидности
Синтетическая валидность. Более эффективным с точки зрения практической направленности теста (его адекватности как средства диагноза и прогноза реальной деятельности) является соотнесение результатов с критериальными мерами определенных существенных элементов изучаемой деятельности или способности. Тест для определения профессиональных способностей конторского служащего может включать анализ грамотности письма, счетных способностей, комбинаторного мышления. Процесс валидизации в данном случае складывается из детального анализа тестируемой деятельности для выявления ее существенных составных элементов, определения удельного веса элементов в составе сложной деятельности; определения связи с критериями по каждому из выделенных элементов деятельности; определения валидности теста путем «синтеза весов» отдельных элементов в реальной деятельности и в тесте.
Валидизация теста может осуществляться на основе критерия, отражающего событие или состояние качества в прошлом (ретроспективная валидизация). Сведения такого рода, как правило, являются дополнительными и применяются в случаях невозможности валидизировать тест по текущему или перспективному критерию. Одним из видов критериальной валидности является валидность инкрементная.
Инкрементная валидность – (англ. incremental – «приращение, прибыль») – один из компонентов критериальной валидности, прогностической валидности теста, отражающий практическую ценность методики при проведении отбора. Инкрементная валидность может быть выражена количественно при помощи коэффициента валидности.
Показатель инкрементной валидности указывает на роль теста в улучшении отбора лиц для реальной деятельности, степень улучшения результативности процедуры отбора по сравнению с традиционной, основанной на анализе объективных сведений, документов, бесед, приеме с испытательным сроком.
Инкрементная валидность рассчитывается в зависимости от значений индекса отбора (доля поступивших по отношению к числу претендентов), коэффициента валидности теста, базового уровня (отношения между лицами, справляющимися с критериальной деятельностью, и случайной выборкой лиц). При уменьшении индекса отбора значение коэффициента инкрементной валидности значительно повышается при условии, что используемый тест обладает высокой валидностью. Определение величины коэффициента инкрементной валидности производится с помощью специальных таблиц (Анастази А., 1982).
28. Текущая и эмпирическая валидности
Текущая валидность (диагностическая, конкурентная) – характеристика теста, отражающая его способность различать испытуемых на основании диагностического признака, являющегося объектом исследования в данной методике. В более узком значении текущая валидность – установление соответствия результатов валидизируемого теста независимому критерию, отражающему состояние исследуемого тестом качества в момент проведения исследования.
Вместе с прогностической валидностью текущая валидность входит в комплекс сведений критериальной валидности методики. Основной процедурой определения текущей валидности является корреляционный анализ связи результатов теста с критериальными характеристиками исследуемого свойства. Распространенным способом характеристики диагностической эффективности методики является сравнение контрастных групп. Текущая валидность может определяться на основании сопоставления оценок, заключений по валидизируемому тесту с результатами другой методики, валидность которой является установленной.
Своеобразным показателем текущей валидности является комплекс сведений о том, насколько удобен, экономичен тест по сравнению с получением информации об исследуемом качестве из других источников (наблюдение, анализ объективных данных, экспертная оценка). Критерий текущей валидности является одним из ведущих при характеристике валидности любой психодиагностической методики. Однако наиболее высоким требованиям текущей валидности должны отвечать клинические тесты, служащие для уточнения дифференциального диагноза, скрининговые методики, тесты достижений, психометрические тесты интеллекта и ряд других.
Валидность эмпирическая – совокупность характеристик валидности теста, полученных сравнительным статистическим способом оценивания. Имеет отношение главным образом к области критериальной валидности и двум ее видам: валидности текущей и валидности прогностической.
Если при определении содержательной валидности оценка теста проводится с помощью различных качественных процедур получения информации описательными методами с использованием экспертных оценок и других источников информации, то эмпирическая валидность измеряется всегда с помощью статистического коррелирования. Проводится корреляционный анализ связи двух рядов значений – оценок теста и показателей по внешнему параметру изучаемого свойства. Конкретные процедуры определения эмпирической валидности связаны с комплексом коэффициентов валидности.
29. Прогностическая валидность
Прогностическая валидность – информация о том, с какой степенью точности и обоснованности методика (тест) позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность отражает временной интервал, на который распространяется обоснование такого суждения.
В стандартных требованиях к педагогическим и психологическим тестам различают прогностическую валидность и валидность текущую, в зависимости от временной связи между критерием и тестом. Оба вида относятся к критериальной валидности теста. Иногда говорят о предсказательной валидности. Термин «предсказание», по мнению А. Анастази (1982), может использоваться как в широком смысле, означая прогноз на основе данных тестирования поведения испытуемого в реальной (критериальной) ситуации, так, в более узком смысле, указывая лишь на временной интервал. В последнем смысле он и используется в прогностической валидности. Характеристика прогностической валидности определяет отрезок времени, для которого задается или проверяется связь с критерием исследуемых качеств.
Иногда текущая валидность заменяет прогностическую валидность. Часто невыгодно затягивать валидизацию, изучая отдаленные критериальные меры тестируемого свойства в обследуемой выборке валидизации. В качестве компромиссного решения для ускорения процедуры валидизации тест может быть проведен в группе, для которой уже имеются критериальные данные.
Для быстрого получения сведений о предсказательных возможностях можно воспользоваться ретроспективной валидизацией. Так, для проверки того, в какой мере хорошие результаты теста способностей соответствуют быстрому обучению в какой-либо области, можно сопоставить критериальные оценки (успеваемость, ретроспективные экспертные заключения и т. д.) за период обследования и в текущий момент у лиц с высокими и низкими оценками по тесту.
Одним из наиболее надежных способов получения сведений о прогностических возможностях результата теста является метод «когорт». Следует проверить, насколько результат теста, предназначенного для изучения некоторых аспектов эмоциональных состояний у больных, предсказателен в отношении вероятности возникновения психосоматических заболеваний, позволяет ли определенный результат по этому тесту судить о повышенном риске подвергнуться таким расстройствам. Учитывая вероятный объем экстремальных (контрастных) групп, выборка должна быть достаточно большой.
30. Содержательная валидность. Этапы валидизации
Содержательная валидность – один из основных типов валидности методики, характеризующий степень репрезентативности содержания заданий теста измеряемой области психических свойств.
Комплекс сведений содержательной валидности традиционно имеет наибольшее значение для тестов, исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной или профессиональной). Валидность по содержанию закладывается в тест уже при подборе заданий будущей методики. Первым этапом валидизации является определение круга исследуемых свойств, видов деятельности, расчленение сложной способности или деятельности на элементы. На втором этапе разрабатывают собственно модель тестовой деятельности на основе наиболее важных элементов реальной деятельности. Наконец, на последнем этапе проводят анализ степени соответствия разработанной модели реальной деятельности, проверку соответствия пропорций представленности элементов в заданиях теста и в реальной деятельности.
Экспертная оценка адекватности содержания заданий теста может быть дополнена при характеристике содержательной валидности рядом эмпирических процедур. Роль этого критерия при оценке содержательной валидности заключается не в верификации конструкта, лежащего в основе теста, а лишь в анализе гипотез, приведших к выбору того или иного материала для теста.
Наряду с тестами достижений содержательная валидность является одной из важнейших форм валидизации критериально-ориентированных тестов, а также методик, предназначенных для профотбора, анализа успешности овладения профессией. Для валидизации личностных опросников и тестов интеллекта критерии содержательной валидности имеют ограниченное применение и используются лишь на начальных стадиях составления теста. Личностные опросники не имеют того сходства с исследуемой областью поведения, как это имеет место в случае тестов достижений. Ответы на вопросы анкеты, опросника, данные проективных исследований позволяют лишь косвенно судить о реальной деятельности испытуемого. Проявление личностных свойств и реализация способностей в деятельности могут носить индивидуальный характер.
При проведении теста интеллекта эффективное решение заданий может достигаться за счет логического мышления, механической памяти, психомоторной подвижности. Опросники личностные и тесты интеллекта прямо не связаны с конкретным курсом обучения или общностью предшествовавшего жизненного опыта, на которых строится содержание тестов достижений.
31. Очевидная, экологическая, иллюзорная (ложная) валидности
Очевидная валидность – представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях методики. Высокая очевидная валидность является весьма желательной. Она выступает в качестве фактора, побуждающего испытуемых к обследованию, способствует более серьезному и ответственному отношению к работе по выполнению заданий теста и к заключениям, формулируемым психологом.
Очевидная валидность улучшает применение понятных формулировок и терминов, также заданий, по содержанию являющихся наиболее естественными с учетом возрастной, половой, профессиональной специфики испытуемых. Очевидная валидность иногда носит название внешней (face validity), «доверительной» (faith validity), валидности.
Экологическая валидность – валидность теста по отношению к измеряемому свойству в контексте определенной ситуации. Экологическая валидность является свойством теста, проявляющимся в том, что его применение при решении различных практических задач ведет к качественно различной интерпретации результатов тестирования (Дружинин В. Н., 1990).
Введение понятия экологической валидности связано с проблемой влияния ситуации на результаты тестирования. Споры между «чертистами» (сторонниками теории черт личности, постулирующими устойчивость в разных ситуациях форм поведения, соответствующих определенным психическим свойствам) и «ситуационалистами» (утверждающими полное отсутствие влияния свойств личности на поведение в конкретной ситуации), хотя и продолжаются по сей день, привели к возникновению и развитию теорий личностно-ситуационного взаимодействия.
Иллюзорная (ложная) валидность – иллюзия соответствия заключения по результатам тестирования личностным характеристикам обследуемого. Возникает как следствие использования предельно общих, а поэтому применимых практически ко всем обследуемым формулировок, таких, например, как «разумный в выборе цели», «стремящийся к лучшей жизни» и т. п. Такого рода утверждения принимаются почти всеми людьми в качестве точного описания их личности, что создает почву для деятельности различного рода прорицателей и предсказателей. Иллюзорная валидность названа эффектом Барнума (по имени Финиса Барнума, популярного организатора публичных зрелищ, говорившего, что «глупец рождается ежеминутно»).
32. Критерий валидности. Основное психометрическое неравенство. Типы критериев валидности
Соответствие теста измеряемому психическому свойству называется валидностью теста. На валидность теста негативно влияют случайные факторы, поэтому в психометрике принято следующее основное психометрическое неравенство:
Валидность ≤ Надежность,
что означает, что валидность не может превышать надежность теста.
Помимо случайных факторов, на валидность теста влияют систематические факторы. Они привносят систематические искажения в результаты.
В современной психометрике разработаны десятки разнообразных теоретических и экспериментальных методов проверки валидности тестов. Основным элементом этих методов является так называемый «критерий».
Критерий валидности – это независимый от теста, внешний по отношению к тесту источник информации об измеряемом свойстве. Мы не можем судить о валидности теста до тех пор, пока не сравним его результаты с источником истинной (или заведомо более валидной) информации об измеряемом свойстве – с критерием.
Типы критериев валидности
В научных исследованиях преобладают специальные лабораторные критерии. Например, конструируется компактный тест-опросник на тревожность. В качестве критерия валидности для него используется специальный трудоемкий объективный лабораторный эксперимент, в котором воспроизводится реальная ситуация тревожности (испытуемым-добровольцам угрожают за ошибочные действия ударами тока).
На практике в качестве критерия валидности используются прагматические критерии – показатели эффективности той деятельности, ради прогнозирования которой предпринимается тестирование.
В качестве критерия валидности используется экспертная оценка. Мы хотим убедиться, что короткий тест на измерение уровня дисциплинированности валиден. Для этого проводится опрос учителей об уровне дисциплинированности хорошо известных им учеников. После этого сравниваются результаты теста и экспертный рейтинг учеников по дисциплинированности. Это один из самых простых, популярных методов эмпирического измерения валидности. Это метод «известных групп». В психометрическом эксперименте по проверке валидности теста приглашаются испытуемые, при этом известно, к какой группе по критерию они относятся. В случае с тестом дисциплинированности подбираются ученики, дисциплинированные по данным экспертной оценки учителей («высокая» группа по критерию) и заведомо недисциплинированные («низкая» группа по критерию). Ученики со средними показателями по критерию в тестировании не участвуют.
33. Математическое выражение критерия валидности (коэффициент Гилфорда). Основные схемы валидизации психодиагностических
Меру совпадения (корреляции) между крайними группами по тесту и по критерию оценивают с помощью самого простого Фи-коэффициента Гилфорда:
При численности протестированной группы в 30 человек (это минимальная выборка для проверки валидности) статистически значимую связь теста с критерием мы можем констатировать, Phi› 0,36. Хотя это и низкая валидность, но все же тест в данном случае дает значимо лучшие результаты, чем случайное гадание.
Но метод «известных групп» обладает серьезным недостатком. Он не всегда позволяет использовать тест для прогноза. При формировании «известных групп» оценивается поведение, которое происходило в прошлом, а мы хотим сделать тест для прогноза поведения, которое будет происходить в будущем. Многие тесты, используемые в образовательной психодиагностике, обладают указанным недостатком. Они проходят в лучшем случае проверку по методике «известных групп» и не обладают прогностической валидностью (или валидность экспериментально не доказана).
Решение проблемы прогностической валидности под силу крупным научно-методическим центрам. Ведь к психометрическому исследованию по проверке прогностической валидности надо привлекать на порядок больше испытуемых – не 30, минимум – 300, так как не известно, кто из этих 300 попадет в крайние группы.
Мы хотим использовать тест для прогноза готовности школьников для обучения в вузе. Это типичная прогностическая психодиагностическая задача. Кто-то должен взяться за программу проверки прогностического потенциала этого теста. Нужно протестировать 300 – 500 школьников, а затем подождать, кто из них поступит в вуз и будет успешно там учиться. После 2-3-летнего интервала можно сформировать критериальные группы и подсчитать корреляцию с прежними тестовыми показателями этих бывших школьников. После реализации такой схемы психометрического эксперимента можно утверждать, что тест прошел проверку на прогностическую валидность. Без этого мы исходим только из доверия к научной интуиции разработчика теста и не имеем независимых доказательств того, что тест можно использовать для прогноза.
Различение обычной дешевой схемы валидизации теста (по «известным группам») и дорогой прогностической схемы валидизации теста – важнейший элемент психодиагностической грамотности не только для психологов, но и для педагогов, как, впрочем, и для любых заказчиков психодиагностической информации.
34. Тестовые нормы. Корреляция качественных признаков
Что, несомненно, должен знать и уметь делать каждый грамотный пользователь теста – это понимать, что такое тестовые нормы и как ими пользоваться.
Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в те-стологии «сырым тестовым баллом». Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в «стандартную». Эта процедура называется «стандартизацией тестового балла».
Допустим, мы провели тест из 20 заданий и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет. Для такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.
Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации. Ее численность, как правило, не меньше 200 человек. Такое количество человек должно принять участие в психометрическом эксперименте по определению тестовых норм – в эксперименте по стандартизации теста.
Корреляция качественных признаков – метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. шкалы измерительные). Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов ранговой корреляции, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона (см. критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона:
Значение P всегда положительно и измеряется от нуля до единицы. Особенностью коэффициента сопряженности Пирсона является то, что максимальное его значение всегда меньше + 1 и в значительной степени зависит от количества наблюдений (размера таблицы). В случае квадратной таблицы (k x k):
Так, в таблице размером (5 x 5) Pmax = 0,894; в таблице (10 x 10) Рmax = 0,949. Поэтому окончательной формой выражения связи между переменными с помощью коэффициента Пирсона является его отношение к величине Рmax для данного случая (P/Pmax).
При расчете сопряженности находит применение также коэффициент Чупрова:
где t – число столбцов таблицы;
k – число строк таблицы.
В психологической диагностике описанные коэффициенты используются относительно редко
35. Ранговая корреляция
Ранговая корреляция – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Ранговая корреляция применяется для анализа связи между признаками, измеряемыми в порядковых шкалах, как метод определения корреляции качественных признаков. Достоинством коэффициентов ранговой корреляции является возможность их использования независимо от характера распределения коррелирующих признаков.
В практике применяются коэффициенты ранговой корреляции Спирмена и Кендалла. Первым этапом расчета коэффициентов ранговой корреляции является ранжирование рядов переменных. Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречаются несколько равных по значению переменных, им присваивается усредненный ранг.
Таблица 1
Ранжирование распределения показателей теста (n = 18)
В таблице 1 приведены данные для расчета коэффициентов ранговой корреляции. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе – соответствующие им данные теста зрительной памяти).
Коэффициент корреляции рангов Спирмена (rs)
определяется из уравнения:
где di – разности между рангами каждой переменной из пар значений X и Y;
n – число сопоставляемых пар.
Получаем:
36. Измерительные и метрические шкалы
Измерительные шкалы (лат. scala – «лестница») – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Шкалы представляют собой метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов числовыми значениями и отображение пропорций континуального состава элементов объекта в соответствующих числах. Элементу совокупности проявлений свойств изучаемого объекта соответствует определенный балл или шкальный индекс, количественно устанавливающий положение наблюдаемой единицы на шкале, которая охватывает всю совокупность или ее часть, существенную с точки зрения задач исследования. Операция упорядочивания исходных эмпирических данных в шкальные носит название шкалирования. Шкалы различаются в зависимости от характера функции, лежащей в основе их построения. В качестве такой функции могут служить: сравнение по признаку убывания или возрастания, ранжирование, оценка интенсивности признака или оценка пропорциональных отношений между признаками. Общая классификация измерительных шкал предложена С. Стивенсон. В ее основу положен признак метрической детерминированности. Согласно этому признаку, шкалы делятся на метрические (интервальные и шкалы отношений) и неметрические (номинативные, шкалы порядка).
Шкала интервалов относится к метрическим шкалам, в которых элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе ранжирования признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.
В шкале интервалов нулевая точка отсчета может устанавливаться произвольно, а величины единиц и направление отсчета могут определяться по избираемым константам.
К разряду шкалы интервалов относятся шкалы стандартного IQ-показателя, Т-баллов, процентилей и др.
Шкалирование в интервальной шкале составляет основу психометрических измерений.
В шкалах отношений (пропорциональных) числовые значения присваиваются объектам таким образом, чтобы между числами и объектами соблюдалась пропорциональность. Начало отсчета в такой шкале фиксировано. Шкала предусматривает операции равенства/неравенства, больше/меньше, равенства интервалов и равенства отношений.
Примером использования такой шкалы в психологических измерениях может служить шкала порогов абсолютной чувствительности анализатора.
37. Номинативные шкалы
Номинативные шкалы (шкалы наименований)
устанавливают соответствие признака тому или иному классу. Объекты объединяют в классы на основании какого-либо общего свойства (классы эквивалентности) либо символа (обозначения). Необязательно, чтобы между выявленными классами существовала внутренняя взаимосвязь. Само название «шкала наименований» указывает на то, что значения по шкале играют роль лишь названий классов. Одним из распространенных видов номинативной шкалы является классификация объектов на две группы по принципу «А – не А» (альтернативные признаки в дихотомической шкале наименований). Конкретными примерами применения такой шкалы являются оценивание ответа испытуемого на пункт опросника в виде утверждения или отрицания, соответствие или несоответствие полученного вида ответа «ключу» (коду) измеряемого свойства (см. личностные опросники).
Примером оценивания в номинативной шкале могут служить классификация решений тестовой задачи или пункт опросника с задачей закрытого типа.
Из названных городов северней расположен город:
а) Псков;
б) Нижний Новгород;
в) Волгоград;
г) Новосибирск;
д) Красноярск.
Противоположностью значения «великодушный» является:
а) расточительный;
б) упрямый;
в) малодушный;
г) скупой;
д) щедрый.
Другой простейшей разновидностью номинативной шкалы является перечень или набор каких-либо признаков, группируемых при сборе информации или ее обработке:
Вы предпочитаете проводить досуг…
а) с товарищами и приятелями;
б) на лоне природы;
в) занимаясь спортом;
г) в кругу семьи и т. д.
Распределение признаков в классах шкалы наименований можно охарактеризовать путем определения абсолютных и относительных частот встречаемости, возможно также определение модальных и центральных значений в классах. Оценка статистической связи между группами признаков возможна с помощью анализа корреляции (см. корреляция качественных признаков). Если один из рядов переменных представлен в дихотомической шкале наименований, а другой – в любой иной (интернальной, отношений или порядковой), то применяются коэффициенты бисериальной корреляции. Номинативная шкала не является шкалой измерения. Она допускает лишь операцию равенства и неравенства и более или менее дифференцированную классификацию признаков. Вместе с тем в психологических исследованиях и психологической диагностике этот вид измерительных шкал имеет достаточно большое значение, особенно при фиксации качественной информации (данных проективных методик при сборе психологического анамнеза).
38. Порядковые шкалы
Порядковые шкалы (ординальные) предназначены для расчленения совокупности признаков на элементы, связанные отношением «больше – меньше», и допускают отнесение переменных к группам, упорядоченным (ранжированным) друг относительно друга и представляющим некое системное единство. Порядковые шкалы дают возможность оценить степень выраженности признака. Они содержат не менее трех классов с установленной последовательностью, не допускающей перестановки. Между двумя показателями объектов А и В, обладающих признаком X, возможны три вида отношений: ХА = ХБ; ХА ‹ХБ; ХА› ХБ. Если имеются три объекта A, В, С и между ними установлены отношения ХА ‹ХБ, ХБ ‹ХС, из которых следует, что ХА ‹ХС. При этом значения разностей между признаками не устанавливаются (шкала неметрическая, единицы измерения отсутствуют). Упорядочивание признаков в ординальной шкале может быть униполярным (при определении классов исходят из степени выраженности измеряемого свойства) и биполярным (в основе разделения лежит ранг степени приближения к одному из противоположных полюсов свойства).
В качестве примера униполярного упорядочивания может быть приведена шкала оценивания качеств внимания: весьма устойчивое / устойчивое / лабильное / рассеянное. Примером оценивания по биполярному принципу может служить идентификация выраженности свойств между полярными антонимическими характеристиками свойств личностных проявлений:
1. уравновешенный… нестабильный;
2. общительный… замкнутый;
3. подвижный… медлительный.
Порядковые шкалы относятся к числу распространенных в психологической диагностике. В качестве одного из практических приемов оценивания результатов испытуемого по порядковой шкале можно привести модификацию теста «прогрессивные матрицы Равена», в котором каждый ответ включает три варианта, последовательно приближающихся к правильному. Вариантом применения порядковой шкалы может быть закрытый дифференцированный ответ на пункт опросника:
Бывает, что я никак не могу принять какое-то окончательное решение и упускаю возможность сделать что-то своевременно.
1. Полностью согласен.
2. Пожалуй, могу согласиться.
3. Не уверен.
4. Скорее не согласен.
5. Совершенно не согласен.
Порядковая шкала допускает операции равенства/неравенства и сравнения по интенсивности. По сравнению со шкалой наименований, здесь возможны определение медианы распределения, использование коэффициентов ранговой корреляции и сопряженности (см. корреляция качественных признаков).
39. Тестовая батарея
Тестовая батарея – совокупность групп тестовых заданий (субтестов), объединенных в одну психодиагностическую методику и направленных на измерение различных сторон сложного психологического конструкта.
Наиболее известными и распространенными в современной психологической диагностике примерами тестовых батарей являются шкалы измерения интеллекта Векслера, батарея тестов Общих способностей (ОАТБ), тест структуры интеллекта Амтхауэра (TSI). Составные методики с включением в них различных групп заданий, направленных на изучение вербальных и практических сторон общих способностей, довольно распространены среди тестов интеллекта.
Комплекс заданий, включенных в тестовую батарею, в значительной мере отражает элементный состав конструкта, на исследование которого направлена данная методика (см. валидность конструктная). Так, батарея тестов WISC (см. шкалы измерения интеллекта Векслера) включает задания на общую осведомленность, понимание, способность к установлению сходства и аналогий, визуальную комбинаторику и репродукцию, смысловой анализ последовательных событий, арифметические способности и навыки, изучение репродуктивной функции памяти и т. д. В совокупности результаты измерений по отдельным субтестам с той или иной степенью полноты репрезентируют исследуемое комплексное качество (в данном примере – комплекс общих способностей).
Несмотря на принадлежность к общей методике, некоторые субтесты тестовых батарей используются в отдельности для решения определенных узких диагностических задач. Часто отдельные субтесты тестовых батарей снабжаются собственными частными нормами и стандартами выполнения. Возможность их комбинирования в зависимости от ситуации обследования является специфической особенностью многих батарейных методик.
Для отдельных многосубтестовых тестовых батарей разработаны сокращенные варианты, состоящие из наиболее нагруженных исследуемыми факторами субтестов, результаты которых тесно коррелируют с результатами полной батареи.
Невзирая на относительную независимость некоторых субтестов тестовой батареи, непременным условием разработки методики и оценки качеств теста в целом является анализ внутренней согласованности, трудности заданий теста, валидности заданий теста не только с точки зрения состава задач отдельных субтестов, но и связи отдельных субтестов с общим результатом тестовой батареи. Процедура разработки и проверки диагностических качеств батарейных методик значительно усложняется по сравнению с единичными тестами.
40. Миннесотский многоаспектный личностный опросник
Миннесотский многоаспектный личностный опросник (Minnesota Multiphasic Personality Inventory, MMPI)– предложен С. Хатуэем и Дж. Маккинли
в 1940 г. MMPI является реализацией типологического подхода к изучению личности и занимает ведущее место среди других личностных опросников в психодиагностических исследованиях (библиография составляет около 4000 названий). Опросник состоит из 550 утверждений, образующих 10 основных диагностических шкал. На каждое из утверждений обследуемые (лица в возрасте от 16 лет и старше с коэффициентом интеллекта не ниже 80) должны дать ответ: «верно», «неверно», «не могу сказать». Ответ, совпадающий с «ключом», оценивается в один балл. Возможны различные варианты предъявления утверждений, обычно это делается с помощью карточек, которые обследуемый раскладывает на три группы в соответствии со своим ответом. Для ускорения интерпретации структуры показателей, экономного описания «профиля» используется система его числового кодирования.
Основные клинические шкалы MMPI и примеры утверждений по каждой из них.
1. Шкала ипохондрии (HS) – определяет «близость» обследуемого к астеноневротическому типу личности.
2. Шкала депрессии (D) – предназначена для определения степени субъективной депрессии, морального дискомфорта (гипотимический тип личности).
3. Шкала истерии (Ну) – разработана для выявления лиц, склонных к невротическим реакциям конверсионного типа (использование симптомов физического заболевания в качестве средства разрешения сложных ситуаций).
4. Шкала психопатии (Ра) – направлена на диагностику социопатического типа личности.
5. Шкала мужественности/женственности (MF) – предназначена для измерения степени идентификации обследуемого с ролью мужчины или женщины, предписываемой обществом.
6. Шкала паранойи (Ра) – позволяет судить о наличии «сверхценных» идей, подозрительности (паранойяльный тип личности).
7. Шкала психастении (Pt) – устанавливает сходство обследуемого с больными, страдающими фобиями, навязчивыми действиями и мыслями (тревожно-мнительный тип личности).
8. Шкала шизофрении (Sc) – направлена на диагностику шизоидного (аутического) типа личности.
9. Шкала гипомании (Ма) – определяется степень «близости» обследуемого гипертимному типу личности.
10. Шкала социальной интроверсии (Si) – диагностика степени соответствия интровертированному типу личности. Клинической шкалой не является, добавлена в опросник в ходе его дальнейшей разработки.
41. Опросник «Шестнадцать личностных факторов»
Опросник «Шестнадцать личностных факторов» (Sixteen Personality Factor Questionnaire, 16 PF) —
личностный опросник. Впервые опубликован Р. Кэттеллом в 1950 г., последнее переработанное руководство опросника «шестнадцать личностных факторов» вышло в 1970 г. (Р. Кэттелл с соавторами). Предназначен для измерения 16 факторов личности и является реализацией подхода к ее исследованию на основе черт.
Разработаны две основные эквивалентные формы опросника (А и В, причем А считается стандартной формой) по 187 вопросов в каждой (для обследования взрослых людей с образованием не ниже чем 8–9 классов). В обеих формах ШЛФ представлены по 3 «буферных» вопроса и от 20 до 26 вопросов, относящихся к каждому из измеряемых факторов. Обследуемому предлагают занести в регистрационный бланк один из вариантов ответа на вопрос: «да», «нет», «не знаю» (или «а», «в», «с»). Полученные результаты выражаются в шкале стэнов с минимальным значением в 0 баллов, максимальным – 10 и средним 5,5 балла. Строится «профиль» личности, при интерпретации которого руководствуются степенью выраженности каждого фактора.
Факторы личности, диагностируемые опросником, обозначаются буквами латинского алфавита, причем буква «Q» используется только для тех факторов, которые выделены на основе Q-данных. Факторы имеют бытовые и технические названия. Первые представляют собой общедоступные определения, ориентированные на непрофессионалов. Фактор А – «сердечность, доброта – обособленность, отчужденность». Технические названия предназначены для специалистов и тесно связаны с научно установленным значением фактора.
При этом часто используются искусственно созданные названия, тот же фактор А будет определяться как «аффектотимия – сизотимия». Как бытовые, так и технические названия факторов даются в биполярной форме, чем устраняется двусмысленность в определении их содержания. Следует иметь в виду, что определение концов оси фактора как положительных (+), так и отрицательных (-) условно и не имеет ни этического, ни психологического смысла. Обычно описание каждого фактора у Р. Кэттелла состоит из разделов:
а) буквенный индекс фактора; разработана также система универсальной индексации, включающая сведения о принципе выделения того или иного фактора и его порядковом номере;
б) техническое и бытовое название;
в) список наиболее значимых характеристик в L-данных; д) интерпретация фактора. Например, фактор С, выделенный на основе L-и Q-данных.
42. Факторный анализ
Факторный анализ – комплекс аналитических методов, позволяющих выявить скрытые признаки, а также причины их возникновения и внутренние закономерности их взаимосвязи.
Факторный анализ направлен на преобразование исходного набора признаков в более простую и содержательную форму. Центральная задача метода – переход от совокупности непосредственно измеряемых признаков изучаемого явления к комплексным обобщенным факторам, за которыми стоят комбинации исходных признаков, выделяемых на основе их внутренних закономерностей, отражающих структуру исследуемой области явлений.
Согласно точке зрения одного из создателей факторного анализа – Л. Терстона, этот метод применяется для «конденсирования» тестовых оценок, сведения их к относительно малому числу независимых переменных и для выделения факторов, необходимых для описания индивидуальных различий тестовых результатов. Факторный анализ представляет собой не только метод статистической обработки исходных данных для обобщений, но и широкий научный метод подтверждения гипотез относительно природы процессов.
Исходной информацией для проведения факторного анализа является корреляционная матрица, или матрица интеркорреляций показателей тестов. В некоторых моделях факторного анализа матрица может включать и другие характеристики связей и сопряженности между изучаемыми признаками (например, кластерные отношения, расстояния в семантическом пространстве). Выделенные путем анализа интеркорреляций или других характеристик связи, обобщенные факторы первого порядка могут быть представлены в виде новой матрицы, отражающей корреляции между факторами. На основе таких матриц могут определяться факторы более высокого порядка.
В истории психологии факторный анализ связан с решением ряда теоретических задач. Сначала он воспринимался как один из основных подходов к раскрытию содержания психологических свойств. Так, Ч. Спирменом (1931 г.) на основе анализа корреляций между результатами различных тестов была выдвинута идея единого генерального фактора (фактор G), лежащего в основе успешности выполнения любых тестов, связанных с измерением интеллектуальных свойств. Л. Терстоном (1931 г.) разработан мультифакторный анализ оценки многих коррелирующих между собой (облических) и относительно независимых (ортогональных) факторов, объясняющий мультифакторную концепцию интеллекта. В настоящее время методы факторного анализа составляют сложную специальную область математической статистики.
43. Шкала «Проявления тревожности». Опросник самоотношения
Шкала «Проявления тревожности» (Manifest Anxiety Scale, MAS) – личностный опросник. Предназначен для измерения проявлений тревожности. Опубликован Дж. Тейлор в 1953 г.
ШПТ состоит из 50 утверждений, на которые обследуемый должен ответить «да» или «нет». Утверждения отбирались из набора утверждений Миннесотского многоаспектного личностного опросника (MMPI). Выбор пунктов для шкалы проявления тревожности осуществлялся на основе анализа их способности различать лиц с «хроническими реакциями тревоги».
Примеры утверждений.
1. Я не в состоянии сосредоточиться на одном предмете.
2. Даже в прохладные дни я легко потею.
Обработка результатов исследования осуществляется аналогично процедуре MMPI. Индекс тревожности измеряется в шкале Т-баллов (см. шкальные оценки). Шкала проявления тревожности нередко используется в качестве одной из дополнительных шкал MMPI. При этом результат измерения тревожности не только дополняет данные по основным клиническим шкалам MMPI, но и в некоторых случаях может быть привлечен к интерпретации профиля в целом.
Личностный опросник, направленный на исследование комплекса факторов отношения к себе. Предложен В. В. Сталиным в 1985 г.
Методика содержит 62 пункта, сформулированных в виде утверждений. Используются два варианта ответов: «согласен» и «не согласен». 7 факторов легли в основу четырех шкал опросника.
1. Самоуважение (14 пунктов) – шкала направлена на отражение аспектов самоотношения к своим способностям, самостоятельности, оценки возможностей контролировать свою жизнь, степени веры в свои силы.
2. Аутосимпатия (16 пунктов) – шкала на позитивном полюсе объединяет доверие к себе и положительную самооценку.
3. Самоинтерес (8 пунктов) – отражение меры близости к себе, интерес к собственным мыслям и чувствам, уверенность в собственном интересе для других.
4. Ожидаемое отношение от окружающих (13 пунктов).
Наряду с приведенными шкалами в опроснике предусмотрена возможность оценивания по обобщенному фактору «глобального самоотношения» (чувства «за» или «против» себя). Балл по глобальному самоотношению подсчитывается на основании учета ответов на 30 пунктов опросника.
Опросник стандартизирован на выборке из 260 испытуемых. Имеются данные об удовлетворительной ретестовой надежности (коэффициенты от 0,57 до 0,90 по отдельным шкалам, интервал ретеста 7-10 дней). Проводятся исследования конструктной валид-ности.
44. Личностные опросники Айзенка
Личностные опросники Айзенка – серия личностных опросников. Предназначены для диагностики нейротизма, экстраверсии – интроверсии и психотизма. Разработаны Г. Айзенком с сотрудниками. Личностные опросники Айзенка являются реализацией типологического подхода к изучению личности.
Описание личностных измерений.
Нейротизм (или эмоциональная неустойчивость) представляет собой континуум от нормальной аффективной стабильности до ее выраженной лабильности.
Понятие «экстраверсии» и «интроверсии» – комплексы коррелирующих между собой черт. Характеристика типичного экстраверта: общительность, широкий круг знакомств, импульсивность, оптимистичность, слабый контроль над эмоциями и чувствами. Типичный интроверт – это спокойный, застенчивый, интроспективный человек, отдален от всех, кроме близких людей. Он планирует действия заблаговременно, любит порядок во всем и держит свои чувства под строгим контролем.
По Г. Айзенку высокие показатели по экстраверсии и нейротизму соответствуют психиатрическому диагнозу истерии, а высокие показатели по интроверсии и нейротизму – состоянию тревоги или реактивной депрессии. Психотизм, как и нейротизм, континуален (норма – психотизм). В случае высоких показателей по этой шкале можно говорить о предрасположенности к психическим отклонениям. Психотическая личность (не патологическая) характеризуется Г. Айзенком как эгоцентрическая, эгоистическая, бесстрастная, неконтактная.
Большое внимание Г. Айзенк в своих исследованиях уделяет сбору экспериментальных данных, подтверждающих универсальность предложенных им измерений личности. Для этого он привлекает факторный анализ результатов многочисленных и разнородных тестов (методик), с помощью которых обследуются критериальные группы. Первоначально на основе комплекса признаков, дифференцирующих здоровых и больных неврозом людей, был выделен фактор нейротизма, позднее – фактор экстра – интроверсии, под который Г. Айзенк в течение длительного времени стремился подвести физиологическую основу, используя ряд положений теории И. П. Павлова. В последние годы аналогичным путем обосновывается фактор психотизма. Например, одним из «доказывающих» экспериментов является обследование групп психотических больных, больных неврозами и здоровых лиц с помощью тестов на остроту зрения, способность опознания «зашумленных» объектов, кожно-гальванической реакции и т. п. Показано, что эти группы дифференцируются по двум факторам – нейротизму и психотизму.
45. Опросник уровня субъективного контроля
Опросник уровня субъективного контроля (УСК) —
личностный опросник. Предназначен для диагностики интернальности/экстернальности. Разработан на основе шкалы локуса контроля Дж. Роттера (Locus of control scale) и опубликован Е. Ф. Бажиным с соавторами в 1984 г.
УСК состоит из 44 утверждений, с которыми обследуемый может согласиться (+) или не согласиться (-). Для исследовательских целей предусмотрен ответ по шестибалльной шкале «– 3, – 2, – 1, + 1, + 2, + 3», в которой «+ 3» означает «полностью согласен», а «– 3» – «совершенно не согласен». С помощью УСК осуществляется измерение интернальности/экстернальности по следующим шкалам.
1. Шкала общей интернальности (И0).
2. Шкала интернальности в области достижений (Ид).
3. Шкала интернальности в области неудач (Ин).
4. Шкала интернальности в семейных отношениях (Ис).
5. Шкала интернальности в области производственных отношений (Ип).
6. Шкала интернальности в области межличностных отношений (Им).
7. Шкала интернальности в отношении здоровья и болезни (Из).
Примеры утверждений УСК (рядом – «ключевой» ответ по соответствующей шкале):
1. Продвижение по службе больше зависит от удачного стечения обстоятельств, чем от способностей и усилий человека (И0-, Ид-, Ин-).
2. Думаю, что случай или судьба не играют важной роли в моей жизни (И0).
3. Многие мои успехи были возможны только благодаря помощи других людей (И0-, Ид-).
Полученные результаты выражаются в стэнах (см. оценки шкальные) и могут быть представлены в виде «профиля субъективного контроля».
Уровень субъективного контроля – характеристика личности, оказывающая регулирующее воздействие на формирование межличностных отношений. В соответствии с концепцией локуса контроля (лат. locus – «место, месторасположение») те лица, которые принимают ответственность за события своей жизни на себя, объясняя их своим поведением, способностями, чертами личности, обладают внутренним (интервальным) контролем. И напротив, людям, которые склонны приписывать ответственность за все события внешним факторам (другим людям, случаю, судьбе и т. п.), присущ внешний (экстернальный) контроль.
В многочисленных экспериментальных исследованиях установлена связь между различными формами поведения, особенностями личности и уровнем ин-тернальности/экстернальности. Так, интерналы в отличие от экстерналов менее склонны подчиняться давлению других людей, сильнее реагируют на утрату личной свободы, активнее ищут информацию, более уверены в себе и т. д.
46. «Несуществующее животное». «Нарисуй человека»
«Несуществующее животное» – проективная методика исследования личности; предложена М. 3. Друкаревич.
Испытуемому предлагают придумать и нарисовать несуществующее животное, а также дать ему ранее не существовавшее имя. Из имеющейся литературы видно, что процедура обследования не стандартизована (используются разных размеров листы бумаги для рисования, в одних случаях рисунок выполняется цветными карандашами, в других – одним цветом и т. д.). Общепринятой системы оценки рисунка не существует. Теоретические посылки, положенные в основу создания методики, совпадают с таковыми у прочих проективных методик. Как и многие другие рисуночные тесты, тест «несуществующее животное» направлен на диагностику личностных особенностей, иногда ее творческих потенций.
Показана удовлетворительная конвергентная валид-ность методики путем установления связи между результатами, полученными с ее помощью, и данными других личностных методик на материале обследования пациентов психиатрической клиники и лиц, проходящих профотбор в штат МВД (П. В. Яньшин, 1988, 1990).
«Нарисуй человека» (НЧ) (Draw A-Person Test,
DAP) – проективная методика исследования личности. Разработана К. Маховер в 1948 г. на основе теста Ф. Гудинаф, предназначенного для определения уровня интеллектуального развития детей и подростков с помощью выполненного ими рисунка мужчины.
Тест «нарисуй человека» можно использовать для обследования как взрослых, так и детей, допускается групповое обследование.
Обследуемому предлагают карандашом на чистом листе бумаги нарисовать человека. После выполнения рисунка ему дают задание нарисовать человека противоположного пола. Заключительный этап обследования – опрос. К. Маховер составлены специальные перечни вопросов о нарисованных фигурах. Эти вопросы касаются возраста, образования, семейного положения.
При интерпретации данных автор исходит из идеи о том, что рисунок является выражением «я» обследуемого. Внимание уделяется анализу разнообразных деталей рисунка, прежде всего особенностям изображения основных частей тела, которые оценивают в соответствии с психоаналитической символикой. Изучение ва-лидности теста «нарисуй человека» западными психологами привело к противоречивым результатам в силу умозрительности предлагаемых автором интерпретаций. Имеются данные о том, что общие субъективные оценки более валидны и надежны, нежели оценки по отдельным деталям рисунка.
47. Тест тематической апперцепции
Тест тематической апперцепции (ТАТ) (Thematic Apperception Test, ТАТ)– проективная методика исследования личности. Наряду с тестом Роршаха – одна из старейших и наиболее распространенных в мире. Создана X. Морган и Г. Мюрреем в 1935 г. Впоследствии методика становится более известной по имени Г. Мюррея, который внес весомый вклад в ее разработку. Стимульный материал теста тематической апперцепции – стандартный набор из 31 таблицы: 30 черно-белых картин и одна пустая таблица, на которой обследуемый может вообразить любую картину. Таблицы, применяемые в настоящее время, – это третья редакция теста тематической апперцепции (1943). В используемых изображениях представлены относительно неопределенные ситуации, допускающие их неоднозначную интерпретацию. В то же время каждый из рисунков обладает особой стимулирующей силой, провоцируя, например, агрессивные реакции или способствуя проявлению установок обследуемого в сфере семейных отношений. В ходе эксперимента предъявляются в определенной последовательности 20 картин, отбираемых из стандартного набора в зависимости от пола и возраста (есть картины для всех: для женщин, мужчин, мальчиков и девочек до 14 лет). Возможно использование сокращенных наборов специально подобранных картин. Обычно обследование проводится в два этапа, по 10 картин за один сеанс с интервалом между сеансами не более, чем один день. Испытуемому предлагают придумать небольшую историю о том, что привело к ситуации, изображенной на картине, что происходит в настоящее время, о чем думают, что чувствуют действующие лица, чем эта ситуация закончится. Рассказы обследуемого записываются дословно, с фиксацией пауз, интонации, выразительных движений, других особенностей. Обычно прибегают к стенограмме, записи на скрытый магнитофон. При групповом обследовании допускается самостоятельная запись рассказа или выбор одного из множества предлагаемых вариантов. Отмечается время с момента предъявления картины до начала рассказа и общее время, затраченное на рассказ по каждой картине.
Завершает обследование опрос, основная задача которого – получение дополнительных данных об обследуемом. Анализ рассказов, записанных при использовании теста тематической апперцепции, строится следующим образом:
1) нахождение «героя», с которым обследуемый идентифицирует себя;
2) определение важнейших характеристик «героя», его потребностей;
3) сравнительная оценка сил, исходящих от «героя», и сил, исходящих из среды.
48. Тест Роршаха
Тест Роршаха (РТ) (Rorschach Test) – проективная методика исследования личности. Создана Г. Роршахом в 1921 г. Тест Роршаха по своей популярности в психодиагностических исследованиях личности занимает ведущее место среди других проективных методик.
Стимульный материал теста Роршаха состоит из 10 стандартных таблиц с черно-белыми и цветными симметричными аморфными (слабоструктурированными) изображениями (так называемые «пятна» Роршаха).
Обследуемому предлагают ответить на вопрос о том, на что, по его мнению, похоже каждое изображение. Ведется дословная запись всех высказываний обследуемого, учитываются время ответа, положение, в котором рассматривается изображение, любые особенности поведения. Завершается обследование опросом, который осуществляется экспериментатором по определенной схеме (уточнение деталей изображения, по которым возникли ассоциации). Иногда применяется процедура «определения пределов», сущность которой состоит в прямом «призыве» обследуемого к определенным реакциям-ответам.
Каждый ответ формализуется с помощью системы символов по следующим пяти счетным категориям:
1) локализация (выбор для ответа всего изображения или его отдельных деталей);
2) детерминанты (для формирования ответа могут быть использованы форма изображения, цвет, форма совместно с цветом и т. д.);
3) уровень формы (оценка того, насколько адекватно форма изображения отражена в ответе, при этом в качестве критерия используются интерпретации, получаемые наиболее часто);
4) содержание (ответ может касаться людей, животных, неодушевленных предметов и т. д.);
5) оригинальность – популярность (оригинальными считаются очень редкие ответы, а популярными те, которые встречаются не менее чем у 30 % обследуемых).
Эти категории имеют детально разработанные классификации и интерпретативные характеристики. Изучаются «суммарные оценки», т. е. суммы однотипных оценок, отношения между ними. Совокупность всех полученных отношений позволяет создать единую и уникальную структуру взаимосвязанных особенностей личности.
Основным теоретическим предположением Г. Роршаха является то, что активность индивидуума определяется как внутренними, так и внешними побуждениями. Сообразно такому пониманию причин активности (в которой личность выражается тем отчетливее, чем менее стереотипны вызывающие ее стимулы) автор теста Роршаха вводит понятия интроверсии и экстратенсии, соответствующие совокупности определенных черт, связанных с преобладающим видом активности.
49. Шкалы измерения интеллекта Векслера
Шкалы измерения интеллекта Векслера (ШИИВ) —
группа наиболее известных, широко используемых тестов интеллекта. Предназначены для измерения уровня интеллектуального развития. Разработаны Д. Векслером. Шкала стандартизирована на выборке испытуемых в возрасте от 7 до 69 лет.
Включает 11 субтестов, составляющих вербальную и невербальную шкалы.
Шкала вербальная
1. Субтест общей осведомленности. Исследует запас простых сведений и знаний. Предлагается 29 вопросов.
2. Субтест общей понятливости. Оценивает полноту понимания смысла выражений, способность к суждению, понимание общественных норм. Предлагается 14 вопросов.
3. Арифметический субтест. Оценивает концентрацию внимания, легкость оперирования числовым материалом.
Испытуемый должен устно решить серию задач. Дается оценка точности ответа и затраченного на решение времени.
4. Субтест установления сходства. Оценивает способность к формированию понятий, классификации, упорядочиванию, абстрагированию, сравнению. В субтесте предлагается 13 пар понятий.
5. Субтест повторения цифровых рядов. Направлен на исследование оперативной памяти и внимания, состоит из двух частей: запоминания и повторения чисел в прямом, обратном порядке.
6. Словарный субтест. Направлен на изучение вербального опыта.
Всего в задании 42 слова: первые 10 – весьма распространенные, повседневного употребления; следующие 20 – средней сложности; третью группу составляют 12 слов высокой степени сложности.
Шкала невербальная.
1. Субтест шифровки цифр. Изучает степень усвоения зрительно-двигательных навыков.
2. Субтест нахождения недостающих деталей. Изучает особенности зрительного восприятия, наблюдательность, способность отличить существенные детали.
3. Субтест кубиков Коса. Направлен на изучение сен-сомоторной координации, способности синтеза целого из частей. Испытуемому предлагают последовательно воспроизвести десять образцов рисунков из разноцветных деревянных кубиков. Время ограничивается по каждому заданию. Оценка зависит как от точности, так и от времени исполнения (см. также кубики Коса).
4. Субтест последовательности картинок. Исследует способность к организации фрагментов в логическое целое, к пониманию ситуации, предвосхищению событий.
5. Субтест составления фигур. Испытуемому предлагают в определенной последовательности детали четырех фигур («человек», «профиль», «рука», «слон») без указания на то, что из этих деталей должно быть составлено. В оценке учитывается время, правильность решения.
50. Шкала памяти Векслера
Шкала памяти Векслера – методика психометрической оценки памяти. Тестовая батарея, включающая серии заданий для исследования отдельных мнестических функций. Разработана Д. Векслером в 1946 г. Задания методики объединяются в 7 субтестов.
I субтест – ориентировка и осведомленность. Выполнение заданий предусматривает ответы испытуемого на наиболее общие вопросы, касающиеся личных и общественных данных.
II субтест – ориентировка во времени и пространстве.
Первые два субтеста методики предъявляются в случае подозрения на наличие умственного недоразвития, глубоких дефектов памяти, нарушение ориентировки.
III субтест – психический контроль. Включает три задания: отсчитывание от 20 в обратном порядке, называние букв алфавита, отсчитывание от 1 до 40 через 3 единицы.
IV субтест – логическая память. Задание состоит в воспроизведении коротких рассказов, отпечатанных на карточках.
V субтест – воспроизведение рядов цифр в прямом и обратном порядке.
VI субтест – воспроизведение геометрических фигур. Испытуемому демонстрируются последовательно 4 карточки с простыми геометрическими изображениями. Экспозиция – 10 с.
VII субтест – воспроизведение парных ассоциаций. Обследуемому зачитывают 10 пар слов, близких или отдаленных по степени ассоциативной связи. Первые 6 пар – «легкие ассоциации», следующие 4 пары – «трудные ассоциации». При первом прочтении они расположены вперемешку. Затем трижды, каждый раз в другом порядке, экспериментатор зачитывает первое слово каждой пары и проверяет запомнившиеся ассоциации. Пауза между сериями – 10 с. Ответ, данный в течение 5 с, засчитывается как правильный.
Результат теста получают при сложении половины суммы удавшихся «легких ассоциаций» с суммой «трудных ассоциаций».
Первичные результаты по всем субтестам суммируют и, используя специальную таблицу, к «сырым» баллам прибавляют возрастную поправку, рассчитанную для возрастных групп в диапазоне от 15 до 79 лет. Корригированный по возрасту первичный результат может быть переведен в оценки, соответствующие баллам стандартного IQ-показателя. Имеется возможность пересчета «сырых» оценок по отдельным субтестам в шкальные оценки.
Достоинством шкалы памяти Векслера является возможность количественного измерения кратковременной и долговременной памяти, словесно-логической, визуальной и ассоциативной репродукции. Наряду с измерением многих показателей в этой компактной и удобной для проведения методике предусмотрен охват широкого возрастного диапазона испытуемых.
51. Коса Кубики
Коса Кубики (КК) – невербальный тест интеллекта. Предложен К. Косом в 1920 г.
Испытуемому предлагают составить фигуры из цветных кубиков по рисункам-образцам. Тестовый материал состоит из шестнадцати кубиков с ребром 2,5 см, стороны которых окрашены в красный, белый, желтый и синий цвета. Оставшиеся две противоположные грани разделены по диагонали, причем одна окрашена в белый и красный цвета, а вторая – в синий и желтый. В набор включены восемнадцать образцов фигур, первый из которых является тренировочным и выполняется совместно с испытуемым. Цвета рисунков-образцов соответствуют цветам кубиков, но размеры образцов вдвое меньше. Образцы размещены посередине картонной карточки, имеющей размер 10 х 7,5 см.
Задания следуют в порядке возрастающей трудности, что обеспечивается последовательной комбинацией следующих условий:
1) фигуру можно построить только из одноцветных сторон кубиков;
2) для построения фигуры следует использовать несколько двухцветных граней;
3) фигуру можно сложить только из двухцветных сторон или из сочетания двухцветных и одноцветных, причем на образце не обозначена граница между соседними кубиками;
4) образец повернут на 45°,т. е. стоит на ребре;
5) для составления фигур требуется использовать все большее количество кубиков;
6) образцы постепенно становятся все менее симметричными;
7) увеличивается количество цветов на образце;
8) образец не ограничивается рамкой, так что на краях сливается с фоном. Имеются сведения о конструктной валидности кубиков Коса. Получена значимая корреляция со шкалой умственного развития Бине-Симона (r = 0,82 – у нормальных детей и r = 0,67 – у слабоумных детей). Изучались связи показателей КК с основными тестами интеллекта, в частности шкалой умственного развития Стэнфорд-Бине (r = 0,77), прогрессивными матрицами Равена (r = 0,81). Обращается внимание на независимость друг от друга показателей КК и тестов арифметических способностей.
Наиболее широкое применение кубики Коса находят в клинической психодиагностике. По данным Кошча (1976), тест весьма полезен при работе с такими контингентами испытуемых, как творческие личности с высоким уровнем способностей и, с другой стороны, умственно отсталые лица; дети с минимальной мозговой дисфункцией, нарушением концентрации внимания, нарушением пространственной ориентировки; дети, страдающие неврозами; дети с задержкой психического развития, педагогически запущенные; больные юношеского и зрелого возраста, страдающие шизофренией.
52. Компьютерные тесты
1. Тесты, предъявление и обработка которых приспособлены к среде ЭВМ.
2. Тесты, специально разработанные для реализации условий и возможностей современной вычислительной техники.
На современном этапе развития компьютерной психодиагностики преобладающее большинство компьютерных тестов – компьютерные версии уже известных методик. Это различные личностные опросники, реже – тесты интеллекта. Проблема, возникающая в связи с появлением компьютерной формы методики, связана с доказательством ее эквивалентности основной версии теста. Сегодня исследованиями доказано, что компьютерные тесты нуждаются в изучении их психометрических параметров. Применительно к характеристике компьютерных тестов введено понятие «эквивалентности валидности», включающее эквивалентность психометрическую, эквивалентность, относящуюся к процессу обследования и популяционную эквивалентность. Исследования за рубежом ограничиваются установлением лишь психометрической эквивалентности компьютерной версии теста. Для многих компьютерных версий тестов, используемых в странах СНГ, отсутствуют данные об их валидности, надежности, величине стандартного отклонения и других психометрических показателях.
Собственно компьютерные тесты, т. е. те, которые изначально разработаны с учетом требований и возможностей современной вычислительной техники, весьма немногочисленны. Их создание осуществляется в рамках так называемого адаптивного тестирования, важнейшей особенностью которого является управление со стороны компьютера основными этапами психодиагностического процесса. Это означает, что должен поддерживаться постоянный и адекватный режим диалога между компьютером и обследуемым. Несмотря на достаточно широкое распространение компьютерных тестов (свыше тысячи тестов ныне используются на Западе в психологических исследованиях, образовании, промышленности и управлении), не утихают споры об их месте в решении многих психодиагностических задач. Наибольшее неприятие исследователей вызывает компьютерная интерпретация результатов тестирования. Простейшие дескриптивные компьютерные интерпретации игнорируют паттерны множественных шкал, содержат противоречивые и взаимозаменяемые утверждения, не обладают гибкостью. Обобщенные утверждения содержат некоторую долю истины обо всех людях, но не решают задачи их дифференциации (эффект Барнума). Компьютерные интерпретации, моделирующие диагностическую деятельность специалиста, далеки от совершенства, и их использование может привести к ошибкам.
53. Контрольные шкалы. «Завершение предложения»
Контрольные шкалы – вспомогательные диагностические средства, позволяющие оценить достоверность информации, получаемой с помощью тех или иных психодиагностических методик. Наиболее широко контрольные шкалы применяются в личностных опросниках.
Различные варианты показателей контрольных шкал методики ММР1 могут интерпретироваться комплексно, давая информацию о возможном характере конкретных данных.
Существующий комплекс шкал является ценным психодиагностическим инструментом. Шкалы могут использоваться отдельно от основной методики в сочетании с любым другим приемом диагностики личности в целях контроля достоверности сообщаемых испытуемым данных, анализа установок, искажающих информацию, полученную на основе самооценки.
«Завершение предложения» – группа проективных методик исследования личности, представляющих собой развитие словесной ассоциации теста выступают в качестве инструмента для измерения лингвистических способностей, имеют давнюю историю в психологических исследованиях. Впервые для изучения личности «Завершение предложения» были применены А. Пейном (1928), а затем А. Тендлером (1930). Обследуемому предлагается серия незаконченных предложений, состоящих из одного или нескольких слов, с тем чтобы он их завершил по своему усмотрению, например:
1) Будущее кажется мне…;
2) Думаю, что настоящий друг…;
3) Женщины…
Предложения формулируются таким образом, что-бы стимулировать обследуемого на ответы, относящиеся к изучаемым свойствам личности. Обработка полученных данных может быть как качественной, так и количественной.
Существует значительное количество методик, основанных на принципе вербального завершения. Одни предназначены для выявления мотивов, потребностей; другие – чувств обследуемого, его отношения к семье, половой жизни, вышестоящим по работе и т. д. Наиболее известны «Завершение предложения», разработанные Дж. Роттером (1950), Д. Саксом (1950), Б. Форером (1950), А. Роде (1957). Принцип вербального завершения используется также в методиках «Завершение истории».
Достоинствами «Завершение предложения» являются их гибкость, возможность приспособления к разнообразным исследовательским задачам. Валидность и надежность этих методик достаточно высоки (Р. Ват-сон, 1978). Допускается групповое обследование.
В нашей стране разные виды «Завершение предложения» используются преимущественно в клинико-диагностических исследованиях.
54. Критериально-ориентированные тесты
Критериально-ориентированные тесты – тип тестов, предназначенных для определения уровня индивидуальных достижений относительно некоторого критерия на основе логико-функционального анализа содержания заданий. В качестве критерия (или объективного эталона) обычно рассматриваются конкретные знания, умения, навыки, необходимые для успешного выполнения той или иной задачи. Это основное отличие критериально-ориентированных тестов от традиционных психометрических тестов, оценка в которых осуществляется на основе соотнесения индивидуальных результатов с групповыми (ориентация на статистическую норму). Термин «критериально-ориентированные тесты» предложен Р. Гласером в 1963 г. Установление содержательного и структурного соответствия заданий теста и реальной задачи – важнейший этап разработки критериально-ориентированных тестов. Этим целям служит так называемая спецификация, включающая:
а) содержательный анализ критериальной задачи, описание ее возможных форм и особенностей;
б) систематизацию знаний, умений и навыков, обеспечивающих выполнение критериальной задачи;
в) образцы тестовых заданий и описание стратегии их конструирования.
Различают две разновидности критериально-ориентированных тестов:
1) тесты, задания которых гомогенны, т. е. сконструированы на одной или аналогичной содержательной и логической основе. Обычно такого рода критериально-ориентированные тесты разрабатываются на материале учебных программ и используются для контроля за формированием соответствующих
знаний, умений и навыков; 2) тесты, задания которых гетерогенны и заметно отличаются по логической структуре. В этом случае обычна ступенчатая структура теста, при которой каждая ступень характеризуется собственным уровнем сложности, определяемым логико-функциональным анализом содержания, относящегося к критериальной области поведения. А. Анастази (1982) считает, что акцент критериально-ориентированных тестов на содержательном смысле интерпретации тестовых показателей может оказать благотворное влияние на тестирование в целом. В частности, описание результатов, полученных с помощью тестов интеллекта, в терминах специфических навыков и умений в значительной мере обогащает фиксируемые ими показатели. Для критериально-ориентированных тестов непригодны в большинстве случаев обычные приемы определения валидности и надежности.
Исходя из социально-психологического норматива анализируются результаты, полученные с помощью известных психометрических тестов.
55. Кодирование тестовых оценок. Шкальные оценки
Кодирование тестовых оценок – элемент процедуры обработки данных психодиагностического обследования. Применяется в многопараметровых тестовых батареях, личностных опросниках, других методиках, предусматривающих представление результата в виде профильных оценок.
Кодирование тестовых оценок дает возможность более экономного и краткого описания совокупности шкальных оценок, профиля шкал, а также более четкой и быстрой разбивки материала на клинически (или характерологически) сходные группы. Кодирование тестовых оценок способствует выявлению в изучаемой группе наиболее общих характеристик и закономерностей. Формализация комплексных тестовых оценок является важным элементом создания банка данных и автоматизированной обработки данных обследования (см. компьютерная психодиагностика).
Шкальные оценки – способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (первичные оценки испытуемых) сравниваются с данными в сопоставимой нормативной группе (например, результат, достигнутый учеником, сравнивается с показателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопоставляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах).
Шкальные оценки в этом смысле имеют количественное содержание и могут быть использованы при статистическом анализе. Одной из распространенных в психологической диагностике форм оценки результата теста путем соотнесения с групповыми данными является расчет процентилей. Процентиль – процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. ранговая корреляция) при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль (PSQ) соответствует медиане (см. меры центральной тенденции) распределения результатов, Р› 50 и Р ‹50, соответственно, представляют ранги результатов выше и ниже среднего уровня результата.
Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. первичные оценки).
56. Психологический диагноз. Заключение
Психологический диагноз (от греч. diagnosis – «распознание») – конечный результат деятельности психолога, направленный на выяснение сущности индивидуально-психологических особенностей личности с целью оценки их актуального состояния, прогноза дальнейшего развития и разработки рекомендаций, определяемых задачей психодиагностического обследования.
Предмет психологического диагноза – установление индивидуально-психологических различий в норме и в патологии. Важнейшим элементом психологического диагноза является выяснение в каждом отдельном случае того, почему данные проявления обнаруживаются в поведении обследуемого, каковы их причины и следствия. По мере обогащения психологического знания этиологический элемент в ПД, вероятно, не будет иметь столь существенного значения, как в настоящее время, во всяком случае в текущей, практической работе. Как правило, установив средствами психодиагностики те или иные индивидуально-психологические особенности, исследователь лишен возможности указать на их причины, место в структуре личности.
Такой уровень диагностики Л. С. Выготский назвал симптоматическим (или эмпирическим). Этот диагноз ограничивается констатацией определенных особенностей или симптомов, на основании которых непосредственно строятся практические выводы. Л. С. Выготский отмечает, что данный диагноз не является собственно научным, так как установление симптомов никогда автоматически не приводит к диагнозу. Здесь работу психолога вполне можно заменить машинной обработкой данных.
Второй ступенью в развитии психологического диагноза является этиологический диагноз, учитывающий не только наличие определенных особенностей (симптомов), но и причины их возникновения.
Высший уровень – типологический диагноз, заключающийся в определении места и значения полученных данных в целостной, динамической картине личности. По словам Л. С. Выготского, диагноз всегда должен иметь в виду сложную структуру личности.
Диагноз неразрывно связан с прогнозом. Содержание прогноза и диагноза совпадает, но прогноз строится на умении настолько понять «внутреннюю логику самодвижения процесса развития, что на основе прошлого и настоящего намечает путь развития». Рекомендуется разбивать прогноз на отдельные периоды и прибегать к длительным повторным наблюдениям.
Заключение – документ о результатах тестирования, подготовленный психологом. 3аключение должно строиться на всех доступных для исследователя данных.
Комментарии к книге «Психодиагностика. Шпаргалка», Алексей Сергеевич Лучинин
Всего 0 комментариев