В этой статье есть несколько проблем. Помогите улучшить ее или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти сообщения )
|
При анализе многомерных наблюдений, предназначенных для оценки субъектов по признаку , шкала Гуттмана (названная в честь Луи Гуттмана ) представляет собой единую (одномерную) порядковую шкалу для оценки признака, из которой могут быть воспроизведены исходные наблюдения. Открытие шкалы Гуттмана в данных зависит от их многомерного распределения, соответствующего определенной структуре (см. ниже). Следовательно, шкала Гуттмана представляет собой гипотезу о структуре данных, сформулированную по отношению к указанному признаку и указанной совокупности, и не может быть построена для любого заданного набора наблюдений. Вопреки широко распространенному мнению, шкала Гуттмана не ограничивается дихотомическими переменными и не обязательно определяет порядок среди переменных. Но если все переменные дихотомические, переменные действительно упорядочены по их чувствительности при регистрации оцениваемого признака, как показано в примере 1.
Пример 1: Дихотомические переменные
Можно предположить, что шкала Гуттмана может быть использована для следующих пяти вопросов, касающихся атрибута «принятие социальных контактов с иммигрантами» (на основе шкалы социальной дистанции Богардуса ), заданных подходящей группе населения:
Положительный ответ конкретного респондента на любой вопрос в этом списке предполагает положительные ответы этого респондента на все предыдущие вопросы в этом списке. Следовательно, можно было бы ожидать получить только ответы, перечисленные в затененной части (столбцы 1–5) Таблицы 1.
Каждая строка в затененной части Таблицы 1 (столбцы 1–5) представляет собой профиль ответа любого числа (≥ 0) респондентов. Каждый профиль в этой таблице указывает на принятие иммигрантов во всех смыслах, указанных в предыдущем профиле, плюс дополнительный смысл, в котором иммигранты принимаются. Если в большом количестве наблюдений наблюдаются только профили, перечисленные в Таблице 1, то гипотеза шкалы Гуттмана подтверждается, и значения шкалы (последний столбец Таблицы 1) обладают следующими свойствами:
Шкала Гуттмана, если она подкреплена данными, полезна для эффективной оценки субъектов (респондентов, испытуемых или любой совокупности исследуемых объектов) по одномерной шкале относительно указанного атрибута. Обычно шкалы Гуттмана находятся относительно атрибутов, которые узко определены.
В то время как другие методы шкалирования (например, шкала Лайкерта ) создают единую шкалу путем суммирования баллов респондентов — процедура, которая предполагает, часто без обоснования, что все наблюдаемые переменные имеют равные веса — шкала Гуттмана избегает взвешивания наблюдаемых переменных; таким образом, «уважая» данные такими, какие они есть. Если шкала Гуттмана подтверждается, измерение атрибута является по сути одномерным; одномерность не навязывается суммированием или усреднением. Эта особенность делает ее подходящей для построения воспроизводимых научных теорий и значимых измерений, как поясняется в теории граней .
Дано множество данных из N субъектов, наблюдаемых по отношению к n порядковым переменным, каждый из которых имеет любое конечное число (≥2) числовых категорий, упорядоченных по возрастанию силы заранее определенного атрибута, пусть a ij будет баллом, полученным субъектом i по переменной j , и определите список баллов, которые субъект i получил по n переменным, a i =a i1 ...a in , как профиль субъекта i . (Количество категорий может быть разным для разных переменных; а порядок переменных в профилях не важен, но должен быть фиксированным).
Определять:
Два профиля, a s и a t равны , обозначаются a s =a t , тогда и только тогда, когда a sj = a tj для всех j =1... n.
Профиль a s больше профиля a t , обозначаемого a s >a t , тогда и только тогда, когда a sj ≥ a tj для всех j =1... n и a sj' > a tj' хотя бы для одной переменной j ' .
Профили a s и a t сопоставимы , обозначаются как a s Sa t , если и только если a s = a t ; или a s >a t ; или a t >a s
Профили a s и a t являются несравнимыми , обозначаемыми как a s $a t , если они несравнимы (то есть, по крайней мере для одной переменной j' , a sj' > a tj' и по крайней мере для одной другой переменной j'' , a tj'' > a sj '' .
Для наборов данных, в которых категории всех переменных упорядочены одинаково по порядку (от большего к меньшему или от меньшего к большему) относительно заданного атрибута, шкала Гуттмана определяется просто следующим образом:
Определение: Шкала Гуттмана — это набор данных, в котором все пары профилей сопоставимы.
Рассмотрим следующие четыре переменные, которые оценивают арифметические навыки среди популяции P учеников:
V1: Может ли ученик (p) выполнять сложение чисел? Нет=1; Да, но только двузначных чисел=2; Да=3.
V2: Знает ли ученик (p) таблицу умножения (1-10)? Нет=1; Да=2.
V3: Может ли ученик (p) выполнять умножение чисел? Нет=1; Да, но только двузначных чисел=2; Да=3.
V4: Может ли ученик (p) выполнить деление в столбик? Нет=1; Да=2.
Можно предположить, что данные, собранные для четырех вышеуказанных переменных среди популяции школьников, демонстрируют шкалу Гуттмана, показанную ниже в Таблице 2:
Таблица 2. Данные четырех порядковых арифметических переменных навыков предположительно образуют шкалу Гуттмана.
В 1 | В 2 | В 3 | В 4 | Возможный Оценка по шкале |
1 | 1 | 1 | 1 | 4 |
2 | 1 | 1 | 1 | 5 |
2 | 2 | 1 | 1 | 6 |
3 | 2 | 1 | 1 | 7 |
3 | 2 | 2 | 1 | 8 |
3 | 2 | 3 | 1 | 9 |
3 | 2 | 3 | 2 | 10 |
Набор профилей, которые, как предполагается, должны произойти (заштрихованная часть в Таблице 2), иллюстрирует определяющую особенность шкалы Гуттмана, а именно, что любая пара профилей сопоставима. Здесь также, если гипотеза подтверждается, одна оценка шкалы воспроизводит ответы субъекта во всех наблюдаемых переменных.
Любой упорядоченный набор чисел может служить шкалой. В этой иллюстрации мы выбрали сумму оценок профиля. Согласно теории граней, только в данных, соответствующих шкале Гуттмана, такое суммирование может быть оправдано.
На практике идеальные («детерминированные») шкалы Гуттмана встречаются редко, но приблизительные шкалы были обнаружены в определенных группах населения в отношении таких атрибутов, как религиозные обряды, узко определенные области знаний, определенные навыки и владение бытовыми приборами. [1] Когда данные не соответствуют шкале Гуттмана, они могут либо представлять собой шкалу Гуттмана с шумом (и обрабатываться стохастически [1] ), либо иметь более сложную структуру, требующую многократного масштабирования для идентификации присущих им шкал.
Степень соответствия набора данных шкале Гуттмана можно оценить с помощью коэффициента воспроизводимости [2] [3], у которого есть несколько версий, в зависимости от статистических предположений и ограничений. Первоначальное определение Гуттмана коэффициента воспроизводимости, C R , просто 1 минус отношение количества ошибок к количеству записей в наборе данных. И, чтобы гарантировать, что есть диапазон ответов (не тот случай, если все респонденты одобрили только один пункт), используется коэффициент масштабируемости. [4]
В шкалировании Гуттмана найдены зачатки теории ответов на вопросы , которая, в отличие от классической теории тестов , признает, что не все вопросы в анкетах имеют одинаковый уровень сложности. Были разработаны недетерминированные (т. е. стохастические) модели, такие как шкала Моккена и модель Раша . Шкала Гуттмана была обобщена до теории и процедур «множественного шкалирования», которая определяет минимальное количество шкал, необходимых для удовлетворительной воспроизводимости.
Как процедура, связывающая содержательное содержание с логическими аспектами данных, шкала Гуттмана ознаменовала появление теории фасетов, разработанной Луисом Гуттманом и его коллегами.
Первоначальное определение шкалы Гуттмана [3] также допускает исследовательский шкалирующий анализ качественных переменных (номинальных переменных или порядковых переменных, которые не обязательно принадлежат к заранее определенному общему атрибуту). Это определение шкалы Гуттмана опирается на предварительное определение простой функции .
Для полностью упорядоченного множества X , скажем, 1,2,..., m , и другого конечного множества Y с k элементами k ≤ m , функция из X в Y является простой функцией, если X можно разбить на k интервалов , которые находятся во взаимно-однозначном соответствии со значениями Y.
Затем шкалу Гуттмана можно определить для набора данных из n переменных, где j -я переменная имеет k j (качественные, не обязательно упорядоченные) категории, таким образом:
Определение: Шкала Гуттмана — это набор данных, для которого существует порядковая переменная X с конечным числом категорий m , скажем, 1,..., m, где m ≥ max j ( k j ), и перестановка профилей субъектов таким образом , что каждая переменная в наборе данных является простой функцией X.
Несмотря на кажущуюся элегантность и привлекательность для поисковых исследований, это определение недостаточно изучено и применяется.