Анализ дерева элементов

Анализ дерева элементов ( ITA ) — это метод анализа данных , который позволяет построить иерархическую структуру элементов анкеты или теста из наблюдаемых шаблонов ответов.
Предположим, что у нас есть анкета с m элементами, и что субъекты могут ответить положительно (1) или отрицательно (0) на каждый из этих элементов, т. е. элементы являются дихотомическими . Если n субъектов отвечают на элементы, это приводит к двоичной матрице данных D с m столбцами и n строками. Типичными примерами этого формата данных являются тестовые элементы, которые могут быть решены (1) или провалены (0) субъектами. Другими типичными примерами являются анкеты, где элементы являются утверждениями, с которыми субъекты могут согласиться (1) или не согласиться (0).
В зависимости от содержания элементов возможно, что ответ субъекта на элемент j определяет его или ее ответы на другие элементы. Например, возможно, что каждый субъект, который согласен с элементом j, также согласится с элементом i . В этом случае мы говорим, что элемент j подразумевает элемент i (краткий ). Целью ITA является выявление таких детерминированных импликаций из набора данных D. я дж {\displaystyle я\rightarrow j}

Алгоритмы для ИТА

Первоначально ИТА был разработан Ван Леуве в 1974 году. [1] Результатом его алгоритма , который мы далее будем называть Классическим ИТА , является логически непротиворечивый набор импликаций . Логически непротиворечивый означает, что если i подразумевает j , а j подразумевает k, то i подразумевает k для каждой тройки i , j , k элементов. Таким образом, результатом ИТА является рефлексивное и транзитивное отношение на наборе элементов, т. е. квазипорядок на элементах. Другой алгоритм для выполнения ИТА был предложен в Schrepp (1999) . Этот алгоритм называется Индуктивным ИТА . Классический ИТА и индуктивный ИТА оба строят квазипорядок на наборе элементов с помощью разведочного анализа данных . Но оба метода используют разный алгоритм для построения этого квазипорядка. Для заданного набора данных результирующие квазипорядки от классического и индуктивного ИТА обычно будут отличаться. Подробное описание алгоритмов, используемых в классическом и индуктивном ИТА, можно найти в Schrepp (2003) или Schrepp (2006) [1]. В недавней статье (Sargin & Ünlü, 2009) предложены некоторые модификации алгоритма индуктивного ИТА, которые улучшают способность этого метода обнаруживать правильные импликации из данных (особенно в случае более высоких показателей случайных ошибок ответа). я дж {\displaystyle я\rightarrow j}


Связь с другими методами

ITA относится к группе методов анализа данных, называемых булевым анализом анкет . Булев анализ был введен Фламентом в 1976 году. [2] Целью булева анализа является обнаружение детерминированных зависимостей (формул из булевой логики, связывающих элементы, как, например , , и ) между элементами анкеты или теста. Со времени основной работы Фламента (1976) было разработано несколько различных методов булева анализа. См., например, Van Buggenhaut и Degreef (1987) , Duquenne (1987) или Theuns (1994) . Эти методы разделяют цель вывести детерминированные зависимости между элементами анкеты из данных, но различаются алгоритмами для достижения этой цели. Сравнение ITA с другими методами булева анализа данных можно найти в Schrepp (2003) . я дж {\displaystyle я\rightarrow j} я дж к {\displaystyle i\клин j\rightarrow k} я дж к {\displaystyle i\vee j\rightarrow k}

Приложения

Существует несколько исследовательских работ, описывающих конкретные приложения анализа дерева элементов. Held и Korossy (1998) анализируют последствия для набора алгебраических задач с помощью классического ITA. Анализ дерева элементов также используется в ряде исследований социальных наук для получения представления о структуре дихотомических данных. Например, в Bart и Krus (1973) предшественник ITA используется для установления иерархического порядка элементов, описывающих социально неприемлемое поведение. В Janssens (1999) метод булевого анализа используется для исследования процесса интеграции меньшинств в систему ценностей доминирующей культуры. Schrepp [3] описывает несколько приложений индуктивного ITA в анализе зависимостей между элементами анкет по социальным наукам.

Пример заявки

Чтобы показать возможности анализа набора данных ITA, мы анализируем утверждения вопроса 4 Международной программы социальных исследований (ISSSP) за 1995 год с помощью индуктивного и классического ITA. ISSSP является продолжающейся ежегодной программой кросс-национального сотрудничества в проведении опросов, охватывающих важные темы для исследований в области социальных наук. Программа проводит каждый год один опрос с сопоставимыми вопросами в каждой из участвующих стран. Темой опроса 1995 года была национальная идентичность . Мы анализируем результаты вопроса 4 для набора данных Западной Германии . Утверждение для вопроса 4 было следующим:

Некоторые говорят, что следующие вещи важны для того, чтобы быть настоящим немцем. Другие говорят, что они не важны. Насколько, по-вашему, важно каждое из следующих :
1. родиться в Германии
2. иметь немецкое гражданство
3. прожить в Германии большую часть своей жизни
4. уметь говорить по-немецки
5. быть христианином
6. уважать политические институты Германии
7. чувствовать себя немцем

У испытуемых были варианты ответов: «Очень важно» , «Важно» , «Не очень важно» , «Совсем не важно » и «Не могу выбрать ответ на утверждения». Чтобы применить ИТА к этому набору данных, мы изменили категории ответов.
«Очень важно» и «Важно» кодируются как 1. «Не очень важно» и «Совсем не важно» кодируются как 0. «Не могу выбрать» обрабатывалось как отсутствующие данные.
На следующем рисунке показаны полученные квазипорядки из индуктивного ИТА и из классического ИТА. я я Т А {\displaystyle \leq _{IITA}} С я Т А {\displaystyle \leq _{CITA}}

Доступное программное обеспечение

Программа ITA 2.0 реализует как классический, так и индуктивный ITA. Программа доступна на [2]. Краткая документация программы доступна в [3].

Смотрите также

Теория ответов на вопросы

Примечания

  1. См. Ван Леуве (1974)
  2. См. Фламент (1976)
  3. ^ См. Schrepp (2002) и Schrepp (2003)

Ссылки

  • Барт, В. М. и Крус, ДЖ. (1973). Метод теории упорядочения для определения иерархий среди элементов. Образовательные и психологические измерения, 33, 291–300.
  • Дюкенн V (1987). Концептуальные последствия между атрибутами и некоторыми свойствами представления конечных решеток. В книге Б. Гантера, Р. Вилле, К. Вулфа (ред.), Beiträge zur Begriffsanalyse: Vorträge der Arbeitstagung Begriffsanalyse, Дармштадт, 1986, стр. 313–339. Wissenschafts-Verlag, Мангейм.
  • Фламент С (1976). Логический анализ анкеты. Мутон, Париж.
  • Хельд, Т. и Коросси, К. (1998). Анализ данных как эвристика для установления теоретически обоснованных структур элементов. Zeitschrift für Psychologie, 206, 169–188.
  • Янссенс, Р. (1999). Булев подход к измерению групповых процессов и установок. Концепция интеграции как пример. Математические социальные науки, 38, 275–293.
  • Шрепп М. (1999). Об эмпирическом построении импликаций для двузначных тестовых заданий. Математические социальные науки, 38(3), 361–375.
  • Шрепп, М. (2002). Исследовательский анализ эмпирических данных путем логического анализа анкет. Zeitschrift für Psychologie, 210/2, S. 99-109.
  • Шрепп, М. (2003). Метод анализа иерархических зависимостей между пунктами анкеты. Методы психологических исследований, 19, 43–79.
  • Шрепп, М. (2006). ITA 2.0: Программа для классического и индуктивного анализа дерева элементов. Журнал статистического программного обеспечения, том 16, выпуск 10.
  • Шрепп, М. (2006). Свойства коэффициента корреляционного согласия: комментарий к Ünlü & Albert (2004). Математические социальные науки, т. 51, выпуск 1, 117–123.
  • Шрепп, М. (2007). Об оценке мер соответствия для квазипорядков. Математические социальные науки, т. 53, выпуск 2, 196–208.
  • Theuns P (1994). Метод дихотомизации для булевого анализа количественных данных о совместном появлении. В G Fischer, D Laming (ред.), Вклад в математическую психологию, психометрию и методологию, серия Scientific Psychology, стр. 173–194. Springer-Verlag, Нью-Йорк.
  • Унлю, А. и Альберт, Д. (2004). Коэффициент корреляционного согласия CA — математический анализ описательной меры согласия. Математические социальные науки, 48, 281–314.
  • Ван Буггенхаут Дж., Дегреф Э. (1987). О методах дихотомизации в булевом анализе анкет. В E Roskam, R Suck (ред.), Mathematical Psychology in Progress, Elsevier Science Publishers BV, Северная Голландия.
  • Ван Леуве, JFJ (1974). Анализ дерева предметов. Nederlands Tijdschrift voor de Psychologie, 29, 475–484.
  • Саргин, А. и Унлю, А. (2009). Индуктивный анализ дерева элементов: исправления, улучшения и сравнения. Математические социальные науки, 58, 376–392.
Получено с "https://en.wikipedia.org/w/index.php?title=Анализ_дерева_элементов&oldid=1040825511"