Эта статья может быть запутанной или непонятной для читателей . ( Апрель 2022 г. ) |
Part of a series on |
Psychology |
---|
Психологическая статистика — это применение формул, теорем, чисел и законов к психологии . Статистические методы для психологии включают разработку и применение статистической теории и методов моделирования психологических данных. Эти методы включают психометрию , факторный анализ , экспериментальные проекты и байесовскую статистику . В статье также обсуждаются журналы в той же области. [1]
Психометрия занимается измерением психологических характеристик. Она включает в себя разработку и применение статистических моделей для ментальных измерений. [2] Теории измерений делятся на две основные области: (1) Классическая теория тестов ; (2) Теория ответов на вопросы . [3]
Классическая теория тестов или теория истинных оценок или теория надежности в статистике представляет собой набор статистических процедур, полезных для разработки психологических тестов и шкал. Она основана на фундаментальном уравнении X = T + E, где X — общий балл, T — истинный балл, а E — ошибка измерения. Для каждого участника предполагается, что существует истинный балл и необходимо получить балл (X), который должен быть как можно ближе к нему. [2] [4] Близость X к T выражается в терминах оценочной способности полученного балла. Надежность в терминах классической процедуры тестирования — это корреляция между истинным баллом и полученным баллом. Типичные процедуры построения теста включают следующие шаги:
(1) Определите конструкцию (2) Опишите поведенческую область конструкции (3) Напишите в 3–5 раз больше элементов, чем желаемая длина теста (4) Получите анализ содержания элемента от экспертов и отбракуйте элементы (5) Получите данные по первоначальной версии теста (6) Анализ элементов (статистическая процедура) (7) Факторный анализ (статистическая процедура) (8) После второй отбраковки создайте окончательную версию (9) Используйте ее для исследования
Надежность вычисляется определенными способами. (A) Надежность между экспертами: Надежность между экспертами — это оценка согласия между независимыми экспертами. Это наиболее полезно для субъективных ответов. Каппа Коэна , альфа Криппендорфа , коэффициенты внутриклассовой корреляции , коэффициенты корреляции , коэффициент конкордации Кендала и т. д. — это полезные статистические инструменты. (B) Надежность повторного тестирования: Процедура повторного тестирования — это оценка временной согласованности теста. Тест проводится дважды для одной и той же выборки с интервалом времени. Корреляция между двумя наборами оценок используется в качестве оценки надежности. Условия тестирования предполагаются идентичными. (C) Надежность внутренней согласованности: Надежность внутренней согласованности оценивает согласованность элементов друг с другом. Надежность с разделением пополам ( пророчество Спирмена-Брауна ) и альфа Кронбаха — популярные оценки этой надежности. [5] (D) Надежность параллельной формы : это оценка согласованности между двумя различными инструментами измерения. Взаимная корреляция между двумя параллельными формами теста или шкалы используется в качестве оценки надежности параллельной формы.
Валидность шкалы или теста — это способность инструмента измерять то, что он призван измерять. [3] Конструктивная валидность , контентная валидность и критериальная валидность — это типы валидности. Конструктивная валидность оценивается с помощью конвергентной и дискриминантной валидности и факторного анализа. Конвергентная и дискриминантная валидность устанавливаются с помощью корреляции между схожими или разными конструктами. Контентная валидность: эксперты по предметной области оценивают контентную валидность. Критериальная валидность — это корреляция между тестом и критериальной переменной (или переменными) конструкта. Регрессионный анализ , множественный регрессионный анализ и логистическая регрессия используются для оценки критериальной валидности. Программные приложения: программное обеспечение R имеет пакет «psych», который полезен для анализа классической теории тестирования . [6]
Современная теория тестирования основана на модели скрытых черт. Каждый элемент оценивает способности испытуемого. Параметр способности называется тета (θ). Параметр сложности называется b. Два важных предположения — локальная независимость и одномерность. Теория ответа элемента имеет три модели. Это однопараметрическая логистическая модель, двухпараметрическая логистическая модель и трехпараметрическая логистическая модель. Кроме того, полезна также полихромная модель IRT. [7]
В программном обеспечении R имеются пакеты «ltm», полезные для анализа IRT.
Факторный анализ лежит в основе психологической статистики. Он имеет две школы: (1) Исследовательский факторный анализ (2) Конфирматорный факторный анализ .
Исследовательский факторный анализ начинается без теории или с очень предварительной теории. Это метод сокращения размерности. Он полезен в психометрии , многомерном анализе данных и аналитике данных . Обычно k-мерная корреляционная матрица или ковариационная матрица переменных сводится к матрице шаблонов факторов k X r, где r < k. Анализ главных компонентов и общий факторный анализ — два способа извлечения данных. Факторизация по главной оси, факторный анализ ML, альфа-факторный анализ и факторный анализ изображения — наиболее полезные способы EFA. Он использует различные методы вращения факторов, которые можно классифицировать как ортогональные (приводящие к некоррелированным факторам) и косоугольные (приводящие к коррелированным факторам).
Пакет «psych» в R полезен для EFA.
Подтверждающий факторный анализ (CFA) — это метод факторного анализа, который начинается с теории и проверяет теорию путем проведения факторного анализа. CFA также называется анализом латентной структуры, который рассматривает фактор как скрытые переменные, вызывающие фактические наблюдаемые переменные. Основное уравнение CFA:
X = Λξ + δ
где X — наблюдаемые переменные, Λ — структурные коэффициенты, ξ — скрытые переменные (факторы), а δ — ошибки. Однако параметры оцениваются с использованием методов машинного обучения; доступны и другие методы оценки. Тест хи-квадрат очень чувствителен, поэтому используются различные меры соответствия. [8] [9] Пакет R 'sem', 'lavaan' полезен для того же.
Экспериментальные методы очень популярны в психологии, насчитывая более 100 лет. Экспериментальная психология является субдисциплиной психологии. Статистические методы, применяемые для разработки и анализа экспериментальных психологических данных, включают t-тест , ANOVA , ANCOVA , MANOVA , MANCOVA , биномиальный тест , хи-квадрат и т. д.
Многомерные поведенческие исследования становятся очень популярными в психологии. Эти методы включают множественную регрессию и прогнозирование; модерируемый и опосредованный регрессионный анализ; логистическую регрессию ; канонические корреляции ; кластерный анализ ; многоуровневое моделирование ; анализ выживания-неудачи; моделирование структурными уравнениями ; иерархическое линейное моделирование и т. д. очень полезны для психологической статистики. [10] [11] [9] [12] [13]
Существует множество специализированных журналов, публикующих достижения в области статистического анализа для психологии:
Различные программные пакеты доступны для статистических методов в психологических исследованиях. Их можно классифицировать как коммерческое программное обеспечение (например, JMP и SPSS ) и программное обеспечение с открытым исходным кодом (например, R ). Среди предложений с открытым исходным кодом программное обеспечение R является самым популярным. Существует множество онлайн-справочников по R, а также пишутся специализированные книги по R для психологов. [14] Пакет "psych" R очень полезен для психологов. Среди прочих, "lavaan", "sem", "ltm", " ggplot2 " являются некоторыми из популярных пакетов. PSPP и KNIME являются другими бесплатными пакетами. Коммерческие пакеты включают JMP, SPSS и SAS . JMP и SPSS обычно описываются в книгах.