СегРег

Программное обеспечение для сегментированной регрессии
Разработчик(и)Институт мелиорации и улучшения земель (ILRI)
Написано вДельфи
Операционная системаМайкрософт Виндоус
Доступно вАнглийский
ТипСтатистическое программное обеспечение
ЛицензияБесплатное фирменное ПО
Веб-сайтСегРег

В статистике и анализе данных прикладное программное обеспечение SegReg представляет собой бесплатный и удобный инструмент для линейного сегментированного регрессионного анализа, позволяющий определить точку разрыва, в которой связь между зависимой и независимой переменной резко меняется. [1]

Функции

Скриншот входной вкладки
Сегментированная регрессия остатков по количеству поливов. Показаны доверительные интервалы .
Скриншот таблицы дисперсионного анализа

SegReg позволяет вводить одну или две независимые переменные. При использовании двух переменных сначала определяется связь между зависимой переменной и наиболее влиятельной независимой переменной, а затем находит связь между остатками и второй независимой переменной. Остатки — это отклонения наблюдаемых значений зависимой переменной от значений, полученных с помощью сегментированной регрессии по первой независимой переменной.

Точка разрыва находится численно путем принятия серии предварительных точек разрыва и выполнения линейной регрессии по обе стороны от них. Предварительная точка разрыва, которая обеспечивает наибольший коэффициент детерминации (как параметр для подгонки линий регрессии к наблюдаемым значениям данных), выбирается как истинная точка разрыва. Чтобы гарантировать, что линии по обе стороны от точки разрыва пересекаются друг с другом точно в точке разрыва, SegReg использует два метода и выбирает метод, дающий наилучшее соответствие.

SegReg распознает множество типов отношений и выбирает окончательный тип на основе статистических критериев, таких как значимость коэффициентов регрессии. Выходные данные SegReg предоставляют статистические доверительные пояса линий регрессии и доверительный блок для точки останова. [2] Уровень доверия может быть выбран как 90%, 95% и 98% уверенности.

Для завершения утверждений о достоверности SegReg предоставляет дисперсионный анализ и таблицу Anova . [3]

На этапе ввода пользователь может указать предпочтение или исключение определенного типа. Предпочтение определенного типа принимается только тогда, когда оно статистически значимо, даже если значимость другого типа выше.

ILRI [4] приводит примеры применения к таким величинам, как урожайность , глубина грунтовых вод и засоленность почвы .

Список публикаций, в которых используется SegReg, можно посмотреть здесь. [5]

Уравнения

При наличии только одной независимой переменной результаты могут выглядеть следующим образом:

  • X < BP ==> Y = A 1 .X + B 1 + R Y
  • X > BP ==> Y = A 2 .X + B 2 + R Y

где BP — точка разрыва, Y — зависимая переменная, X — независимая переменная, A — коэффициент регрессии , B — константа регрессии и R Y — остаток Y. При наличии двух независимых переменных результаты могут выглядеть следующим образом:

  • X < BP X   ==> Y = A 1 .X + B 1 + R Y
  • X > BP X   ==> Y = A 2 .X + B 2 + R Y
  • Z < BP Z   ==> R Y = C 1 .Z + D 1
  • Z > BP Z   ==> R Y = C 2 .Z + D 2

где, кроме того, BP X — это BP X, BP Z — это BP Z, Z — вторая независимая переменная, C — коэффициент регрессии , а D — константа регрессии для регрессии R Y на Z.

Подстановка выражений R Y из второго набора уравнений в первый набор дает:

  • X < BP X и Z < BP Z   ==> Y = A 1 .X + C 1 .Z + E 1
  • X < BP X и Z > BP Z   ==> Y = A 1 .X + C 2 .Z + E 2
  • X > BP X и Z < BP Z   ==> Y = A 2 .X + C 1 .Z + E 3
  • X > BP X и Z > BP Z   ==> Y = A2.X + C2.Z + E4

где E1 = B1 + D1 , E2 = B1 + D2 , E3 = B2 + D1 и E4 = B2 + D2 .

Альтернатива

Скриншот, данные, показывающие уровень толерантности (порог) урожая пшеницы к засолению почвы, выраженный в электропроводности как ECe = 7,1 дСм/м.

В качестве альтернативы регрессиям по обе стороны от точки разрыва (порога) можно использовать метод частичной регрессии для нахождения максимально возможного горизонтального отрезка с незначительным коэффициентом регрессии, за пределами которого имеется определенный наклон со значительным коэффициентом регрессии. Альтернативный метод можно использовать для сегментированных регрессий типа 3 и типа 4, когда есть намерение обнаружить уровень толерантности зависимой переменной для различных количеств независимой, объясняющей, переменной (также называемой предиктором). [6]

Прилагаемый рисунок касается тех же данных, что показаны на синем графике в информационном поле в верхней части этой страницы. Здесь пшеничная культура имеет толерантность к засолению почвы до уровня EC=7,1 dS/m вместо 4,6 на синем рисунке. Однако соответствие данных за пределами порогового значения не такое хорошее, как на синем рисунке, который был создан с использованием принципа минимизации суммы квадратов отклонений наблюдаемых значений от линий регрессии по всей области объясняющей переменной X (т. е. максимизации коэффициента детерминации), в то время как частичная регрессия предназначена только для нахождения точки, где горизонтальный тренд меняется на наклонный тренд.

Смотрите также

Ссылки

  1. ^ Статистические принципы сегментированной регрессии с точкой останова
  2. ^ определение доверительного интервала точки разрыва
  3. ^ F-тесты в дисперсионном анализе для сегментированной линейной регрессии
  4. ^ Исследование дренажа на фермерских полях: анализ данных , 2002. Вклад в проект «Жидкое золото» Международного института мелиорации и улучшения земель (ILRI), Вагенинген, Нидерланды. [1]
  5. ^ Список публикаций, использующих SegReg
  6. ^ Бесплатное программное обеспечение для частичной регрессии
Взято с "https://en.wikipedia.org/w/index.php?title=SegReg&oldid=1090313312"