![]() Скриншот вкладки «Графика» | |
Разработчик(и) | Институт мелиорации и улучшения земель (ILRI) |
---|---|
Написано в | Дельфи |
Операционная система | Майкрософт Виндоус |
Доступно в | Английский |
Тип | Статистическое программное обеспечение |
Лицензия | Бесплатное фирменное ПО |
Веб-сайт | СегРег |
В статистике и анализе данных прикладное программное обеспечение SegReg представляет собой бесплатный и удобный инструмент для линейного сегментированного регрессионного анализа, позволяющий определить точку разрыва, в которой связь между зависимой и независимой переменной резко меняется. [1]
SegReg позволяет вводить одну или две независимые переменные. При использовании двух переменных сначала определяется связь между зависимой переменной и наиболее влиятельной независимой переменной, а затем находит связь между остатками и второй независимой переменной. Остатки — это отклонения наблюдаемых значений зависимой переменной от значений, полученных с помощью сегментированной регрессии по первой независимой переменной.
Точка разрыва находится численно путем принятия серии предварительных точек разрыва и выполнения линейной регрессии по обе стороны от них. Предварительная точка разрыва, которая обеспечивает наибольший коэффициент детерминации (как параметр для подгонки линий регрессии к наблюдаемым значениям данных), выбирается как истинная точка разрыва. Чтобы гарантировать, что линии по обе стороны от точки разрыва пересекаются друг с другом точно в точке разрыва, SegReg использует два метода и выбирает метод, дающий наилучшее соответствие.
SegReg распознает множество типов отношений и выбирает окончательный тип на основе статистических критериев, таких как значимость коэффициентов регрессии. Выходные данные SegReg предоставляют статистические доверительные пояса линий регрессии и доверительный блок для точки останова. [2] Уровень доверия может быть выбран как 90%, 95% и 98% уверенности.
Для завершения утверждений о достоверности SegReg предоставляет дисперсионный анализ и таблицу Anova . [3]
На этапе ввода пользователь может указать предпочтение или исключение определенного типа. Предпочтение определенного типа принимается только тогда, когда оно статистически значимо, даже если значимость другого типа выше.
ILRI [4] приводит примеры применения к таким величинам, как урожайность , глубина грунтовых вод и засоленность почвы .
Список публикаций, в которых используется SegReg, можно посмотреть здесь. [5]
При наличии только одной независимой переменной результаты могут выглядеть следующим образом:
где BP — точка разрыва, Y — зависимая переменная, X — независимая переменная, A — коэффициент регрессии , B — константа регрессии и R Y — остаток Y. При наличии двух независимых переменных результаты могут выглядеть следующим образом:
где, кроме того, BP X — это BP X, BP Z — это BP Z, Z — вторая независимая переменная, C — коэффициент регрессии , а D — константа регрессии для регрессии R Y на Z.
Подстановка выражений R Y из второго набора уравнений в первый набор дает:
где E1 = B1 + D1 , E2 = B1 + D2 , E3 = B2 + D1 и E4 = B2 + D2 .
В качестве альтернативы регрессиям по обе стороны от точки разрыва (порога) можно использовать метод частичной регрессии для нахождения максимально возможного горизонтального отрезка с незначительным коэффициентом регрессии, за пределами которого имеется определенный наклон со значительным коэффициентом регрессии. Альтернативный метод можно использовать для сегментированных регрессий типа 3 и типа 4, когда есть намерение обнаружить уровень толерантности зависимой переменной для различных количеств независимой, объясняющей, переменной (также называемой предиктором). [6]
Прилагаемый рисунок касается тех же данных, что показаны на синем графике в информационном поле в верхней части этой страницы. Здесь пшеничная культура имеет толерантность к засолению почвы до уровня EC=7,1 dS/m вместо 4,6 на синем рисунке. Однако соответствие данных за пределами порогового значения не такое хорошее, как на синем рисунке, который был создан с использованием принципа минимизации суммы квадратов отклонений наблюдаемых значений от линий регрессии по всей области объясняющей переменной X (т. е. максимизации коэффициента детерминации), в то время как частичная регрессия предназначена только для нахождения точки, где горизонтальный тренд меняется на наклонный тренд.