This article includes a list of general references, but it lacks sufficient corresponding inline citations. (August 2010) |
В статистическом анализе обнаружение изменений или обнаружение точек изменений пытается определить время, когда распределение вероятностей стохастического процесса или временного ряда изменяется. В целом проблема касается как обнаружения того, произошло ли изменение или нет, или могло произойти несколько изменений, так и определения времени любых таких изменений.
Конкретные приложения, такие как обнаружение шагов и обнаружение краев , могут быть связаны с изменениями в среднем значении , дисперсии , корреляции или спектральной плотности процесса. В более общем смысле обнаружение изменений также включает обнаружение аномального поведения: обнаружение аномалий .
При офлайн- обнаружении точек изменения предполагается, что доступна последовательность длины, и цель состоит в том, чтобы определить, произошли ли какие-либо точки изменения в серии. Это пример постфактум-анализа , и к нему часто подходят с использованием методов проверки гипотез . Напротив, онлайн- обнаружение точек изменения связано с обнаружением точек изменения во входящем потоке данных.
Временной ряд измеряет прогрессию одной или нескольких величин с течением времени. Например, на рисунке выше показан уровень воды в реке Нил между 1870 и 1970 годами. Обнаружение точек изменения связано с определением того, значительно ли меняется поведение ряда, и если да, то когда . В примере с рекой Нил объем воды значительно меняется после того, как на реке была построена плотина. Важно отметить, что аномальные наблюдения, которые отличаются от текущего поведения временного ряда, обычно не считаются точками изменения, пока ряд возвращается к своему предыдущему поведению впоследствии.
Математически мы можем описать временной ряд как упорядоченную последовательность наблюдений . Мы можем записать совместное распределение подмножества временного ряда как . Если цель состоит в том, чтобы определить, произошла ли точка изменения в момент времени в конечном временном ряду длины , то мы действительно спрашиваем, равно ли . Эту задачу можно обобщить на случай более чем одной точки изменения.
При использовании подхода последовательного анализа («онлайн») любое тестирование изменений должно предусматривать компромисс между следующими общими метриками:
В байесовской задаче обнаружения изменений доступно априорное распределение для времени изменения.
Обнаружение изменений в режиме онлайн также осуществляется с использованием потоковых алгоритмов .
Basseville (1993, Раздел 2.6) обсуждает офлайн -обнаружение изменения среднего с проверкой гипотез на основе работ Page [2] и Picard [3] и оценку максимального правдоподобия времени изменения, связанную с двухфазной регрессией . Другие подходы используют кластеризацию на основе оценки максимального правдоподобия , [ требуется ссылка ] , используют оптимизацию для вывода количества и времени изменений, [4] с помощью спектрального анализа, [5] или анализа сингулярного спектра. [6]
Статистически говоря, обнаружение изменений часто рассматривается как проблема выбора модели. [8] [9] [10] Модели с большим количеством точек изменения лучше соответствуют данным, но с большим количеством параметров. Лучший компромисс может быть найден путем оптимизации критерия выбора модели, такого как критерий информации Акаике и критерий информации Байеса . Также использовался байесовский выбор модели. Байесовские методы часто количественно определяют неопределенности всех видов и отвечают на вопросы, которые трудно решить классическими методами, например, какова вероятность наличия изменения в заданное время и какова вероятность того, что данные имеют определенное количество точек изменения. [8]
«Офлайн» подходы не могут использоваться для потоковых данных, поскольку они требуют сравнения со статистикой полного временного ряда и не могут реагировать на изменения в реальном времени, но часто обеспечивают более точную оценку времени и величины изменения.
Тесты на обнаружение изменений часто используются в производстве для контроля качества , обнаружения вторжений , фильтрации спама , отслеживания веб-сайтов и медицинской диагностики.
Обнаружение лингвистических изменений относится к способности обнаруживать изменения на уровне слов в нескольких представлениях одного и того же предложения. Исследователи обнаружили, что степень семантического совпадения (т. е. родственности) между измененным словом и новым словом влияет на легкость, с которой такое обнаружение осуществляется (Sturt, Sanford, Stewart, & Dawydiak, 2004). Дополнительные исследования показали, что сосредоточение внимания на слове, которое будет изменено во время первоначального прочтения исходного предложения, может улучшить обнаружение. Это было показано с использованием курсивного текста для привлечения внимания, при котором слово, которое будет изменено, выделяется курсивом в исходном предложении (Sanford, Sanford, Molle, & Emmott, 2006), а также с использованием расщепляющих конструкций, таких как « It was the tree that needed water» (Kennette, Wurm, & Van Havermaet, 2010). Эти явления обнаружения изменений кажутся устойчивыми, даже происходящими кросс-лингвистически, когда двуязычные читают исходное предложение на своем родном языке и измененное предложение на своем втором языке (Kennette, Wurm & Van Havermaet, 2010). Недавно исследователи обнаружили изменения на уровне слов в семантике с течением времени путем вычислительного анализа временных корпусов (например, слово «гей» приобрело новое значение с течением времени ) с использованием обнаружения точек изменения. [11] Это также применимо к чтению не-слов, таких как музыка. Несмотря на то, что музыка не является языком, она все равно пишется, и люди понимают ее значение, которое включает восприятие и внимание, что позволяет обнаружить изменения. [12]
Визуальное обнаружение изменений — это способность человека обнаруживать различия между двумя или более изображениями или сценами. [13] Это необходимо во многих повседневных задачах. Одним из примеров является обнаружение изменений на дороге для безопасного и успешного вождения. Обнаружение изменений имеет решающее значение при управлении автотранспортными средствами для обнаружения других транспортных средств, сигналов регулирования дорожного движения, пешеходов и многого другого. [14] Другим примером использования визуального обнаружения изменений является распознавание лиц. При обнаружении своей внешности обнаружение изменений имеет жизненно важное значение, поскольку лица «динамичны» и могут меняться из-за различных факторов, таких как «условия освещения, выражения лица, старение и окклюзия». [15] Алгоритмы обнаружения изменений используют различные методы, такие как «отслеживание черт, выравнивание и нормализация», чтобы захватывать и сравнивать различные черты лица и шаблоны у разных людей, чтобы правильно идентифицировать людей. [15] Визуальное обнаружение изменений включает в себя интеграцию «входных сигналов нескольких датчиков, когнитивных процессов и механизмов внимания», часто фокусируясь на нескольких стимулах одновременно. [16] Мозг обрабатывает визуальную информацию от глаз, сравнивает ее с предыдущими знаниями, хранящимися в памяти, и определяет различия между двумя стимулами. Этот процесс происходит быстро и бессознательно, позволяя людям реагировать на изменяющуюся среду и вносить необходимые коррективы в свое поведение. [17]
Было проведено несколько исследований для анализа когнитивных функций обнаружения изменений. При когнитивном обнаружении изменений исследователи обнаружили, что большинство людей переоценивают свое обнаружение изменений, когда на самом деле они более подвержены слепоте к изменениям, чем они думают. [18] Когнитивное обнаружение изменений имеет много сложностей, основанных на внешних факторах, и сенсорные пути играют ключевую роль в определении успеха в обнаружении изменений. Одно исследование предполагает и доказывает, что мультисенсорная сеть путей, которая состоит из трех сенсорных путей, значительно повышает эффективность обнаружения изменений. [19] Сенсорный путь один объединяет стимулы вместе, сенсорный путь два включает использование стратегии средней конкатенации для изучения измененного поведения, а сенсорный путь три включает использование стратегии средней разницы для изучения измененного поведения. [19] При совместной работе всех трех из них обнаружение изменений имеет значительно более высокий уровень успеха. [19] Ранее считалось, что задняя теменная кора (ЗТК) играет роль в улучшении обнаружения изменений из-за ее фокусировки на «сенсорной и связанной с задачей активности». [20] Однако исследования также опровергли, что PPC необходим для обнаружения изменений; хотя они имеют высокую функциональную корреляцию друг с другом, механистическое участие PPC в обнаружении изменений незначительно. [20] Более того, нисходящая обработка играет важную роль в обнаружении изменений, поскольку она позволяет людям прибегать к фоновым знаниям, которые затем влияют на восприятие, что также распространено у детей. Исследователи провели продольное исследование, охватывающее развитие детей и обнаружение изменений на протяжении младенчества и до взрослой жизни. [21] В этом исследовании было обнаружено, что обнаружение изменений сильнее у маленьких младенцев по сравнению с детьми старшего возраста, причем нисходящая обработка является основным фактором этого результата. [21]