Моделирование подъема

Методика прогностического моделирования

Моделирование подъема , также известное как инкрементальное моделирование , моделирование истинного подъема или сетевое моделирование, представляет собой метод прогностического моделирования , который напрямую моделирует инкрементальное воздействие воздействия (например, прямого маркетингового мероприятия) на поведение человека.

Uplift modeling имеет применение в управлении взаимоотношениями с клиентами для моделирования дополнительных продаж, перекрестных продаж и удержания. Он также применялся к политическим выборам и персонализированной медицине . В отличие от связанной с этим концепции дифференциального прогнозирования в психологии, Uplift Modeling предполагает наличие активного агента.

Введение

Моделирование подъема использует рандомизированный научный контроль не только для измерения эффективности действия, но и для построения прогностической модели, которая предсказывает инкрементальный ответ на действие. Ответ может быть двоичной переменной (например, посещение веб-сайта) [1] или непрерывной переменной (например, доход клиента). [2] Моделирование подъема — это метод интеллектуального анализа данных , который применяется преимущественно в отраслях финансовых услуг, телекоммуникаций и прямого маркетинга в розничной торговле для дополнительных продаж , перекрестных продаж , оттока и удержания клиентов.

Измерение подъема

Подъем маркетинговой кампании обычно определяется как разница в скорости отклика между обработанной группой и рандомизированной контрольной группой. Это позволяет маркетинговой команде изолировать эффект маркетингового действия и измерить эффективность или неэффективность этого отдельного маркетингового действия. Честные маркетинговые команды приписывают себе только инкрементальный эффект своей кампании.

Однако многие маркетологи определяют подъем (а не увеличение) как разницу в частоте ответов между экспериментальной и контрольной группами, поэтому моделирование подъема можно определить как улучшение (увеличение) подъема посредством прогностического моделирования.

В таблице ниже приведены сведения о кампании, показывающие количество ответов и расчетный коэффициент ответов для гипотетической маркетинговой кампании. Эта кампания будет определена как имеющая подъем коэффициента ответов на 5%. Она создала 50 000 дополнительных ответов (100 000 - 50 000).

ГруппаКоличество клиентовОтветыСкорость отклика
Обработанный1,000,000100,00010%
Контроль1,000,00050,0005%

Традиционное моделирование реакции

Традиционное моделирование ответа обычно берет группу обработанных клиентов и пытается построить прогностическую модель, которая отделяет вероятных ответчиков от неответчиков с помощью одного из ряда методов прогностического моделирования . Обычно это будет использовать деревья решений или регрессионный анализ .

Для построения этой модели будут использоваться только данные клиентов, прошедших лечение.

В отличие от этого, моделирование подъема использует как обработанных, так и контрольных клиентов для построения предиктивной модели, которая фокусируется на инкрементальном ответе. Для понимания этого типа модели предполагается, что существует фундаментальная сегментация, которая разделяет клиентов на следующие группы (их названия были предложены Н. Рэдклиффом и объяснены в [3] )

  • Убеждаемые  : клиенты, которые реагируют на маркетинговое действие только потому, что оно было направлено на них
  • Несомненные факты  : клиенты, которые бы отреагировали, независимо от того, были ли они целевыми или нет
  • Потерянные дела  : клиенты, которые не будут реагировать независимо от того, являются ли они целевыми или нет.
  • «Не беспокоить» или «Спящие собаки»  : клиенты, которые с меньшей вероятностью ответят, потому что они были объектом атаки

Единственный сегмент, который обеспечивает действительно постепенные ответы, — это Persuadables .

Моделирование подъема предоставляет методику оценки, которая позволяет разделить клиентов на группы, описанные выше.

Традиционное моделирование реагирования часто нацелено на « верные вещи», поскольку не позволяет отличить их от « убеждаемых» .

Возврат инвестиций

Поскольку моделирование подъема фокусируется только на инкрементных ответах, оно обеспечивает очень сильные случаи возврата инвестиций при применении к традиционным действиям по формированию и удержанию спроса. Например, ориентируясь только на убедительных клиентов в исходящей маркетинговой кампании, можно значительно улучшить затраты на контакт и, следовательно, возврат на единицу затрат.

Устранение негативных последствий

Одно из наиболее эффективных применений моделирования подъема — устранение негативных эффектов кампаний по удержанию. Как в телекоммуникационной, так и в финансовой сфере кампании по удержанию часто могут заставить клиентов расторгнуть контракт или политику. Моделирование подъема позволяет исключить этих клиентов, «Не беспокоить», из кампании.

Применение к A/B и многомерному тестированию

Редко бывает так, что есть одна группа обработки и контроля. Часто «обработка» может быть множеством простых вариаций сообщения или многоэтапной контактной стратегией, которая классифицируется как одна обработка. В случае A/B или многовариантного тестирования моделирование подъема может помочь понять, обеспечивают ли вариации в тестах какой-либо значительный подъем по сравнению с другими критериями таргетинга, такими как поведенческие или демографические показатели.

История моделирования поднятия

Первое появление истинного моделирования реакции , по-видимому, относится к работам Рэдклиффа и Сурри. [4]

Виктор Ло также опубликовал на эту тему работу «The True Lift Model» (2002), [5] а затем снова Рэдклифф в работе «Использование контрольных групп для нацеливания на прогнозируемый подъем: построение и оценка моделей подъема» (2007). [6]

Рэдклифф также предоставляет очень полезный раздел часто задаваемых вопросов (FAQ) на своем веб-сайте Scientific Marketer. [7] Ло (2008) предлагает более общую структуру, от проектирования программ до прогностического моделирования и оптимизации, а также будущих областей исследований. [8]

Независимо моделирование подъема изучал Петр Жепаковски. Вместе с Шимоном Ярошевичем он адаптировал теорию информации для построения многоклассовых деревьев решений подъема и опубликовал статью в 2010 году. [9] А позже в 2011 году они расширили алгоритм до случая множественного лечения. [10]

Похожие подходы были исследованы в персонализированной медицине . [11] [12] Шимон Ярошевич и Петр Жепаковски (2014) разработали методологию повышения для анализа выживаемости и применили ее к рандомизированному контролируемому исследованию. [13] Йонг (2015) объединил математический алгоритм оптимизации с помощью динамического программирования с методами машинного обучения для оптимальной стратификации пациентов. [14]

Моделирование подъема является частным случаем старой психологической концепции дифференциального прогнозирования. [15] В отличие от дифференциального прогнозирования, моделирование подъема предполагает наличие активного агента и использует меру подъема в качестве метрики оптимизации.

Моделирование подъема недавно было расширено и включено в различные алгоритмы машинного обучения , такие как индуктивное логическое программирование , [15] байесовские сети , [16] статистическое реляционное обучение , [12] машины опорных векторов , [17] [18] анализ выживания [13] и ансамблевое обучение . [19]

Несмотря на то, что моделирование подъема широко применяется в маркетинговой практике (наряду с политическими выборами), оно редко появлялось в маркетинговой литературе. Кейн, Ло и Чжэн (2014) опубликовали тщательный анализ трех наборов данных с использованием нескольких методов в маркетинговом журнале и предоставили доказательства того, что более новый подход (известный как метод четырех квадрантов) довольно хорошо зарекомендовал себя на практике. [20] Ло и Пачаманова (2015) расширили моделирование подъема до предписывающей аналитики для ситуаций с множественным лечением и предложили алгоритмы для решения больших детерминированных задач оптимизации и сложных задач стохастической оптимизации, где оценки неточны. [21]

В недавних исследованиях анализируется эффективность различных современных моделей подъема в сравнительных исследованиях с использованием больших объемов данных. [22] [1]

Подробное описание моделирования подъема, его истории, способа построения моделей подъема, отличий от построения классических моделей, а также методов оценки, специфичных для подъема, сравнение различных программных решений и объяснение различных экономических сценариев можно найти здесь. [23]

Реализации

На языке питона

  • CausalML, реализация алгоритмов, связанных с причинно-следственным выводом и машинным обучением, направленная на преодоление разрыва между теоретической работой по методологии и практическим применением [24]
  • DoubleML, реализует фреймворк машинного обучения с двойным/уменьшенным кодом Черножукова и др. [25]
  • EconML, оценивающий эффекты гетерогенного лечения на основе данных наблюдений с помощью машинного обучения, созданный в рамках проекта Microsoft Research « Автоматизированное обучение и интеллект для причинно-следственной связи и экономики» (ALICE)
  • UpliftML обеспечивает масштабируемое моделирование неограниченного и ограниченного подъема на основе экспериментальных данных.
  • PyLift (был заархивирован на GitHub 29 ноября 2022 г.)
  • scikit-uplift, обеспечивает быструю реализацию моделей в стиле sklearn , оценочные метрики и инструменты визуализации

В Р

  • DoubleML, реализует фреймворк машинного обучения с двойным/уменьшенным кодом Черножукова и др. [25]
  • пакет повышения (был удален из CRAN 19 февраля 2022 г.)

Другие языки

  • JMP от SAS
  • Портретный подъем Питни Боуз
  • Узел Uplift для KNIME от Dymatrix
  • Моделирование подъема в Миро от Stochastic Solutions

Наборы данных

  • Набор данных Hillstrom Email Marketing
  • Набор данных прогнозирования Criteo Uplift
  • Набор данных моделирования Lenta Uplift
  • Набор данных для моделирования X5 RetailHero Uplift
  • MegaFon Uplift Конкурсный набор данных

Примечания и ссылки

  1. ^ ab Devriendt, Floris; Moldovan, Darie; Verbeke, Wouter (2018). «Обзор литературы и экспериментальная оценка современного состояния моделирования подъема: ступенька к развитию предписывающей аналитики». Big Data . 6 (1): 13– 41. doi :10.1089/big.2017.0104. PMID  29570415.
  2. ^ Губела, Робин М.; Лессманн, Стефан; Ярошевич, Шимон (2020). «Трансформация отклика и разложение прибыли для моделирования роста доходов». Европейский журнал операционных исследований . 283 (2): 647– 661. arXiv : 1911.08729 . doi : 10.1016/j.ejor.2019.11.030. S2CID  208175716.
  3. ^ Н. Рэдклифф (2007). Определение того, кого можно спасти, а кого оттолкнет деятельность по удержанию . Stochastic Solution Limited
  4. ^ Рэдклифф, Нью-Джерси; и Сурри, П.Д. (1999); Анализ дифференциального отклика: Моделирование истинного отклика путем изоляции эффекта одного действия , в Трудах по кредитному скорингу и кредитному контролю VI , Центр кредитных исследований, Школа менеджмента Эдинбургского университета
  5. ^ Lo, VSY (2002); Модель истинного подъема , Информационный бюллетень исследований ACM SIGKDD, том 4, № 2, 78–86, доступно по адресу http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=4FD247B4987CBF2E29186DACE0D40C3D?doi=10.1.1.99.7064&rep=rep1&type=pdf
  6. ^ Рэдклифф, Нью-Джерси (2007); Использование контрольных групп для определения прогнозируемого подъема: построение и оценка моделей подъема , Журнал аналитики прямого маркетинга, Ассоциация прямого маркетинга
  7. ^ Часто задаваемые вопросы о научном маркетологе по моделированию подъема
  8. ^ Ло, ВСЙ (2008) «Новые возможности в маркетинговом анализе данных». В «Энциклопедии хранилищ и анализа данных», 2-е издание, под редакцией Вана (2008), Idea Group Publishing.
  9. ^ Жепаковский, Петр; Ярошевич, Шимон (2010). «Деревья решений для моделирования поднятий». Международная конференция IEEE 2010 по интеллектуальному анализу данных . Сидней, Австралия. стр.  441–450 . doi :10.1109/ICDM.2010.62. ISBN 978-1-4244-9131-5. S2CID  14362608.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  10. ^ Rzepakowski, Piotr; Jaroszewicz, Szymon (2011). «Деревья решений для моделирования подъема с одиночной и множественной обработкой». Knowledge and Information Systems . 32 (2): 303– 327. doi : 10.1007/s10115-011-0434-0 .
  11. ^ Cai, T.; Tian, ​​L.; Wong, PH; и Wei, LJ (2009); Анализ данных рандомизированных сравнительных клинических испытаний для персонализированного выбора лечения , Серия рабочих документов по биостатистике Гарвардского университета, документ 97
  12. ^ ab Nassif, Houssam; Kuusisto, Finn; Burnside, Elizabeth S; Page, David; Shavlik, Jude; Santos Costa, Vitor (2013). "Score as You Lift (SAYL): A Statistical Relational Learning Approach to Uplift Modeling". Advanced Information Systems Engineering . Lecture Notes in Computer Science. Vol. 8190. Prague. pp.  595– 611. doi :10.1007/978-3-642-40994-3_38. ISBN 978-3-642-38708-1. PMC  4492311 . PMID  26158122.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  13. ^ аб Ярошевич, Шимон; Жепаковский, Петр (2014). «Моделирование поднятия с данными о выживании» (PDF) . Семинар ACM SIGKDD по медицинской информатике (HI KDD'14) . Нью-Йорк, США.
  14. ^ Йонг, Ф. Х. (2015), «Количественные методы стратифицированной медицины», докторская диссертация, кафедра биостатистики, Гарвардская школа общественного здравоохранения им. Т. Х. Чана, http://dash.harvard.edu/bitstream/handle/1/17463130/YONG-DISSERTATION-2015.pdf?sequence=1 .
  15. ^ ab Nassif, Houssam; Santos Costa, Vitor; Burnside, Elizabeth S; Page, David (2012). "Relational Differential Prediction". Машинное обучение и обнаружение знаний в базах данных . Конспект лекций по информатике. Том 7523. Бристоль, Великобритания. С.  617– 632. doi :10.1007/978-3-642-33460-3_45. ISBN 978-3-642-33459-7.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  16. ^ Нассиф, Хаусам; Ву, Йиронг; Пейдж, Дэвид; Бернсайд, Элизабет (2012). «Логическая дифференциальная прогнозирующая байесовская сеть, улучшение диагностики рака груди у пожилых женщин». Симпозиум Американской ассоциации медицинской информатики (AMIA'12) . 2012 : 1330–1339 . PMC 3540455. PMID  23304412 . 
  17. ^ Куусисто, Финн; Сантос Коста, Витор; Нассиф, Хусам; Бернсайд, Элизабет; Пейдж, Дэвид; Шавлик, Джуд (2014). «Машины опорных векторов для дифференциального прогнозирования». Машинное обучение и обнаружение знаний в базах данных . Конспект лекций по информатике. Том 8725. Нанси, Франция. С.  50–65 . doi :10.1007/978-3-662-44851-9_4. ISBN 978-3-662-44850-2. PMC  4492338 . PMID  26158123.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  18. ^ Заневич, Лукаш; Ярошевич, Шимон (2013). «Машины опорных векторов для моделирования подъема». Первый семинар IEEE ICDM по обнаружению причин . Даллас, Техас.
  19. ^ Солтыс, Михал; Ярошевич, Шимон; Жепаковский, Петр (2015). «Ансамблевые методы моделирования поднятий». Интеллектуальный анализ данных и обнаружение знаний . 29 (6): 1531–1559 . doi : 10.1007/s10618-014-0383-9 .
  20. ^ Кейн, К.; Ло, В.С.Й.; Чжэн, Дж. (2014). «Поиск по-настоящему отзывчивых клиентов и потенциальных клиентов с использованием моделирования True-Lift: сравнение новых и существующих методов». Журнал маркетинговой аналитики . 2 (4): 218– 238. doi :10.1057/jma.2014.18. S2CID  256513132.
  21. ^ Ло, ВСЙ; Пачаманова, Д. (2015). «От моделирования прогнозного подъема к аналитике предписывающего подъема: практический подход к оптимизации лечения с учетом риска оценки». Журнал маркетинговой аналитики . 3 (2): 79–95 . doi :10.1057/jma.2015.5. S2CID  256508939.
  22. ^ Gubela, Robin M.; Bequé, Artem; Lessmann, Stefan; Gebert, Fabian (2019). «Conversion Uplift in E-Commerce: A Systematic Benchmark of Modeling Strategies». International Journal of Information Technology & Decision Making . 18 (3): 747– 791. doi : 10.1142/S0219622019500172. hdl : 10419/230773 . S2CID  126538764.
  23. ^ Р. Михель, И. Шнакенбург, Т. фон Мартенс (2019). «Targeting Uplift». Springer, ISBN 978-3-030-22625-1 
  24. ^ Чэнь, Хуэйган; Харинен, Тотте; Ли, Чон-Юн; Юнг, Майк; Чжао, Чжэньюй (2020-03-02), CausalML: Пакет Python для каузального машинного обучения, arXiv, doi :10.48550/arXiv.2002.11631, arXiv:2002.11631 , получено 22.01.2025
  25. ^ ab Черножуков, Виктор; Четвериков, Денис; Демирер, Мерт; Дюфло, Эстер; Хансен, Кристиан; Ньюи, Уитни; Робинс, Джеймс (2018-02-01). "Двойное/беспристрастное машинное обучение для лечения и структурных параметров". The Econometrics Journal . 21 (1): C1 – C68 . doi :10.1111/ectj.12097. hdl : 10419/189736 . ISSN  1368-4221.

Смотрите также

  • Эбби Джонсон объясняет, как это работает, в этой видеотрансляции
  • Вводный технический документ с полными ссылками
  • Эрик Сигел: Моделирование подъема
  • Руководство пользователя по моделированию подъема на uplift-modeling.com
Взято с "https://en.wikipedia.org/w/index.php?title=Uplift_modelling&oldid=1272087824"