Перелив (эксперимент)

В экспериментах переток — это косвенное воздействие на субъекта, не затронутого экспериментом напрямую. Эти эффекты полезны для анализа политики , но усложняют статистический анализ экспериментов.

Анализ побочных эффектов подразумевает ослабление предположения о невмешательстве, или SUTVA (предположение о стабильной ценности лечения единицы). Это предположение требует, чтобы раскрытие субъектом i своих потенциальных результатов зависело только от собственного статуса лечения этого субъекта i и не было затронуто статусом лечения другого субъекта j . В обычных условиях, когда исследователь стремится оценить средний эффект лечения ( ), нарушение предположения о невмешательстве означает, что традиционные оценщики для ATE, такие как разница в средних значениях, могут быть смещены . Однако существует много реальных случаев, когда раскрытие подразделением потенциальных результатов зависит от назначения лечения другому подразделению, и анализ этих эффектов может быть столь же важным, как и анализ прямого эффекта лечения. А Т Э ^ {\displaystyle {\widehat {ATE}}}

Одним из решений этой проблемы является переопределение причинной оценки интереса путем переопределения потенциальных результатов субъекта с точки зрения собственного статуса лечения и статуса лечения связанных субъектов. Затем исследователь может проанализировать различные оценки интереса по отдельности. Одно важное предположение здесь заключается в том, что этот процесс охватывает все модели перетоков и что не остается никаких немоделированных перетоков (например, перетоки происходят в пределах домохозяйства из двух человек, но не за его пределами).

После того, как потенциальные результаты переопределены, остальная часть статистического анализа включает моделирование вероятностей подвергнуться лечению с учетом определенного графика назначения лечения и использование обратного взвешивания вероятности (IPW) для получения несмещенных (или асимптотически несмещенных) оценок интересующей величины.

Примеры побочных эффектов

Эффекты перетока могут возникать различными способами. Распространенные приложения включают анализ перетоков социальных сетей и географических перетоков. Вот несколько примеров:

  • Коммуникация : вмешательство, передающее информацию о технологии или продукте, может повлиять на решения других участников сети, если оно распространяется за пределы первоначального пользователя. [1]
  • Конкуренция : Помощь в трудоустройстве для молодых соискателей может повлиять на перспективы рынка труда тех, кто не прошел обучение, но конкурирует за те же рабочие места. [2]
  • Заражение: прием препаратов для дегельминтизации может снизить вероятность заражения других людей этой болезнью. [3]
  • Сдерживание : Информация о государственных проверках в конкретных муниципалитетах может распространяться на близлежащие муниципалитеты. [4]
  • Перемещение: вмешательство полиции в работу «горячей точки», которое увеличивает присутствие полиции на определенной улице, может привести к перемещению преступности на близлежащие необработанные улицы. [5]
  • Перераспределение ресурсов : точечное вмешательство полиции, которое увеличивает присутствие полиции на определенной улице, может уменьшить присутствие полиции на близлежащих улицах.
  • Социальное сравнение : программа, которая случайным образом распределяет людей для получения ваучера на переезд в новый район, может дополнительно повлиять на убеждения контрольной группы относительно их жилищных условий. [6]

В таких примерах лечение в рандомизированном контролируемом исследовании может иметь прямой эффект на тех, кто получает вмешательство, а также побочный эффект на тех, кто не подвергался непосредственному лечению.

Статистические вопросы

Оценка побочных эффектов в экспериментах поднимает три статистических вопроса, которые исследователи должны учитывать.

Ослабление предположения о невмешательстве

Одним из ключевых предположений для беспристрастного вывода является предположение о невмешательстве, которое утверждает, что потенциальные результаты индивидуума раскрываются только его собственным назначением лечения, а не назначением лечения других. [7] Это предположение также называется индивидуалистическим ответом на лечение [8] или предположением о стабильной ценности лечения единицы . Невмешательство нарушается, когда субъекты могут общаться друг с другом о своем лечении, решениях или опыте, тем самым влияя на потенциальные результаты друг друга. Если предположение о невмешательстве не выполняется, единицы больше не имеют только два потенциальных результата (леченый и контрольный), а множество других потенциальных результатов, которые зависят от назначений лечения других единиц, [9] что усложняет оценку среднего эффекта лечения .

Оценка эффектов перетока требует ослабления предположения о невмешательстве. Это связано с тем, что результаты подразделения зависят не только от его назначения лечения, но и от назначения лечения его соседей. Исследователь должен установить набор потенциальных результатов, которые ограничивают тип вмешательства. В качестве примера рассмотрим эксперимент, в котором студентам бакалавриата рассылают политическую информацию для повышения их политического участия. Если исследуемая группа состоит из всех студентов, живущих с соседом по комнате в общежитии колледжа, можно представить четыре набора потенциальных результатов в зависимости от того, получил ли информацию студент или его партнер (предположим, что перетока за пределами каждой двухместной комнаты не было):

  • Y 0,0 относится к потенциальным результатам для отдельного человека, когда он не получает лечения (0) и его сосед по комнате тоже не получал лечения (0).
  • Y 0,1 относится к потенциальному результату для отдельного человека, когда он не проходит лечение (0), но его сосед по комнате проходит лечение (1).
  • Y 1,0 относится к потенциальному результату для отдельного человека, когда он проходит лечение (1), а его сосед по комнате не проходит лечение (0).
  • Y 1,1 относится к потенциальному результату лечения отдельного человека (1) и его соседа по комнате (1).

Теперь на результаты человека влияет как то, получил ли он лечение, так и то, получил ли его сосед по комнате лечение. Мы можем оценить один тип эффекта перелива , посмотрев, как результаты человека изменяются в зависимости от того, получил ли его сосед по комнате лечение или нет, при условии, что человек не получал лечения напрямую. Это будет отражено разницей Y 0,1 - Y 0,0 . Аналогичным образом мы можем измерить, как результаты человека изменяются в зависимости от статуса лечения его соседа по комнате, когда сам человек проходит лечение. Это равносильно взятию разницы Y 1,1 - Y 1,0 .

В то время как исследователи обычно принимают эксперименты , поскольку они требуют менее требовательных предположений, перетоки могут быть «неограниченными по объему и не поддающимися определению по форме». [10] Исследователь должен сделать конкретные предположения о том, какие типы перетоков являются действующими. Можно ослабить предположение о невмешательстве различными способами в зависимости от того, как перетоки, как предполагается, происходят в данной обстановке. Одним из способов моделирования эффектов перетока является бинарный индикатор того, был ли также обработан непосредственный сосед, как в примере выше. Можно также постулировать эффекты перетока, которые зависят от количества непосредственных соседей, которые также были обработаны, также известные как эффекты уровня k. [11]

Картографирование экспозиции

Преобразование сетей в матрицу смежности

Следующим шагом после переопределения интересующей нас причинной оценки является характеристика вероятности побочного воздействия для каждого субъекта в анализе с учетом некоторого вектора назначения лечения. Аронов и Самии (2017) [12] представляют метод получения матрицы вероятностей воздействия для каждой единицы в анализе.

Сначала определим диагональную матрицу с вектором вероятностей назначения лечения П = диаг ( п з 1 , п з 2 , , п з | Ω | ) . {\displaystyle \mathbf {P} =\operatorname {diag} \left(p_{\mathbf {z} _{1}},p_{\mathbf {z} _{2}},\dots ,p_{\mathbf {z} _{|\Omega |}}\right).}

Во-вторых, определите матрицу индикаторов того, подвержен ли блок переливу или нет. Это делается с помощью матрицы смежности , как показано справа, где информация о сети может быть преобразована в матрицу индикаторов. Эта результирующая матрица индикаторов будет содержать значения , реализованные значения случайной двоичной переменной , указывающие, подвержен ли блок переливу или нет. я {\displaystyle \mathbf {Я} } г к {\displaystyle d_{k}} Д я = ф ( З , θ я ) {\displaystyle D_{i}=f\left(\mathbf {Z} ,\theta _{i}\right)}

В-третьих, получим сэндвич-продукт , матрицу N  ×  N , содержащую два элемента: индивидуальную вероятность воздействия по диагонали и совместные вероятности воздействия по диагоналям: я к П я к {\ displaystyle \ mathbf {I} _ {k} \ mathbf {P} \ mathbf {I} _ {k} ^ {\ prime }} π я ( г к ) {\displaystyle \пи _{i}\left(d_{k}\right)} π я дж ( г к ) {\displaystyle \пи _{ij}\left(d_{k}\right)}

я к П я к = [ π 1 ( г к ) π 12 ( г к ) π 1 Н ( г к ) π 21 ( г к ) π 2 ( г к ) π 2 Н ( г к ) π Н 1 ( г к ) π Н 2 ( г к ) π Н ( г к ) ] {\displaystyle \mathbf {I} _{k}\mathbf {P} \mathbf {I} _{k}^{\prime }=\left[{\begin{array}{cccc}{\pi _{1}(d_{k})}&\pi _{12}(d_{k})&\cdots &\pi _{1N}(d_{k})\\\pi _{21}(d_{k})&\pi _{2}(d_{k})&\cdots &\pi _{2N}(d_{k})\\\vdots &\vdots &\ddots &\\\pi _{N1}(d_{k})&\pi _{N2}(d_{k})&{}&\pi _{N}(d_{k})\end{array}}\right]} Аналогичным образом совместную вероятность воздействия i , находящегося в условиях воздействия , и j, находящегося в других условиях воздействия, можно получить путем вычисления : г к {\displaystyle d_{k}} г л {\displaystyle d_{l}} я к П я л {\ displaystyle \ mathbf {I} _ {k} \ mathbf {P} \ mathbf {I} _ {l} ^ {\ prime }}

я к П я л = [ 0 π 12 ( г к , г л ) π 1 Н ( г к , г л ) π 21 ( г к , г л ) 0 π 2 Н ( г к , г л ) π Н 1 ( г к , г л ) π Н 2 ( г к , г л ) 0 ] {\displaystyle \mathbf {I} _{k}\mathbf {P} \mathbf {I} _{l}^{\prime }=\left[{\begin{array}{cccc }{0}&{\pi _{12}\left(d_{k},d_{l}\right)}&{\dots }&{\pi _{1N}\left(d_{k},d_{l}\right)}\\{\pi _{21}\left(d_{k},d_{l}\right)}&{0}&{\ldots }&{\pi _{2N}\left(d_{k},d_{l}\right)}\\{\vdots }&{\vdots }&{\ddots }&{}\\\pi _{N1}(d_{k},d_{l})&\пи _{N2}(d_{k},d_{l})&&0\end{array}}\right]} Обратите внимание, что диагонали во второй матрице равны 0, поскольку субъект не может одновременно подвергаться воздействию двух различных условий воздействия, точно так же, как субъект не может одновременно выявить два различных потенциальных результата.

Полученные вероятности воздействия затем можно использовать для обратного взвешивания вероятностей (IPW, описано ниже) в оценщике, таком как оценщик Хорвица–Томпсона . π {\displaystyle \пи}

Важное предостережение заключается в том, что эта процедура исключает все единицы, вероятность воздействия которых равна нулю (например, единицы, не связанные ни с какими другими единицами), поскольку эти числа оказываются в знаменателе регрессии IPW.

Необходимость в обратных вероятностных весах

На этом рисунке показана сеть, иллюстрирующая необходимость обратных весов вероятности. На подрисунке A показана сеть из 25 узлов, 6 из которых подлежат лечению. На подрисунке B показана вероятность назначения перелива для каждой единицы при условии, что обработаны 3 единицы.

Оценка эффектов перетока требует дополнительной осторожности: хотя лечение назначается напрямую, статус перетока назначается косвенно и может привести к дифференциальным вероятностям назначения перетока для единиц. Например, субъект с 10 дружескими связями с большей вероятностью будет косвенно подвержен лечению, чем субъект с только одной дружеской связью. Неучет различных вероятностей воздействия перетока может исказить оценки среднего эффекта перетока.

На рисунке 1 показан пример, в котором подразделения имеют различные вероятности назначения в условие перетока. На подрисунке A показана сеть из 25 узлов, в которой подразделения, выделенные зеленым цветом, имеют право на лечение. Перетоки определяются как разделяющие по крайней мере одно ребро с обработанным подразделением. Например, если узел 16 обработан, узлы 11, 17 и 21 будут классифицированы как подразделения перетока. Предположим, что три из этих шести зеленых подразделений выбраны случайным образом для лечения, так что возможны различные наборы назначений лечения. В этом случае на подрисунке B показана вероятность назначения каждого узла условию перетока. Узел 3 назначается в условие перетока в 95% рандомизаций, поскольку он разделяет ребра с тремя обработанными подразделениями. Этот узел будет контрольным узлом только в 5% рандомизаций: то есть, когда три обработанных узла — 14, 16 и 18. Между тем, узел 15 назначается для перетока только в 50% случаев — если узел 14 не подвергается прямой обработке, узел 15 не будет назначен для перетока. ( 6 3 ) = 20 {\displaystyle {\binom {6}{3}}=20}

Использование обратных вероятностных весов

При анализе экспериментов с различными вероятностями назначения следует соблюдать особые меры предосторожности. Эти различия в вероятностях назначения могут быть нейтрализованы регрессией с обратной вероятностью (IPW) , где каждое наблюдение взвешивается обратной величиной его вероятности быть назначенным условию лечения, наблюдаемому с использованием оценщика Хорвица-Томпсона . [13] Этот подход решает проблему смещения , которое может возникнуть, если потенциальные результаты были систематически связаны с вероятностями назначения. Недостатком этого оценщика является то, что он может быть чреват изменчивостью выборки , если некоторым наблюдениям придается большой вес (т. е. единица с низкой вероятностью быть переливом случайно назначается условию перелива).

Использование рандомизированного вывода для проверки гипотез

В некоторых условиях оценка изменчивости эффекта перетока создает дополнительные трудности. Когда исследование имеет фиксированную единицу кластеризации , такую ​​как школа или домохозяйство, исследователи могут использовать традиционные инструменты корректировки стандартных ошибок , такие как кластерно-устойчивые стандартные ошибки, которые допускают корреляции в терминах ошибок внутри кластеров, но не между ними. [14] Однако в других условиях нет фиксированной единицы кластеризации. Для проведения проверки гипотез в этих условиях рекомендуется использовать вывод рандомизации . [15] Этот метод позволяет генерировать p-значения и доверительные интервалы, даже когда перетоки не придерживаются фиксированной единицы кластеризации, но близлежащие единицы, как правило, назначаются аналогичным условиям перетока, как в случае нечеткой кластеризации .

Смотрите также

Ссылки

  1. ^ «Распространение технологий в социальных сетях: данные программы обучения по кофе в Руанде». IGC . 31 марта 2010 г. Получено 11 декабря 2018 г.
  2. ^ Замора, Филипп; Ратело, Роланд; Гурганд, Марк; Дюфло, Эстер; Крепон, Бруно (2013-05-01). «Имеют ли политики на рынке труда эффекты смещения? Данные кластеризованного рандомизированного эксперимента». The Quarterly Journal of Economics . 128 (2): 531– 580. doi : 10.1093/qje/qjt001. hdl : 1721.1/82896 . ISSN  0033-5533. S2CID  15381050.
  3. ^ «Черви: определение воздействия на образование и здоровье при наличии внешних эффектов лечения | Эдвард Мигель, профессор экономики, Калифорнийский университет в Беркли». emiguel.econ.berkeley.edu . Получено 11 декабря 2018 г.
  4. ^ Авис, Эрик; Ферраз, Клаудио; Финан, Фредерико (2018). «Снижают ли государственные аудиты коррупцию? Оценка последствий разоблачения коррумпированных политиков» (PDF) . Журнал политической экономии . 126 (5): 1912– 1964. doi :10.1086/699209. hdl :10419/176135. S2CID  36161954.
  5. ^ Вайсбурд, Дэвид; Телеп, Коди В. (2014-05-01). «Охрана горячих точек: что мы знаем и что нам нужно знать». Журнал современного уголовного правосудия . 30 (2): 200–220 . doi :10.1177/1043986214525083. ISSN  1043-9862. S2CID  145692978.
  6. ^ Собель, Майкл (2006). «Что демонстрируют рандомизированные исследования жилищной мобильности?». Журнал Американской статистической ассоциации . 101 (476): 1398– 1407. doi :10.1198/016214506000000636. S2CID  739283.
  7. ^ "PsycNET". psycnet.apa.org . Получено 2018-12-11 .
  8. ^ Мански, Чарльз Ф. (2013-02-01). «Идентификация реакции на лечение с социальными взаимодействиями» (PDF) . The Econometrics Journal . 16 (1): S1 – S23 . doi :10.1111/j.1368-423X.2012.00368.x. hdl : 10419/64721 . ISSN  1368-4221. S2CID  1559596.
  9. ^ Розенбаум, Пол Р. (2007). «Интерференция между единицами в рандомизированных экспериментах». Журнал Американской статистической ассоциации . 102 (477): 191– 200. CiteSeerX 10.1.1.571.7817 . doi :10.1198/016214506000001112. S2CID  38153548. 
  10. ^ Розенбаум, Пол Р. (2007). «Интерференция между единицами в рандомизированных экспериментах». Журнал Американской статистической ассоциации . 102 (477): 191– 200. CiteSeerX 10.1.1.571.7817 . doi :10.1198/016214506000001112. S2CID  38153548. 
  11. ^ Као, Эдвард; Тулис, Панос (2013-02-13). «Оценка эффектов причинно-следственного влияния». Международная конференция по машинному обучению : 1489–1497 .
  12. ^ Аронов, Питер М.; Сэми, Сайрус (2017-12-01). «Оценка средних причинных эффектов при общем вмешательстве с применением к эксперименту с социальными сетями». Анналы прикладной статистики . 11 (4): 1912–1947 . arXiv : 1305.6156 . doi : 10.1214/16-aoas1005. ISSN  1932-6157. S2CID  26963450.
  13. ^ Хортвиц, Д. Г.; Томпсон, Д. Дж. (1952). «Обобщение выборки без возвращения из конечной вселенной». Журнал Американской статистической ассоциации . 47 (260): 663– 685. doi :10.1080/01621459.1952.10483446. JSTOR  2280784. S2CID  120274071.
  14. ^ А. Колин Кэмерон; Дуглас Л. Миллер. «Руководство для практиков по кластерно-устойчивому выводу» (PDF) . Cameron.econ.ucdavis.edu . Получено 19 декабря 2018 г. .
  15. ^ "10 вещей, которые нужно знать о выводе рандомизации". Egap.org . Получено 11 декабря 2018 г.
Взято с "https://en.wikipedia.org/w/index.php?title=Spillover_(experiment)&oldid=1192012130"