ДеГрут обучение

Процесс социального обучения

Обучение ДеГрута относится к типу социального обучения по принципу «правила большого пальца». Идея была сформулирована в общей форме американским статистиком Моррисом Х. ДеГрутом ; [1] предшественники были сформулированы Джоном Р. П. Френчем [2] и Фрэнком Харари. [3] Модель использовалась в физике , информатике и наиболее широко в теории социальных сетей . [4] [5]

Настройка и процесс обучения

Возьмем общество агентов, где у каждого есть мнение по какому-либо вопросу, представленное вектором вероятностей . Агенты не получают новой информации, на основе которой они могли бы обновить свои мнения, но они общаются с другими агентами. Связи между агентами (кто знает кого) и вес, который они придают мнениям друг друга, представлены матрицей доверия, где — вес, который агент придает мнению агента. Таким образом, матрица доверия находится во взаимно-однозначном отношении с взвешенным направленным графом , где есть ребро между и тогда и только тогда, когда . Матрица доверия является стохастической , ее строки состоят из неотрицательных действительных чисел, причем каждая строка дает в сумме 1. н {\displaystyle n} п ( 0 ) = ( п 1 ( 0 ) , , п н ( 0 ) ) {\displaystyle p(0)=(p_{1}(0),\dots ,p_{n}(0))} Т {\displaystyle Т} Т я дж {\displaystyle T_{ij}} я {\displaystyle я} дж {\displaystyle j} я {\displaystyle я} дж {\displaystyle j} Т я дж > 0 {\displaystyle T_{ij}>0}

Формально убеждения обновляются в каждом периоде по мере

п ( т ) = Т п ( т 1 ) {\displaystyle p(t)=Tp(t-1)}

поэтому мнения th периода связаны с первоначальными мнениями т {\displaystyle т}

п ( т ) = Т т п ( 0 ) {\displaystyle p(t)=T^{t}p(0)}

Схождение убеждений и консенсус

Важный вопрос заключается в том, сходятся ли убеждения к пределу и друг к другу в долгосрочной перспективе. Поскольку матрица доверия является стохастической , стандартные результаты в теории цепей Маркова могут быть использованы для установления условий, при которых предел

п ( ) = лим т п ( т ) = лим т Т т п ( 0 ) {\displaystyle p(\infty )=\lim _{t\to \infty }p(t)=\lim _{t\to \infty }T^{t}p(0)}

существует для любых начальных убеждений . Следующие случаи рассматриваются в Golub и Jackson [6] (2010). п ( 0 ) [ 0 , 1 ] н {\displaystyle p(0)\in [0,1]^{n}}

Сильно связанный случай

Если граф социальной сети (представленный матрицей доверия) является сильно связанным , то сходимость убеждений эквивалентна каждому из следующих свойств:

  • представленный график является апериодическим Т {\displaystyle Т}
  • существует единственный левый собственный вектор , соответствующий собственному значению 1, сумма элементов которого равна 1, такой что для каждого , для каждого , где обозначает скалярное произведение . с {\displaystyle с} Т {\displaystyle Т} п [ 0 , 1 ] н {\displaystyle p\in [0,1]^{n}} ( лим т Т т п ) я = с п {\displaystyle \left(\lim _{t\to \infty }T^{t}p\right)_{i}=s\cdot p} я { 1 , , н } {\displaystyle i\in \{1,\точки ,n\}} {\displaystyle \cdot}

Эквивалентность между двумя последними утверждениями является прямым следствием теоремы Перрона–Фробениуса .

Общий случай

Для того чтобы иметь конвергентные убеждения, не обязательно иметь тесно связанную социальную сеть, однако равенство ограничивающих убеждений в общем случае не выполняется.

Мы говорим, что группа агентов замкнута , если для любого , только если . Убеждения сходятся тогда и только тогда, когда каждый набор узлов (представляющих индивидов), который сильно связан и замкнут, также апериодичен . С { 1 , , н } {\displaystyle C\subseteq \{1,\dots ,n\}} я С {\displaystyle i\in C} Т я дж > 0 {\displaystyle T_{ij}>0} дж С {\displaystyle j\in C}

Консенсус

Говорят, что группа людей достигает консенсуса, если для любого . Это означает, что в результате процесса обучения в пределе у них возникает одно и то же убеждение по данному вопросу. С {\displaystyle С} п я ( ) = п дж ( ) {\ displaystyle p_ {i} (\ infty) = p_ {j} (\ infty)} я , дж С {\displaystyle i,j\in C}

В случае сильно связанной и апериодической сети вся группа достигает консенсуса. В общем, любая сильно связанная и закрытая группа индивидов достигает консенсуса для каждого начального вектора убеждений тогда и только тогда, когда он апериодический. Если, например, есть две группы, удовлетворяющие этим предположениям, они достигают консенсуса внутри групп, но не обязательно консенсуса на уровне общества. С {\displaystyle С}

Социальное влияние

Возьмем сильно связанную и апериодическую социальную сеть. В этом случае общее ограничивающее убеждение определяется первоначальными убеждениями через

п ( ) = с п ( 0 ) {\displaystyle p(\infty)=s\cdot p(0)}

где — уникальный левый собственный вектор единичной длины , соответствующий собственному значению 1. Вектор показывает веса, которые агенты придают начальным убеждениям друг друга в пределе консенсуса. Таким образом, чем выше , тем большее влияние индивидуум оказывает на консенсусное убеждение. с {\displaystyle с} Т {\displaystyle Т} с {\displaystyle с} с я {\displaystyle s_{i}} я {\displaystyle я}

Свойство собственного вектора подразумевает, что с = с Т {\displaystyle s=sT}

с я = дж = 1 н Т дж я с дж {\displaystyle s_{i}=\sum _{j=1}^{n}T_{ji}s_{j}}

Это означает, что влияние представляет собой средневзвешенное влияние тех агентов , которые обращают внимание на , с весами их уровня доверия. Следовательно, влиятельные агенты характеризуются тем, что им доверяют другие лица с высоким влиянием. я {\displaystyle я} с дж {\displaystyle s_{j}} я {\displaystyle я}

Примеры

Эти примеры приведены в работе Джексона [4] (2008).

Схождение убеждений

Общество с конвергентными убеждениями

Рассмотрим общество из трех человек со следующей матрицей доверия:

Т = ( 0 1 / 2 1 / 2 1 0 0 0 1 0 ) {\displaystyle T={\begin{pmatrix}0&1/2&1/2\\1&0&0\\0&1&0\\\end{pmatrix}}}

Следовательно, первый человек взвешивает убеждения двух других с равным весом, в то время как второй слушает только первого, третий только второго человека. Для этой структуры социального доверия предел существует и равен

лим т Т т п ( 0 ) = ( лим т Т т ) п ( 0 ) = ( 2 / 5 2 / 5 1 / 5 2 / 5 2 / 5 1 / 5 2 / 5 2 / 5 1 / 5 ) п ( 0 ) {\displaystyle \lim _{t\to \infty }T^{t}p(0)=\left(\lim _{t\to \infty }T^{t}\right)p(0)={\begin{pmatrix}2/5&2/5&1/5\\2/5&2/5&1/5\\2/5&2/5&1/5\\\end{pmatrix}}p(0)}

поэтому вектор влияния равен , а консенсусное убеждение равно . Другими словами, независимо от первоначальных убеждений, индивиды достигают консенсуса, где первоначальное убеждение первого и второго человека имеет в два раза большее влияние, чем убеждение третьего. с = ( 2 / 5 , 2 / 5 , 1 / 5 ) {\displaystyle s=\left(2/5,2/5,1/5\right)} 2 / 5 п 1 ( 0 ) + 2 / 5 п 2 ( 0 ) + 1 / 5 п 3 ( 0 ) {\displaystyle 2/5p_{1}(0)+2/5p_{2}(0)+1/5p_{3}(0)}

Неконвергентные убеждения

Общество с неконвергентными убеждениями

Если мы изменим предыдущий пример так, что третий человек также будет слушать исключительно первого, то получим следующую матрицу доверия:

Т = ( 0 1 / 2 1 / 2 1 0 0 1 0 0 ) {\displaystyle T={\begin{pmatrix}0&1/2&1/2\\1&0&0\\1&0&0\\\end{pmatrix}}}

В этом случае для любого мы имеем к 1 {\displaystyle k\geq 1}

Т 2 к 1 = ( 0 1 / 2 1 / 2 1 0 0 1 0 0 ) {\displaystyle T^{2k-1}={\begin{pmatrix}0&1/2&1/2\\1&0&0\\1&0&0\\\end{pmatrix}}}

и

Т 2 к = ( 1 0 0 0 1 / 2 1 / 2 0 1 / 2 1 / 2 ) {\displaystyle T^{2k}={\begin{pmatrix}1&0&0\\0&1/2&1/2\\0&1/2&1/2\\\end{pmatrix}}}

так что не существует и убеждения не сходятся в пределе. Интуитивно, 1 обновляется на основе убеждений 2 и 3, в то время как 2 и 3 обновляются исключительно на основе убеждения 1, поэтому они меняют свои убеждения в каждом периоде. лим т Т т {\displaystyle \lim _{t\to \infty }T^{t}}

Асимптотические свойства в больших обществах: мудрость

Можно изучить результаты процесса обучения ДеГроота в больших обществах, то есть в пределе. н {\displaystyle n\to \infty }

Пусть предмет, по которому у людей есть мнения, будет "истинным состоянием" . Предположим, что у людей есть независимые шумовые сигналы (теперь верхний индекс относится ко времени, аргумент к размеру общества). Предположим, что для всех матрица доверия такова, что ограничивающие убеждения существуют независимо от начальных убеждений. Тогда последовательность обществ называется мудрой , если μ [ 0 , 1 ] {\displaystyle \mu \in [0,1]} п я ( 0 ) ( н ) {\displaystyle p_{i}^{(0)}(n)} μ {\displaystyle \мю} н {\displaystyle n} Т ( н ) {\displaystyle T(n)} п я ( ) ( н ) {\displaystyle p_{i}^{(\infty)}(n)} ( Т ( н ) ) н = 1 {\displaystyle \left(T(n)\right)_{n=1}^{\infty }}

макс я н | п я ( ) μ |   п   0 {\displaystyle \max _{i\leq n}|p_{i}^{(\infty )}-\mu |{\xrightarrow {\ p\ }}0}

где обозначает сходимость по вероятности . Это означает, что если общество растет без ограничений, со временем у них возникнет общее и точное убеждение по неопределенному вопросу.   п   {\displaystyle {\xrightarrow {\ p\ }}}

Необходимое и достаточное условие мудрости может быть задано с помощью векторов влияния. Последовательность обществ мудра тогда и только тогда, когда

лим н макс я н с я ( н ) = 0 {\displaystyle \lim _{n\to \infty }\max _{i\leq n}s_{i}(n)=0}

то есть общество мудро именно тогда, когда влияние даже самого влиятельного индивида исчезает в пределе большого общества. Для дальнейшей характеристики и примеров см. Голуб и Джексон [6] (2010).

Ссылки

  1. ^ ДеГрут, Моррис Х. 1974. «Достижение консенсуса». Журнал Американской статистической ассоциации , 69(345): 118–21.
  2. ^ Френч, Джон РП 1956. «Формальная теория социальной власти» Психологический обзор , 63: 181–94.
  3. ^ Харари, Фрэнк. 1959. «Критерий единодушия в теории социальной власти Френча» в книге Дорвина Картрайта (ред.), Исследования социальной власти , Энн-Арбор, Мичиган: Институт социальных исследований.
  4. ^ ab Джексон, Мэтью О. 2008. Социальные и экономические сети. Princeton University Press.
  5. ^ Колей, Гаурав; Дешмукх, Джаяти; Шриниваса, Шринатх (2020). «Социальный капитал как взаимодействие и пересмотр убеждений». В Арефе, Самин; Бончева, Калина; Брагьери, Марко; Дигнум, Фрэнк; Джаннотти, Фоска; Гризолия, Франческо; Педрески, Дино (ред.). Социальная информатика . Конспекты лекций по информатике. Том. 12467. Чам: Springer International Publishing. стр.  137–151 . doi : 10.1007/978-3-030-60975-7_11. ISBN 978-3-030-60975-7. S2CID  222233101.
  6. ^ ab Голуб, Бенджамин и Мэтью О. Джексон 2010. «Наивное обучение в социальных сетях и мудрость толпы», Американский экономический журнал: Микроэкономика, Американская экономическая ассоциация, т. 2(1), страницы 112-49, февраль.
Взято с "https://en.wikipedia.org/w/index.php?title=DeGroot_learning&oldid=1174069503"