Центральность

Степень связанности внутри графа

В теории графов и сетевом анализе индикаторы центральности присваивают номера или рейтинги узлам в графе в соответствии с их положением в сети. Приложения включают определение наиболее влиятельных лиц в социальной сети , ключевых узлов инфраструктуры в Интернете или городских сетях , суперраспространителей заболеваний и мозговых сетей. [1] [2] Концепции центральности были впервые разработаны в анализе социальных сетей , и многие из терминов, используемых для измерения центральности, отражают их социологическое происхождение. [3]

Определение и характеристика индексов центральности

Индексы центральности являются ответами на вопрос «Что характеризует важную вершину?» Ответ дается в терминах действительной функции на вершинах графа, где полученные значения, как ожидается, обеспечат ранжирование, которое идентифицирует наиболее важные узлы. [4] [5] [6]

Слово «важность» имеет широкий спектр значений, что приводит к множеству различных определений центральности. Были предложены две схемы категоризации. «Важность» может быть понята в отношении типа потока или передачи по сети. Это позволяет классифицировать центральности по типу потока, который они считают важным. [5] «Важность» может быть альтернативно понята как участие в связности сети. Это позволяет классифицировать центральности на основе того, как они измеряют связность. [7] Оба этих подхода делят центральности на отдельные категории. Еще один вывод заключается в том, что центральность, которая подходит для одной категории, часто «ошибается» при применении к другой категории. [5]

Многие, хотя и не все, меры центральности эффективно подсчитывают количество путей (также называемых обходами) некоторого типа, проходящих через заданную вершину; меры различаются тем, как определяются и подсчитываются соответствующие обходы. Ограничение рассмотрения этой группой позволяет таксономию, которая помещает многие центральности в спектр от тех, которые связаны с обходами длины один (степенная центральность) до бесконечных обходов (центрированность по собственному вектору). [4] [8] Другие меры центральности, такие как центральность по промежуточности, фокусируются не только на общей связанности, но и на занимаемых позициях, которые имеют решающее значение для связности сети.

Характеристика по сетевым потокам

Сеть можно считать описанием путей, по которым что-то течет. Это позволяет характеризовать на основе типа потока и типа пути, закодированного центральностью. Поток может быть основан на передачах, где каждый неделимый элемент идет от одного узла к другому, как посылка, идущая от места доставки к дому клиента. Второй случай - последовательное дублирование, в котором элемент реплицируется так, что он есть и у источника, и у цели. Примером является распространение информации через сплетни, при этом информация распространяется частным образом, и как исходный, так и целевой узлы информируются в конце процесса. Последний случай - параллельное дублирование, при котором элемент дублируется по нескольким ссылкам одновременно, как радиопередача, которая предоставляет одну и ту же информацию многим слушателям одновременно. [5]

Аналогично, тип пути может быть ограничен геодезическими (кратчайшие пути), путями (ни одна вершина не посещается более одного раза), тропами (вершины могут посещаться несколько раз, ни одно ребро не пересекается более одного раза) или прогулками (вершины и ребра могут посещаться/пересекаться несколько раз). [5]

Характеристика по структуре походки

Альтернативная классификация может быть получена из того, как построена центральность. Она снова разделяется на два класса. Центральности бывают радиальными и медиальными. Радиальные центральности подсчитывают маршруты, которые начинаются/заканчиваются в данной вершине. Центральности степени и собственного значения являются примерами радиальных центральностей, подсчитывая количество маршрутов длины один или бесконечности. Медиальные центральности подсчитывают маршруты, которые проходят через данную вершину. Каноническим примером является центральность Фримена по промежуточности, количество кратчайших путей, которые проходят через данную вершину. [7]

Аналогично, подсчет может охватывать либо объем , либо длину прогулок. Объем — это общее количество прогулок заданного типа. Три примера из предыдущего абзаца попадают в эту категорию. Длина охватывает расстояние от заданной вершины до остальных вершин в графе. Центральность по близости, общее геодезическое расстояние от заданной вершины до всех остальных вершин, является наиболее известным примером. [7] Обратите внимание, что эта классификация не зависит от типа подсчитанной прогулки (т. е. прогулка, тропа, путь, геодезическая).

Боргатти и Эверетт предполагают, что эта типология дает представление о том, как лучше всего сравнивать меры центральности. Центральности, помещенные в один и тот же ящик в этой классификации 2×2, достаточно похожи, чтобы сделать правдоподобные альтернативы; можно разумно сравнить, что лучше для данного приложения. Однако меры из разных ящиков категорически различны. Любая оценка относительной пригодности может происходить только в контексте предопределения того, какая категория более применима, что делает сравнение спорным. [7]

Центральность радиального объема существует в спектре

Характеристика по структуре обхода показывает, что почти все широко используемые центральности являются мерами радиального объема. Они кодируют убеждение, что центральность вершины является функцией центральности вершин, с которыми она связана. Центральности различаются по тому, как определяется ассоциация.

Боначич показал, что если ассоциация определяется в терминах обходов , то семейство центральностей может быть определено на основе длины рассматриваемого обхода. [4] Степень центральности учитывает обходы длиной один, в то время как центральность по собственному значению учитывает обходы длиной бесконечность. Альтернативные определения ассоциации также разумны. Альфа-центральность позволяет вершинам иметь внешний источник влияния. Подграфовая центральность Эстрады предлагает учитывать только замкнутые пути (треугольники, квадраты и т. д.).

Сердцем таких мер является наблюдение, что степени матрицы смежности графа дают количество обходов длины, заданной этой степенью. Аналогично, экспонента матрицы также тесно связана с количеством обходов заданной длины. Начальное преобразование матрицы смежности позволяет по-другому определить тип подсчитанного обхода. При любом подходе центральность вершины может быть выражена как бесконечная сумма, либо

k = 0 A R k β k {\displaystyle \sum _{k=0}^{\infty }A_{R}^{k}\beta ^{k}}

для матричных степеней или или

k = 0 ( A R β ) k k ! {\displaystyle \sum _{k=0}^{\infty }{\frac {(A_{R}\beta )^{k}}{k!}}}

для матричных экспонент, где

  • k {\displaystyle k} длина прогулки,
  • A R {\displaystyle A_{R}} — преобразованная матрица смежности, а
  • β {\displaystyle \beta } — параметр дисконтирования, обеспечивающий сходимость суммы.

Семейство мер Боначича не преобразует матрицу смежности. Альфа-центральность заменяет матрицу смежности ее резольвентой . Подграфовая центральность заменяет матрицу смежности ее следом. Поразительный вывод заключается в том, что независимо от первоначального преобразования матрицы смежности все такие подходы имеют общее предельное поведение. По мере приближения к нулю индексы сходятся к степени центральности. По мере приближения к максимальному значению индексы сходятся к собственному значению центральности. [8] β {\displaystyle \beta } β {\displaystyle \beta }

Теоретико-игровая центральность

Общей чертой большинства вышеупомянутых стандартных мер является то, что они оценивают важность узла, фокусируясь только на роли, которую узел играет сам по себе. Однако во многих приложениях такой подход неадекватен из-за синергии, которая может возникнуть, если функционирование узлов рассматривается в группах.

Пример теоретико-игровой центральности

Например, рассмотрим задачу остановки эпидемии. Глядя на изображение сети выше, какие узлы следует вакцинировать? Основываясь на ранее описанных мерах, мы хотим распознать узлы, которые являются наиболее важными в распространении болезни. Подходы, основанные только на центральности, которые фокусируются на индивидуальных особенностях узлов, могут быть не очень хорошей идеей. Узлы в красном квадрате по отдельности не могут остановить распространение болезни, но рассматривая их как группу, мы ясно видим, что они могут остановить болезнь, если она началась в узлах , , и . Теоретико-игровые центральности пытаются консультироваться с описанными проблемами и возможностями, используя инструменты из теории игр. Подход, предложенный в [9], использует число Шепли . Из-за сложности вычисления числа Шепли по времени большинство усилий в этой области направлено на реализацию новых алгоритмов и методов, которые полагаются на особую топологию сети или особый характер проблемы. Такой подход может привести к снижению сложности по времени с экспоненциальной до полиномиальной. v 1 {\displaystyle v_{1}} v 4 {\displaystyle v_{4}} v 5 {\displaystyle v_{5}}

Аналогично, распределение полномочий концепции решения ( [10] ) применяет индекс мощности Шепли-Шубика , а не значение Шепли , для измерения двустороннего прямого влияния между игроками. Распределение действительно является типом центральности собственного вектора. Оно используется для сортировки объектов больших данных в Ху (2020), [11], таких как рейтинг колледжей США.

Важные ограничения

Индексы центральности имеют два важных ограничения, одно очевидное, а другое тонкое. Очевидное ограничение заключается в том, что центральность, которая оптимальна для одного приложения, часто неоптимальна для другого приложения. Действительно, если бы это было не так, нам не нужно было бы так много различных центральностей. Иллюстрацией этого явления служит граф воздушных змеев Кракхардта , для которого три различных понятия центральности дают три различных выбора самой центральной вершины. [12]

Более тонким ограничением является распространенное заблуждение, что центральность вершин указывает на относительную важность вершин. Индексы центральности явно предназначены для создания рейтинга, который позволяет указывать на наиболее важные вершины. [4] [5] С этим они справляются хорошо, при только что отмеченном ограничении. Они не предназначены для измерения влияния узлов в целом. Недавно сетевые физики начали разрабатывать метрики влияния узлов для решения этой проблемы.

Ошибка двоякая. Во-первых, ранжирование только упорядочивает вершины по важности, оно не количественно определяет разницу в важности между различными уровнями ранжирования. Это можно смягчить, применив централизацию Фримена к рассматриваемой мере центральности, что дает некоторое представление о важности узлов в зависимости от различий в их оценках централизации. Кроме того, централизация Фримена позволяет сравнивать несколько сетей, сравнивая их самые высокие оценки централизации. [13]

Во-вторых, признаки, которые (правильно) идентифицируют наиболее важные вершины в данной сети/приложении, не обязательно обобщаются на остальные вершины. Для большинства других сетевых узлов рейтинги могут быть бессмысленными. [14] [15] [16] [17] Это объясняет, почему, например, только первые несколько результатов поиска изображений Google отображаются в разумном порядке. Pagerank — крайне нестабильная мера, показывающая частые смены ранга после небольших корректировок параметра jump. [18]

Хотя неспособность индексов центральности обобщать остальную часть сети может на первый взгляд показаться нелогичной, она напрямую следует из приведенных выше определений. Сложные сети имеют неоднородную топологию. В той степени, в которой оптимальная мера зависит от структуры сети наиболее важных вершин, мера, которая оптимальна для таких вершин, является субоптимальной для остальной части сети. [14]

Степень центральности

Примеры A) центральности по промежуточности , B) центральности по близости , C) центральности по собственному вектору , D) центральности по степени , E) гармонической центральности и F) центральности по Кацу одного и того же случайного геометрического графа.



Исторически первым и концептуально самым простым является степень центральности , которая определяется как количество ссылок, инцидентных узлу (т. е. количество связей, которые имеет узел). Степень можно интерпретировать с точки зрения непосредственного риска узла подхватить что-либо, проходящее через сеть (например, вирус или некоторую информацию). В случае направленной сети (где связи имеют направление) мы обычно определяем две отдельные меры степени центральности, а именно степень вхождения и степень исхода . Соответственно, степень вхождения — это количество связей, направленных на узел, а степень исхода — это количество связей, которые узел направляет другим. Когда связи связаны с некоторыми положительными аспектами, такими как дружба или сотрудничество, степень вхождения часто интерпретируется как форма популярности, а степень исхода — как общительность.

Степень центральности вершины для данного графа с вершинами и ребрами определяется как v {\displaystyle v} G := ( V , E ) {\displaystyle G:=(V,E)} | V | {\displaystyle |V|} | E | {\displaystyle |E|}

C D ( v ) = deg ( v ) {\displaystyle C_{D}(v)=\deg(v)}

Вычисление степени центральности для всех узлов графа требует плотного представления матрицы смежности графа, а для ребер — разреженного представления матрицы . Θ ( V 2 ) {\displaystyle \Theta (V^{2})} Θ ( E ) {\displaystyle \Theta (E)}

Определение центральности на уровне узлов можно распространить на весь граф, и в этом случае мы говорим о централизации графа . [19] Пусть будет узлом с наивысшей степенью центральности в . Пусть будет -узловым связным графом, который максимизирует следующую величину (при этом будет узлом с наивысшей степенью центральности в ): v {\displaystyle v*} G {\displaystyle G} X := ( Y , Z ) {\displaystyle X:=(Y,Z)} | Y | {\displaystyle |Y|} y {\displaystyle y*} X {\displaystyle X}

H = j = 1 | Y | [ C D ( y ) C D ( y j ) ] {\displaystyle H=\sum _{j=1}^{|Y|}[C_{D}(y*)-C_{D}(y_{j})]}

Соответственно, степень централизации графа следующая: G {\displaystyle G}

C D ( G ) = i = 1 | V | [ C D ( v ) C D ( v i ) ] H {\displaystyle C_{D}(G)={\frac {\sum _{i=1}^{|V|}[C_{D}(v*)-C_{D}(v_{i})]}{H}}}

Значение максимизируется, когда граф содержит один центральный узел, с которым соединены все остальные узлы ( звездчатый граф ), и в этом случае H {\displaystyle H} X {\displaystyle X}

H = ( n 1 ) ( ( n 1 ) 1 ) = n 2 3 n + 2. {\displaystyle H=(n-1)\cdot ((n-1)-1)=n^{2}-3n+2.}

Итак, для любого графика G := ( V , E ) , {\displaystyle G:=(V,E),}

C D ( G ) = i = 1 | V | [ C D ( v ) C D ( v i ) ] | V | 2 3 | V | + 2 {\displaystyle C_{D}(G)={\frac {\sum _{i=1}^{|V|}[C_{D}(v*)-C_{D}(v_{i})]}{|V|^{2}-3|V|+2}}}

Кроме того, новая обширная глобальная мера степени центральности под названием «Склонность к созданию центра» (TMH) определяется следующим образом: [2]

TMH = i = 1 | V | deg ( v ) 2 i = 1 | V | deg ( v ) {\displaystyle {\text{TMH}}={\frac {\sum _{i=1}^{|V|}\deg(v)^{2}}{\sum _{i=1}^{|V|}\deg(v)}}}

где TMH увеличивается с появлением степени центральности в сети.

Близость центральности

В связном графе нормализованная центральность близости (или близость ) узла — это средняя длина кратчайшего пути между узлом и всеми другими узлами в графе. Таким образом, чем более центральным является узел, тем ближе он ко всем остальным узлам.

Близость была определена Алексом Бавеласом (1950) как обратная величина удаленности , [ 20] [21] то есть где — расстояние между вершинами u и v . Однако, говоря о центральности близости, люди обычно имеют в виду ее нормализованную форму, заданную предыдущей формулой, умноженной на , где — число узлов в графе C B ( v ) = ( u d ( u , v ) ) 1 {\textstyle C_{B}(v)=(\sum _{u}d(u,v))^{-1}} d ( u , v ) {\displaystyle d(u,v)} N 1 {\displaystyle N-1} N {\displaystyle N}

C ( v ) = N 1 u d ( u , v ) . {\displaystyle C(v)={\frac {N-1}{\sum _{u}d(u,v)}}.}

Эта нормализация позволяет проводить сравнения между узлами графов разных размеров. Для многих графов существует сильная корреляция между обратной величиной близости и логарифмом степени, [22] где — степень вершины v, а α и β — константы для каждой сети. ( C ( v ) ) 1 α ln ( k v ) + β {\displaystyle (C(v))^{-1}\approx -\alpha \ln(k_{v})+\beta } k v {\displaystyle k_{v}}

Учет расстояний от или до всех других узлов не имеет значения в неориентированных графах, тогда как в ориентированных графах он может давать совершенно иные результаты (например, веб-сайт может иметь высокую центральность близости от исходящей ссылки, но низкую центральность близости от входящей ссылки).

Гармоническая центральность

В (не обязательно связном) графе гармоническая центральность меняет местами сумму и обратные операции в определении центральности близости:

H ( v ) = u | u v 1 d ( u , v ) {\displaystyle H(v)=\sum _{u|u\neq v}{\frac {1}{d(u,v)}}}

где если нет пути от u до v . Гармоническую центральность можно нормализовать, разделив на , где — количество узлов в графе. 1 / d ( u , v ) = 0 {\displaystyle 1/d(u,v)=0} N 1 {\displaystyle N-1} N {\displaystyle N}

Гармоническая центральность была предложена Марчиори и Латорой (2000) [23] , а затем независимо Деккером (2005), использовавшим название «ценностная центральность» [24] , и Роша (2009). [25]

Центральность промежуточности

Оттенок (от красного = 0 до синего = макс.) показывает промежуточность узлов.

Посредническая ценность — это мера центральности вершины в графе ( существует также посредническая ценность ребер , которая здесь не обсуждается). Посредническая ценность количественно определяет количество раз, когда узел действует как мост на кратчайшем пути между двумя другими узлами. Она была введена как мера для количественной оценки контроля человека над коммуникацией между другими людьми в социальной сети Линтоном Фрименом . [26] В его концепции вершины, которые имеют высокую вероятность появления на случайно выбранном кратчайшем пути между двумя случайно выбранными вершинами, имеют высокую посредническую ценность.

Промежуточность вершины в графе с вершинами вычисляется следующим образом: v {\displaystyle v} G := ( V , E ) {\displaystyle G:=(V,E)} V {\displaystyle V}

  1. Для каждой пары вершин ( s , t ) вычислите кратчайшие пути между ними.
  2. Для каждой пары вершин ( s , t ) определите долю кратчайших путей, проходящих через рассматриваемую вершину (в данном случае вершину v ).
  3. Просуммируйте эту дробь по всем парам вершин ( s , t ).

Более компактно промежуточность можно представить как: [27]

C B ( v ) = s v t V σ s t ( v ) σ s t {\displaystyle C_{B}(v)=\sum _{s\neq v\neq t\in V}{\frac {\sigma _{st}(v)}{\sigma _{st}}}}

где — общее число кратчайших путей от узла до узла , а — число тех путей, которые проходят через . Промежуточность может быть нормализована путем деления на число пар вершин, не включая v , что для ориентированных графов равно , а для неориентированных графов равно . Например, в неориентированном звездном графе центральная вершина (которая содержится в каждом возможном кратчайшем пути) будет иметь промежуточность (1, если нормализована), в то время как листья (которые не содержатся ни в одном кратчайшем пути) будут иметь промежуточность 0. σ s t {\displaystyle \sigma _{st}} s {\displaystyle s} t {\displaystyle t} σ s t ( v ) {\displaystyle \sigma _{st}(v)} v {\displaystyle v} ( n 1 ) ( n 2 ) {\displaystyle (n-1)(n-2)} ( n 1 ) ( n 2 ) / 2 {\displaystyle (n-1)(n-2)/2} ( n 1 ) ( n 2 ) / 2 {\displaystyle (n-1)(n-2)/2}

С точки зрения вычислений, как центральность по промежуточности, так и центральность по близости всех вершин в графе включают вычисление кратчайших путей между всеми парами вершин на графе, что требует времени с алгоритмом Флойда-Уоршелла . Однако на разреженных графах алгоритм Джонсона может быть более эффективным, требуя времени. В случае невзвешенных графов вычисления могут быть выполнены с помощью алгоритма Брандеса [27], который требует времени. Обычно эти алгоритмы предполагают, что графы неориентированные и связаны с учетом петель и множественных ребер. Когда речь идет о сетевых графах, часто графы не имеют петель или множественных ребер для поддержания простых отношений (где ребра представляют связи между двумя людьми или вершинами). В этом случае использование алгоритма Брандеса разделит окончательные баллы центральности на 2, чтобы учесть, что каждый кратчайший путь учитывается дважды. [27] O ( V 3 ) {\displaystyle O(V^{3})} O ( | V | | E | + | V | 2 log | V | ) {\displaystyle O(|V||E|+|V|^{2}\log |V|)} O ( | V | | E | ) {\displaystyle O(|V||E|)}

Центральность собственного вектора

Центральность собственного вектора (также называемая собственной центральностью ) — это мера влияния узла в сети . Она присваивает относительные баллы всем узлам в сети на основе концепции, что связи с узлами с высокой оценкой вносят больший вклад в оценку рассматриваемого узла, чем равные связи с узлами с низкой оценкой. [28] [ 6] PageRank Google и центральность Каца являются вариантами центральности собственного вектора. [29]

Использование матрицы смежности для нахождения центральности собственного вектора

Для заданного графа с числом вершин пусть будет матрицей смежности , т.е. если вершина связана с вершиной , и в противном случае. Относительная оценка центральности вершины может быть определена как неотрицательное решение по множеству вершин уравнений: G := ( V , E ) {\displaystyle G:=(V,E)} | V | {\displaystyle |V|} A = ( a v , t ) {\displaystyle A=(a_{v,t})} a v , t = 1 {\displaystyle a_{v,t}=1} v {\displaystyle v} t {\displaystyle t} a v , t = 0 {\displaystyle a_{v,t}=0} x v {\displaystyle x_{v}} v {\displaystyle v} v V {\displaystyle v\in V}

x v = 1 λ t M ( v ) x t = 1 λ t G a v , t x t {\displaystyle x_{v}={\frac {1}{\lambda }}\sum _{t\in M(v)}x_{t}={\frac {1}{\lambda }}\sum _{t\in G}a_{v,t}x_{t}}

где — набор соседей и — константа. С небольшой перестановкой это можно переписать в векторной записи как уравнение собственного вектора M ( v ) {\displaystyle M(v)} v {\displaystyle v} λ {\displaystyle \lambda }

A x = λ x {\displaystyle \mathbf {Ax} ={\lambda }\mathbf {x} } .

В общем случае будет много различных собственных значений , для которых существует ненулевое решение собственного вектора. Поскольку элементы матрицы смежности неотрицательны, существует единственное наибольшее собственное значение, которое является действительным и положительным, согласно теореме Перрона–Фробениуса . Это наибольшее собственное значение приводит к желаемой мере центральности. [28] Компонента соответствующего собственного вектора затем дает относительную оценку центральности вершины в сети. Собственный вектор определяется только с точностью до общего множителя, поэтому хорошо определены только отношения центральностей вершин. Чтобы определить абсолютную оценку, необходимо нормализовать собственный вектор, например, так, чтобы сумма по всем вершинам равнялась 1 или общему числу вершин n . Итерация мощности является одним из многих алгоритмов собственных значений , которые можно использовать для нахождения этого доминирующего собственного вектора. [29] Более того, это можно обобщить так, что записи в A могут быть действительными числами, представляющими силу связи, как в стохастической матрице . λ {\displaystyle \lambda } v t h {\displaystyle v^{th}} v {\displaystyle v}

Центральность Каца

Центральность по Кацу [30] является обобщением степени центральности. Степень центральности измеряет количество непосредственных соседей, а центральность по Кацу измеряет количество всех узлов, которые могут быть соединены через путь, в то время как вклады удаленных узлов штрафуются. Математически это определяется как

x i = k = 1 j = 1 N α k ( A k ) j i {\displaystyle x_{i}=\sum _{k=1}^{\infty }\sum _{j=1}^{N}\alpha ^{k}(A^{k})_{ji}}

где - коэффициент затухания в . α {\displaystyle \alpha } ( 0 , 1 ) {\displaystyle (0,1)}

Центральность по Кацу можно рассматривать как вариант центральности по собственному вектору. Другая форма центральности по Кацу —

x i = α j = 1 N a i j ( x j + 1 ) . {\displaystyle x_{i}=\alpha \sum _{j=1}^{N}a_{ij}(x_{j}+1).}

По сравнению с выражением центральности собственного вектора, заменяется на x j {\displaystyle x_{j}} x j + 1. {\displaystyle x_{j}+1.}

Показано [31] , что главный собственный вектор (связанный с наибольшим собственным значением матрицы смежности) является пределом центральности Каца при приближении снизу. A {\displaystyle A} α {\displaystyle \alpha } 1 λ {\displaystyle {\tfrac {1}{\lambda }}}

Центральность PageRank

PageRank удовлетворяет следующему уравнению

x i = α j a j i x j L ( j ) + 1 α N , {\displaystyle x_{i}=\alpha \sum _{j}a_{ji}{\frac {x_{j}}{L(j)}}+{\frac {1-\alpha }{N}},}

где

L ( j ) = i a j i {\displaystyle L(j)=\sum _{i}a_{ji}}

— это число соседей узла (или число исходящих ссылок в направленном графе). По сравнению с центральностью по собственному вектору и центральностью по Кацу, одним из основных отличий является масштабный коэффициент . Другое отличие между PageRank и центральностью по собственному вектору заключается в том, что вектор PageRank является левым собственным вектором (обратите внимание, что у коэффициента индексы перевернуты). [32] j {\displaystyle j} L ( j ) {\displaystyle L(j)} a j i {\displaystyle a_{ji}}

Центральность перколяции

Существует множество мер центральности для определения «важности» отдельного узла в сложной сети. Однако эти меры количественно определяют важность узла в чисто топологических терминах, и значение узла никак не зависит от «состояния» узла. Оно остается постоянным независимо от динамики сети. Это верно даже для взвешенных мер промежуточности. Однако узел вполне может быть расположен в центре с точки зрения промежуточности центральности или другой меры центральности, но может не быть «центрально» расположенным в контексте сети, в которой есть просачивание. Просачивание «заражения» происходит в сложных сетях в ряде сценариев. Например, вирусная или бактериальная инфекция может распространяться по социальным сетям людей, известным как контактные сети. Распространение болезни также можно рассматривать на более высоком уровне абстракции, рассматривая сеть городов или населенных пунктов, соединенных автомобильным, железнодорожным или воздушным сообщением. Компьютерные вирусы могут распространяться по компьютерным сетям. Слухи или новости о деловых предложениях и сделках также могут распространяться через социальные сети людей. Во всех этих сценариях «инфекция» распространяется по связям сложной сети, изменяя «состояния» узлов по мере своего распространения, как восстанавливаемые, так и нет. Например, в эпидемиологическом сценарии люди переходят из «восприимчивого» в «заражённое» состояние по мере распространения инфекции. Состояния, которые могут принимать отдельные узлы в приведенных выше примерах, могут быть бинарными (например, получил/не получил новость), дискретными (восприимчив/заражён/выздоровел) или даже непрерывными (например, доля инфицированных людей в городе) по мере распространения инфекции. Общей чертой во всех этих сценариях является то, что распространение инфекции приводит к изменению состояний узлов в сетях. С учётом этого была предложена центральность перколяции (PC), которая специально измеряет важность узлов с точки зрения содействия просачиванию через сеть. Эта мера была предложена Пиравенаном и др. [33]

Центральность перколяции определяется для данного узла в данный момент времени как доля «просачиваемых путей», проходящих через этот узел. «Просачиваемый путь» — это кратчайший путь между парой узлов, где исходный узел просачивается (например, заражен). Целевой узел может быть просачиваемым или непросачиваемым, или находиться в частично просачивающемся состоянии.

P C t ( v ) = 1 N 2 s v r σ s r ( v ) σ s r x t s [ x t i ] x t v {\displaystyle PC^{t}(v)={\frac {1}{N-2}}\sum _{s\neq v\neq r}{\frac {\sigma _{sr}(v)}{\sigma _{sr}}}{\frac {{x^{t}}_{s}}{{\sum {[{x^{t}}_{i}}]}-{x^{t}}_{v}}}}

где — общее количество кратчайших путей от узла к узлу , а — количество тех путей, которые проходят через . Состояние перколяции узла в момент времени обозначается как и два особых случая: когда , что указывает на неперколированное состояние в момент времени, тогда как когда , что указывает на полностью перколированное состояние в момент времени . Значения между ними указывают на частично перколированные состояния (например, в сети поселков это будет процент людей, инфицированных в этом городе). σ s r {\displaystyle \sigma _{sr}} s {\displaystyle s} r {\displaystyle r} σ s r ( v ) {\displaystyle \sigma _{sr}(v)} v {\displaystyle v} i {\displaystyle i} t {\displaystyle t} x t i {\displaystyle {x^{t}}_{i}} x t i = 0 {\displaystyle {x^{t}}_{i}=0} t {\displaystyle t} x t i = 1 {\displaystyle {x^{t}}_{i}=1} t {\displaystyle t}

Прикрепленные веса к путям перколяции зависят от уровней перколяции, назначенных исходным узлам, исходя из предпосылки, что чем выше уровень перколяции исходного узла, тем важнее пути, исходящие из этого узла. Узлы, которые лежат на кратчайших путях, исходящих из высокоперколированных узлов, поэтому потенциально более важны для перколяции. Определение PC также может быть расширено, чтобы включить также веса целевых узлов. Расчеты центральности перколяции выполняются во времени с эффективной реализацией, принятой из быстрого алгоритма Брандеса, и если расчет должен учитывать веса целевых узлов, то худшее время составляет . O ( N M ) {\displaystyle O(NM)} O ( N 3 ) {\displaystyle O(N^{3})}

Межклановая центральность

Кросс-кликовая центральность одного узла в сложном графе определяет связность узла с различными кликами . Узел с высокой кросс-кликовой связностью облегчает распространение информации или болезни в графе. Клики — это подграфы, в которых каждый узел соединен с каждым другим узлом в клике. Кросс-кликовая связность узла для данного графа с вершинами и ребрами определяется как , где — количество клик, к которым принадлежит вершина. Эта мера была использована Фагани в 2013 году [34], но впервые была предложена Эвереттом и Боргатти в 1998 году, где они назвали ее клико-перекрывающейся центральностью. v {\displaystyle v} G := ( V , E ) {\displaystyle G:=(V,E)} | V | {\displaystyle |V|} | E | {\displaystyle |E|} X ( v ) {\displaystyle X(v)} X ( v ) {\displaystyle X(v)} v {\displaystyle v}

централизация Фримена

Централизация любой сети является мерой того, насколько ее самый центральный узел является центральным по отношению к тому, насколько центральными являются все остальные узлы. [13] Затем меры централизации (a) вычисляют сумму разностей в центральности между самым центральным узлом в сети и всеми остальными узлами; и (b) делят эту величину на теоретически наибольшую такую ​​сумму разностей в любой сети того же размера. [13] Таким образом, каждая мера центральности может иметь свою собственную меру централизации. Определено формально, если — любая мера центральности точки , если — наибольшая такая мера в сети, и если: C x ( p i ) {\displaystyle C_{x}(p_{i})} i {\displaystyle i} C x ( p ) {\displaystyle C_{x}(p_{*})}

max i = 1 N ( C x ( p ) C x ( p i ) ) {\displaystyle \max \sum _{i=1}^{N}(C_{x}(p_{*})-C_{x}(p_{i}))}

представляет собой наибольшую сумму разностей в центральности точек для любого графа с тем же числом узлов, тогда централизация сети равна: [13] C x {\displaystyle C_{x}}

C x = i = 1 N ( C x ( p ) C x ( p i ) ) max i = 1 N ( C x ( p ) C x ( p i ) ) . {\displaystyle C_{x}={\frac {\sum _{i=1}^{N}(C_{x}(p_{*})-C_{x}(p_{i}))}{\max \sum _{i=1}^{N}(C_{x}(p_{*})-C_{x}(p_{i}))}}.}

Идея принадлежит Линтону Фримену .

Меры центральности, основанные на различиях

В проиллюстрированной сети зеленые и красные узлы являются наиболее непохожими, поскольку они не имеют общих соседей между собой. Таким образом, зеленый вносит больший вклад в центральность красного, чем серые, поскольку красный может получить доступ к синим только через зеленый, а серые узлы избыточны для красного, поскольку он может получить прямой доступ к каждому серому узлу без какого-либо посредника.

Для получения лучших результатов в ранжировании узлов заданной сети в [35] используются меры различия (специфичные для теории классификации и интеллектуального анализа данных) для обогащения мер центральности в сложных сетях. Это иллюстрируется центральностью собственного вектора , вычисляя центральность каждого узла через решение задачи собственных значений

W c = λ c {\displaystyle W\mathbf {c} =\lambda \mathbf {c} }

где (произведение координат на координату) и является произвольной матрицей несходства , определяемой через меру несходства, например, несходство Жаккара , заданное как W i j = A i j D i j {\displaystyle W_{ij}=A_{ij}D_{ij}} D i j {\displaystyle D_{ij}}

D i j = 1 | V + ( i ) V + ( j ) | | V + ( i ) V + ( j ) | {\displaystyle D_{ij}=1-{\dfrac {|V^{+}(i)\cap V^{+}(j)|}{|V^{+}(i)\cup V^{+}(j)|}}}

Эта мера позволяет нам количественно оценить топологический вклад (поэтому она называется центральностью вклада) каждого узла в центральность данного узла, при этом больший вес/значимость имеют узлы с большей степенью несходства, поскольку они предоставляют данному узлу доступ к узлам, к которым он сам не может получить прямой доступ.

Примечательно, что неотрицательно, поскольку и являются неотрицательными матрицами, поэтому мы можем использовать теорему Перрона–Фробениуса, чтобы гарантировать, что указанная выше задача имеет единственное решение для λ  =  λ max с неотрицательным c , что позволяет нам вывести центральность каждого узла в сети. Следовательно, центральность i-го узла равна W {\displaystyle W} A {\displaystyle A} D {\displaystyle D}

c i = 1 n j = 1 n W i j c j , i = 1 , , n {\displaystyle c_{i}={\dfrac {1}{n}}\sum _{j=1}^{n}W_{ij}c_{j},\,\,\,\,\,\,i=1,\cdots ,n}

где - количество узлов в сети. Несколько мер различия и сетей были протестированы в [36], получив улучшенные результаты в изученных случаях. n {\displaystyle n}

Меры центральности, используемые в транспортных сетях

Транспортные сети, такие как дорожные сети и железнодорожные сети, широко изучаются в транспортной науке и городском планировании. Ряд недавних исследований были сосредоточены на использовании мер центральности для анализа транспортных сетей. Хотя многие из этих исследований просто используют общие меры центральности, такие как Betweenness Centrality, также были определены специальные меры центральности для анализа транспортных сетей. Среди них выделяется Transportation Centrality . [37]

Транспортная центральность измеряет сумму пропорций путей от пар узлов в сети, которые проходят через рассматриваемый узел. В этом отношении она похожа на центральность по промежуточным связям. Однако, в отличие от центральности по промежуточным связям, которая рассматривает только кратчайшие пути, транспортная центральность рассматривает все возможные пути между парой узлов. Таким образом, транспортная центральность является обобщенной версией центральности по промежуточным связям, и при определенных условиях она действительно сводится к центральности по промежуточным связям.

Транспортная центральность данного узла v определяется как: [37]


T C ( v ) = 1 / ( ( N 1 ) ( N 2 ) ) Σ s v t Σ i P s , t v e β C s , t i Σ j P s , t v e β C s , t j {\displaystyle TC(v)=1/((N-1)(N-2))\Sigma _{s\neq v\neq t}{\frac {\Sigma _{i\in P_{s,t}^{v}}e^{-\beta C_{s,t}^{i}}}{\Sigma _{j\in P_{s,t}^{v}}e^{-\beta C_{s,t}^{j}}}}}

Смотрите также

Примечания и ссылки

  1. ^ Ван ден Хойвел MP, Спорнс О (декабрь 2013 г.). «Сетевые концентраторы в человеческом мозге». Тенденции в когнитивных науках . 17 (12): 683–96 . doi :10.1016/j.tics.2013.09.012. PMID  24231140. S2CID  18644584.
  2. ^ ab Saberi M, Khosrowabadi R, Khatibi A, Misic B, Jafari G (январь 2021 г.). «Топологическое влияние отрицательных связей на стабильность мозговой сети в состоянии покоя». Scientific Reports . 11 (1): 2176. Bibcode :2021NatSR..11.2176S. doi :10.1038/s41598-021-81767-7. PMC 7838299 . PMID  33500525. 
  3. ^ Newman, MEJ 2010. Сети: Введение. Оксфорд, Великобритания: Oxford University Press.
  4. ^ abcd Бонасич, Филлип (1987). «Власть и центральность: семейство мер». Американский журнал социологии . 92 (5): 1170– 1182. doi : 10.1086/228631. S2CID  145392072.
  5. ^ abcdef Боргатти, Стивен П. (2005). «Центральность и сетевой поток». Социальные сети . 27 : 55–71 . CiteSeerX 10.1.1.387.419 . doi :10.1016/j.socnet.2004.11.008. 
  6. ^ ab Christian FA Negre, Uriel N. Morzan, Heidi P. Hendrickson, Rhitankar Pal, George P. Lisi, J. Patrick Loria, Ivan Rivalta, Junming Ho, Victor S. Batista. (2018). "Центральность собственных векторов для характеристики аллостерических путей белков". Труды Национальной академии наук . 115 (52): E12201 – E12208 . arXiv : 1706.02327 . Bibcode : 2018PNAS..11512201N. doi : 10.1073 /pnas.1810452115 . PMC 6310864. PMID  30530700.  {{cite journal}}: CS1 maint: multiple names: authors list (link)
  7. ^ abcd Боргатти, Стивен П.; Эверетт, Мартин Г. (2006). «Теоретико-графовый взгляд на центральность». Социальные сети . 28 (4): 466– 484. doi :10.1016/j.socnet.2005.11.005.
  8. ^ ab Benzi, Michele; Klymko, Christine (2013). «Анализ матриц различных мер центральности». SIAM Journal on Matrix Analysis and Applications . 36 (2): 686–706 . arXiv : 1312.6722 . doi : 10.1137/130950550. S2CID  7088515.
  9. ^ Михалак, Аадитья, Щепаньски, Равиндран и Дженнингс arXiv : 1402.0567
  10. ^ Ху, Синвэй; Шепли, Ллойд (2003). «О распределении полномочий в организациях». Игры и экономическое поведение . 45 : 132–170 . doi :10.1016/s0899-8256(03)00130-1.
  11. ^ Ху, Синвэй (2020). «Сортировка больших данных по выявленным предпочтениям с применением к рейтингу колледжей». Журнал больших данных . 7. arXiv : 2003.12198 . doi : 10.1186/s40537-020-00300-1 .
  12. ^ Кракхардт, Дэвид (июнь 1990 г.). «Оценка политического ландшафта: структура, познание и власть в организациях». Administrative Science Quarterly . 35 (2): 342–369 . doi :10.2307/2393394. JSTOR  2393394.
  13. ^ abcd Freeman, Linton C. (1979), "centrality in social networks: Conceptual cleification" (PDF) , Social Networks , 1 (3): 215– 239, CiteSeerX 10.1.1.227.9549 , doi :10.1016/0378-8733(78)90021-7, S2CID  751590, архивировано из оригинала (PDF) 22.02.2016 , извлечено 31.07.2014 
  14. ^ ab Lawyer, Glenn (2015). «Понимание распространяющейся мощности всех узлов в сети: перспектива непрерывного времени». Sci Rep . 5 : 8665. arXiv : 1405.6707 . Bibcode : 2015NatSR...5E8665L. doi : 10.1038/srep08665. PMC 4345333. PMID  25727453 . 
  15. ^ da Silva, Renato; Viana, Matheus; da F. Costa, Luciano (2012). «Прогнозирование вспышки эпидемии по индивидуальным особенностям распространителей». J. Stat. Mech.: Theory Exp . 2012 (7): P07005. arXiv : 1202.0024 . Bibcode :2012JSMTE..07..005A. doi :10.1088/1742-5468/2012/07/p07005. S2CID  2530998.
  16. ^ Бауэр, Франк; Лизье, Джозеф (2012). «Определение влиятельных распространителей и эффективная оценка числа случаев заражения в моделях эпидемий: подход с подсчетом прогулок». Europhys Lett . 99 (6): 68007. arXiv : 1203.0502 . Bibcode : 2012EL.....9968007B. doi : 10.1209/0295-5075/99/68007. S2CID  9728486.
  17. ^ Sikic, Mile; Lancic, Alen; Antulov-Fantulin, Nino; Stefanic, Hrvoje (2013). «Эпидемическая центральность — есть ли недооцененное эпидемическое воздействие периферийных узлов сети?». The European Physical Journal B. 86 ( 10): 1– 13. arXiv : 1110.2558 . Bibcode : 2013EPJB...86..440S. doi : 10.1140/epjb/e2013-31025-5. S2CID  12052238.
  18. ^ Гошал, Г.; Барабси, А. Л. (2011). «Ранжирование стабильности и сверхстабильных узлов в сложных сетях». Nat Commun . 2 : 394. Bibcode : 2011NatCo...2..394G. doi : 10.1038/ncomms1396 . PMID  21772265.
  19. ^ Фримен, Линтон С. «Центральность в концептуальном разъяснении социальных сетей». Социальные сети 1.3 (1979): 215–239.
  20. ^ Алекс Бавелас. Модели общения в группах, ориентированных на выполнение задач. J. Acoust. Soc. Am , 22 (6):725–730, 1950.
  21. ^ Sabidussi, G (1966). «Индекс центральности графа». Psychometrika . 31 (4): 581– 603. doi : 10.1007/bf02289527. hdl : 10338.dmlcz/101401 . PMID  5232444. S2CID  119981743.
  22. ^ Эванс, Тим С.; Чен, Биншенг (2022). «Связывание центральности сети с мерами близости и степени». Communications Physics . 5 (1): 172. arXiv : 2108.01149 . Bibcode : 2022CmPhy...5..172E. doi : 10.1038/s42005-022-00949-5 . ISSN  2399-3650. S2CID  236881169.
  23. ^ Маркиори, Массимо; Латора, Вито (2000), «Гармония в маленьком мире», Physica A: Статистическая механика и ее приложения , 285 ( 3– 4): 539– 546, arXiv : cond-mat/0008357 , Bibcode : 2000PhyA..285..539M, doi : 10.1016/s0378-4371(00)00311-3, S2CID  10523345
  24. ^ Деккер, Энтони (2005). «Концептуальная дистанция в анализе социальных сетей». Журнал социальной структуры . 6 (3). Архивировано из оригинала 2020-12-04 . Получено 2017-02-18 .
  25. ^ Янник Роша. Центральность по близости, распространенная на несвязанные графы: индекс гармонической центральности (PDF) . Applications of Social Network Analysis, ASNA 2009. Архивировано (PDF) из оригинала 16.08.2017 . Получено 19.02.2017 .
  26. ^ Фримен, Линтон (1977). «Набор мер центральности, основанных на промежуточности». Социометрия . 40 (1): 35– 41. doi :10.2307/3033543. JSTOR  3033543.
  27. ^ abc Brandes, Ulrik (2001). "Более быстрый алгоритм для центральности по промежуточности" (PDF) . Journal of Mathematical Sociology . 25 (2): 163– 177. CiteSeerX 10.1.1.11.2024 . doi :10.1080/0022250x.2001.9990249. hdl :10983/23603. S2CID  13971996. Архивировано из оригинала 4 марта 2016 г. Получено 11 октября 2011 г. 
  28. ^ ab MEJ Newman (2016). "Математика сетей" (PDF) . В Durlauf, Steven; Blume, Lawrence E. (ред.). The New Palgrave Dictionary of Economics (2-е изд.). Springer. стр. 465ff. Архивировано (PDF) из оригинала 2021-01-22 . Получено 2006-11-09 .
  29. ^ ab Austin, David (декабрь 2006 г.). «Как Google находит иголку в стоге сена в Интернете». AMS Feature Column . Американское математическое общество. Архивировано из оригинала 11.01.2018 . Получено 24.08.2011 .
  30. ^ Кац, Л. 1953. Новый индекс статуса, полученный из социометрического индекса. Психометрика, 39–43.
  31. ^ Боначич, П. (1991). «Одновременные групповые и индивидуальные центральности». Социальные сети . 13 (2): 155– 168. doi :10.1016/0378-8733(91)90018-o.
  32. ^ Как Google ранжирует веб-страницы? Архивировано 31 января 2012 г. в Wayback Machine 20Q: About Networked Life
  33. ^ Пиравенан, М.; Прокопенко, М.; Хоссейн, Л. (2013). «Центральность перколяции: количественная оценка влияния узлов на теорию графов во время перколяции в сетях». PLOS ONE . 8 (1): e53095. Bibcode : 2013PLoSO...853095P. doi : 10.1371/journal.pone.0053095 . PMC 3551907. PMID  23349699 . 
  34. ^ Faghani, Mohamamd Reza (2013). «Исследование механизмов распространения и обнаружения червей XSS в социальных сетях». Труды IEEE по информационной криминалистике и безопасности . 8 (11): 1815– 1826. doi :10.1109/TIFS.2013.2280884. S2CID  13587900.
  35. ^ Альварес-Сокорро, А. Дж.; Эррера-Альмарса, Г. Ч.; Гонсалес-Диас, Л. А. (2015-11-25). «Эйгенцентральность, основанная на мерах различия, выявляет центральные узлы в сложных сетях». Scientific Reports . 5 : 17095. Bibcode :2015NatSR...517095A. doi :10.1038/srep17095. PMC 4658528 . PMID  26603652. 
  36. ^ Альварес-Сокорро, А. Дж.; Эррера-Альмарса; Гонсалес-Диас, Л. А. «Дополнительная информация для собственной центральности, основанная на мерах различия, выявляет центральные узлы в сложных сетях» (PDF) . Nature Publishing Group. Архивировано (PDF) из оригинала 2016-03-07 . Получено 2015-12-29 .
  37. ^ ab Piraveenan, Mahendra; Saripada, Naressa Belle (2023). «Транспортная центральность: количественная оценка относительной важности узлов в транспортных сетях на основе моделирования трафика». IEEE Access . 11 : 142214– 142234. Bibcode : 2023IEEEEA..11n2214P. doi : 10.1109/ACCESS.2023.3339121 . ISSN  2169-3536.

Дальнейшее чтение

  • Кошюцки, Д.; Леманн, КА; Питерс, Л.; Рихтер, С.; Тенфельде-Подель, Д. и Злотовски, О. (2005) Индексы центральности. В Брандес, У. и Эрлебах, Т. (ред.) Сетевой анализ: методологические основы , стр. 16–61, LNCS 3418, Springer-Verlag.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Centrality&oldid=1259333256"