Centralidad

Grado de conectividad dentro de un gráfico

En la teoría de grafos y el análisis de redes , los indicadores de centralidad asignan números o clasificaciones a los nodos dentro de un grafo correspondientes a su posición en la red. Las aplicaciones incluyen la identificación de la(s) persona(s) más influyente(s) en una red social , nodos de infraestructura clave en Internet o redes urbanas , superpropagadores de enfermedades y redes cerebrales. [1] [2] Los conceptos de centralidad se desarrollaron por primera vez en el análisis de redes sociales , y muchos de los términos utilizados para medir la centralidad reflejan su origen sociológico . [3]

Definición y caracterización de los índices de centralidad

Los índices de centralidad son respuestas a la pregunta "¿Qué caracteriza a un vértice importante?". La respuesta se da en términos de una función de valor real en los vértices de un gráfico, donde se espera que los valores producidos proporcionen una clasificación que identifique los nodos más importantes. [4] [5] [6]

La palabra "importancia" tiene una amplia variedad de significados, lo que da lugar a muchas definiciones diferentes de centralidad. Se han propuesto dos esquemas de categorización. La "importancia" puede concebirse en relación con un tipo de flujo o transferencia a través de la red. Esto permite clasificar las centralidades según el tipo de flujo que consideran importante. [5] La "importancia" puede concebirse alternativamente como la participación en la cohesión de la red. Esto permite clasificar las centralidades en función de cómo miden la cohesión. [7] Ambos enfoques dividen las centralidades en categorías distintas. Una conclusión adicional es que una centralidad que es apropiada para una categoría a menudo "se equivocará" cuando se aplica a una categoría diferente. [5]

Muchas de las medidas de centralidad, aunque no todas, cuentan efectivamente la cantidad de caminos (también llamados recorridos) de algún tipo que pasan por un vértice dado; las medidas difieren en cómo se definen y cuentan los recorridos relevantes. Restringir la consideración a este grupo permite una taxonomía que coloca muchas centralidades en un espectro que va desde las relacionadas con recorridos de longitud uno (centralidad de grado) hasta recorridos infinitos (centralidad de vector propio). [4] [8] Otras medidas de centralidad, como la centralidad de intermediación , se centran no solo en la conectividad general, sino en ocupar posiciones que son fundamentales para la conectividad de la red.

Caracterización por flujos de red

Una red puede considerarse una descripción de los caminos por los que fluye algo. Esto permite una caracterización basada en el tipo de flujo y el tipo de camino codificado por la centralidad. Un flujo puede basarse en transferencias, donde cada elemento indivisible va de un nodo a otro, como una entrega de paquete que va desde el sitio de entrega hasta la casa del cliente. Un segundo caso es la duplicación en serie, en la que un elemento se replica de manera que tanto el origen como el destino lo tengan. Un ejemplo es la propagación de información a través de chismes, con la información propagándose de manera privada y con los nodos de origen y destino siendo informados al final del proceso. El último caso es la duplicación paralela, con el elemento siendo duplicado en varios enlaces al mismo tiempo, como una transmisión de radio que proporciona la misma información a muchos oyentes a la vez. [5]

De la misma manera, el tipo de ruta se puede limitar a geodésicas (rutas más cortas), caminos (ningún vértice se visita más de una vez), senderos (los vértices se pueden visitar varias veces, ningún borde se atraviesa más de una vez) o paseos (los vértices y los bordes se pueden visitar/atravesar varias veces). [5]

Caracterización por estructura de marcha

Se puede derivar una clasificación alternativa a partir de cómo se construye la centralidad. Esta se divide nuevamente en dos clases. Las centralidades son radiales o mediales. Las centralidades radiales cuentan los recorridos que comienzan o terminan en el vértice dado. Las centralidades de grado y de valor propio son ejemplos de centralidades radiales, que cuentan el número de recorridos de longitud uno o longitud infinita. Las centralidades mediales cuentan los recorridos que pasan por el vértice dado. El ejemplo canónico es la centralidad de intermediación de Freeman, el número de caminos más cortos que pasan por el vértice dado. [7]

De la misma manera, el conteo puede capturar tanto el volumen como la longitud de los paseos. El volumen es el número total de paseos del tipo dado. Los tres ejemplos del párrafo anterior caen en esta categoría. La longitud captura la distancia desde el vértice dado hasta los vértices restantes en el gráfico. La centralidad de proximidad, la distancia geodésica total desde un vértice dado hasta todos los demás vértices, es el ejemplo más conocido. [7] Nótese que esta clasificación es independiente del tipo de paseo contado (es decir, paseo, sendero, camino, geodésico).

Borgatti y Everett proponen que esta tipología proporciona una idea de cómo comparar mejor las medidas de centralidad. Las centralidades ubicadas en la misma casilla en esta clasificación 2x2 son lo suficientemente similares como para dar lugar a alternativas plausibles; se puede comparar razonablemente cuál es mejor para una aplicación determinada. Sin embargo, las medidas de diferentes casillas son categóricamente distintas. Cualquier evaluación de la aptitud relativa solo puede ocurrir en el contexto de predeterminar qué categoría es más aplicable, lo que hace que la comparación sea discutible. [7]

Las centralidades de volumen radial existen en un espectro

La caracterización por estructura de recorrido muestra que casi todas las centralidades de uso generalizado son medidas de volumen radial. Estas codifican la creencia de que la centralidad de un vértice es una función de la centralidad de los vértices con los que está asociado. Las centralidades se distinguen entre sí según cómo se define la asociación.

Bonacich demostró que si la asociación se define en términos de recorridos , entonces se puede definir una familia de centralidades en función de la longitud del recorrido considerado. [4] La centralidad de grado cuenta los recorridos de longitud uno, mientras que la centralidad de valor propio cuenta los recorridos de longitud infinita. También son razonables las definiciones alternativas de asociación. La centralidad alfa permite que los vértices tengan una fuente externa de influencia. La centralidad de subgrafo de Estrada propone contar solo los recorridos cerrados (triángulos, cuadrados, etc.).

El núcleo de tales medidas es la observación de que las potencias de la matriz de adyacencia del grafo dan el número de caminatas de longitud dada por esa potencia. De manera similar, la matriz exponencial también está estrechamente relacionada con el número de caminatas de una longitud dada. Una transformación inicial de la matriz de adyacencia permite una definición diferente del tipo de caminata contada. Bajo cualquiera de los enfoques, la centralidad de un vértice se puede expresar como una suma infinita, ya sea

k = 0 A R k β k {\displaystyle \sum _{k=0}^{\infty }A_{R}^{k}\beta ^{k}}

para potencias matriciales o

k = 0 ( A R β ) k k ! {\displaystyle \sum _{k=0}^{\infty }{\frac {(A_{R}\beta )^{k}}{k!}}}

para matrices exponenciales, donde

  • k {\displaystyle k} es la longitud de la caminata,
  • A R {\displaystyle A_{R}} es la matriz de adyacencia transformada, y
  • β {\displaystyle \beta } es un parámetro de descuento que asegura la convergencia de la suma.

La familia de medidas de Bonacich no transforma la matriz de adyacencia. La centralidad alfa reemplaza la matriz de adyacencia con su resolvente . La centralidad del subgrafo reemplaza la matriz de adyacencia con su traza. Una conclusión sorprendente es que, independientemente de la transformación inicial de la matriz de adyacencia, todos estos enfoques tienen un comportamiento limitante común. A medida que se acerca a cero, los índices convergen a la centralidad de grado. A medida que se acerca a su valor máximo, los índices convergen a la centralidad de valor propio. [8] β {\displaystyle \beta } β {\displaystyle \beta }

Centralidad de la teoría de juegos

La característica común de la mayoría de las medidas estándar mencionadas anteriormente es que evalúan la importancia de un nodo centrándose únicamente en el papel que desempeña el nodo por sí mismo. Sin embargo, en muchas aplicaciones, este enfoque es inadecuado debido a las sinergias que pueden producirse si se considera el funcionamiento de los nodos en grupos.

Ejemplo de centralidad en la teoría de juegos

Por ejemplo, considere el problema de detener una epidemia. Mirando la imagen de arriba de la red, ¿qué nodos deberíamos vacunar? Con base en las medidas descritas previamente, queremos reconocer los nodos que son los más importantes en la propagación de la enfermedad. Los enfoques basados ​​solo en centralidades, que se centran en características individuales de los nodos, pueden no ser una buena idea. Los nodos en el cuadrado rojo, individualmente no pueden detener la propagación de la enfermedad, pero considerándolos como un grupo, vemos claramente que pueden detener la enfermedad si ha comenzado en los nodos , , y . Las centralidades de teoría de juegos intentan consultar los problemas y oportunidades descritos, utilizando herramientas de la teoría de juegos. El enfoque propuesto en [9] utiliza el valor de Shapley . Debido a la dureza de la complejidad temporal del cálculo del valor de Shapley, la mayoría de los esfuerzos en este dominio se dirigen a implementar nuevos algoritmos y métodos que se basan en una topología peculiar de la red o un carácter especial del problema. Tal enfoque puede llevar a reducir la complejidad temporal de exponencial a polinomial. v 1 {\displaystyle v_{1}} v 4 {\displaystyle v_{4}} v 5 {\displaystyle v_{5}}

De manera similar, la distribución de autoridad del concepto de solución ( [10] ) aplica el índice de poder de Shapley-Shubik , en lugar del valor de Shapley , para medir la influencia directa bilateral entre los actores. La distribución es de hecho un tipo de centralidad de vector propio. Se utiliza para ordenar objetos de big data en Hu (2020), [11] como la clasificación de universidades de EE. UU.

Limitaciones importantes

Los índices de centralidad tienen dos limitaciones importantes, una obvia y otra sutil. La limitación obvia es que una centralidad que es óptima para una aplicación a menudo es subóptima para una aplicación diferente. De hecho, si esto no fuera así, no necesitaríamos tantas centralidades diferentes. Una ilustración de este fenómeno la proporciona el gráfico de cometas de Krackhardt , para el cual tres nociones diferentes de centralidad dan tres opciones diferentes del vértice más central. [12]

La limitación más sutil es la falacia comúnmente aceptada de que la centralidad de los vértices indica la importancia relativa de los vértices. Los índices de centralidad están diseñados explícitamente para producir una clasificación que permita indicar los vértices más importantes. [4] [5] Esto lo hacen bien, con la limitación que acabamos de señalar. No están diseñados para medir la influencia de los nodos en general. Recientemente, los físicos de redes han comenzado a desarrollar métricas de influencia de nodos para abordar este problema.

El error es doble. En primer lugar, un ranking solo ordena los vértices por importancia, no cuantifica la diferencia de importancia entre los diferentes niveles del ranking. Esto se puede mitigar aplicando la centralización de Freeman a la medida de centralidad en cuestión, que proporciona cierta información sobre la importancia de los nodos en función de las diferencias en sus puntuaciones de centralización. Además, la centralización de Freeman permite comparar varias redes comparando sus puntuaciones de centralización más altas. [13]

En segundo lugar, las características que identifican (correctamente) los vértices más importantes en una red/aplicación dada no necesariamente se generalizan a los vértices restantes. Para la mayoría de los otros nodos de la red, las clasificaciones pueden no tener sentido. [14] [15] [16] [17] Esto explica por qué, por ejemplo, solo los primeros resultados de una búsqueda de imágenes de Google aparecen en un orden razonable. El PageRank es una medida altamente inestable, que muestra frecuentes reversiones de clasificación después de pequeños ajustes del parámetro de salto. [18]

Si bien el hecho de que los índices de centralidad no se generalicen al resto de la red puede parecer contraintuitivo en un primer momento, se desprende directamente de las definiciones anteriores. Las redes complejas tienen una topología heterogénea. En la medida en que la medida óptima depende de la estructura de red de los vértices más importantes, una medida que sea óptima para dichos vértices no será óptima para el resto de la red. [14]

Centralidad de grado

Ejemplos de A) Centralidad de intermediación , B) Centralidad de cercanía , C) Centralidad de vector propio , D) Centralidad de grado , E) Centralidad armónica y F) Centralidad de Katz del mismo grafo geométrico aleatorio.



Históricamente, la primera y conceptualmente más simple es la centralidad de grado , que se define como el número de enlaces incidentes sobre un nodo (es decir, el número de vínculos que tiene un nodo). El grado se puede interpretar en términos del riesgo inmediato de un nodo de contraer lo que sea que fluya a través de la red (como un virus o alguna información). En el caso de una red dirigida (donde los vínculos tienen dirección), generalmente definimos dos medidas separadas de centralidad de grado, a saber, indegree y outdegree . En consecuencia, indegree es un recuento del número de vínculos dirigidos al nodo y outdegree es el número de vínculos que el nodo dirige a otros. Cuando los vínculos se asocian a algunos aspectos positivos como la amistad o la colaboración, indegree a menudo se interpreta como una forma de popularidad y outdegree como sociabilidad.

La centralidad de grado de un vértice , para un gráfico dado con vértices y aristas, se define como v {\displaystyle v} G := ( V , E ) {\displaystyle G:=(V,E)} | V | {\displaystyle |V|} | E | {\displaystyle |E|}

C D ( v ) = deg ( v ) {\displaystyle C_{D}(v)=\deg(v)}

Para calcular la centralidad de grado de todos los nodos de un gráfico se utiliza una representación de matriz de adyacencia densa del gráfico, y para los bordes se utiliza una representación de matriz dispersa . Θ ( V 2 ) {\displaystyle \Theta (V^{2})} Θ ( E ) {\displaystyle \Theta (E)}

La definición de centralidad a nivel de nodo se puede extender a todo el grafo, en cuyo caso estamos hablando de centralización de grafo . [19] Sea el nodo con mayor centralidad de grado en . Sea el grafo conexo de nodos que maximiza la siguiente cantidad (siendo el nodo con mayor centralidad de grado en ): v {\displaystyle v*} G {\displaystyle G} X := ( Y , Z ) {\displaystyle X:=(Y,Z)} | Y | {\displaystyle |Y|} y {\displaystyle y*} X {\displaystyle X}

H = j = 1 | Y | [ C D ( y ) C D ( y j ) ] {\displaystyle H=\sum _{j=1}^{|Y|}[C_{D}(y*)-C_{D}(y_{j})]}

En consecuencia, el grado de centralización del gráfico es el siguiente: G {\displaystyle G}

C D ( G ) = i = 1 | V | [ C D ( v ) C D ( v i ) ] H {\displaystyle C_{D}(G)={\frac {\sum _{i=1}^{|V|}[C_{D}(v*)-C_{D}(v_{i})]}{H}}}

El valor de se maximiza cuando el gráfico contiene un nodo central al que están conectados todos los demás nodos (un gráfico en estrella ) y, en este caso H {\displaystyle H} X {\displaystyle X}

H = ( n 1 ) ( ( n 1 ) 1 ) = n 2 3 n + 2. {\displaystyle H=(n-1)\cdot ((n-1)-1)=n^{2}-3n+2.}

Entonces, para cualquier gráfico G := ( V , E ) , {\displaystyle G:=(V,E),}

C D ( G ) = i = 1 | V | [ C D ( v ) C D ( v i ) ] | V | 2 3 | V | + 2 {\displaystyle C_{D}(G)={\frac {\sum _{i=1}^{|V|}[C_{D}(v*)-C_{D}(v_{i})]}{|V|^{2}-3|V|+2}}}

Además, una nueva medida global extensa para la centralidad de grado denominada Tendency to Make Hub (TMH) define lo siguiente: [2]

TMH = i = 1 | V | deg ( v ) 2 i = 1 | V | deg ( v ) {\displaystyle {\text{TMH}}={\frac {\sum _{i=1}^{|V|}\deg(v)^{2}}{\sum _{i=1}^{|V|}\deg(v)}}}

donde TMH aumenta con la aparición de centralidad de grado en la red.

Centralidad de proximidad

En un gráfico conectado , la centralidad de cercanía normalizada (o cercanía ) de un nodo es la longitud promedio de la ruta más corta entre el nodo y todos los demás nodos del gráfico. Por lo tanto, cuanto más central sea un nodo, más cerca estará de todos los demás nodos.

La cercanía fue definida por Alex Bavelas (1950) como el recíproco de la lejanía , [20] [21] es decir donde es la distancia entre los vértices u y v . Sin embargo, cuando se habla de centralidad de cercanía, la gente suele referirse a su forma normalizada, dada por la fórmula anterior multiplicada por , donde es el número de nodos en el grafo C B ( v ) = ( u d ( u , v ) ) 1 {\textstyle C_{B}(v)=(\sum _{u}d(u,v))^{-1}} d ( u , v ) {\displaystyle d(u,v)} N 1 {\displaystyle N-1} N {\displaystyle N}

C ( v ) = N 1 u d ( u , v ) . {\displaystyle C(v)={\frac {N-1}{\sum _{u}d(u,v)}}.}

Esta normalización permite realizar comparaciones entre nodos de grafos de diferentes tamaños. Para muchos grafos, existe una fuerte correlación entre la inversa de la cercanía y el logaritmo del grado, [22] donde es el grado del vértice v mientras que α y β son constantes para cada red. ( C ( v ) ) 1 α ln ( k v ) + β {\displaystyle (C(v))^{-1}\approx -\alpha \ln(k_{v})+\beta } k v {\displaystyle k_{v}}

Tomar distancias desde o hacia todos los demás nodos es irrelevante en gráficos no dirigidos, mientras que puede producir resultados totalmente diferentes en gráficos dirigidos (por ejemplo, un sitio web puede tener una alta centralidad de cercanía a partir de un enlace saliente, pero una baja centralidad de cercanía a partir de enlaces entrantes).

Centralidad armónica

En un gráfico (no necesariamente conexo), la centralidad armónica invierte las operaciones de suma y recíprocas en la definición de centralidad de cercanía:

H ( v ) = u | u v 1 d ( u , v ) {\displaystyle H(v)=\sum _{u|u\neq v}{\frac {1}{d(u,v)}}}

donde si no hay camino de u a v . La centralidad armónica se puede normalizar dividiendo por , donde es el número de nodos en el gráfico. 1 / d ( u , v ) = 0 {\displaystyle 1/d(u,v)=0} N 1 {\displaystyle N-1} N {\displaystyle N}

La centralidad armónica fue propuesta por Marchiori y Latora (2000) [23] y luego de forma independiente por Dekker (2005), utilizando el nombre de "centralidad valorada", [24] y por Rochat (2009). [25]

Centralidad de intermediación

El tono (de rojo = 0 a azul = máximo) muestra la intermediación de los nodos.

La centralidad de intermediación es una medida de centralidad de un vértice dentro de un grafo (también existe la centralidad de intermediación de aristas , que no se analiza aquí). La centralidad de intermediación cuantifica la cantidad de veces que un nodo actúa como puente a lo largo del camino más corto entre otros dos nodos. Fue introducida como una medida para cuantificar el control de un humano en la comunicación entre otros humanos en una red social por Linton Freeman . [26] En su concepción, los vértices que tienen una alta probabilidad de ocurrir en un camino más corto elegido aleatoriamente entre dos vértices elegidos aleatoriamente tienen una alta centralidad.

La intermediación de un vértice en un gráfico con vértices se calcula de la siguiente manera: v {\displaystyle v} G := ( V , E ) {\displaystyle G:=(V,E)} V {\displaystyle V}

  1. Para cada par de vértices ( s , t ), calcule los caminos más cortos entre ellos.
  2. Para cada par de vértices ( s , t ), determine la fracción de caminos más cortos que pasan por el vértice en cuestión (aquí, vértice v ).
  3. Suma esta fracción sobre todos los pares de vértices ( s , t ).

De manera más compacta, la intermediación se puede representar como: [27]

C B ( v ) = s v t V σ s t ( v ) σ s t {\displaystyle C_{B}(v)=\sum _{s\neq v\neq t\in V}{\frac {\sigma _{st}(v)}{\sigma _{st}}}}

donde es el número total de caminos más cortos de nodo a nodo y es el número de esos caminos que pasan por . La intermediación se puede normalizar dividiendo por el número de pares de vértices sin incluir v , que para grafos dirigidos es y para grafos no dirigidos es . Por ejemplo, en un grafo en estrella no dirigido , el vértice central (que está contenido en cada camino más corto posible) tendría una intermediación de (1, si se normaliza) mientras que las hojas (que no están contenidas en ningún camino más corto) tendrían una intermediación de 0. σ s t {\displaystyle \sigma _{st}} s {\displaystyle s} t {\displaystyle t} σ s t ( v ) {\displaystyle \sigma _{st}(v)} v {\displaystyle v} ( n 1 ) ( n 2 ) {\displaystyle (n-1)(n-2)} ( n 1 ) ( n 2 ) / 2 {\displaystyle (n-1)(n-2)/2} ( n 1 ) ( n 2 ) / 2 {\displaystyle (n-1)(n-2)/2}

Desde un punto de vista de cálculo, tanto las centralidades de intermediación como las de cercanía de todos los vértices de un grafo implican calcular los caminos más cortos entre todos los pares de vértices de un grafo, lo que requiere tiempo con el algoritmo Floyd-Warshall . Sin embargo, en grafos dispersos, el algoritmo de Johnson puede ser más eficiente y requiere tiempo. En el caso de grafos no ponderados, los cálculos se pueden realizar con el algoritmo de Brandes [27], que requiere tiempo. Normalmente, estos algoritmos suponen que los grafos no están dirigidos y están conectados con la posibilidad de bucles y múltiples aristas. Cuando se trata específicamente de grafos de red, a menudo los grafos no tienen bucles ni múltiples aristas para mantener relaciones simples (donde las aristas representan conexiones entre dos personas o vértices). En este caso, el uso del algoritmo de Brandes dividirá las puntuaciones de centralidad finales por 2 para tener en cuenta que cada camino más corto se cuenta dos veces. [27] O ( V 3 ) {\displaystyle O(V^{3})} O ( | V | | E | + | V | 2 log | V | ) {\displaystyle O(|V||E|+|V|^{2}\log |V|)} O ( | V | | E | ) {\displaystyle O(|V||E|)}

Centralidad del vector propio

La centralidad de vector propio (también llamada centralidad propia ) es una medida de la influencia de un nodo en una red . Asigna puntuaciones relativas a todos los nodos de la red basándose en el concepto de que las conexiones a nodos con puntuaciones altas contribuyen más a la puntuación del nodo en cuestión que las conexiones iguales a nodos con puntuaciones bajas. [28] [6] El PageRank de Google y la centralidad de Katz son variantes de la centralidad de vector propio. [29]

Uso de la matriz de adyacencia para encontrar la centralidad del vector propio

Para un grafo dado con número de vértices , sea la matriz de adyacencia , es decir, si un vértice está vinculado a otro vértice , y en caso contrario. La puntuación de centralidad relativa del vértice se puede definir como: G := ( V , E ) {\displaystyle G:=(V,E)} | V | {\displaystyle |V|} A = ( a v , t ) {\displaystyle A=(a_{v,t})} a v , t = 1 {\displaystyle a_{v,t}=1} v {\displaystyle v} t {\displaystyle t} a v , t = 0 {\displaystyle a_{v,t}=0} v {\displaystyle v}

x v = 1 λ t M ( v ) x t = 1 λ t G a v , t x t {\displaystyle x_{v}={\frac {1}{\lambda }}\sum _{t\in M(v)}x_{t}={\frac {1}{\lambda }}\sum _{t\in G}a_{v,t}x_{t}}

donde es un conjunto de vecinos de y es una constante. Con un pequeño reordenamiento, esto se puede reescribir en notación vectorial como la ecuación del vector propio . M ( v ) {\displaystyle M(v)} v {\displaystyle v} λ {\displaystyle \lambda }

A x = λ x {\displaystyle \mathbf {Ax} ={\lambda }\mathbf {x} }

En general, habrá muchos valores propios diferentes para los cuales existe una solución de vector propio distinto de cero. Dado que las entradas en la matriz de adyacencia no son negativas, existe un único valor propio máximo, que es real y positivo, según el teorema de Perron-Frobenius . Este valor propio máximo da como resultado la medida de centralidad deseada. [28] El componente del vector propio relacionado proporciona entonces la puntuación de centralidad relativa del vértice en la red. El vector propio solo se define hasta un factor común, por lo que solo las razones de las centralidades de los vértices están bien definidas. Para definir una puntuación absoluta, se debe normalizar el vector propio, por ejemplo, de modo que la suma de todos los vértices sea 1 o el número total de vértices n . La iteración de potencia es uno de los muchos algoritmos de valores propios que se pueden utilizar para encontrar este vector propio dominante. [29] Además, esto se puede generalizar de modo que las entradas en A puedan ser números reales que representen las fortalezas de la conexión, como en una matriz estocástica . λ {\displaystyle \lambda } v t h {\displaystyle v^{th}} v {\displaystyle v}

Centralidad de Katz

La centralidad de Katz [30] es una generalización de la centralidad de grado. La centralidad de grado mide la cantidad de vecinos directos y la centralidad de Katz mide la cantidad de todos los nodos que se pueden conectar a través de un camino, mientras que las contribuciones de los nodos distantes se penalizan. Matemáticamente, se define como

x i = k = 1 j = 1 N α k ( A k ) j i {\displaystyle x_{i}=\sum _{k=1}^{\infty }\sum _{j=1}^{N}\alpha ^{k}(A^{k})_{ji}}

donde es un factor de atenuación en . α {\displaystyle \alpha } ( 0 , 1 ) {\displaystyle (0,1)}

La centralidad de Katz puede considerarse una variante de la centralidad de vector propio. Otra forma de centralidad de Katz es

x i = α j = 1 N a i j ( x j + 1 ) . {\displaystyle x_{i}=\alpha \sum _{j=1}^{N}a_{ij}(x_{j}+1).}

En comparación con la expresión de centralidad del vector propio, se reemplaza por x j {\displaystyle x_{j}} x j + 1. {\displaystyle x_{j}+1.}

Se muestra que [31] el vector propio principal (asociado con el valor propio más grande de , la matriz de adyacencia) es el límite de la centralidad de Katz a medida que se aproxima desde abajo. A {\displaystyle A} α {\displaystyle \alpha } 1 λ {\displaystyle {\tfrac {1}{\lambda }}}

Centralidad del PageRank

PageRank satisface la siguiente ecuación

x i = α j a j i x j L ( j ) + 1 α N , {\displaystyle x_{i}=\alpha \sum _{j}a_{ji}{\frac {x_{j}}{L(j)}}+{\frac {1-\alpha }{N}},}

dónde

L ( j ) = i a j i {\displaystyle L(j)=\sum _{i}a_{ji}}

es el número de vecinos del nodo (o número de enlaces salientes en un gráfico dirigido). En comparación con la centralidad del vector propio y la centralidad de Katz, una diferencia importante es el factor de escala . Otra diferencia entre PageRank y la centralidad del vector propio es que el vector PageRank es un vector propio de la izquierda (nótese que el factor tiene los índices invertidos). [32] j {\displaystyle j} L ( j ) {\displaystyle L(j)} a j i {\displaystyle a_{ji}}

Centralidad de percolación

Existen numerosas medidas de centralidad para determinar la "importancia" de un único nodo en una red compleja. Sin embargo, estas medidas cuantifican la importancia de un nodo en términos puramente topológicos, y el valor del nodo no depende de su "estado" de ninguna manera. Permanece constante independientemente de la dinámica de la red. Esto es cierto incluso para las medidas de intermediación ponderadas. Sin embargo, un nodo puede perfectamente estar ubicado centralmente en términos de centralidad de intermediación u otra medida de centralidad, pero puede no estar ubicado "centralmente" en el contexto de una red en la que hay percolación. La percolación de un "contagio" ocurre en redes complejas en varios escenarios. Por ejemplo, una infección viral o bacteriana puede propagarse a través de redes sociales de personas, conocidas como redes de contacto. La propagación de una enfermedad también puede considerarse en un nivel más alto de abstracción, contemplando una red de ciudades o centros de población, conectados por carreteras, ferrocarriles o enlaces aéreos. Los virus informáticos pueden propagarse a través de redes informáticas. Los rumores o noticias sobre ofertas y acuerdos comerciales también pueden propagarse a través de redes sociales de personas. En todos estos escenarios, un "contagio" se propaga a través de los vínculos de una red compleja, alterando los "estados" de los nodos a medida que se propaga, ya sea recuperable o no. Por ejemplo, en un escenario epidemiológico, los individuos pasan del estado "susceptible" al "infectado" a medida que se propaga la infección. Los estados que pueden adoptar los nodos individuales en los ejemplos anteriores podrían ser binarios (como recibir/no recibir una noticia), discretos (susceptible/infectado/recuperado) o incluso continuos (como la proporción de personas infectadas en una ciudad), a medida que se propaga el contagio. La característica común en todos estos escenarios es que la propagación del contagio da como resultado el cambio de estados de los nodos en las redes. La centralidad de percolación (CP) se propuso con esto en mente, que mide específicamente la importancia de los nodos en términos de ayudar a la percolación a través de la red. Esta medida fue propuesta por Piraveenan et al. [33]

La centralidad de percolación se define para un nodo determinado, en un momento determinado, como la proporción de "caminos de percolación" que pasan por ese nodo. Un "camino de percolación" es un camino más corto entre un par de nodos, donde el nodo de origen está percolado (por ejemplo, infectado). El nodo de destino puede estar percolado o no percolado, o en un estado parcialmente percolado.

P C t ( v ) = 1 N 2 s v r σ s r ( v ) σ s r x t s [ x t i ] x t v {\displaystyle PC^{t}(v)={\frac {1}{N-2}}\sum _{s\neq v\neq r}{\frac {\sigma _{sr}(v)}{\sigma _{sr}}}{\frac {{x^{t}}_{s}}{{\sum {[{x^{t}}_{i}}]}-{x^{t}}_{v}}}}

donde es el número total de caminos más cortos de nodo a nodo y es el número de esos caminos que pasan por . El estado de percolación del nodo en el momento se denota por y dos casos especiales son cuando que indica un estado no percolado en el momento mientras que cuando que indica un estado completamente percolado en el momento . Los valores intermedios indican estados parcialmente percolados (por ejemplo, en una red de municipios, este sería el porcentaje de personas infectadas en ese municipio). σ s r {\displaystyle \sigma _{sr}} s {\displaystyle s} r {\displaystyle r} σ s r ( v ) {\displaystyle \sigma _{sr}(v)} v {\displaystyle v} i {\displaystyle i} t {\displaystyle t} x t i {\displaystyle {x^{t}}_{i}} x t i = 0 {\displaystyle {x^{t}}_{i}=0} t {\displaystyle t} x t i = 1 {\displaystyle {x^{t}}_{i}=1} t {\displaystyle t}

Los pesos asociados a las rutas de percolación dependen de los niveles de percolación asignados a los nodos de origen, basándose en la premisa de que cuanto mayor sea el nivel de percolación de un nodo de origen, más importantes son las rutas que se originan en ese nodo. Por lo tanto, los nodos que se encuentran en rutas más cortas que se originan en nodos altamente percolados son potencialmente más importantes para la percolación. La definición de PC también se puede ampliar para incluir los pesos de los nodos de destino. Los cálculos de centralidad de percolación se ejecutan en el tiempo con una implementación eficiente adoptada del algoritmo rápido de Brandes y, si el cálculo necesita considerar los pesos de los nodos de destino, el peor tiempo posible es . O ( N M ) {\displaystyle O(NM)} O ( N 3 ) {\displaystyle O(N^{3})}

Centralidad entre camarillas

La centralidad entre camarillas de un solo nodo en un grafo complejo determina la conectividad de un nodo con diferentes camarillas . Un nodo con alta conectividad entre camarillas facilita la propagación de información o enfermedad en un grafo. Las camarillas son subgrafos en los que cada nodo está conectado a todos los demás nodos de la camarilla. La conectividad entre camarillas de un nodo para un grafo dado con vértices y aristas se define como donde es el número de camarillas a las que pertenece el vértice. Esta medida fue utilizada por Faghani en 2013 [34] pero fue propuesta por primera vez por Everett y Borgatti en 1998 donde la llamaron centralidad de superposición de camarillas. v {\displaystyle v} G := ( V , E ) {\displaystyle G:=(V,E)} | V | {\displaystyle |V|} | E | {\displaystyle |E|} X ( v ) {\displaystyle X(v)} X ( v ) {\displaystyle X(v)} v {\displaystyle v}

Centralización de Freeman

La centralización de cualquier red es una medida de cuán central es su nodo más central en relación con cuán centrales son todos los demás nodos. [13] Las medidas de centralización entonces (a) calculan la suma de las diferencias en centralidad entre el nodo más central en una red y todos los demás nodos; y (b) dividen esta cantidad por la suma teóricamente más grande de tales diferencias en cualquier red del mismo tamaño. [13] Por lo tanto, cada medida de centralidad puede tener su propia medida de centralización. Definida formalmente, si es cualquier medida de centralidad del punto , si es la medida más grande de tal tipo en la red, y si: C x ( p i ) {\displaystyle C_{x}(p_{i})} i {\displaystyle i} C x ( p ) {\displaystyle C_{x}(p_{*})}

max i = 1 N ( C x ( p ) C x ( p i ) ) {\displaystyle \max \sum _{i=1}^{N}(C_{x}(p_{*})-C_{x}(p_{i}))}

es la mayor suma de diferencias en la centralidad de puntos para cualquier gráfico con el mismo número de nodos, entonces la centralización de la red es: [13] C x {\displaystyle C_{x}}

C x = i = 1 N ( C x ( p ) C x ( p i ) ) max i = 1 N ( C x ( p ) C x ( p i ) ) . {\displaystyle C_{x}={\frac {\sum _{i=1}^{N}(C_{x}(p_{*})-C_{x}(p_{i}))}{\max \sum _{i=1}^{N}(C_{x}(p_{*})-C_{x}(p_{i}))}}.}

El concepto se debe a Linton Freeman .

Medidas de centralidad basadas en disimilitud

En la red ilustrada, los nodos verdes y rojos son los más disímiles porque no comparten vecinos entre ellos. Así, el verde contribuye más a la centralidad del rojo que los grises, porque el rojo puede acceder a los azules solo a través del verde, y los nodos grises son redundantes para el rojo, porque puede acceder directamente a cada nodo gris sin ningún intermediario.

Para obtener mejores resultados en el ranking de los nodos de una red dada, en [35] se utilizan medidas de disimilitud (propias de la teoría de clasificación y minería de datos) para enriquecer las medidas de centralidad en redes complejas. Esto se ilustra con la centralidad de vectores propios , calculando la centralidad de cada nodo a través de la solución del problema de valores propios.

W c = λ c {\displaystyle W\mathbf {c} =\lambda \mathbf {c} }

donde (producto de coordenadas) y es una matriz de disimilitud arbitraria , definida a través de una medida de disimilitud, por ejemplo, la disimilitud de Jaccard dada por W i j = A i j D i j {\displaystyle W_{ij}=A_{ij}D_{ij}} D i j {\displaystyle D_{ij}}

D i j = 1 | V + ( i ) V + ( j ) | | V + ( i ) V + ( j ) | {\displaystyle D_{ij}=1-{\dfrac {|V^{+}(i)\cap V^{+}(j)|}{|V^{+}(i)\cup V^{+}(j)|}}}

Donde esta medida nos permite cuantificar la contribución topológica (por eso se llama centralidad de contribución) de cada nodo a la centralidad de un nodo dado, teniendo mayor peso/relevancia aquellos nodos con mayor disimilitud, ya que estos permiten al nodo dado acceder a nodos a los que por sí mismo no puede acceder directamente.

Cabe destacar que no es negativo porque y son matrices no negativas, por lo que podemos usar el teorema de Perron-Frobenius para asegurar que el problema anterior tiene una solución única para λ  =  λ max con c no negativo, lo que nos permite inferir la centralidad de cada nodo en la red. Por lo tanto, la centralidad del i-ésimo nodo es W {\displaystyle W} A {\displaystyle A} D {\displaystyle D}

c i = 1 n j = 1 n W i j c j , i = 1 , , n {\displaystyle c_{i}={\dfrac {1}{n}}\sum _{j=1}^{n}W_{ij}c_{j},\,\,\,\,\,\,i=1,\cdots ,n}

donde es el número de nodos en la red. En [36] se probaron varias medidas de disimilitud y redes obteniendo mejores resultados en los casos estudiados. n {\displaystyle n}

Medidas de centralidad utilizadas en redes de transporte

Las redes de transporte, como las redes de carreteras y las redes ferroviarias, se estudian ampliamente en la ciencia del transporte y la planificación urbana. Varios estudios recientes se han centrado en el uso de medidas de centralidad para analizar las redes de transporte. Si bien muchos de estos estudios simplemente utilizan medidas de centralidad genéricas como la centralidad de intermediación, también se han definido medidas de centralidad personalizadas específicamente para el análisis de redes de transporte. Entre ellas, destaca la centralidad del transporte . [37]

La centralidad de transporte mide la suma de las proporciones de las rutas de pares de nodos en una red que pasan por el nodo en cuestión. En este sentido, es similar a la centralidad de intermediación. Sin embargo, a diferencia de la centralidad de intermediación, que solo considera las rutas más cortas, la centralidad de transporte considera todas las rutas posibles entre un par de nodos. Por lo tanto, la centralidad de transporte es una versión genérica de la centralidad de intermediación y, en determinadas condiciones, se reduce a la centralidad de intermediación.

La centralidad de transporte de un nodo dado v se define como: [37]


T C ( v ) = 1 / ( ( N 1 ) ( N 2 ) ) Σ s v t Σ i P s , t v e β C s , t i Σ j P s , t v e β C s , t j {\displaystyle TC(v)=1/((N-1)(N-2))\Sigma _{s\neq v\neq t}{\frac {\Sigma _{i\in P_{s,t}^{v}}e^{-\beta C_{s,t}^{i}}}{\Sigma _{j\in P_{s,t}^{v}}e^{-\beta C_{s,t}^{j}}}}}

Véase también

Notas y referencias

  1. ^ van den Heuvel MP, Sporns O (diciembre de 2013). "Núcleos de red en el cerebro humano". Tendencias en ciencias cognitivas . 17 (12): 683–96. doi :10.1016/j.tics.2013.09.012. PMID  24231140. S2CID  18644584.
  2. ^ ab Saberi M, Khosrowabadi R, Khatibi A, Misic B, Jafari G (enero de 2021). "Impacto topológico de los vínculos negativos en la estabilidad de la red cerebral en estado de reposo". Scientific Reports . 11 (1): 2176. Bibcode :2021NatSR..11.2176S. doi :10.1038/s41598-021-81767-7. PMC 7838299 . PMID  33500525. 
  3. ^ Newman, MEJ 2010. Redes: una introducción. Oxford, Reino Unido: Oxford University Press.
  4. ^ abcd Bonacich, Phillip (1987). "Poder y centralidad: una familia de medidas". Revista estadounidense de sociología . 92 (5): 1170–1182. doi :10.1086/228631. S2CID  145392072.
  5. ^ abcdef Borgatti, Stephen P. (2005). "Centralidad y flujo de red". Redes sociales . 27 : 55–71. CiteSeerX 10.1.1.387.419 . doi :10.1016/j.socnet.2004.11.008. 
  6. ^ ab Christian FA Negre, Uriel N. Morzan, Heidi P. Hendrickson, Rhitankar Pal, George P. Lisi, J. Patrick Loria, Ivan Rivalta, Junming Ho, Victor S. Batista. (2018). "Centralidad de vectores propios para la caracterización de vías alostéricas de proteínas". Actas de la Academia Nacional de Ciencias . 115 (52): E12201–E12208. arXiv : 1706.02327 . Bibcode :2018PNAS..11512201N. doi : 10.1073/pnas.1810452115 . PMC 6310864. PMID  30530700. {{cite journal}}: CS1 maint: multiple names: authors list (link)
  7. ^ abcd Borgatti, Stephen P.; Everett, Martin G. (2006). "Una perspectiva de teoría de grafos sobre la centralidad". Redes sociales . 28 (4): 466–484. doi :10.1016/j.socnet.2005.11.005.
  8. ^ ab Benzi, Michele; Klymko, Christine (2013). "Un análisis matricial de diferentes medidas de centralidad". Revista SIAM sobre análisis matricial y aplicaciones . 36 (2): 686–706. arXiv : 1312.6722 . doi :10.1137/130950550. S2CID  7088515.
  9. ^ Michalak, Aadithya, Szczepański, Ravindran y Jennings arXiv : 1402.0567
  10. ^ Hu, Xingwei; Shapley, Lloyd (2003). "Sobre la distribución de la autoridad en las organizaciones". Juegos y comportamiento económico . 45 : 132–170. doi :10.1016/s0899-8256(03)00130-1.
  11. ^ Hu, Xingwei (2020). "Ordenación de big data por preferencia revelada con aplicación a la clasificación universitaria". Journal of Big Data . 7 . arXiv : 2003.12198 . doi : 10.1186/s40537-020-00300-1 .
  12. ^ Krackhardt, David (junio de 1990). "Evaluación del panorama político: estructura, cognición y poder en las organizaciones". Administrative Science Quarterly . 35 (2): 342–369. doi :10.2307/2393394. JSTOR  2393394.
  13. ^ abcd Freeman, Linton C. (1979), "centralidad en redes sociales: Clarificación conceptual" (PDF) , Social Networks , 1 (3): 215–239, CiteSeerX 10.1.1.227.9549 , doi :10.1016/0378-8733(78)90021-7, S2CID  751590, archivado desde el original (PDF) el 22 de febrero de 2016 , consultado el 31 de julio de 2014 
  14. ^ ab Lawyer, Glenn (2015). "Entender el poder de propagación de todos los nodos de una red: una perspectiva de tiempo continuo". Sci Rep . 5 : 8665. arXiv : 1405.6707 . Bibcode :2015NatSR...5E8665L. doi :10.1038/srep08665. PMC 4345333 . PMID  25727453. 
  15. ^ da Silva, Renato; Viana, Matheus; da F. Costa, Luciano (2012). "Predicción de brotes epidémicos a partir de características individuales de los propagadores". J. Stat. Mech.: Theory Exp . 2012 (7): P07005. arXiv : 1202.0024 . Bibcode :2012JSMTE..07..005A. doi :10.1088/1742-5468/2012/07/p07005. S2CID  2530998.
  16. ^ Bauer, Frank; Lizier, Joseph (2012). "Identificación de propagadores influyentes y estimación eficiente de las cifras de infección en modelos epidémicos: un enfoque de recuento de pasos". Europhys Lett . 99 (6): 68007. arXiv : 1203.0502 . Bibcode :2012EL.....9968007B. doi :10.1209/0295-5075/99/68007. S2CID  9728486.
  17. ^ Sikic, Mile; Lancic, Alen; Antulov-Fantulin, Nino; Stefanic, Hrvoje (2013). "Centralidad epidémica: ¿hay un impacto epidémico subestimado de los nodos periféricos de la red?". The European Physical Journal B . 86 (10): 1–13. arXiv : 1110.2558 . Bibcode :2013EPJB...86..440S. doi :10.1140/epjb/e2013-31025-5. S2CID  12052238.
  18. ^ Ghoshal, G.; Barabsi, AL (2011). "Ranking de estabilidad y nodos superestables en redes complejas". Nat Commun . 2 : 394. Bibcode :2011NatCo...2..394G. doi : 10.1038/ncomms1396 . PMID  21772265.
  19. ^ Freeman, Linton C. "Centralidad en las redes sociales: clarificación conceptual". Redes sociales 1.3 (1979): 215–239.
  20. ^ Alex Bavelas. Patrones de comunicación en grupos orientados a tareas. J. Acoust. Soc. Am , 22 (6):725–730, 1950.
  21. ^ Sabidussi, G (1966). "El índice de centralidad de un grafo". Psychometrika . 31 (4): 581–603. doi :10.1007/bf02289527. hdl : 10338.dmlcz/101401 . PMID  5232444. S2CID  119981743.
  22. ^ Evans, Tim S.; Chen, Bingsheng (2022). "Vincular la centralidad de la red mide la cercanía y el grado". Física de las comunicaciones . 5 (1): 172. arXiv : 2108.01149 . Bibcode :2022CmPhy...5..172E. doi : 10.1038/s42005-022-00949-5 . ISSN  2399-3650. S2CID  236881169.
  23. ^ Marchiori, Massimo; Latora, Vito (2000), "Armonía en el mundo pequeño", Physica A: Mecánica estadística y sus aplicaciones , 285 (3–4): 539–546, arXiv : cond-mat/0008357 , Bibcode :2000PhyA..285..539M, doi :10.1016/s0378-4371(00)00311-3, S2CID  10523345
  24. ^ Dekker, Anthony (2005). «Distancia conceptual en el análisis de redes sociales». Journal of Social Structure . 6 (3). Archivado desde el original el 4 de diciembre de 2020 . Consultado el 18 de febrero de 2017 .
  25. ^ Yannick Rochat. Centralidad de cercanía extendida a grafos no conexos: el índice de centralidad armónica (PDF) . Aplicaciones del análisis de redes sociales, ASNA 2009. Archivado (PDF) desde el original el 2017-08-16 . Consultado el 2017-02-19 .
  26. ^ Freeman, Linton (1977). "Un conjunto de medidas de centralidad basadas en la intermediación". Sociometría . 40 (1): 35–41. doi :10.2307/3033543. JSTOR  3033543.
  27. ^ abc Brandes, Ulrik (2001). "Un algoritmo más rápido para la centralidad de intermediación" (PDF) . Journal of Mathematical Sociology . 25 (2): 163–177. CiteSeerX 10.1.1.11.2024 . doi :10.1080/0022250x.2001.9990249. hdl :10983/23603. S2CID  13971996. Archivado desde el original el 4 de marzo de 2016. Consultado el 11 de octubre de 2011 . 
  28. ^ ab MEJ Newman (2016). "Las matemáticas de las redes" (PDF) . En Durlauf, Steven; Blume, Lawrence E. (eds.). The New Palgrave Dictionary of Economics (2.ª ed.). Springer. pp. 465ff. Archivado (PDF) desde el original el 22 de enero de 2021. Consultado el 9 de noviembre de 2006 .
  29. ^ ab Austin, David (diciembre de 2006). "Cómo Google encuentra tu aguja en el pajar de la Web". Columna destacada de la AMS . American Mathematical Society. Archivado desde el original el 11 de enero de 2018. Consultado el 24 de agosto de 2011 .
  30. ^ Katz, L. 1953. Un nuevo índice de estatus derivado del índice sociométrico. Psychometrika, 39–43.
  31. ^ Bonacich, P (1991). "Centralidades grupales e individuales simultáneas". Redes sociales . 13 (2): 155–168. doi :10.1016/0378-8733(91)90018-o.
  32. ^ ¿ Cómo clasifica Google las páginas web? Archivado el 31 de enero de 2012 en Wayback Machine 20Q: Acerca de la vida en red
  33. ^ Piraveenan, M.; Prokopenko, M.; Hossain, L. (2013). "Centralidad de percolación: cuantificación del impacto de la teoría de grafos de los nodos durante la percolación en redes". PLOS ONE . ​​8 (1): e53095. Bibcode :2013PLoSO...853095P. doi : 10.1371/journal.pone.0053095 . PMC 3551907 . PMID  23349699. 
  34. ^ Faghani, Mohamamd Reza (2013). "Un estudio de los mecanismos de propagación y detección de gusanos XSS en redes sociales en línea". IEEE Transactions on Information Forensics and Security . 8 (11): 1815–1826. doi :10.1109/TIFS.2013.2280884. S2CID  13587900.
  35. ^ Álvarez-Socorro, AJ; Herrera-Almarza, GC; González-Díaz, LA (25 de noviembre de 2015). "La centralidad propia basada en medidas de disimilitud revela nodos centrales en redes complejas". Informes científicos . 5 : 17095. Código Bib : 2015NatSR...517095A. doi :10.1038/srep17095. PMC 4658528 . PMID  26603652. 
  36. ^ Alvarez-Socorro, AJ; Herrera-Almarza; González-Díaz, LA "Información suplementaria sobre centralidad propia basada en medidas de disimilitud revela nodos centrales en redes complejas" (PDF) . Nature Publishing Group. Archivado (PDF) desde el original el 2016-03-07 . Consultado el 2015-12-29 .
  37. ^ ab Piraveenan, Mahendra; Saripada, Naressa Belle (2023). "Centralidad del transporte: cuantificación de la importancia relativa de los nodos en las redes de transporte en función del modelado del tráfico". IEEE Access . 11 : 142214–142234. doi : 10.1109/ACCESS.2023.3339121 . ISSN  2169-3536.

Lectura adicional

  • Koschützki, D.; Lehmann, KA; Peeters, L.; Richter, S.; Tenfelde-Podehl, D. y Zlotowski, O. (2005) Centrality Indices. En Brandes, U. y Erlebach, T. (Eds.) Network Analysis: Methodological Foundations , págs. 16–61, LNCS 3418, Springer-Verlag.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Centrality&oldid=1242214784"