viernes, 16 de mayo de 2014

La suma de tus amigos y los suyos indican si eres un viralizador masivo


¿Quiénes son los propagadores más influyentes de información en una red? A los responsables de marketing, bloggers, servicios de noticias e incluso a los gobiernos les gustaría poder contestar esa pregunta. Entre otras cosas porque la respuesta podría proporcionar formas de promover productos de forma rápida, aumentar la popularidad de los partidos políticos por encima de sus rivales y sembrar la rápida difusión de noticias y opiniones.

Así que no es de extrañar que los teóricos de la red lleven algún tiempo pensando cuál es la mejor forma de identificar a estas personas y comprobar cómo podría extenderse la información que reciben por una red. De hecho, han encontrado una serie de medidas con las que identificar a los llamados superpropagadores, es decir, personas que difunden información, ideas o incluso enfermedades de forma más eficiente que cualquier otra.

Pero hay un problema. Las redes sociales son tan complejas que los científicos de la red no han sido capaces de poner a prueba sus ideas en el mundo real. Por ejemplo, siempre ha sido difícil reconstruir la estructura exacta de las redes de Twitter o Facebook. En su lugar, han creado modelos que imitan en cierto modo a las redes reales y han probado sus ideas en dichos modelos, en vez de hacerlo en las redes.

Sin embargo, cada vez hay más pruebas de que la información no se propaga a través de las redes reales de la misma manera en que lo hace a través de estos modelos idealizados. Las personas tienden a transmitir la información sólo cuando están interesadas ​​en un tema y cuando están activas, factores que son difíciles de tener en cuenta en un modelo de red puramente topológico.

Así que la pregunta sobre cómo encontrar a los superpropagadores sigue abierta. Aunque parece que la situación podría cambiar gracias al trabajo de Sen Pei en la Universidad de Beihang en Pekín (China), junto a varios colegas, que han realizado el primer estudio sobre superpropagadores en redes reales.

El equipo ha estudiado la forma en que la información fluye en torno a varias redes, que van desde la red de blogs Livejournal a la red de publicación científica en la Sociedad Americana de Física, así como en subgrupos de las redes de Twitter y Facebook. Y han descubierto el indicador clave que identifica a los superpropagadores en estas redes.

Hasta ahora, los científicos de la red han desarrollado una serie de pruebas matemáticas para medir la influencia que tienen los individuos sobre la difusión de información a través de una red. Por ejemplo, una medida es simplemente el número de conexiones que tiene una persona con otras en la red, una propiedad conocida como grado. Lo que se cree es que las personas con más conexiones son mejores a la hora de difundir información.

Otra medida utiliza el famoso algoritmo PageRank que Google desarrolló para la clasificación de páginas web. Las personas conectadas con otras personas de alto rango reciben una clasificación más alta.
Luego está la "centralidad intermedia", que mide la cantidad de atajos en una red que pasan a través de un individuo específico. Se cree es que estas personas son más capaces de inyectar información en la red.

Finalmente está la propiedad de los nodos en una red, conocida como su núcleo k (k-core). Se determina mediante la eliminación de forma repetitiva de las periferias de una red para ver qué queda de ella. El núcleo k es el paso en el que dicho nodo o persona son eliminados de la red. Obviamente, las personas más conectadas sobreviven al proceso y consiguen la puntuación de núcleo k más alta.

La pregunta que Sen y su equipo se dispusieron a contestar era cuál de estas medidas logra detectar mejor a los superpropagadores de información en una red real.

Comenzaron con LiveJournal, una red de blogs en ​​la que los usuarios mantienen listas de amigos que representan vínculos sociales con otros usuarios de LiveJournal. Esta red permite a los usuarios volver a publicar la información de otros blogs y utilizar una referencia de los enlaces que llevan a la publicación original. Esto permite a Sen y su equipo recrear no sólo la red de vínculos sociales entre los usuarios de LiveJournal, sino también la forma en que la información se transmite entre ellos.

Sen y sus colaboradoes recolectaron todas las entradas de blog desde ​​febrero de 2010 a noviembre de 2011, un total de más de 56 millones de publicaciones. De ellas, unas 600.000 contienen enlaces a otros mensajes publicados por usuarios de LiveJournal.
Los datos revelan dos importantes propiedades de la difusión de información. En primer lugar, sólo unos 250.000 usuarios participan activamente en la propagación de la información. Esto supone una pequeña fracción del total.

Pero, más importante aún, descubrieron que la información no siempre se difunde a través de la red social. Encontraron que la información podía extenderse entre dos usuarios de LiveJournal a pesar de que no tuvieran ninguna relación social.
Probablemente esto se debe a que encuentran la información fuera del ecosistema de LiveJournal, quizás a través de búsquedas en la web o a través de otras redes. "Sólo el 31,93 % de las publicaciones propagadas pueden atribuirse a los vínculos sociales observables", señalan.

Eso está en marcado contraste con las suposiciones sobre muchos modelos de red social. Dichos modelos simulan la forma en que fluye la información asumiendo que viaja directamente a través de la red de una persona a otra, como una enfermedad que se transmite por contacto físico.

El trabajo de Sen y su equipo sugiere que también resultan cruciales las influencias fuera de la red. En la práctica, la información a menudo se extiende a través de varias fuentes aparentemente independientes dentro de la red, y al mismo tiempo. Esto tiene importantes implicaciones a la hora de detectar a los superpropagadores.

Sen y compañía afirman que el grado de una persona, es decir, su cantidad de conexiones, no es un buen predictor de la difusión de la información, tal y como pensaban hasta ahora los teóricos. "Creemos que el grado del usuario no es un indicador fiable de la influencia en todas las circunstancias", aseguran.

Es más, el algoritmo PageRank a menudo es poco eficaz en este tipo de red. "Contrariamente a lo que se cree, aunque PageRank sea efectivo a la hora de clasificar páginas web, hay muchas situaciones en las que no logra localizar a los superpropagadores de información", afirman.
Por el contrario, la propiedad del núcleo k encuentra a los superpropagadores con relativa eficacia. "Una y otra vez, hemos encontrado que los mejores propagadores están situados en el núcleo k", señalan.

Lo interesante de todo esto es que Sen y su equipo encontraron resultados similares cuando examinaron la red de divulgación científica en revistas de la Sociedad Americana de Física, así como en subgrupos de las redes de Twitter y Facebook. Los usuarios de estas distintas redes mostraron el mismo comportamiento de difusión de información.

Pero antes de llegar a la conclusión de que el problema de encontrar a los superpropagadores ha sido resuelto, hay un factor adicional que debemos tener en cuenta. La medida del núcleo k es una propiedad global de la red, y sólo se puede calcular teniendo en cuenta la estructura de la red entera.

Esto no resulta muy práctico cuando se trata de grandes redes, como Facebook y Twitter, que son también las más valiosas para los responsables de marketing, los políticos, etc.
Así que Sen y su equipo han desarrollado otra medición de la influencia que funciona casi tan bien como la medida del núcleo k, pero que resulta mucho más fácil de calcular cuando se usan subconjuntos de toda la red.

Su método consiste en sumar los grados de los vecinos más cercanos de una persona, y aseguran que es casi tan bueno como la puntuación del núcleo k para predecir quién es un superpropagador.
En otras palabras, toma a cada uno de tus amigos más cercanos, cuenta el número de conexiones que tienen y luego súmalo todo. Si tus amigos más cercanos están altamente conectados, lo más probable es que seas un superpropagador.

Si es así, hay gente a la que le gustaría conocerte mejor: responsables de marketing, políticos, gobiernos, etc. Los superpropagadores son una herramienta de enorme valor, y será interesante ver cómo evoluciona el mercado para ellos y sus servicios.

Ref: arxiv.org/abs/1405.1790 : Searching For Superspreaders Of Information In Real-World Social Media

No hay comentarios:

Publicar un comentario