martes, 27 de septiembre de 2011

Minería de Datos en las Redes Sociales

¿Qué son las Redes Sociales?
Las redes sociales son estructuras sociales compuestas de grupos de personas, las cuales están conectadas por uno o varios tipos de relaciones, tales como amistad, parentesco, intereses comunes o conocimientos que comparten. Este tipo de relaciones se lleva a cabo a través de la transmición informática de datos entre los diferentes individuos que conforman a la red social, estos datos pueden ser públicos (Todos lo ven, sea dentro o fuera de la red) o privados. El auge actual de estas redes sociales ha revolucionado la forma de comunicarnos que tenemos las personas, la cantidad de datos que se comparten a diario (Imagenes, texto, conversaciones, videos y demás) es desorbitante y las posibilidades a la hora de analizar esos datos para obtener información es igualmente inmensa. Se sabe que aproximadamente el 67 por ciento de los millones de usuarios de Internet a nivel mundial usan redes sociales como Facebook, Twitter y Linkedin, pero existen miles de redes sociales diferentes, e incluso existen plataformas donde cada uno puede crear su propia red social.


¿Qué es la Minería de Datos en las Redes Sociales?
La minería de datos (Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información es previamente desconocida y se espera que resulte útil para algún proceso. En resumen, la minería de datos prepara, sondea y explora los datos para sacar la información oculta en ellos. Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en los datos.

Básicamente existen 2 modelos de Minería de Datos:
Predictivos. Estiman valores futuros de variables denominadas “variables objetivo” o “variables dependientes”, utilizando información histórica u otras variables las cuales se denominan “variables independientes” o “variables predictivas”. Por ejemplo; estimar el volumen de ventas de un nuevo punto de venta (variable objetivo), según su ubicación o volumen de ventas de locales próximos (variable independiente).  
Descriptivos. Identifican patrones que explican o agregan los datos, facilitando la exploración y análisis, no predicen nuevos datos. Por ejemplo; identificación de públicos objetivos para campañas de marketing.  


¿Cuál es el fin de la Minería de Datos en las Redes Sociales?
El fin noble que se enarbola tras la minería de datos en las redes sociales es la idea de incrementar la satisfacción de la experiencia de los usuarios, que reciben ofertas de mayor interés al haber sido diseñadas previamente en función de los datos obtenidos, los usuarios pueden contactarse con personas más similares a ellos, les llegan promociones más acordes a sus gustos, necesidades y posibilidades y mejoras del servicio en varios aspectos. Por ejemplo el análisis demográfico basado en edad, sexo o nivel de educación a un análisis de comportamiento multidimensional permite a las entidades crediticias extraer conclusiones sobre qué tipo de cliente puede ser cada persona y qué tipo de oferta puede ser de mayor interés en cada caso. Las redes sociales venden esta infomación a las diferentes empresas, constituyendo esto un eje principal en su modelo de negocio.  

¿Cómo se realiza?
Esto depende de las características de las diferentes redes sociales.
En Facebook los datos pueden configurarse para ser públicos o privados, el acceso a todo el gigantesco volúmen de datos que esta red moviliza lo tiene solamente la empresa misma de forma interna. Organizaciones externas a Facebook pueden conseguir datos de las personas por diferentes medios utilizando la api (interfaz de programación de aplicaciones), con la que es posible el desarrollo de diferentes aplicaciones, como juegos y variados servicios que la plataforma ofrece, que aunque parecen ser gratuitos, tienen como objetivo principal el recolectar datos personales de los usuarios. También se pueden hacer scripts que vayan almacenando información que los usuarios tengan como pública hasta formar inmensas Bases de Datos. O por medios menos legales como el caso del Hacker que ofrecía vender 1,5 millones de cuentas con sus contraseñas.

Actualmente están surgiendo empresas especializadas en la vigilancia de medios de comunicación social, aplicables a Twitter y otras redes sociales, cuyo objetivo es capturar y recolectar la información de los usuarios, desarrollando posteriormente los llamados “gráficos sociales” que sintetizan toda esa información. De la minería de datos en las redes sociales se puede obtener cualquier tipo de información, alguna hasta un tanto particular, como por ejemplo información sobre los estados de ánimo de la gente, que día del año es el cumpleaños de más personas, que épocas del año son más comunes las rupturas de parejas (Las rupturas aumentan en primavera y unas semanas antes de navidad y disminuyen en verano y durante las vacaciones..), cual fue la película más vista y todo lo que se nos pueda ocurrir, es inferible a través de esta técnica.
También se pueden predecir cuestiones indirectas, por ejemplo, a través de un estudio de Twitter, la universidad de Indiana en EEUU, ha descubierto una correlación estadística directa entre el estado de ánimo de los usuarios extraído de twitter y el índice de de cotización de diferentes acciones en la Bolsa.

Además gracias a las mejoras en las apis de programación de twitter y facebook que permiten el acceso a una gran cantidad de datos, irán apareciendo nuevas aplicaciones que funcionen por encima de estas plataformas, como por ejemplo el análisis de sentimiento.