Desarrollo de una herramienta business intelligence para el análisis de redes sociales almacenadas en grafos
Development of a Business Intelligence Tool for the Analysis of Social Networks Stored in Graph Databases
Author
Ruiz Martínez, Noelia
Date
2013-07Director/es
Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Redes sociales
Inteligencia de negocio
Bases de datos orientadas a grafos
Social networks
Business intelligence
Graph-oriented databases
Abstract:
RESUMEN: En los últimos años se ha producido un gran crecimiento de los servicios basados en redes sociales como, por ejemplo, Twitter o Facebook. Si se visualiza la disposición de los datos que conforman estas redes, se asemeja en gran medida a un grafo en el que los nodos representan usuarios y las aristas que los unen las relaciones que se establecen entre ellos. Es por ello que, generalmente, estas aplicaciones utilizan gestores orientados a grafos para el almacenamiento de la información, como es el caso de Twitter, que hace uso del gestor FlockDB; o para soportar parte de su funcionalidad, como ocurre en el caso de Facebook que integra aplicaciones basadas en grafos a través del protocolo Open Graph.
Esta importancia de las redes sociales en la actualidad se traduce también en la relevancia de la búsqueda de información interesante para el negocio a partir de los datos correspondientes a la actividad realizada por los usuarios y a las relaciones existentes entre ellos.
Por estos motivos, este Proyecto Fin de Carrera ha tenido como objetivo el desarrollo de una herramienta Business Intelligence que incluyera la definición y el cálculo de indicadores de interés para analizar redes sociales. Con este propósito se utilizaron conjuntos de datos reales de diferentes características y tamaños y se almacenaron en un gestor de bases de datos orientadas a grafos, siendo Neo4J el elegido. Se diseñó, además, un almacén de datos, o data warehouse, como soporte a la herramienta Business Intelligence ante la imposibilidad de realizar ciertas consultas directamente sobre las bases de datos en grafo y con objeto de que el sistema pudiera ser extendido fácilmente. Posteriormente, se construyó el correspondiente módulo de extracción, transformación y carga así como los informes a través de los cuales los usuarios finales podrán explotarán la información.
ABSTRACT: In the last few years, services based on social networks such as Facebook or Twitter have experienced great growth. If data from these networks is visualized, it looks like a graph in which nodes represent users and edges the relationships between them. As a consequence, these applications generally use graph-oriented database management systems to store the information. This is the case of Twitter, which uses a graph-oriented management system called FlockDB; or like Facebook, which integrates applications based on graphs using the Open Graph protocol to provide part of its functionality.
Nowadays, this importance of social networks involves, also, the importance of looking for interesting information in business using data which corresponds to the activity of users and the relationships between them.
Therefore, the purpose of this Degree Project has been the development of a Business Intelligence tool which included the definition and calculation of different interesting indicators to analyze social networks. With that in mind, some real datasets with different features and sizes were used and stored using Neo4J, a graph-oriented database management system. A data warehouse was designed too as a support to the Business Intelligence tool facing the impossibility of answering some queries using only the graph database and in order to extend easily the tool. Afterwards, an extraction, transformation and load module was built just like the reports through which the end user will analyze the information.