dc.contributor.advisor | García Saiz, Diego | |
dc.contributor.advisor | García Fernández, Julio | |
dc.contributor.author | López Murcia, Marina | |
dc.contributor.other | Universidad de Cantabria | es_ES |
dc.date.accessioned | 2021-03-15T17:45:35Z | |
dc.date.available | 2021-03-15T17:45:35Z | |
dc.date.issued | 2020-06 | |
dc.identifier.uri | http://hdl.handle.net/10902/20973 | |
dc.description.abstract | RESUMEN: Un Data Lake es un repositorio de datos en bruto provenientes de diversas fuentes que permite el uso de herramientas de Big Data y Machine Learning. Es un sistema pensado para procesos de inteligencia de negocio, ya que permite cruzar grandes volúmenes de información de distintos entornos haciendo uso de técnicas de paralelización masiva.
El problema es que estos sistemas tienen una estructura muy compleja y carecen de una estandarización, lo que los convierte en proyectos de alto riesgo con altas tasas de fracaso.
Este trabajo de fin de grado se desarrolla en colaboración con la empresa CIC consulting informático, una consultoría de desarrollo de proyectos de informática. La empresa quiere realizar la integración de tres productos desarrollados internamente, IDboxRT, SgrWin y Fieldeas que, aunque se desarrollen por separado, en ocasiones son usados de forma conjunta
El objetivo de este proyecto es evaluar la tecnología de los Data Lake para la integración de estos tres productos, comprobando su capacidad de integración con distintas herramientas de Big Data y Machine Learning mediante la implementación de distintas variantes del sistema. | es_ES |
dc.description.abstract | ABSTRACT: A Data Lake is a repository of raw data from various sources that allows the use of Big Data and Machine Learning tools. It is a system designed for Business Intelligence processes, since it allows to cross large volumes of information from different environments by using massive parallelization techniques. The problem is that these systems have a very complex structure and also lack of standarization, making them high-risk projects with high failure rates.
This final degree project is developed in collaboration with the company CIC consulting informático, a computer consulting company. The company wants to integrate three internally developed products, IDboxRT, SgrWin y Fieldeas that, although developed separately, are sometimes used together.
The objective of this project is to evaluate the Data Lake technologies for the integration of these three products, verifying their integration capacity with different Big Data and Machine Learning tools through the implementation of different system variants. | es_ES |
dc.format.extent | 42 | es_ES |
dc.language.iso | spa | es_ES |
dc.rights | Atribución-NoComercial-SinDerivadas 3.0 España | es_ES |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/es/ | * |
dc.subject.other | Data Lake | es_ES |
dc.subject.other | Big Data | es_ES |
dc.subject.other | Machine Learning | es_ES |
dc.title | Evaluación de Data Lakes en Machine Learning y Big Data | es_ES |
dc.title.alternative | Evaluation of Data Lakes in Machine Learning and Big Data | es_ES |
dc.type | info:eu-repo/semantics/bachelorThesis | es_ES |
dc.rights.accessRights | openAccess | es_ES |
dc.description.degree | Grado en Ingeniería Informática | es_ES |