Mostrar el registro sencillo

dc.contributor.advisorZorrilla Pantaleón, Marta E. 
dc.contributor.advisorNavarro Matesanz, Roberto
dc.contributor.authorCallejo González, Javier
dc.contributor.otherUniversidad de Cantabriaes_ES
dc.date.accessioned2017-03-27T10:31:29Z
dc.date.available2017-03-27T10:31:29Z
dc.date.issued2016-11
dc.identifier.urihttp://hdl.handle.net/10902/10706
dc.description.abstractRESUMEN: A diario se genera información textual tanto en entornos públicos, bien sea de webs, blogs o redes sociales; como en entornos privados, como puede ser la documentación generada por las empresas; y que contiene una información, a priori, oculta. Para descubrir la riqueza de estos textos, la información ha de ser procesada y analiza computacionalmente; y por ello, la empresa Atos WordlGrid S.L. consciente de la falta de análisis en este terreno está desarrollando un proyecto de I+D+i cuyo objetivo es proporcionar a las empresas del sector energético una herramienta de detección de fraude usando técnicas de Big Data y Aprendizaje automático. El proyecto que aquí se presenta es un módulo de este proyecto que tiene como objetivo el diseño e implementación de un sistema que implemente técnicas para procesar, analizar y clasificar textos, lo que se conoce como un módulo Text Mining. El sistema utiliza las últimas tecnologías que ofrece el ecosistema Apache Hadoop, principalmente Spark 2.0 y Mlib, que permiten construir un sistema distribuido y paralelizable con el fin de aprovechar las capacidades computacionales que nos ofrecen los entornos Big Data.es_ES
dc.description.abstractABSTRACT: Textual information it has been daily generated in public environment, such as the web, blogs or social networks, but also in private environments, such as the documentation generated by the companies themselves. In order to find out the riches of texts, information has to be processed and computationally analysed. Therefor, Atos WordlGrid S.L enterprise, which is aware of the lack of analysis in this field, it is developing an R+D+I project, whose objective is to provide to utilities a fraud detection tool using Big Data and Machine Learning techniques. In the project presented here is a module of this project that aims to design and implement a system that use techniques to process, analyse and classify texts, that is known as a Text Mining module. The system uses the latest technologies offered by the Apache Hadoop ecosystem, mainly Spark 2.0 and Mlib, which allow to build a distributed and parallelized system, with the porpoise of take advantage of the computational capabilities offered by Big Data environments.es_ES
dc.format.extent51 p.es_ES
dc.language.isospaes_ES
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 Españaes_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/es/*
dc.subject.otherMinería de textoses_ES
dc.subject.otherProcesado de lenguaje naturales_ES
dc.subject.otherSparkes_ES
dc.subject.otherBig Dataes_ES
dc.subject.otherText mininges_ES
dc.subject.otherNatural Language Processinges_ES
dc.titleHerramienta de Text Mining aplicado a textos cortos y redes socialeses_ES
dc.title.alternativeText mining tool for short texts and social networkses_ES
dc.typeinfo:eu-repo/semantics/bachelorThesises_ES
dc.rights.accessRightsopenAccesses_ES
dc.description.degreeGrado en Ingeniería Informáticaes_ES


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo

Atribución-NoComercial-SinDerivadas 3.0 EspañaExcepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España