Análisis de datos aplicado a incidentes acuáticos utilizando técnicas de Machine Learning
Data analysis applied to aquatic incidents using Machine Learning techniques
Ver/ Abrir
Identificadores
URI: http://hdl.handle.net/10902/20981Registro completo
Mostrar el registro completo DCAutoría
Garay Teja, Luis MiguelFecha
2020-10Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Data science
Machine learning
Estadística
Correlación
Significancia
Clustering
Árboles de Decisión
Statistics
Correlation
Significance
Decision trees
Resumen/Abstract
RESUMEN: El presente trabajo de Fin de Grado (TFG) trata sobre la realización, de principio a fin, de un proyecto de data science, acometiendo todas las fases que este tipo de proyectos llevan asociadas.
El data science es un campo interdisciplinar que aglutina método científico, procesos y sistemas con el objetivo de extraer información útil de datos en sus diferentes formas. Para ello conjuga diferentes campos como la estadística, el machine learning y la analítica predictiva. Hoy en día es especialmente relevante no solo en el mundo de la empresa privada, sino también en el de la investigación, como podría ser la física. Gracias a que las herramientas y técnicas propias de este campo proponen formas alternativas de trabajar con los datos recopilados en los proyectos en los que se usen, pueden llegar a facilitar la resolución de los diferentes problemas que se aborden.
En el caso concreto que nos ocupa, tendremos dos fuentes de información principales, a saber, datos meteorológicos, y datos relativos a incidentes acuáticos. El objetivo principal de este proyecto es aplicar la metodología y técnicas propias del data science con el fin de caracterizar los incidentes en base a los datos disponibles, con especial atención a los datos climáticos. En el proyecto se aplicarán diferentes técnicas estadísticas y se profundizará en la extracción del conocimiento mediante la aplicación de técnicas de machine learning.
ABSTRACT: In this Final Degree’s Project we develop a full Data Science project from beginning to end, undertaking all the phases associated with this kind of project.
Data Science is an interdisciplinary field that brings together scientific method, processes and systems with the aim of extracting useful information from data in its different forms, combining different fields such as statistics, machine learning, and predictive analytics. Today it is especially relevant not only in the private business field, but also in the research field, such as physics. Thanks to the fact that the tools and techniques of this field propose alternative ways of working with the data collected in the projects in which they are used, they can facilitate the resolution of the different problems that are addressed.
In the specific case that concern us, we will have two main sources of information, namely, meteorological data, and data related to aquatic incidents. The main objective of this project will be to apply the methodology and techniques of Data Science in order to (extract useful information?) determine if there are weather patterns, correlations between the different variables, and we will perform machine learning models in order to make predictions.
In the specific case at hand, we will have two main sources of information, namely, meteorological data, and data related to aquatic incidents. The main objective of this project is to apply the methodology and techniques of data science in order to characterize incidents based on the available data, with special attention to climate data. Different statistical techniques will be applied in the project and the extraction of knowledge will be deepened through the application of machine learning techniques.