Mostrar el registro sencillo

dc.contributor.advisorLloret Iglesias, Lara
dc.contributor.authorFerreño Blanco, Diego 
dc.contributor.otherUniversidad de Cantabriaes_ES
dc.date.accessioned2019-09-24T12:16:16Z
dc.date.available2020-01-01T03:45:13Z
dc.date.issued2019-07-01
dc.identifier.urihttp://hdl.handle.net/10902/16902
dc.description.abstractABSTRACT: Drawing is a widely used industrial process in which steel rods are pulled through a series of dies to stretch and strengthen the material. The demanding deformations Steel is subjected to during drawing may result in the breakage of the wire. The hypothesis of this research is that, acknowledging that drawing failure is a very complex process, it is not a random event but can be predicted using a suitable approach. In this sense, Machine Learning classification and clustering algorithms have been implemented to predict the probability of failure during drawing and to optimize the manufacturing conditions in order to reduce the failure rate in an actual industrial process. The following algorithms have been employed for classification: K-Nearest Neighbors, Random Forests and Artificial Neural Networks. The reduced value of the rejection rate implies that classification must be carried out on an imbalanced dataset. For this reason, resampling methods (undersampling, oversampling and SMOTE) and specific scores for imbalanced datasets were used. In a first stage, classification was conducted on individual steel rod coils (33841 instances) obtaining disappointing results with or without introducing resampling. In view of this, we decided to rework the problem aiming at reducing the imbalance by grouping individual coils into heats (689 heats). In this way, it was possible to obtain a qualified Random Forest classifier which provided satisfactory scores (ROC AUC of 0.824 and an average precision of 0.604 in the test dataset). This tool allows the heats with a higher probability of undergoing any breakage during drawing to be detected, thus improving the final quality of the product. K-means clustering (K=4) has been successfully used in this study to identify those manufacturing conditions that minimize the number of breakages during drawing. This result is of utmost importance for decision making during steelmaking. An analysis of feature importance was developed through two independent and complementary approaches: on the first hand, by using the Random Forest algorithm optimized for classification of heats; on the other hand, by obtaining the differences between the coordinates of the centroids of the optimum and worst clusters. These two approaches have provided equivalent results, making it possible to identify those manufacturing parameters most influencing the breakage probability during drawing.es_ES
dc.description.abstractRESUMEN: El trefilado es un proceso industrial muy utilizado en el que rollos de alambrón de acero son arrastrados a través de una serie de hileras de diámetros progresivamente inferiores para estirar y endurecer el material. Las exigentes deformaciones a las que se ve sometido el acero durante el trefilado pueden provocar la rotura del alambre. La hipótesis de esta investigación es que, reconociendo que el fallo durante el trefilado es un proceso muy complejo, no es un evento aleatorio, sino que puede predecirse utilizando un enfoque adecuado. En este sentido, se han implementado algoritmos de clasificación y clustering de Machine Learning para predecir la probabilidad de fallo durante el trefilado y optimizar las condiciones de fabricación con el fin de reducir la tasa de fallo en un proceso industrial real. Para la clasificación se han utilizado los siguientes algoritmos: Vecinos K-Nearest, Random Forest y redes neuronales artificiales. La baja tasa de rechazo implica que la clasificación debe llevarse a cabo en un set de datos desequilibrado. Por esta razón, se utilizaron métodos de remuestreo (undersampling, oversampling y SMOTE) y métricas específicas para conjuntos de datos desequilibrados. En una primera etapa, la clasificación se realizó en rollos individuales de acero (33841 casos) obteniendo resultados decepcionantes con o sin remuestreo. En vista de esto, decidimos replantear el problema con el objetivo de reducir el desequilibrio agrupando los rollos en coladas (689). De esta manera, fue posible obtener un clasificador, Random Forest que proporcionó resultados satisfactorios (ROC AUC de 0.824 y una precisión promedio de 0.604 en el conjunto de datos de test). Esta herramienta permite detectar las coladas con mayor probabilidad de sufrir roturas durante el trefilado, mejorando así la calidad final del producto. El algoritmo de clustering Kmeans (K=4) ha sido utilizado con éxito en este estudio para identificar aquellas condiciones de fabricación que minimizan el número de roturas durante el trefilado. Este resultado es de suma importancia para la toma de decisiones durante la fabricación del acero. Se desarrolló un análisis de la importancia de las variables a través de dos enfoques independientes y complementarios: por un lado, utilizando el algoritmo de Random Forest optimizado para la clasificación de las coladas; por otro lado, obteniendo las diferencias entre las coordenadas de los centroides de los clusters óptimo y pésimo. Estos dos enfoques han dado resultados equivalentes, permitiendo identificar los parámetros de fabricación que más influyen en la probabilidad de rotura durante el trefilado.es_ES
dc.format.extent37es_ES
dc.language.isoenges_ES
dc.rights© Diego Ferreño Blancoes_ES
dc.subject.otherCold drawinges_ES
dc.subject.otherSteel wirees_ES
dc.subject.otherMachine learninges_ES
dc.subject.otherClassificationes_ES
dc.subject.otherClusteringes_ES
dc.subject.otherImbalanced datasetes_ES
dc.subject.otherTrefilado en fríoes_ES
dc.subject.otherAlambre de aceroes_ES
dc.subject.otherMachine learninges_ES
dc.subject.otherClasificaciónes_ES
dc.subject.otherClusteringes_ES
dc.subject.otherConjunto de datos desequilibradoes_ES
dc.titleOptimization of the fabrication of cold drawn steel wire through classification and clustering machine learning algorithmses_ES
dc.title.alternativeOptimización de la fabricación de alambre de acero mediante trefilado en frío por medio de algoritmos de machine learning de clasificación y clusteringes_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.rights.accessRightsrestrictedAccesses_ES
dc.description.degreeMáster en Ciencia de Datoses_ES


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo