• Mi UCrea
    Ver ítem 
    •   UCrea
    • UCrea Académico
    • Facultad de Ciencias
    • Máster Universitario en Ciencia de Datos / Master in Data Science
    • M6323 Trabajos académicos
    • Ver ítem
    •   UCrea
    • UCrea Académico
    • Facultad de Ciencias
    • Máster Universitario en Ciencia de Datos / Master in Data Science
    • M6323 Trabajos académicos
    • Ver ítem
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Optimization of the fabrication of cold drawn steel wire through classification and clustering machine learning algorithms

    Optimización de la fabricación de alambre de acero mediante trefilado en frío por medio de algoritmos de machine learning de clasificación y clustering

    Ver/Abrir
    TFM_DFB.pdf (627.3Kb)
    Identificadores
    URI: http://hdl.handle.net/10902/16902
    Compartir
    RefworksMendeleyBibtexBase
    Estadísticas
    Ver Estadísticas
    Google Scholar
    Registro completo
    Mostrar el registro completo DC
    Autoría
    Ferreño Blanco, DiegoAutoridad Unican
    Fecha
    2019-07-01
    Director/es
    Lloret Iglesias, Lara
    Derechos
    © Diego Ferreño Blanco
    Palabras clave
    Cold drawing
    Steel wire
    Machine learning
    Classification
    Clustering
    Imbalanced dataset
    Trefilado en frío
    Alambre de acero
    Machine learning
    Clasificación
    Clustering
    Conjunto de datos desequilibrado
    Resumen/Abstract
    ABSTRACT: Drawing is a widely used industrial process in which steel rods are pulled through a series of dies to stretch and strengthen the material. The demanding deformations Steel is subjected to during drawing may result in the breakage of the wire. The hypothesis of this research is that, acknowledging that drawing failure is a very complex process, it is not a random event but can be predicted using a suitable approach. In this sense, Machine Learning classification and clustering algorithms have been implemented to predict the probability of failure during drawing and to optimize the manufacturing conditions in order to reduce the failure rate in an actual industrial process. The following algorithms have been employed for classification: K-Nearest Neighbors, Random Forests and Artificial Neural Networks. The reduced value of the rejection rate implies that classification must be carried out on an imbalanced dataset. For this reason, resampling methods (undersampling, oversampling and SMOTE) and specific scores for imbalanced datasets were used. In a first stage, classification was conducted on individual steel rod coils (33841 instances) obtaining disappointing results with or without introducing resampling. In view of this, we decided to rework the problem aiming at reducing the imbalance by grouping individual coils into heats (689 heats). In this way, it was possible to obtain a qualified Random Forest classifier which provided satisfactory scores (ROC AUC of 0.824 and an average precision of 0.604 in the test dataset). This tool allows the heats with a higher probability of undergoing any breakage during drawing to be detected, thus improving the final quality of the product. K-means clustering (K=4) has been successfully used in this study to identify those manufacturing conditions that minimize the number of breakages during drawing. This result is of utmost importance for decision making during steelmaking. An analysis of feature importance was developed through two independent and complementary approaches: on the first hand, by using the Random Forest algorithm optimized for classification of heats; on the other hand, by obtaining the differences between the coordinates of the centroids of the optimum and worst clusters. These two approaches have provided equivalent results, making it possible to identify those manufacturing parameters most influencing the breakage probability during drawing.
     
    RESUMEN: El trefilado es un proceso industrial muy utilizado en el que rollos de alambrón de acero son arrastrados a través de una serie de hileras de diámetros progresivamente inferiores para estirar y endurecer el material. Las exigentes deformaciones a las que se ve sometido el acero durante el trefilado pueden provocar la rotura del alambre. La hipótesis de esta investigación es que, reconociendo que el fallo durante el trefilado es un proceso muy complejo, no es un evento aleatorio, sino que puede predecirse utilizando un enfoque adecuado. En este sentido, se han implementado algoritmos de clasificación y clustering de Machine Learning para predecir la probabilidad de fallo durante el trefilado y optimizar las condiciones de fabricación con el fin de reducir la tasa de fallo en un proceso industrial real. Para la clasificación se han utilizado los siguientes algoritmos: Vecinos K-Nearest, Random Forest y redes neuronales artificiales. La baja tasa de rechazo implica que la clasificación debe llevarse a cabo en un set de datos desequilibrado. Por esta razón, se utilizaron métodos de remuestreo (undersampling, oversampling y SMOTE) y métricas específicas para conjuntos de datos desequilibrados. En una primera etapa, la clasificación se realizó en rollos individuales de acero (33841 casos) obteniendo resultados decepcionantes con o sin remuestreo. En vista de esto, decidimos replantear el problema con el objetivo de reducir el desequilibrio agrupando los rollos en coladas (689). De esta manera, fue posible obtener un clasificador, Random Forest que proporcionó resultados satisfactorios (ROC AUC de 0.824 y una precisión promedio de 0.604 en el conjunto de datos de test). Esta herramienta permite detectar las coladas con mayor probabilidad de sufrir roturas durante el trefilado, mejorando así la calidad final del producto. El algoritmo de clustering Kmeans (K=4) ha sido utilizado con éxito en este estudio para identificar aquellas condiciones de fabricación que minimizan el número de roturas durante el trefilado. Este resultado es de suma importancia para la toma de decisiones durante la fabricación del acero. Se desarrolló un análisis de la importancia de las variables a través de dos enfoques independientes y complementarios: por un lado, utilizando el algoritmo de Random Forest optimizado para la clasificación de las coladas; por otro lado, obteniendo las diferencias entre las coordenadas de los centroides de los clusters óptimo y pésimo. Estos dos enfoques han dado resultados equivalentes, permitiendo identificar los parámetros de fabricación que más influyen en la probabilidad de rotura durante el trefilado.
    Colecciones a las que pertenece
    • M6323 Trabajos académicos [97]

    UNIVERSIDAD DE CANTABRIA

    Repositorio realizado por la Biblioteca Universitaria utilizando DSpace software
    Contacto | Sugerencias
    Metadatos sujetos a:licencia de Creative Commons Reconocimiento 4.0 España
     

     

    Listar

    Todo UCreaComunidades y coleccionesFecha de publicaciónAutoresTítulosTemasEsta colecciónFecha de publicaciónAutoresTítulosTemas

    Mi cuenta

    AccederRegistrar

    Estadísticas

    Ver Estadísticas
    Sobre UCrea
    Qué es UcreaGuía de autoarchivoArchivar tesisAcceso abiertoGuía de derechos de autorPolítica institucional
    Piensa en abierto
    Piensa en abierto
    Compartir

    UNIVERSIDAD DE CANTABRIA

    Repositorio realizado por la Biblioteca Universitaria utilizando DSpace software
    Contacto | Sugerencias
    Metadatos sujetos a:licencia de Creative Commons Reconocimiento 4.0 España