Un algoritmo de ramificación y poda para realizar agrupamientos óptimos

Soto Sánchez, Francisco Javier

dc.contributor.advisor	Gómez Pérez, Ana Isabel
dc.contributor.advisor	Gómez Pérez, Domingo
dc.contributor.author	Soto Sánchez, Francisco Javier
dc.contributor.other	Universidad de Cantabria	es_ES
dc.date.accessioned	2023-09-07T14:47:47Z
dc.date.issued	2022-07
dc.identifier.uri	https://hdl.handle.net/10902/29826
dc.description.abstract	Los algoritmos de Clustering, i.e. algoritmos para el agrupamiento de datos por su similitud en «clusters», son una de las herramientas más populares dentro del campo de la Inteligencia Artificial y la Minería de Datos. Una de las de razones de su popularidad es su simplicidad conceptual, lo que permite una formulación matemática basada en la resolución de un problema combinatorio. La heurística más utilizada en la práctica es la dada por Lloyd y es la que se basa el algoritmo k-means para encontrar los centros de masa de los diferentes «clusters». Aunque el algoritmo es a la vez sencillo de implementar y eficiente, un problema importante es que solo hay una garantía probabilista de que devuelva una solución cercana a la óptima. Ello plantea la necesidad de encontrar algoritmos «óptimos», en otras palabras, que devuelvan siempre la solución óptima para un conjunto de datos de entrada. Aunque se sabe que este problema es NP-duro, la investigación de nuevos algoritmos óptimos ayuda a entender el comportamiento y las limitaciones de k-means y sus variantes. Este trabajo propone varias mejoras algorítmicas para resolver el problema de optimización, centrándonos dentro del paradigma de programación conocido como ramificación y poda. Los experimentos computacionales que hemos realizado con nuestra implementación en Sage muestran una mejora con respecto a la implementación del mejor algoritmo óptimo conocido.	es_ES
dc.description.abstract	Clustering (partitioning a set into different subsets) is among the most widely used type of algorithms for unstructured data. Its popularity comes from the simple basis behind it which often means solving a combinatorial problem of finding the minimum of an objective function. The most popular clustering algorithm in practice is Lloyd’s heuristic approximation algorithm to the k-means optimum centroids. A crucial issue of this approach is that there is only a probabilistic guarantee regarding the goodness of the solution. Indeed, it is possible to construct datasets where Lloyd’s heuristic approximation algorithm only finds local minimums. A challenging problem is finding the global optimum for any given dataset. Although this problem is NP-hard, new algorithms for finding optimal clustering offer many benefits for the research of new heuristic algorithms. This work analyses possible improvements for solving this problem, focusing on optimizing the global searches with branch-andbound techniques. The numerical results show a promising computational advantage for the case of the partitioning of two sets over previous proposals.	es_ES
dc.format.extent	62 p.	es_ES
dc.language.iso	eng	es_ES
dc.rights	© Francisco Javier Soto Sánchez	es_ES
dc.subject.other	Algoritmos	es_ES
dc.subject.other	Arreglos de hiperplanos	es_ES
dc.subject.other	Clustering	es_ES
dc.subject.other	Algorithms	es_ES
dc.subject.other	Hyperplane arrangement	es_ES
dc.title	Un algoritmo de ramificación y poda para realizar agrupamientos óptimos	es_ES
dc.title.alternative	A branch-and-bound algorithm for finding optimal clustering	es_ES
dc.type	info:eu-repo/semantics/masterThesis	es_ES
dc.rights.accessRights	embargoedAccess	es_ES
dc.description.degree	Máster en Matemáticas y Computación	es_ES
dc.embargo.lift	2027-07-16
dc.date.embargoEndDate	2027-07-16

Ficheros en el ítem

Nombre:: SotoSanchezJavier.pdf
Tamaño:: 749.4Kb
Formato:: PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)

M1098 Trabajos académicos [75]

Mostrar el registro sencillo

Un algoritmo de ramificación y poda para realizar agrupamientos óptimos

Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Listar

Mi cuenta

Estadísticas

Sobre UCrea

Piensa en abierto

Compartir