Catálogo de publicaciones - tesis

Compartir en
redes sociales


Título de Acceso Abierto

Métodos de clustering robustos

Juan Domingo González Víctor J. Yohai

publishedVersion.

Resumen/Descripción – provisto por el repositorio digital
Se tienen p variables medidas sobre n objetos. El problema de clustering, que se presenta en varias áreas del conocimiento, consiste en dividir el conjunto de n objetos en K grupos homogéneos, es decir de modo que en cada grupo las p variables tomen valores parecidos. Hay varios enfoques para este problema, uno de los más populares es "K-means", que consiste en minimizar la media de las distancias de los objetos a los centros de los grupos a los que pertenecen. Este procedimiento tiene la ventaja de ser conceptualmente y computacionalmente simple. Sin embargo, es muy sensible a la presencia de puntos atípicos. Se propone una alternativa robusta basada en minimizar una escala robusta de tipo tau de las distancias entre los puntos y los centros de los grupos a los que pertenecen. Simulaciones por el método de Monte Carlo muestran que este procedimiento no es mayormente afectado por puntos atípicos. Se muestra además que los centros de los grupos están bien definidos, y que son fuertemente consistentes. Otro enfoque para clustering es utilizar un modelo de mezcla de K distribuciones, donde cada distribución depende de varios parámetros. En este caso, el método usuales estimar los parámetros por máxima verosimilitud. En el caso de que las distribuciones son normales multivariadas, este estimador se calcula utilizando un algoritmo EM. Sin embargo, este procedimiento tampoco es robusto. En esta tesis se modifica el algoritmo EM de modo que la estimación de los parámetros sea robusta y consistente. Asímismo, se implementa el algoritmo y se realizan simulaciones de Monte Carlo, en donde se muestran las ventajas de la presente propuesta frente a otros estimadores clásicos y robustos de la literatura.
Palabras clave – provistas por el repositorio digital

No disponibles.

Disponibilidad
Institución detectada Año de publicación Navegá Descargá Solicitá
No requiere 2019 Biblioteca Digital (FCEN-UBA) (SNRD) acceso abierto

Información

Tipo de recurso:

tesis

Idiomas de la publicación

  • español castellano

País de edición

Argentina

Fecha de publicación

Información sobre licencias CC

https://creativecommons.org/licenses/by/2.5/ar/