Skip to content

Latest commit

 

History

History
17 lines (12 loc) · 1.37 KB

README.md

File metadata and controls

17 lines (12 loc) · 1.37 KB

Clustering utilizando el algoritmo Lista de Clusters

Este repositorio contiene el trabajo realizado para el curso de posgrado "Nuevas Propuestas Para Búsquedas Por Similitud En Bases De Datos Métricas" de la Universidad Nacional de San Luis (Argentina) en el año 2017.

En este repositorio se encuentran:

  • Una implementación "naive" en Python del algoritmo Lista de Clusters.
  • Notebooks de Jupyter que muestran la aplicación del algoritmo para la tarea de clustering sobre conjuntos de datos sintéticos y se lo compara con algoritmos clásicos de clustering.
  • Informe final.

Dependencias

Para poder recrear las gráficas y ejecutar las notebooks de Jupyter es necesario instalar Python y los paquetes adecuados. Para ello recomendamos utilizar conda como gestor de entornos. La forma más sencilla es instalando Anaconda Python. Una vez instalado este, se puede ejecutar el siguiente comando en un terminal para generar el mismo ambiente de clustering utilizado para generar las gráficas: conda env create -f environment.yml. Para activar el ambiente se debe utilizar el siguiente comando:

  • En Windows, ejecuta: activate clustering.
  • En macOS y Linux, ejecuta: source activate clustering.

Luego, para correr la notebook de Jupyter, ejecutar el comando: jupyter notebook.