Wednesday, June 24, 2015

Кластеризация документов

Пошаговые примеры кластеризации документов с использованием Python. Содержание:

Stopwords, stemming, and tokenization
Tf-idf and document similarity
K-means clustering
Multidimensional scaling
Visualizing document clusters
Hierarchical document clustering
Latent Dirichlet Allocation (LDA)

No comments: