Ngày nhận bài: 05-12-2011 / Ngày duyệt đăng: 18-05-2012
Nghiên cứu một số thuật toán phân cụm điển hình trên dữ liệu định danh nhằm mục đích tổng hợp, phân tích, đánh giá một số thuật toán phân cụm dữ liệu định danh điển hình như K-mode, ROCK, MMR giúp độc giả có cái nhìn trực quan về các thuật toán này để từ đó dễ dàng lựa chọn một thuật toán phù hợp cho bài toán thực tế trong quá trình khai phá dữ liệu. Nghiên cứu tập trung phân tích thuật toán phân cụm dữ liệu định danh MMR dựa trên lý thuyết tập thô. Thuật toán MMR đã được cài đặt thành chương trình máy tính, thử nghiệm và chỉ ra chất lượng phân cụm khá tốt so với các thuật toán phân cụm khác.