Chất lượng phân cụm của thuật toán K-Means dựa vào phương pháp lấy mẫu thực hiện song song theo mô hình MapReduce

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Thị Tuyết Nguyễn, Hoàng Việt Trần, Thiên Thành Trần

Ngôn ngữ: vie

Ký hiệu phân loại: 006.31 Machine learning

Thông tin xuất bản: Tạp chí Khoa học - Đại học Quy Nhơn, 2018

Mô tả vật lý: 125-133

Bộ sưu tập: Metadata

ID: 492083

Cải tiến thuật toán K-means (SK-meansMR) và đạt tốc độ tính toán cao trên dữ liệu lớn và đánh giá chất lượng phân cụm của thuật toán SK-meansMR và thuật toán K-means gốc để chứng minh thuật toán SK-meansMR ngoài việc cải thiện được tốc độ so với thuật toán K-means mà còn đảm bảo chất lượng phân cụm trên dữ liệu lớn.Today, clustering is one of the most widely used data mining methods in practice. K-means is one of the classic clustering algorithms. However, the speed of the K-means algorithm initially did not meet the big data problems. Two factors that affect the speed of K-means are repeated repetition and centering. To solve these two problems we have improved the K-means algorithm (SK-meansMR) and achieved high computation speed on large data. In this paper we focus on the clustering quality of the SK-meansMR algorithm and the original K-means to demonstrate the SK-meansMR algorithm not only improves the speed but also ensures the quality of clustering on large data.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH