MỘT PHƯƠNG PHÁP PHÂN VÙNG DỮ LIỆU THEO ĐỘ TIN CẬY DỰA TRÊN PHÂN CỤM MỜ VIỄN CẢNH

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Thị Cành Hoàng, Huy Thông Phạm, Thế Huân Phùng

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên, 2022

Mô tả vật lý: tr.103-113

Bộ sưu tập: Báo, Tạp chí

ID: 332243

Data clustering and applications have received much research attention in recent years. During data collection, it is possible that some data with lower confidence (wrong value, incorrect attribute, etc.). This will reduce the clustering performance with possible outliers and noises. Several research directions have been proposed to solve this problem. First, for data elements with wrong values or wrong attributes can use Safe semi-supervised fuzzy clustering methods. Secondly, for noisy data elements, the concept of Picture Fuzzy Set can be used, although there are some related studies to reduce noices and increase the quality of clustering, it is only on the traditional fuzzy set. In this paper, we propose a new algorithm named as PT2FCM, to handle the problem of data partition with confidence problem. The proposed method is implemented and experimentally compared against the related methods, including the standard Picture fuzzy clustering (FCPFS), and the Confidence-weighted safe semi-supervised clustering (CS3FCM), etc. The experimental results show that the proposed method has better performance comparing to selected methods on the same datasets.Phân cụm dữ liệu và các lĩnh vực ứng dụng là một trong những hướng nghiên cứu nhận được nhiều sự quan tâm từ các nhà khoa học trong những năm gần đây. Trong quá trình thu thập dữ liệu, có thể một số dữ liệu có độ tin cậy thấp hơn (sai giá trị, thuộc tính không chính xác, v.v.) tồn tại trong toàn bộ tập dữ liệu. Điều này sẽ làm giảm hiệu suất phân cụm với các nhiễu và ngoại lệ có thể xảy ra. Một số hướng nghiên cứu đã được đưa ra để giải quyết vấn đề này. Thứ nhất, đối với các dữ liệu sai giá trị, sai thuộc tính có thể sử dụng các phương pháp phân cụm bán giám sát mờ an toàn. Thứ hai, đối với các điểm dữ liệu nhiễu có thể sử dụng khái niệm tập mờ viễn cảnh, cho dù đã có một số nghiên cứu liên quan nhằm tăng chất lượng phân cụm, tuy nhiên chỉ dừng lại ở tập mờ truyền thống. Trong bài báo này, chúng tôi đề xuất một phương pháp mới trong phân vùng dữ liệu theo độ tin cậy dựa trên phân cụm mờ viễn cảnh có tên gọi PT2FCM. Thuật toán đề xuất được so sánh thực nghiệm với một số phương pháp liên quan như phân cụm bán giám sát mờ trên tập mờ viễn cảnh (FCPFS), phân cụm bán giám sát mờ an toàn (CS3FCM), v.v. Các kết quả thực nghiệm cho thấy, phương pháp đề xuất có chất lượng phân cụm tốt so với các phương pháp liên quan trong cùng tập dữ liệu.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH