Một thuật toán nhanh cho khai thác các tập hữu ích cao chứa K mục

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Nguyễn Thị Tân Tiến, Nguyễn Văn Tảo, Nông Thị Hoa

Ngôn ngữ: Vie

Ký hiệu phân loại: 510 Mathematics

Thông tin xuất bản: Khoa học và Công nghệ - Đại học Thái Nguyên, 2021

Mô tả vật lý: 185-190

Bộ sưu tập: Metadata

ID: 420773

Khai thác tập hữu ích cao thực hiện tìm kiếm các tập mục được bán ra mang lại mức lãi cao hơn một ngưỡng cho trước. Việc tìm ra các tập hữu ích cao giúp gợi ý các mặt hàng liên quan trên các trang thương mại điện tử và đưa ra các chính sách bán hàng hiệu quả. Các hệ thống gợi ý thường hiện thêm khoảng 5 đến 7 sản phẩm tương tự hoặc có liên quan để giúp người dùng lựa chọn các sản phẩm cần mua. Trong các nghiên cứu trước đây, việc tìm các tập hữu ích cao thường tốn thời gian do xét nhiều tổ hợp các mục hàng trong một giao dịch. Trong bài báo này, chúng tôi đưa ra một thuật toán nhanh cho khai thác các tập hữu ích cao chứa k mục. Một cấu trúc danh sách nhỏ gọn được dùng để lưu thông tin về các tập mục chứa k mục xuất hiện trong cơ sở dữ liệu giao dịch. Đầu tiên, thực hiện phân mảnh dọc cơ sở dữ liệu giao dịch để sinh ra các phân mảnh con. Tiếp theo, khai thác các tập hữu ích cao trên từng phân mảnh dọc bằng cách thống kê các tập mục và tính số tiền lãi của tập mục đó. Các thực nghiệm được làm trên các cơ sở dữ liệu chuẩn. Kết quả thực nghiệm cho thấy cách tiếp cận đề xuất giảm đáng kể cả bộ nhớ và thời gian tính toán. Hơn nữa, thuật toán đề xuất còn tốt hơn thuật toán được so sánh., Tóm tắt tiếng anh, High utility itemset mining performs to find sold item sets whose profit overcomes a given threshold. Finding high utility itemsets helps to suggest related items on e-commerce sites and makes effective policies of sales. Recommender systems usually introduct from 5 to 7 related products to help users choose products. In previous studies, finding high utility itemsets often consume the time because many combinations of items were considered. In this paper, we present a fast algorithm for mining k-item high utility itemsets. A compact list structure is used to store information about the itemsets appearing from the curent database. First, the proposed algorithm perform a vertical segmentation of the transaction database to obtain sub-partitions. Next, mine high utility itemsets on each subpartiton by listing k-itemsets and its utility. Experiments were performed on brenchmark databases. Experimental results show that the proposed approach significantly reduces both memory and computation time. Moreover, it is better than the compared algorithm.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 71010608 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH