Khai thác dữ liệu chuỗi theo mối quan tâm của người dùng

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Thị Thiên Trang Văn

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Phát triển và Hội nhập, 2023

Mô tả vật lý: tr.68-77

Bộ sưu tập: Metadata

ID: 379402

Khai thác dữ liệu chuỗi hay còn gọi là khai thác mẫu tuần tự là đi tìm những chuỗi con xuất hiện phổ biến (gọi là mẫu tuần tự) trong cơ sở dữ liệu chuỗi, ngưỡng phổ biến này do người dùng quy định. Trong những năm gần đây, do sự bùng nổ thông tin và dữ liệu lớn, bài toán này có xu hướng phát triển thành khai thác mẫu tuần tự có ràng buộc nhằm khắc phục cả hai thách thức về tính hiệu quả và hiệu suất thực thi vì ràng buộc đại diện cho mối quan tâm của người dùng. Bài báo này trình bày khảo sát chi tiết tất cả các phương pháp khai thác mẫu tuần tự và các loại ràng buộc đã được nghiên cứu. Phân loại các phương pháp khai thác, đồng thời phân tích ưu nhược điểm của chúng, từ đó chỉ ra hướng tiếp cận và phương pháp làm nền tảng cho các nghiên cứu về sau của bài toán này.Sequence data mining, also known as sequential pattern mining, is to find all frequent sub-sequences (called sequential patterns) in a sequence database, the threshold of frequency is specified by the user. In recent years, with the explosion growth of information and big data, this problem trends toward mining with constraints to overcome both effectiveness and efficiency challenges since that the constraints represent for the user’s interest. This paper presents a detailed survey of recent studies on mining sequential pattern and the categories of the constraints. Moreover, it also classifies the main methods and analyzes their advantages and limitations, thereby main approaches and strategies to solve sequential pattern mining problems in the future are presented.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH