Phát hiện motif bằng thuật toán scrimp++ cải tiến

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Thành Sơn Nguyễn, Thị Dung Trần

Ngôn ngữ: Vie

Ký hiệu phân loại: 510 Mathematics

Thông tin xuất bản: Tạp chí Khoa học Trường Đại học Sư phạm Thành phố Hồ Chí Minh , 2022

Mô tả vật lý: 435-448

Bộ sưu tập: Metadata

ID: 404956

Motif trên chuỗi thời gian là cặp chuỗi con giống nhau nhất trong một chuỗi thời gian hay các cặp chuỗi giống nhau nhất trong một cơ sở dữ liệu chuỗi thời gian. Khám phá motif trên chuỗi thời gian là bài toán quan trọng trong khai phá dữ liệu chuỗi thời gian. Gần đây, một số thuật toán mới đã được giới thiệu cho bài toán khám phá motif dựa vào vector chứa khoảng cách giữa một chuỗi con với lân cận gần nhất của nó. Các thuật toán này sử dụng kĩ thuật kết hợp việc chuẩn hóa chuỗi thời gian vào trong công thức tính độ đo khoảng cách Euclid khi tính toán ma trận khoảng cách. Phương pháp tiêu biểu cho cách tiếp cận này là thuật toán Scrimp++. Bài báo này giới thiệu một phiên bản cải tiến của thuật toán Scrimp++ cho bài toán khám phá motif nhằm cải thiện thời gian thực thi của thuật toán. Kết quả thực nghiệm cho thấy thuật toán đề xuất thực hiện tốt hơn thuật toán gốc về mặt thời gian nhưng vẫn đảm bảo về độ chính xác., Tóm tắt tiếng anh, A time series motif is a nearest neighbor subsequence pair of a long time series or a nearest neighbor sequence pair in a time series database. Time series motif discovery is a vital task in time series data mining. Recently, some algorithms were proposed for discovering time series motifs. These algorithms use a vector called matrix profile which contains distances between each subsequence and its nearest neighbor in time series. The vector is computed based on the combination between time series normalization and Euclidean distance measure. The typical method for the approach is the Scrimp++ algorithm. This paper introduces an improved version of this algorithm to improve the speed of the algorithm. The experimental results shows that our proposed algorithm outperforms the original algorithm in terms of running time with same accuracy.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 71010608 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH