MỘT PHƯƠNG PHÁP TỐI ƯU THAM SỐ TÍNH MỜ TRÍCH RÚT TẬP CÂU TÓM TẮT TỐI ƯU TỪ DỮ LIỆU SỐ=A FUZZINNESS PARAMETER OPTIMIZATION METHOD TO EXTRACT THE OPTIMAL SET OF LINGUISTIC SUMMARIES FROM NUMERIC DATA

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Đình Phong Phạm, Thị Lan Phạm, Xuân Thanh Trần

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên, 2024

Mô tả vật lý: tr.49 - 57

Bộ sưu tập: Metadata

ID: 479035

Extracting a set of linguistic summaries from numeric data aims to produce summary sentences expressed in natural language that describe the hidden knowledge in the numeric dataset. A number of genetic algorithm models have been proposed to extract the optimal set of linguistic summaries, in which the algorithm model for extracting the set of linguistic summaries ensures the interpretability of the content of the summary sentences by applying genetic algorithm with greedy strategy gives quite good results. However, the determination of fuzziness parameter values of the algorithm model depends on the expert's intuition. In this paper, a method to optimize the fuzziness parameter values to improve the quality of the set of linguistic summaries extracted from numeric data is proposed. Experimental results with the creep database show that with the optimized fuzziness parameter values, the quality of the extracted set of linguistic summaries is better on three measures: fitness function value, average truth value and number of sentences with linguistic quantifier greater than a half.Trích rút tập câu tóm tắt bằng ngôn ngữ từ dữ liệu số giúp đưa ra các câu tóm tắt được diễn đạt bằng ngôn ngữ tự nhiên mô tả tri thức ẩn dấu trong tập dữ liệu số. Một số mô hình thuật toán di truyền được đề xuất nhằm trích rút tập câu tóm tắt tối ưu, trong đó, mô hình thuật toán trích rút tập câu tóm tắt đảm bảo tính giải nghĩa nội dung các câu tóm tắt trên cơ sở kết hợp thuật toán di truyền với chiến lược tham lam cho kết quả khá tốt. Tuy nhiên, việc xác định các tham số tính mờ của mô hình thuật toán phụ thuộc vào cảm nhận trực giác của chuyên gia. Trong bài báo này, chúng tôi đề xuất một thuật toán tối ưu các tham số tính mờ nhằm nâng cao chất lượng tập câu tóm tắt được trích xuất từ dữ liệu số. Kết quả thực nghiệm với cơ sở dữ liệu creep cho thấy, với bộ tham số tính mờ được tối ưu, chất lượng của tập câu tóm tắt được trích rút tốt hơn trên ba độ đo là giá trị hàm thích nghi, giá trị chân lý trung bình và số câu có từ lượng hóa lớn hơn a half.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH