Xây dựng hệ thống tự động giải đáp thắc mắc về quy định học tập tại Trường Đại học Công nghiệp bằng kỹ thuật học sâu

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Thị Phúc Đặng, Văn Nghiêm Đăng, Thanh Long Nguyễn, Thị Minh Khoa Trần

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học và Công nghệ - ĐH Công nghiệp TP. Hồ Chí Minh, 2023

Mô tả vật lý: 59-70

Bộ sưu tập: Metadata

ID: 447360

Hiện nay, đối với trường đại học có quy mô lớn như Đại học Công nghiệp TPHCM, số lượng quy định, quy chế, thông báo rất lớn và cập nhật thường xuyên dẫn đến việc tìm hiểu và nắm bắt nội dung trở nên khó khăn. Trong bài báo, chúng tôi xây dựng hệ thống tự động trả lời câu hỏi dựa trên nội dung của các file văn bản bằng kỹ thuật deep learning. Hệ thống trích chọn thông tin từ câu hỏi, đưa vào là các từ khoá và trả về đoạn văn bản liên quan bằng thuật toán BM25. Ứng với đoạn văn bản có độ liên quan cao nhất, mô hình deep learning được huấn luyện để trích xuất ra câu trả lời tương ứng. Mô hình được huấn luyện dựa trên bộ dữ liệu huấn luyện với 10000 và bộ dữ liệu test 1600 cặp câu hỏi và câu trả lời tương ứng từ các đoạn văn bản được lấy từ các thông báo, quy định, quy chế của nhà trường. Chúng tôi tinh chỉnh các mô hình deep learning để huấn luyện và đánh giá, dựa trên hiệu quả và độ chính xác để lựa chọn mô hình tối ưu nhất. Kết quả độ chính xác đạt được theo F1-score của mô hình BERT là 73.93%, RoBERTa là 75.59% PhoBERT là 45.13% và DistilBERT là 72.95%. Mô hình RoBERTa được lựa chọn với tốc độ huấn luyện và độ chính xác cao nhất và được triển khai lên hệ thống để đánh giá kết quả.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 71010608 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH