Sử dụng best cho tóm tắt văn bản tiếng Việt

0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Đức Thọ Bùi, Thị Thu Trang Đỗ, Thanh Huyền Ngô

Ngôn ngữ: vie

Ký hiệu phân loại: 370.1 Philosophy and theory, education for specific objectives, educational psychology

Thông tin xuất bản: Tạp chí Khoa học và Công nghệ - Trường Đại học Sư phạm Kỹ thuật Hưng Yên, 2022

Mô tả vật lý: 20-26

Bộ sưu tập: Báo, Tạp chí

ID: 435641

Thêm vào giỏ

Bài báo này giới thiệu phương pháp tóm tắt văn bản theo hai hướng trích rút và tóm lược, sử dụng mô hình ngôn ngữ huấn luyện trước. Để làm điều này, đổi với bài toán trích rút, chúng tôi sử dụng mô hình BERTSum. Mô hình sử dụng BERT (Bidirectional Encoder Representations from Transformers) đế mã hoá các cầu đầu vào và dùng LSTM (Long Short Term Memory Networks) để biểu diễn mối quan hệ giữa các câu. Đối với bài toán tóm lược, chúng tôi sử dụng BERT để mã hóa ngữ nghĩa của văn bản đầu vào để sinh ra bản tóm tắt phù hợp. Tác giả thử nghiệm phương pháp trên bộ dữ liệu tiếng Việt được chia sẻ từ bài báo VNDS (A Vietnamese Dataset for Summarization) và đánh giá phương pháp bảng ROUGE (Recall - Oriented Understudy for Gisting Evaluation). Kết quả thực nghiệm cho thấy giữa hai bài toán tóm tắt trích rút và tóm tắt tóm lược BERT đạt hiệu quả hơn ở bài toán tóm tắt trích rút.

1. Đọc trực tuyến

1. Đọc trực tuyến

Tạo bộ sưu tập với mã QR