TỔNG QUAN VỀ MỘT SỐ PHƯƠNG PHÁP DỊCH MÁY CHO CẶP NGÔN NGỮ NGHÈO TÀI NGUYÊN

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Nghĩa Luân Phạm

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học - Trường Đại học Hải Phòng: Kinh tế và Kỹ thuật - Công nghệ, 2024

Mô tả vật lý: tr.4

Bộ sưu tập: Báo, Tạp chí

ID: 482998

Dữ liệu song ngữ là rất quan trọng, không thể thiếu khi xây dựng một mô hình dịch máy. Tuy nhiên, khó khăn lớn nhất là lượng dữ liệu này thường rất ít, đặc biệt là đối với nhiều cặp ngôn ngữ ít phổ biến trên thế giới. Việc thu thập và xử lý dữ liệu song ngữ không chỉ tốn kém về mặt tài chính mà còn đòi hỏi sự đầu tư lớn về thời gian và nhân lực. Do đó, việc tạo ra một bộ dữ liệu đủ lớn và chất lượng để huấn luyện các mô hình dịch máy là một thách thức đáng kể. Để giải quyết vấn đề thiếu dữ liệu cho dịch máy, nhiều phương pháp đã được nghiên cứu và áp dụng như sử dụng dữ liệu đơn ngữ, học chuyển đổi và sử dụng ngôn ngữ trục. Mỗi phương pháp đều có ưu điểm và hạn chế riêng. Việc lựa chọn phương pháp phù hợp phụ thuộc vào đặc điểm của cặp ngôn ngữ cần dịch và mục tiêu sử dụng. Bài báo này sẽ giới thiệu tổng quan về một cách tiếp cận chính cho hướng nghiên cứu này.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH