Chất lượng của các hệ thống dịch tự động tiếng Việt hiện nay vẫn còn thấp khi so sánh với chất lượng dịch của các cặp ngôn ngữ phổ biến khác. Có nhiều yếu tố ảnh hưởng đến chất lượng của mô hình dịch, trong đó có phương pháp dịch và kho ngữ liệu. Để xây dựng một hệ thống dịch có chất lượng tốt, cần sử dụng kho ngữ liệu tốt về chất lượng và có số lượng lớn. Bài báo này tiến hành nghiên cứu thực trạng của các kho ngữ liệu song ngữ tiếng Việt hiện nay và tổ chức xây dựng các hệ thống dịch Anh-Việt từ các kho ngữ liệu có kích thước khác nhau, sử dụng các phương pháp dịch khác nhau. Kết quả đánh giá chất lượng của các hệ thống dịch thu được cho thấy, khi sử dụng kho ngữ liệu có kích thước càng lớn thì chất lượng của hệ thống dịch càng tăng.