Các hệ thống khai phá quan điểm tiếng Việt dựa trên phương pháp từ vựng thông thường sử dụng bộ từ điển VietSentiWordNet. Tuy nhiên, bộ từ điển dữ liệu này áp dụng cho miền tin tức nên khi sử dụng để phân lớp trong lĩnh vực du lịch sẽ đạt hiệu quả không cao và dễ gây nhầm lẫn. Mục tiêu của bài báo này nhằm xây dựng hệ thống đánh giá nhà hàng đạt hiệu quả phân lớp cao trong lĩnh vực du lịch. Để xây dựng hệ thống, chúng tôi sử dụng phương pháp khai phá quan điểm dựa trên từ vựng kết hợp với bộ từ điển quan điểm tiếng Việt thuộc lĩnh vực du lịch VietSentiWordNetPlus. Ngoài ra, chúng tôi còn áp dụng các kỹ thuật tiền xử lý dữ liệu cho các câu bình luận để tăng ngữ nghĩa cho câu. Kết quả thực nghiệm cho thấy, hệ thống của chúng tôi đã cho kết quả phân lớp quan điểm tốt hơn, với trung bình độ chính xác tổng quát, độ chính xác, độ đầy đủ và độ đầy đủ điều hòa lần lượt là 84,64%
76,39%
81,12%
78,15% so với 71,76%
63,64%
68,72%
63,82% của hệ thống sử dụng bộ từ điển VietSentiWordNet. Hệ thống của chúng tôi đạt hiệu quả cao khi phân lớp quan điểm với nguồn dữ liệu thuộc lĩnh vực du lịch như nhà hàng, khách sạn, điểm du lịch., Tóm tắt tiếng anh, Vietnamese opinion mining systems are based on the lexicon-based approach using the VietSentiWordNet dictionary. However, this data dictionary applies to the news domain, so when used to classify in the tourism domain, it will be ineffective and easy to cause confusion. The objective of this paper is to build a restaurant assessment system with high classification efficiency in the tourism domain. To build the system, we use lexicon-based approach to opinion mining combined with the Vietnamese opinion dictionary in the tourism domain VietSentiWordNetPlus. In addition, we also apply data preprocessing techniques to the comments to increase the semantics of the sentences. The experimental results showed that, our system gave better opinion classification results, with average accuracy, precision, recall and F-score 84.64%
76.39%
81.12%
78.15% versus 71.76%
63.64%
68.72%
63.82% of the system uses the VietSentiWordNet dictionary. Our system is highly effective when classifying opinion with data sources in the tourism domain such as restaurants, hotels, tourist attractions.