Trong bài toán phân loại văn bản, hầu hết các nghiên cứu trước đây đều so sánh đánh giá các mô hình huấn luyện trên một tập kiểm thử với kích thước nhất định, cũng như chưa làm rõ thời gian huấn luyện của các mô hình. Nghiên cứu này tập trung đánh giá độ chính xác của 3 mô hình phân loại văn bản: Support Vector Machine, Linear Regression, Naïve Bayes trên các tập kiểm thử với kích thước khác nhau
sau đó nêu rõ các thông số đánh giá của mô hình với một test set có kích thước 900 câu hỏi. Bên cạnh đó, thời gian huấn luyện của từng mô hình cũng được so sánh trên các tập huấn luyện có kích thước khác nhau. Kết quả chỉ ra Naïve Bayes đều có độ chính xác tốt và thời gian huấn luyện nhanh nổi trội so với 2 mô hình còn lại. Sau cùng, tác giả vận dụng kết quả nghiên cứu đề xuất giải pháp xây dựng một chatbot tư vấn tuyển sinh qua Facebook, cho kết quả thực nghiệm tốt và có thể ứng dụng tại các đơn vị giáo dục Việt Nam.