Trong vài năm gần đây, các trường đại học thường khảo sát, thu thập ý kiến của sinh viên để nâng cao hiệu quả giảng dạy và cải thiện chất lượng đào tạo. Tuy nhiên việc phân tích một cách thủ công sẽ tốn nhiều chi phí về công sức và thời gian khi kích thước phản hồi lớn. Do đó, trong bài báo này, chúng tôi giới thiệu một bộ dữ liệu trên phản hồi của sinh viên cho bài toán phát hiện khía cạnh và phân loại cảm xúc theo khía cạnh. Bộ dữ liệu của chúng tôi bao gồm 5010 câu được gán nhãn theo 11 khía cạnh khác nhau (hành vi, kỹ năng giảng dạy...) và theo ba cảm xúc (tích cực, tiêu cực và trung tính) với độ đồng thuận là 88,95% và 80,52% tương ứng hai bài toán. Bên cạnh đó, chúng tôi cũng trình bày một chuỗi thí nghiệm dựa trên bộ dữ liệu dựa trên mô hình kết hợp BiLSTM-CNN so sánh với các mô hình máy học khác. Kết quả nghiên cứu cho thấy rằng phương pháp kết hợp BiLSTM-CNN đạt kết quả tốt hơn các phương pháp khác với chỉ số F1 là 78,93% và 73,78% tương ứng cho bài toán phát hiện khía cạnh và phân loại trạng thái cảm xúc theo khía cạnh. Kết quả thử nghiệm chứng minh tính hiệu quả của kiến trúc tổng thể của chúng tôi., Tóm tắt tiếng anh, In recent years, universities are interested in surveying and analyzing student's feedbacks to improve teaching effectiveness as well as training quality. However, the manual analysis will be costly in terms of effort and time-consuming with the large data. Therefore, in this paper, we introduce a new dataset on student's feedback of aspect categories detection and aspect-sentiment classification tasks. Our data consists of 5,010 sentences which are annotated by 11 pre-defined aspect categories (teacher behavior, teaching skills...) and 3 sentiment polarities (positive, negative, neutral) with annotation agreements of 88.95% and 80.52% according to two tasks. In addition, we present a series of experiments on the dataset based on a combination model BiLSTM-CNN, compared with other machine learning approaches. The experimental results show that our combination method achieves the best scores with the F1-score of 78.93% and 73.78% for the aspect category detection task and aspect-sentiment classification task, respectively. Experimental results demonstrate the effectiveness of our ensemble architecture.