Dự đoán khách hàng rời bỏ dịch vụ là một bài toán phân lớp trong khai phá dữ liệu, sử dụng các mô hình phân lớp để dự đoán khách hàng có khả năng rời bỏ dịch vụ hay không. Đây là một trong những bài toán khó và có ý nghĩa quan trọng đối với các doanh nghiệp. Bài toán này đặc biệt khó bởi dữ liệu thường gặp vấn đề mất cân bằng khi số lượng khách hàng rời dịch vụ chỉ chiếm một tỉ lệ nhỏ trong tổng số. Do đó, bài toán dự đoán khách hàng rời dịch vụ trở nên khó khăn và thách thức hơn, cần có hướng tiếp cận mới để giải quyết. Một số phương pháp phổ biến giải quyết vấn đề này như SMOTE, Borderline-SMOTE, Safe-level SMOTE mặc dù đã đạt được những kết quả tích cực, nhưng một số trường hợp lại không đạt được kết quả mong đợi. Trong bài báo này, chúng tôi sẽ trình bày về ứng dụng của phương pháp phân lớp dữ liệu mất cân bằng trong giải quyết bài toán dự đoán khách hàng rời bỏ dịch vụ và đưa ra phương pháp cải tiến mới để nâng cao hiệu quả dự đoán.