Dữ liệu biểu hiện gen từ các thí nghiệm microarray là một dữ liệu phổ biến cho chẩn đoán ung thư. Tuy nhiên, điểm đặc biệt của loại dữ liệu này là có rất ít mẫu trong khi số biểu hiện gen lại lên tới hàng nghìn mẫu nên rất khó để lựa chọn được các gen có hiệu quả cho việc phân tích. Do đó, giảm chiều dữ liệu là phương pháp cần thiết trước khi dữ liệu đưa vào phân tích và phân tích thành phần cơ bản (PCA) là phương pháp được sử dụng để giảm chiều dữ liệu đầu vào. Trong bài báo này, có thể nhận thấy không phải phải thành phần dữ liệu đầu tiên là các thành phần dữ liệu tốt nhất do đo cần phải sử dụng thêm phương pháp lựa chọn đặc tính sau khi giảm chiều dữ liệu để chọn ra các đặc tính tốt nhất cho việc phân loại. Vì vậy, chúng tôi đề xuất sử dụng PCA để giảm chiều dữ liệu sau đó dùng thuật toán cây quyết định (DT) để lựa chọn ra các đặc tính phù hợp nhất và mạng MLP để phân loại dữ liệu. Các kết quả đạt được cho thấy đề xuất của chúng tôi cho hiệu quả tốt.