Nhóm bệnh lý tim mạch là nguyên nhân gây tử vong hàng đầu trên thế giới, chiếm 31% tổng số ca tử vong. Việc chẩn đoán sớm bệnh và giai đoạn bệnh hỗ trợ rất nhiều cho quá trình điều trị, hạn chế sự tiến triển cũng như biến chứng và tỷ lệ tử vong. Quá trình này được thực hiện thông qua sự phân tích những thông tin, bằng chứng, triệu chứng thăm khám lâm sàng, cận lâm sàng bởi các chuyên gia, y bác sĩ. Gần đây, để góp phần hỗ trợ cho quá trình chẩn đoán, phương pháp tiếp cận trí tuệ nhân tạo đã được áp dụng để tăng tốc quá trình phân tích và xử lý. Các phương pháp này hầu hết sử dụng lý thuyết xác suất với vai trò trung tâm là định lý Bayes. Trong nghiên cứu này, chúng tôi cũng dự đoán bệnh lý tim mạchtheo hướng tiếp cận khoa học dữ liệu, nhưng đi theo một nhánh khác - kết hợp bằng chứng sử dụng lý thuyết Dempster Shafer. Cụ thể, mỗi triệu chứng được xem là một bằng chứng để kết luận về bệnh với một mức độ không chắc chắn nào đó. Phép kết hợp Dempster được dùng để tổng hợp các bằng chứng. Mức độ không chắc chắn của mỗi bằng chứng sẽ được tìm bởi thuật toán tối ưu sườn dốc (gradient descent). Kết quả bước đầu cho thấy phương pháp mới này không chỉ có sự cải thiện đáng kể về khả năng dự đoán khi so sánh với các phương pháp Bayes mà còn chỉ ra được mức độ chắc chắn của từng triệu chứng trong quá trình chẩn đoán. Những kết quả này cho phép sự kỳ vọng vào khả năng hỗ trợ lâm sàng của phương pháp cũng như tiềm năng ứng dụng của khoa học dữ liệu vào lĩnh vực y học.