As the Coronavirus Disease 2019 (COVID-19) have left devastating consequences over the world, an effective screening test procedure is crucial to strengthen public health and put the disease to a halt. This study introduces a refined pipeline to train deep learning predictive models for the detection of COVID-19 from chest X-rays, as well as the resulting models themselves. The pipeline involves multiple techniques to combat overfitting and optimize predictive results, such as data augmentation, Bayesian optimization for hyperparameter tuning, selecting the appropriate performance metric, and early stopping during model training. On the COVID-XRay-5K v3 dataset, the three models, ResNet50, NASNet-A-Mobile, and Xception, achieved the areas under the precision-recall curves of 0.9773, 0.9633, and 0.9003
and the areas under the receiver operating characteristic curves of 0.9940, 0.9964, and 0.9812, respectively. At 98% recall (sensitivity), they sustained high specificity of 97.53%, 97.60%, and 86.00%. With such performance, these deep learning models are promising tools to aid in the combat against the pandemic.Do đại dịch Coronavirus 2019 (COVID-19) đã để lại những hậu quả tàn khốc trên toàn thế giới, một quy trình chẩn đoán sàng lọc hiệu quả đóng vai trò rất quan trọng trong việc hỗ trợ cho ngành y tế cộng đồng và ngăn chặn dịch bệnh. Nghiên cứu này giới thiệu một quy trình tinh chỉnh cho việc huấn luyện các mô hình dự đoán học sâu để phát hiện COVID-19 từ ảnh chụp X-quang lồng ngực, cũng như chính các kết quả mô hình thu được. Quy trình này bao gồm nhiều kỹ thuật để tránh tình trạng mô hình quá khớp và tối ưu hóa các kết quả dự đoán, chẳng hạn như tăng dữ liệu, tối ưu hóa Bayes để điều chỉnh siêu thông số, chọn trị số hiệu suất phù hợp và dừng sớm trong quá trình huấn luyện mô hình. Trên tập dữ liệu COVID-XRay-5K v3, ba kiểu mô hình ResNet50, NASNet-A-Mobile và Xception đã đạt được chỉ số AU-PRC là 0,9773, 0,9633 và 0,9003
và AU-ROC lần lượt là 0,9940, 0,9964 và 0,9812. Ở độ nhạy 98%, chúng duy trì độ đặc hiệu cao là 97,53%, 97,60% và 86,00%. Với hiệu suất như vậy, các mô hình học sâu này là những công cụ đầy hứa hẹn để hỗ trợ trong cuộc chiến chống lại đại dịch.