At present, applications of large storage technology and data mining in the medical field to diagnose, prevent, and treat diseases with the purpose of improving human health are preferred the practical researches.In this study, we would like to introduce HealthDL: A system for collecting and storing medical data. HealthDL has a dispersal architecture, is built from open components for large data, and continuously increases in real time. An optimal system retrieves database from biomedical devices and medical record database coming from millions of geographically dispersed devices. Tests and evaluations on the real system using standard assessment tools with simulated database show good results.Hiện nay, ứng dụng công nghệ lưu trữ lớn, khai phá dữ liệu trong lĩnh vực y tế để chẩn đoán, phòng ngừa và điều trị bệnh nhằm can thiệp nâng cao tình trạng sức khỏe con người là hướng nghiên cứu có nhu cầu thực tiễn. Trong nghiên cứu này, các tác giả giới thiệu HealthDL - Một hệ thống thu thập và lưu trữ dữ liệu y tế. HealthDL có kiến trúc phân tán, xây dựng từ các thành phần khả mở cho dữ liệu lớn, gia tăng liên tục theo thời gian thực. Hệ thống tối ưu cho dữ liệu nhận về từ các thiết bị y sinh và dữ liệu thông tin lịch sử bệnh án đến từ hàng triệu thiết bị phân tán về mặt địa lý. Các thử nghiệm, đánh giá trên hệ thống thực bằng các công cụ đánh giá tiêu chuẩn với dữ liệu mô phỏng cho kết quả tốt.