Nghiên cứu này đề xuất một phương pháp mới nhằm nâng cao hiệu quả nghiên cứu thuốc bằng cách tái sử dụng các loại thuốc hiện có, nhằm giảm thời gian và chi phí liên quan đến quá trình phát triển thuốc truyền thống, có thể kéo dài từ 10 đến 15 năm và tiêu tốn hàng tỷ đô la. Các phương pháp tiếp cận hiện tại tập trung vào việc tận dụng dữ liệu không đồng nhất, chẳng hạn như tương tác thuốc-protein và bệnh-protein, để xây dựng các mạng lưới phức tạp liên kết thuốc, protein và bệnh tật. Tuy nhiên, một thách thức đáng kể là sự mất cân bằng dữ liệu, trong đó số lượng tương tác giữa thuốc và bệnh tiềm ẩn chưa được xác nhận (nhóm đa số) nhiều hơn số lượng thuốc được phê duyệt (nhóm thiểu số), ảnh hưởng nghiêm trọng đến hiệu suất dự đoán của các mô hình học máy. Những nỗ lực trước đây để giải quyết vấn đề này đã cho thấy thành công hạn chế. Nghiên cứu này giới thiệu một cách tiếp cận mới tích hợp các đường dẫn meta trong các mạng thông tin không đồng nhất với các kỹ thuật cân bằng dữ liệu để giải quyết sự mất cân bằng này. Kết quả thực nghiệm chứng minh rằng phương pháp đề xuất giúp nâng cao hiệu suất và độ tin cậy của mô hình trong việc xác định mối quan hệ mới giữa thuốc và bệnh tật. Nghiên cứu này thể hiện một tiến bộ đầy hứa hẹn bằng cách tận dụng các chiến lược dựa trên mạng và kỹ thuật cân bằng dữ liệu để tạo điều kiện thuận lợi cho việc khám phá lại các ứng dụng thuốc, từ đó có khả năng cách mạng hóa cách tiếp cận phát triển thuốc của ngành dược phẩm.This study proposes a new method to improve the efficiency of drug discovery by repurposing existing drugs, aiming to reduce the time and costs associated with traditional drug development processes, which can span 10 to 15 years and cost billions of dollars. Current approaches focus on leveraging heterogeneous data, such as drug-protein and disease-protein interactions, to construct complex networks that link drugs, proteins, and diseases. However, a significant challenge is the imbalance in data, where numerous unconfirmed potential drug-disease interactions (the majority class) outnumber approved drugs (the minority class), severely impacting the predictive performance of machine learning models. Previous attempts to address this issue have shown limited success. This study introduces a novel approach that integrates meta-paths in heterogeneous information networks with data balancing techniques to tackle this imbalance. Experimental results demonstrate that the proposed method enhances model performance and reliability in identifying new relationships between drugs and diseases. This research represents a promising advancement by leveraging network-based strategies and data balancing techniques to facilitate the rediscovery of drug applications, thereby potentially revolutionizing the pharmaceutical industry’s approach to drug development.