NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI UNG THƯ THÔNG QUA BIỂU HIỆN GEN TỪ CÁC THÍ NGHIỆM MICROARRAY

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Dang Thuy Hang, Do Van Dinh, Hoai Linh Tran

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học & Công nghệ - Trường Đại học Công nghiệp Hà Nội, 2022

Mô tả vật lý: tr.33

Bộ sưu tập: Metadata

ID: 337457

Dữ liệu biểu hiện gen từ các thí nghiệm microarray là một dữ liệu phổ biến chochẩn đoán ung thư. Tuy nhiên, điểm đặc biệt của loại dữ liệu này là có rất ít mẫutrong khi số biểu hiện gen lại lên tới hàng nghìn mẫu nên rất khó để lựa chọn đượccác gen có hiệu quả cho việc phân tích. Do đó, giảm chiều dữ liệu là phương phápcần thiết trước khi dữ liệu đưa vào phân tích và phân tích thành phần cơ bản (PCA)là phương pháp được sử dụng để giảm chiều dữ liệu đầu vào. Trong bài báo này, cóthể nhận thấy không phải phải thành phần dữ liệu đầu tiên là các thành phần dữliệu tốt nhất do đo cần phải sử dụng thêm phương pháp lựa chọn đặc tính sau khigiảm chiều dữ liệu để chọn ra các đặc tính tốt nhất cho việc phân loại. Vì vậy, chúngtôi đề xuất sử dụng PCA để giảm chiều dữ liệu sau đó dùng thuật toán cây quyếtđịnh (DT) để lựa chọn ra các đặc tính phù hợp nhất và mạng MLP để phân loại dữliệu. Các kết quả đạt được cho thấy đề xuất của chúng tôi cho hiệu quả tốt.Gene expression microarray data is one of the most popular for dianosis ofcancer. However, the microarray data have thousands of genes and very fewsamples, it is crucial to develop techniques to effectively gene selection foranalysis. So, dimension reduction is an important issue for analysis, of whichprinciple component analysis (PCA) is one of the frequently used methods, and inthe previous works, the top several principle components are selected formodeling according to the descending order of eigenvalues. While in this paper,we argue that not all the first features are useful, but features should be selectedform all the components by feature selection methods. We demonstrate aframework for selecting good feature subsets from all the principle components,leading to enhance classifier accuracy rates on the gene expression microarraydata. As a case study, we have considered PCA for dimension reduction, decesiontree algorithms (DT) for feature selection, and then Multi Layer Perceptronnetwork (MLP) for classification. Experimental results illustrate that ourproposed framework is effective to enhance classification accuracy rates.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH