HỒI QUY LASSO VÀ ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU UNG THƯ VÚ

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Quỳnh Vân Nông, Đình Hùng Trần

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học và Công nghệ - Đại học Thái Nguyên, 2022

Mô tả vật lý: tr.433-440

Bộ sưu tập: Metadata

ID: 332284

Hồi quy LASSO là một trong những phương pháp hồi quy phạt được đề xuất bởi Tibshirani vào năm 1996. Mục tiêu của LASSO là lựa chọn và ước lượng tham số trong mô hình hồi quy tuyến tính bằng cách hiệu chỉnh một số hệ số bằng 0. Đặc biệt, LASSO rất hữu ích trong việc phân tích dữ liệu gen, trong đó số lượng yếu tố dự báo (gen) lớn hơn nhiều so với số lượng quan sát mẫu (số bệnh nhân). Trong bài báo này, chúng tôi sẽ hệ thống lại các kiến thức cơ bản về hồi quy LASSO và áp dụng phương pháp LASSO cho nghiên cứu gen ở bệnh nhân ung thư vú. Mục tiêu của chúng tôi là xác định gen nào ảnh hưởng đến mức độ nghiêm trọng của ung thư vú theo dữ liệu microarray. Kết quả cho thấy, LASSO hoạt động tương đối tốt trong phân tích mức độ biểu hiện gen và chỉ ra được những gen có liên quan tới gen gây ung thư vú BRC1 là các gen NBR2, AASDH, KIAA2013, VPS25, NBR1, SEC22C, RPL27, CBLN3, KHDRBS1, XRCC2. Trên thực tế, gen NBR2 tiếp giáp với BRCA1 trên nhiễm sắc thể 17 và hai gen này có chung một vùng gen khởi động. Như vậy, tiên lượng ung thư vú xác định bằng hồi quy sẽ giúp chúng ta hiểu rõ hơn về cơ chế tiềm ẩn sự xuất hiện của ung thư vú đối với phụ nữ còn trẻ.The LASSO is one of the regularized regression methods proposed by Tibshirani in 1996. The goal of LASSO is to select and estimate parameters in a linear regression model by exactly shrinking some coefficients to zero. In particular, the LASSO is useful in analyzing microarray gen data in which the number of predictors (genes) is much larger than the number of sample observations (number of patients). In this paper, we introduce a brief summary of the LASSO and apply this method to study gene in breast cancer data. The aim was to assess the genes interactions associated with breast cancer microarray data. The results show that the LASSO method performs relatively well in analyzing gene expression levels and indicates genes that related to the breast cancer gene BRCA1 such as genes NBR2, AASDH, KIAA2013, VPS25, NBR1, SEC22C, RPL27, CBLN3, KHDRBS1, XRCC2. In fact, the NBR2 gene is adjacent to BRCA1 on chromosome 17, and two genes share the same promoter region. Thus, breast cancer prognosis determined by regression will help us to better understand the mechanism underlying the occurrence of breast cancer of young women.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH