Bồn trầm tích An Châu (bồn An Châu) là một cấu trúc địa chất kéo dài theo phương Tây Bắc - Đông Nam, phân bố ở vùng Đông Bắc Việt Nam. Bồn An Châu được cho là bồn có quy mô lớn và có tiềm năng dầu khí. Thực tế này cho thấy, nhiều khả năng sẽ phát hiện được các tích tụ dầu khí trong bồn An Châu thuộc địa phận của Việt Nam. Mặc dù tiềm năng dầu khí của bồn này được nhận định từ rất sớm, nhưng vì nhiều lý do mà cho đến nay công tác điều tra, khảo sát địa chất và thăm dò ở khu vực bồn An Châu còn rất sơ sài, chưa đáp ứng được các yêu cầu của công tác tìm kiếm - thăm dò dầu khí. Việc ứng dụng mô hình học máy (machine learning - ML) vào nhận dạng tướng đá là một phương pháp mới giúp giảm thiểu thời gian xử lý, tổng hợp cơ sở dữ liệu về cả số lượng và định dạng, phát hiện các mối quan hệ ẩn sâu giữa các lớp thông tin nhận dạng. Mục tiêu chính của nghiên cứu này là nhận dạng tướng đất đá khu vực bồn An Châu từ phần số liệu đầy đủ đã được huấn luyện bởi cấu trúc mạng cây quyết định (DT) kết hợp thuật toán gradient boosting (XGB) để đánh giá cấu trúc và xác định tiềm năng dầu khí khu vực này. Điều kiện tiên quyết để nâng cao độ chính xác của học máy là phải làm giàu cơ sở dữ liệu thông qua tích hợp số liệu địa chất - địa chấn và tính toán thêm các thuộc tính để xây dựng “mô hình học” - huấn luyện ML và sử dụng kết quả huấn luyện đó để nhận dạng tướng đất đá trong khu vực bồn An Châu.The An Chau basin (An Chau basin) is a geological structure extending in a northwest-southeast direction, located in the northeastern region of Vietnam. The An Chau basin is considered a large-scale basin with significant petroleum potential. This fact suggests a high likelihood of discovering hydrocarbon accumulations within the An Chau basin within Vietnam’s territory. Although the petroleum potential of this basin was identified early, for various reasons, geological surveys and exploration activities in the An Chau basin remain rudimentary and have not yet met the requirements for effective petroleum exploration and production. The application of machine learning (ML) models to lithofacies identification offers a novel approach to reducing processing time, consolidating large and diverse datasets, and uncovering hidden relationships among layers of identification information. The primary objective of this study is to identify lithofacies in the An Chau basin using comprehensive datasets trained with a decision tree (DT) structure combined with a gradient boosting algorithm (XGB) to evaluate the structure and assess the petroleum potential of this area. A prerequisite for improving the accuracy of machine learning is enriching the database through the integration of geological and seismic data, along with the calculation of additional attributes to build the “learning model” training the ML system and applying the trained model to identify lithofacies in the An Chau basin.