Các phương pháp học máy đã và đang được thử nghiệm với dữ liệu viễn thám đa độ phân giải như ảnh vệ tinh, ảnh hàng không, dữ liệu từ thiết bị bay không người lái (UAV), tập hợp dữ liệu đám mây điểm và đem lại kết quả khả quan. Tuy nhiên, với cấu trúc phức tạp của các loại hình lớp phủ và với đặc điểm nguồn dữ liệu lớn, các mô hình dựng sẵn đôi khi không đạt được độ chính xác mong đợi trong phân loại. Nghiên cứu này tích hợp mạng nơ-ron tích chập và thuật toán Catboost trong phân loại lớp phủ mặt đất từ dữ liệu UAV. Dữ liệu đầu vào của mô hình là ảnh chụp UAV tại Hà nội, kết hợp với mô hình số bề mặt (DSM). Kết quả cho thấy mô hình đề xuất có độ chính xác phân loại = 91,5%, cao hơn so với các phương pháp phổ biến khác và có thể sử dụng tại các khu vực đô thị khác tại Việt Nam.