Mạng nơ-ron tích chập (CNN) là một trong những mô hình học sâu hiệu quả nhất trong lĩnh vực nhận diện khuôn mặt, các vùng hình ảnh khác nhau luôn được sử dụng đồng thời khi trích xuất các đặc trưng hình ảnh, nhưng trong thực tế, các phần của khuôn mặt đóng nhữngvai trò khác nhau trong việc nhận diện. Trong bài báo này, chúng tôi sử dụng mối tương quan giữa phát hiện và hiệu chỉnh để nâng cao hiệu suất trong một mạng nơ-ron tích chập xếp chồng (MTCNN). Ngoài ra, chúng tôi sử dụng framework FaceNet của Google để tìm hiểu cách ánh xạ từ hình ảnh khuôn mặt đến không gian Euclide, nơi khoảng cách tương ứng trực tiếp với độ đo độ tương tự khuôn mặt để trích xuất hiệu suất của các thuật toán đặc trưng khuôn mặt. Thuật toán gộp trung bình có trọng số được áp dụng cho mạng FaceNet và thuật toán nhận dạng khuôn mặt dựa trên mô hình FaceNet cải tiến được đề xuất. Thực nghiệm và ứng dụng thử nghiệm cho thấy thuật toán nhận dạng khuôn mặt được đề xuất có độ chính xác nhận dạng cao sử dụng phương pháp nhận dạng khuôn mặt dựa trên học sâu.