CẢI THIỆN HIỆU QUẢ CỦA PHÁT HIỆN NGƯỜI TRONG ĐÁM ĐÔNG BẤT THƯỜNG SỬ DỤNG CHẮT LỌC TRI THỨC CHO MẠNG YOLO

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Thị Hương Giang Đoàn, Anh Dũng Hồ, Ngọc Trung Nguyễn, Trung Hiếu Nguyễn

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học & Công nghệ - Trường Đại học Công nghiệp Hà Nội, 2024

Mô tả vật lý: tr.39

Bộ sưu tập: Báo, Tạp chí

ID: 413995

Deep Neural Networks has been achieved outstanding advantages in many different fields, especially object detection using the YOLO networks. The YOLO models have increasingly improved to obtain efficiency and overcome shortcomings of previous versions. However, in order to obtain better performance that the network structure is more complex, the number of model parameters is larger, and requires the longer response time and inverse. Especially, human detection problem in abnormal crowds that faces to some problems such as the high density of people in a frame and the lager speed of human movements. To achieve high accuracy in human detection of anormaly crowd context, the model requires a complex architecture, which leads to high time cost. In this study, the knowledge distillation from multiple higher configurations of the complex YOLO models to a simpler configuration of YOLO model. Experimental results performed on two unusual crowd databases show that our propose framework achieves better results on both single database evaluation and cross database evaluation from 1% to 6.8% higher in accuracy, the response time of our method reduces 9.16ms than YOLO V8 when it tested on GPU.Mạng nơ ron học sâu ngày càng thể hiện rõ ưu điểm vượt trội trong nhiều lĩnh vực khác nhau, như bài toán phát hiện đối tượng trong ảnh với mô hình mạng YOLO. Mạng YOLO ngày càng được cải tiến để nâng cao hiệu quả và khắc phục nhược điểm của các phiên bản trước đó. Tuy nhiên, một vấn đề đặt ra là để mạng có thể đạt kết quả cao hơn thì cấu trúc mạng phức tạp hơn, số lượng tham số nhiều hơn và điều đó khiến thời gian đáp ứng lâu hơn. Khi đó, để triển khai các bài toán có cấu hình máy đơn giản sẽ đối mặt với nhiều hạn chế về tốc độ và độ chính xác. Đặc biệt với bài toán phát hiện người trong đám đông bất thường sẽ có số lượng người trong khung hình khá nhiều, dày đặc và tốc độ di chuyển nhanh nên hệ thống phát hiện người trong ngữ cảnh này sẽ có độ chính xác thấp. Để đạt độ chính xác cao đòi hỏi mô hình có kiến trúc phức tạp lại dẫn tới tốc độ xử lý chậm và yêu cầu máy tính có cấu hình cao. Trong nghiên cứu này, mô hình học chuyển giao tri thức mới từ nhiều mô hình YOLO cấu hình cao sang mô hình YOLO cấu hình đơn giản hơn sử dụng cơ chế học chuyển giao có chắt lọc tri thức để mạng có kiến trúc nhẹ có thể học được các kiến thức của mạng có kiến trúc phức tạp. Giải pháp đề xuất được thử nghiệm trên hai cơ sở dữ liệu đám đông bất thường. Kết quả đạt được cho thấy hệ thống của chúng tôi đạt kết quả tốt hơn với giao thức đánh giá trên từng cơ sở dữ liệu riêng biệt và giao thức đánh giá chéo giữa các cơ sở dữ liệu khác nhau. Độ chính xác thử nghiệm cao hơn từ 1% đến 6,8% trong khi thời gian đáp ứng nhanh hơn 9,16ms khi chạy trên GPU.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH