Phát hiện hành vi mang vũ khí là một trong những bài toán cấp bách và yêu cầu triển khai trên phạm vi rộng với nhiều camera và thường yêu cầu cài đặt trên cấu hình hệ thống gọn nhẹ nhưng cần phải đạt được độ chính xác cao. Mạng YOLO (You Only Look Once) là một trong những mô hình phát hiện đối tượng trong ảnh khá hiệu quả hiện nay. Tuy nhiên, các mô hình YOLO được công bố cho cộng đồng dùng chung không được huấn luyện trên các cơ sở dữ liệu (CSDL) vũ khí. Nghiên cứu này thực hiện thu thập và gán nhãn bộ CSDL của 06 loại vũ khí thông dụng. Ngoài ra, bài báo cũng triển khai giải pháp học chuyển giao giữa các mô hình YOLO cấu hình cao và nặng cho các mô hình YOLO cấu hình thấp và nhẹ hơn. Việc này giúp chuyển giao tri thức mà hệ chuyên gia đã tổng hợp được đối với các loại vũ khí cho các mô hình nhẹ nhằm đạt được một mô hình có cấu hình đơn giản, dễ dàng triển khai thực tế trong khi độ chính xác hệ thống cao hơn. Nghiên cứu còn đề xuất giải pháp phát hiện hành vi mang vũ khí của người sử dụng kết hợp kết quả đầu ra của mô hình YOLO với luồng dịch chuyển quang học của các đối tượng phát hiện trong ảnh. Kết quả đạt được cho thấy hệ thống của chúng tôi đạt kết quả tốt hơn khi học chuyển giao để phát hiện vũ khí và đặc biệt đạt kết quả cao hơn khi phát hiện hành vi mang vũ khí. Độ chính xác thử nghiệm khi phát hiện vũ khí khi học chuyển giao giữa mô hình YOLO V3 tiny so với YOLO V3 tiny – YOLO V8 KD cao hơn từ 2% đến 7,9% trong khi thời gian đáp ứng nhanh hơn 10,95 ms khi chạy trên GPU. Độ chính xác phát hiện hành vi mang vũ khí của giải pháp đề xuất được cải thiện lên tới 13,88% so với sử dụng kết quả đầu ra của mô hình của YOLO V3 tiny.Weapon carrying behavior detection is one of the necessary problems. This system deploys on a large space with many cameras. It is installed in a compact and slow configuration while it requires high accuracy. The YOLO network is one of the most effective object detection models in image/video. However, the published YOLO (You Only Look Once) models are not trained on weapons databases. This study collects and labels the database of 6 common types of weapons. In addition, the paper also implements a transfer learning solution between high-configuration and heavy YOLO models to lower-configuration and smaller YOLO models. This work aims to transfer the knowledge from the expert system that has compiled about weapons to a simpler model to achieve a model with a simple configuration, easy to deploy in practice while maintaining higher accuracy. The research also proposes a solution to detect the user's weapon carrying behavior that combines the output of the YOLO model with the optical flow stream of detected humans and weapons in the image. The results show that our system achieves better results when transferring learning to detect weapons and especially achieves better results when detecting weapon carrying behavior. Experimental weapon detection accuracy between YOLO V3 tiny models compared to YOLO V3 tiny – YOLO V8 KD is 2% to 7.9% higher while response time is 10.95 ms faster when tested on GPU. The weapon carrying behavior detection accuracy of the proposed solution is improved by up to 13.88% compared to using the model output of YOLO V3 tiny.