Currently, surveillance cameras are increasingly widely used in family apartments, due to advances in hardware technology, high connectivity, and low cost. Integrating cameras with different edge devices into the smart home ecosystem is becoming popular to create a common controller for other devices such as lights, doorbells, and temperature. However, cameras, due to limited hardware resources, usually only support simple motion and person recognition techniques. In this study, we build a real-time thief detection model based on transfer learning techniques on popular edge devices. Experimental results show that the model has the lowest inference speed 3.6 FPS (Raspberry Pi 3 B+), 6.5 FPS (Raspberry Pi 4 B), and 10.2 FPS (Jetson Nano), with AP (test) accuracy over 60%. Therefore, the system is feasible when deployed in practice.Hiện nay, các camera giám sát ngày càng được sử dụng rộng rãi trong các căn hộ gia đình, do những tiến bộ công nghệ phần cứng, khả năng kết nối cao, chi phí thấp. Việc tích hợp các camera với thiết bị biên khác nhau vào hệ sinh thái nhà thông minh đang trở nên phổ biến nhằm tạo ra bộ điều khiển chung cho các thiết bị khác như: đèn, chuông cửa, nhiệt độ. Tuy nhiên, các camera do giới hạn về tài nguyên phần cứng nên thường chỉ hỗ trợ kỹ thuật nhận dạng chuyển động, người đơn giản. Trong nghiên cứu này, chúng tôi xây dựng mô hình nhận dạng trộm theo thời gian thực dựa trên kỹ thuật học chuyển giao (Transfer learning) trên thiết bị biên phổ biến Hệ thống đã được thử nghiệm trên các bộ dữ liệu mẫu và trên các mô hình YOLOv8n, EfficientDetD0, MobilenetV2 SSDLite cho thấy mô hình tốc độ độ xử lý thấp nhất là 3.6 FPS (Raspberry Pi 3 B+), 6.5 FPS (Raspberry Pi 4 B), 10.2 FPS (Jetson Nano) với độ chính xác AP (kiểm tra) trên 60%. Vì vậy, hệ thống khả thi khi triển khai vào thực tế.