Theo báo cáo của cơ quan Phòng chống tội phạm Liên hợp quốc, mỗi năm trên thế giới số lượng bạo lực ngày càng tăng. Trong các phân loại hành động như đánh, nắm tóc, cởi quần áo, bóp cổ, đá,... thì hành động đá là một trong những hành động gây nguy hiểm có thể gây tổn thương. Bài viết nghiên cứu các kỹ thuật mạng nơ-ron học sâu Visual Geometry Group (VGG) kết hợp với mạng Long Short-Term Memory (LSTM) và mạng Gated Recurrent Units (GRU) để phát hiện hành động đá dựa trên bộ dữ liệu ViSGU gồm 403 clip hành động đá và 401 clip hành động không đá, do nhóm tác giả xây dựng. Kết quả thực nghiệm tạo mô Hình huấn luyện đánh giá dữ liệu cho bài toán phát hiện hành động đá có độ chính xác tốt trên 97%., Tóm tắt tiếng anh, According to a report of the United Nations Office on Drugs and Crime, the number of violence is increasing over years. Among criminal acts and illegal acts like hitting, holding hair, undressing and strangling, kicking is considered a dangerous action that can cause injuries. This study proposes the use of Visual Geometry Group (VGG) network combined with Long Short-Term Memory (LSTM) network and Gated Recurrent Units (GRU) network to detect kick action based on the ViSGU dataset including 403 kick action clips and 401 non kick action clips. The study's training model which evaluates data for the kick action detection have a good accuracy of over 97%.