Nghiên cứu mô phỏng dáng người trong không gian ba chiều từ đơn ảnh đã có tiến triển đáng kể trong thời gian gần đây, nhờ tính toán bằng các mô hình có kiến trúc mạng tối ưu, kết hợp với các bộ dữ liệu quy mô lớn. Tuy nhiên, khi áp dụng vào điều kiện môi trường khác nhau trong thực tế, các phương pháp hiện có vẫn chưa đạt được độ chính xác so với kỳ vọng. Bài báo này đề xuất một giải pháp mới gồm hai mô hình kết hợp nhằm tăng độ chính xác dựa trên phương thức học sâu. Mô hình thứ nhất gọi là Squeeze-and-Excitation Network, được dùng để dựng lại dáng người hai chiều từ một ảnh đầu vào
Sau đó, sử dụng kết hợp giữa các lớp kết nối đầy đủ và mạng chập đồ thị để dựng thành dáng người ba chiều từ thông tin đầu ra của mô hình trước. Hiệu quả của phương pháp được chứng minh bằng cách so sánh với bộ dữ liệu chuẩn, và cho thấy độ chính xác được cải thiện đáng kể so với các phương pháp đã có trước.