Thực nghiệm đánh giá YOLOX cho bài toán phát hiện đối tượng tài liệu

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Huỳnh Viết Tuấn Kiệt, Nguyễn Tấn Trần Minh Khang, Nguyễn Trọng Thuận, Nguyễn Văn Toàn, Võ Duy Nguyên

Ngôn ngữ: Vie

Ký hiệu phân loại: 004 Data processing || Computer science

Thông tin xuất bản: Khoa học (Đại học Cần Thơ), 2022

Mô tả vật lý: 52-60

Bộ sưu tập: Metadata

ID: 418390

Trong vài thập kỷ qua, với sự gia tăng nhanh chóng trong việc số hóa các hình ảnh tài liệu, việc trích xuất thông tin chính xác là một trong những hướng nghiên cứu quan trọng. Với sự phát triển của phát hiện đối tượng, nhiều nghiên cứu ra đời hướng đến việc phân loại tài liệu dựa trên nhiều thành phần của trang tài liệu đó. Mục tiêu của nghiên cứu này là đề cập đến bài toán POD (Page Object Detection) - phát hiện đối tượng xuất hiện trong trang tài liệu thông qua đánh giá 2 bộ dữ liệu IIIT-AR-13K và UIT-DODV dựa theo phương pháp YOLOX. YOLOX đạt kết quả 69,0% mAP, tốt hơn 2,90% so với kết quả mô hình one-stage cao nhất - YOLOv4-mish được công bố trên bộ dữ liệu UIT-DODV. Trong khi ở IIIT-AR-13K, YOLOX đạt được 66,9% mAP và thấp hơn nhiều so với các phương pháp two-stage đã công bố trước đó. Bên cạnh, những phân tích về độ hiệu quả của phương pháp state-of-the-art YOLOX cho bài toán POD cũng được cung cấp, là tiền đề cho những nghiên cứu tiếp theo trong tương lai., Tóm tắt tiếng anh, In the few recent decades, the rapidly increasing digitalization of image documents, accurate information extraction has been an important research area of the document analysis community. Many research works have been conducted on element-based approach for document classification. In this paper, the objective addresses the POD (Page Object Detection) problem - detecting objects that appear in document pages, by evaluating 2 datasets IIIT-AR-13K and UIT-DODV as the benchmark for the YOLOX method. YOLOX achieved 69,0% mAP on the UIT-DODV dataset and 66,9% mAP on the IIIT-AR-13K dataset. Compared to the highest result of the previous state-of-the-art of onestage detector - YOLOv4x-mish, on the UIT-DODV dataset, YOLOX surpassed by 2,90% mAP. YOLOX is significantly lower in IIIT-AR-13K than in previously announced two-stage approaches. Furthermore, this research provided an analysis on the effectiveness of the state-of-the-art method YOLOX on the POD problem, which will become a premise for future researches.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 71010608 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH