Ứng dụng học sâu và nhận diện ký tự quang học trong số hóa tài liệu báo cáo tài chính=Application of Deep Learning and Optical Character Recognition in Digitizing Financial Statements

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Thiên Vũ Đặng, Hoành Sử Lê, Quang Học Nguyễn, Thị Minh Hiền Trần

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Kinh tế và Ngân hàng châu Á, 2024

Mô tả vật lý: tr.21-39

Bộ sưu tập: Báo, Tạp chí

ID: 480052

The digital revolution is fundamentally altering our interaction with data. Traditional methods like manual data entry for digitizing tables in financial statements are becoming obsolete, failing to meet the standards of cost efficiency and time effectiveness in reporting. To address this challenge, this paper proposes a method centered on leveraging PaddleOCR to automatically recognize tables within images extracted from financial reports. Our approach harnesses deep learning models and optical character recognition (OCR) technology embedded within this open-source tool. The process involves detecting tables, detecting and recognizing text, predicting table structures, and ultimately reconstructing them into HTML format and Excel files. Through experimentation and comparison with actual tables, our study achieves an average TEDS score of 95% for regular tables with full borders and 83% for borderless tables. These promising results underscore the tool's viability in digitizing documents containing tables, thereby streamlining data entry processes. Furthermore, this outcome marks a significant milestone toward the broader goal of complete digitization through robotic process automation (RPA).Trong bối cảnh của cuộc cách mạng số hóa toàn cầu, việc sử dụng phương pháp nhập liệu thủ công để số hóa bảng biểu trong báo cáo tài chính (BCTC) đã trở nên lỗi thời và không đáp ứng được nhu cầu về thời gian và chi phí trong thời đại hiện nay. Để khắc phục hạn chế này, nghiên cứu tập trung đề xuất một phương pháp tự động nhận diện bảng biểu trong các BCTC từ hình ảnh thông qua công cụ PaddleOCR. Nghiên cứu tận dụng những mô hình học sâu và công nghệ nhận diện ký tự quang học (OCR) của công cụ mã nguồn mở này để tiến hành các công đoạn phát hiện bảng, phát hiện và nhận diện văn bản, dự đoán cấu trúc bảng và tọa độ ô và cuối cùng là tái tạo lại bảng tương đồng dưới dạng file Excel, HTML. Nghiên cứu thực nghiệm và so sánh với các bảng thực tế, đạt được độ chính xác trung bình trong việc tái tạo cấu trúc bảng và nhận diện các cột nội dung quan trọng là 95% đối với dạng bảng có các đường viền đầy đủ và 83% đối với dạng bảng ít viền. Kết quả khả quan này khẳng định tính ứng dụng của công cụ cho giải pháp số hóa tài liệu chứa bảng biểu, giảm bớt thời lượng xử lí các công việc nhập liệu.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH