Chuyển đổi số các cơ sở giáo dục đào tạo đang là một nhiệm vụ cấpbách và Học viện Ngân hàng cũng không nằm ngoài guồng quay của cuộccách mạng công nghệ này. Để quá trình chuyển đổi số được thuận lợi thì quátrình số hóa dữ liệu cần được ưu tiên đẩy mạnh. Trong bài báo này, tác giảnghiên cứu những giải pháp phù hợp cho việc số hóa dữ liệu văn bản đã vàđang lưu hành trong Học viện Ngân hàng. Cụ thể, tác giả giới thiệu các côngnghệ cốt lõi trong số hóa tài liệu như Nhận dạng ký tự quang học, Xử lý vănbản thông minh, khảo sát các giải pháp tiêu biểu trên thị trường ở Việt Namđể lựa chọn giải pháp khả thi và tiến hành cài đặt thử nghiệm giải pháp FPT.AI Reader với bộ dữ liệu tự thu thập từ một số phòng ban tại Học viện. Kết quảthực nghiệm cho thấy tỷ lệ sai số ở mức từ đạt 27% và chỉ 16% từ bị sai ở cáctiêu đề, đơn vị ban hành, loại văn bản. Giải pháp hoàn toàn có thể được nghiên cứu cải thiện thêm nhằm đáp ứng nhu cầu số hóa tại Học viện trong tương laiDigital transformation of education and training institutions is becoming an urgent task andBanking Academy is not an exception. In order to facilitate the digital transformation process, digitizationtasks must always be promoted. In this paper, the author conducts a research about digitization technologyand proposes solutions for digitizing text documents in Banking Academy. Specifically, this articleintroduces core technologies in document digitization such as Optical Character Recognition, Intelligent TextProcessing, investigates typical solutions on the Vietnamese Digitization market to choose the appropriateone and conducts an experiment based on FPT.AI Reader with manually-collected datasets from severaldepartments in the Academy. The experimental results are impressive, with 27% word error rate and only 16%error in the text containing title, department name, document type. This solution could be improved to applyto the digitization process at the Banking Academy in the future.