Phân tích trang văn bản là một bước không thể thiếu trong các hệ thống nhận dạng văn bản. Việc phân tích trang văn bản là để xác định phạm vi, cấu trúc của các khối từ, từ đó mới có thể nhận dạng và trả lại cấu trúc của trang văn bản sau nhận dạng một cách chính xác. Bài báo đề cập đến một kỹ thuật đánh giá độ sai lệch của văn bản dựa vào cấu trúc. Qua đó, đề xuất một thuật toán phân tích trang văn bản dựa vào các văn bản mẫu đã có.