gian, tiền bạc và sức lực của con người, do đó, thông tin nội tại về mô hình (như kiến trúc, các siêu tham số và tập dữ liệu huấn luyện) cần được giữ bí mật. Những mô hình này được gọi là hộp đen và ngày càng có nhiều nghiên cứu tìm cách tấn công cũng như đưa ra phương pháp bảo vệ chúng. Các công bố gần đây thường tập trung vào lĩnh vực thị giác máy tính, ngược lại, còn khá ít nghiên cứu về các phương pháp tấn công mô hình hộp đen với dữ liệu văn bản. Bài báo này giới thiệu một phương pháp nghiên cứu trích xuất chức năng của mô hình hộp đen trong nhiệm vụ phân tích cảm xúc văn bản. Phương pháp này đã được thử nghiệm hiệu quả dựa trên các kỹ thuật lấy mẫu ngẫu nhiên nhằm tái tạo một mô hình mới có chức năng tương đương với mô hình ban đầu, đạt độ chính xác (94.46% so với 94.92%) và độ tương đồng cao (96.82%).Most commercial machine learning models today are designed to require significant amounts of time, money, and human effort. Therefore, intrinsic information about the model (such as architecture, hyperparameters, and training data) needs to be kept confidential. These models are referred to as black boxes, and there is an increasing amount of research focused on both attacking and protecting them. Recent publications have often concentrated on the field of computer vision
in contrast, there is still relatively little research on methods for attacking black box models with textual data. This article introduces a research method for extracting the functionality of a black box model in the task of text sentiment analysis. The method has been effectively tested based on random sampling techniques to reconstruct a new model with equivalent functionality to the original model, achieving high accuracy (94.46% compared to 94.92%) and high similarity (96.82%).