Tăng cường huấn luyện mô hình học tự chú ý cho phân tích và phân đoạn tiếng nói

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Minh Tân Hà, Kim Quốc Nguyễn

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Tạp chí Khoa học và Công nghệ - Đại học Nguyễn Tất Thành, 2023

Mô tả vật lý: tr.15

Bộ sưu tập: Metadata

ID: 380949

Nghiên cứu này đề xuất một phương pháp tăng cường mới sử dụng mô hình tự chú ý để phân tách giọng nói đơn kênh. Đầu tiên, đóng băng tất cả các lớp trong mô hình tự chú ý đã được huấn luyện trước. Tiếp theo, tiến hành huấn luyện lại mô hình qua ba giai đoạn, sử dụng cơ chế lập lịch để điều chỉnh tốc độ học tập và mở khóa các lớp trong mô hình theo lịch trình. Qua quá trình này, mô hình được cập nhật và nâng cấp từ kiến thức trước đó, giúp cải thiện hiệu suất mô hình đồng thời giảm thiểu thời gian và chi phí huấn luyện. Phương pháp này không chỉ giúp tăng hiệu suất của mô hình so với các phương pháp truyền thống mà còn có thể được áp dụng để cải thiện hiệu suất của các mô hình hiện có. Kết quả thử nghiệm choa thấy rằng mô hình được huấn luyện theo phương pháp này vượt trội hơn các phương pháp hiện tại đối với nhiệm vụ tách giọng nói đơn âm trên các tập dữ liệu thông thường.This study introduces a novel augmentation approach employing a self-attention model for isolating single-channel speech. Initially, we immobilize all layers within the pre-trained self-attention model. Subsequently, we embark on a three-stage retraining process, incorporating a scheduling mechanism to adapt the learning rate and gradually unlock layers based on a pre-defined schedule. This iterative procedure facilitates the refinement and enhancement of the model's capabilities, leveraging prior knowledge to elevate performance metrics while curtailing training duration and expenses. Notably, this technique not only surpasses conventional methodologies in terms of efficacy but also holds promises for enhancing the performance of pre-existing models. Experimental results underscore the superiority of models trained using this methodology over established techniques in the domain of monosyllabic speech separation across standard datasets.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH