CẢI TIẾN CHẤT LƯỢNG CỦA NHẬN DẠNG NGƯỜI NÓI TIẾNG VIỆT SỬ DỤNG HỌC CHUYỂN ĐỔI VÀ HỌC BIỂU DIỄN CỘNG ĐỒNG=IMPROVING PERFORMANCE OF VIETNAMESE SPEAKER RECOGNITION USING TRANSFER LEARNING AND ENSEMBLE EMBEDDING

 0 Người đánh giá. Xếp hạng trung bình 0

Tác giả: Tấn Hoàng Hồ, Cao Trưởng Trần

Ngôn ngữ: vie

Ký hiệu phân loại:

Thông tin xuất bản: Journal of Science and Technique: Section on Information and Communication Technology, 2024

Mô tả vật lý: tr.104

Bộ sưu tập: Metadata

ID: 245784

Công nghệ nhận dạng người nói giúp nhận diện hoặc xác minh danh tính dựa trên các đặc điểm giọng nói riêng của từng người, chẳng hạn như cao độ, tông giọng và cách nói chuyện. Công nghệ này được sử dụng rộng rãi để tăng cường an ninh, cải thiện dịch vụ khách hàng, hỗ trợ điều tra và tạo ra các tương tác cá nhân hóa với thiết bị thông minh. Trong những năm gần đây, nhờ ứng dụng các kỹ thuật học sâu, nhận dạng người nói đã đạt đượcnhiều tiến bộ. Tuy nhiên, việc nhận dạng người nói tiếng Việt vẫn còn gặp nhiều khó khăn. Bài viết này đề xuất những chiến lược mới, kết hợp giữa học chuyển giao và học cộng đồng, nhằm cải thiện độ chính xác trong nhận dạng người nói tiếng Việt. Các kết quả thử nghiệm trên dữ liệu tiếng Việt cho thấy độ chính xác đã được cải thiện rõ rệt.Speaker recognition technology is crucial for identifying or verifying individuals based on their unique vocal characteristics, such as pitch, tone, and speaking style. This technology is widely used to enhance security, improve customer service, support law enforcement, and personalize interactions with smart devices. In recent years, thanks to the application of deep learning techniques, speaker recognition has made significant progress. However, Vietnamese speaker recognition still faces many challenges. This paper presents new strategies that combine transfer learning and ensemble learning to improve the accuracy of Vietnamese speaker recognition. Experimental results on Vietnamese datasets show significant improvements in recognition accuracy. These findings highlight the potential of tailored approaches to advance speaker recognition technology for Vietnamese speakers and expand its applications in this field.
Tạo bộ sưu tập với mã QR

THƯ VIỆN - TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP.HCM

ĐT: (028) 36225755 | Email: tt.thuvien@hutech.edu.vn

Copyright @2024 THƯ VIỆN HUTECH