Bài viết nghiên cứu “Sử dụng các mô hình ngôn ngữ lời nói mở rộng chuyển văn bản thành giọng nói tương đương con người thông qua việc truyền bá phong cách và đào tạo”. Kết quả nghiên cứu đã cho thấy phương pháp này có thể phản ánh hiệu quả các đặc điểm phong cách từ âm thanh tham chiếu. Hơn nữa, Style vectơ từ mô hình, tác giả mã hóa một tập hợp thông tin phong phú có trong âm thanh tham chiếu, bao gồm cao độ, năng lượng, tốc độ nói, chuyển tiếp biểu mẫu và nhận dạng người nói.In this study, extensive speech language models were used to convert text into human equivalent speech through style propagation and training. This study’s results showed that this method can effectively reflect stylistic features from reference audio. Furthermore, from the study’s research model, the Style vector was encoded with a rich set of information contained in the reference audio, including pitch, energy, speaking rate, form transitions, and speaker identity.