Tổng hợp giọng máy tiếng Việt - Thành tựu mới từ các chuyên gia AI Việt Nam

Mới đây, FPT.AI ra mắt công nghệ giọng máy AceSound – bước tiến vượt bậc trong tổng hợp giọng máy từ ngôn ngữ tự nhiên của con người.  

Cú “lột xác” ấn tượng của giọng máy tiếng Việt

Công nghệ tổng hợp giọng nói là việc tạo ra giọng máy của người từ đầu vào là văn bản hay các mã hóa phát âm. Hệ thống này còn được gọi là chuyển văn bản thành giọng nói (Text to Speech). Trên thế giới, công nghệ giọng nói được nghiên cứu và có những bứt phá mạnh mẽ trong khoảng 10 năm trở lại đây. Những “ông trùm” công nghệ lớn trên thế giới đều sở hữu nhiều giọng máy riêng với chất lượng giọng tự nhiên như người thật. Những giọng máy nổi tiếng và gần gũi nhất có thể kể đến Google Assistant, Amazon Alexa, Trợ lý ảo Siri của Apple hay Samsung Bixby…

Để tiếp cận thị trường Việt Nam, nhiều công ty công nghệ toàn cầu đã phát triển giọng nói tiếng Việt như Google, Nuance. Tuy nhiên, chất lượng giọng không tự nhiên và gặp nhiều hạn chế về tính vùng miền. Giọng máy tiếng Việt “Made in Vietnam” thì có ngữ điệu gần gũi với người Việt hơn nhưng lại bị hạn chế về hiệu năng, khả năng tích hợp với các hệ thống lớn.

Mới đây, FPT.AI đã ra mắt thêm hàng loạt giọng máy mới ứng dụng công nghệ AceSound vượt trội. AceSound vận dụng những công nghệ tiên tiến nhất về tổng hợp giọng nói, khai thác triệt để công nghệ học sâu (deep learning). Do đó, mô hình máy tính có thể học được hàng nghìn đặc trưng về ngữ điệu, biểu cảm trong giọng nói tự nhiên của con người. Kiến trúc mô hình học sâu được tinh chỉnh riêng để tối ưu cho từng giọng nói theo giới tính, vùng miền. Để giọng máy hoàn thiện và có chất lượng tự nhiên như người thật, đội ngũ kỹ sư, các nhà khoa học của FPT.AI đã thực hiện hàng nghìn thí nghiệm nhằm phân tích mẫu, liên tục cải tiến chất lượng âm học.

Phiên bản mới thay đổi về cao độ, tốc độ, cách phát âm, khả năng ngắt nghỉ…khiến giọng máy AceSound trở nên mượt mà, sống động hơn. Các giọng mới như giọng Ban Mai AceSound, giọng Minh Quang AceSound, giọng Thu Minh AceSound… có ngữ điệu, biểu cảm gần như tiệm cận với người thật, thậm chí hay hơn người thật, chất lượng ngang với giọng đọc của các MC chuyên nghiệp. Hầu hết người nghe không phân biệt được giọng máy AceSound với giọng người thật trong 10 giây đầu tiên. Hơn thế nữa, giọng máy AceSound có hiệu năng triển khai vượt trội, sẵn sàng tích hợp với các hệ thống lớn trong thời gian ngắn.

Tổng hợp giọng máy tiếng Việt - Thành tựu mới từ các chuyên gia AI Việt Nam
 

Tiềm năng ứng dụng mạnh mẽ của giọng máy

Kể từ khi ra mắt, giọng máy FPT.AI đã nhanh chóng được tích hợp vào Trợ lý ảo của các trung tâm tổng đài Chăm sóc khách hàng (CSKH) tại nhiều doanh nghiệp lớn như Home Credit, ngân hàng VIB, công ty dược Boston Pharma... Với hiệu năng triển khai vượt trội và khả năng tích hợp vào các hệ thống tổng đài lớn, giọng máy FPT.AI đang phục vụ hàng triệu khách hàng mỗi tháng với số điểm hài lòng trung bình lên tới 4,5/5 điểm.

Giọng nói của Trợ lý ảo được xây dựng để tạo ra sự đặc trưng riêng biệt cho từng thương hiệu, ngành nghề. Bằng cách “huấn luyện” bot hiểu ngôn ngữ tự nhiên nhờ AI, voicebot có thể giao tiếp hai chiều với con người theo thời gian thực, đưa ra các câu phản hồi có giọng nói biểu cảm, ngữ điệu, mang lại sắc thái tự nhiên cho cuộc hội thoại. Với công nghệ AceSound, giọng máy có thể hoạt động như người phát ngôn của thương hiệu, truyền bá thông điệp của doanh nghiệp bằng một giọng nói đặc trưng, tạo ra dấu ấn riêng các doanh nghiệp Việt thời 4.0.

Trong bối cảnh đại dịch Covid-19 diễn biến phức tạp, Trợ lý ảo AI hỗ trợ đắc lực công tác phòng chống dịch như tiếp nhận các cuộc gọi cần hỗ trợ từ người dân, thực hiện cuộc gọi sàng lọc người bệnh, thông báo lịch tiêm vắc xin, thăm hỏi sức khỏe của người dân sau khi tiêm vắc-xin. Các ứng dụng sử dụng giọng máy để giao tiếp ngày càng trở nên phổ biến hơn trên thế giới. Không chỉ mang lại lợi ích cho công đồng người khuyết tật, người khiếm thị, những người mất khả năng đọc, giọng máy còn được ứng dụng nhiều vào lĩnh vực giáo dục như sách nói, các bài giảng điện tử.

Với tham vọng đưa giọng máy tiếng Việt ra thế giới, FPT.AI liên tục cải tiến và câp nhật những công nghệ mới nhất, nhằm tạo ra những giọng máy với chất lượng vượt trội, không thua kém gì các giọng máy hàng đầu thế giới hiện nay. Tạo ra những giải pháp công nghệ ưu việt không chỉ là mục tiêu của đội ngũ chuyên gia về Trí tuệ nhân tạo tại FPT.AI, mà đó cũng là thách thức FPT.AI đặt ra để chinh phục và khẳng định vị thế của mình trên thị trường công nghệ thế giới.

Trải nghiệm giọng máy tiếng Việt FPT.AI AceSound tại: https://fptsmartcloud.vn/uPgZM 

An Nhiên

 
List comment
 
CEO mới của Twitter là ai?
icon

Với những đóng góp mang tính bước ngoặt, Giám đốc Công nghệ (CTO) Parag Agrawal sẽ là người tiếp quản vị trí CEO của Twitter sau khi nhà đồng sáng lập Jack Dorsey từ nhiệm...

 
Nên dùng ví nóng hay ví lạnh để trữ tiền số?
icon

Các loại ví nóng dễ truy xuất, tương thích nhiều loại coin và token nhưng tiềm ẩn nguy cơ bị tin tặc tấn công. Ví lạnh an toàn nhưng người dùng phải tốn thêm chi phí.

 
 
NFT có nghĩa là gì mà được chọn là Từ nổi bật của năm 2021 vượt qua cả Covid-19?
icon

NFT có nghĩa là gì mà được chọn là Từ nổi bật của năm 2021 vượt qua cả Covid-19?

 
Công bố gian hàng quốc gia Việt Nam trên sàn thương mại điện tử JD.com
icon

Dự kiến từ cuối tháng 12, “Gian hàng quốc gia Việt Nam” trên nền tảng thương mại điện tử của JD hỗ trợ xuất khẩu cho doanh nghiệp Việt Nam, sẽ đi vào vận hành.

 
 
Nhu cầu tuyển dụng tài xế, shipper tăng mạnh
icon

Trong giai đoạn bình thường mới, nhu cầu tuyển dụng tài xế và lực lượng giao hàng tại các doanh nghiệp tăng vượt hơn nguồn cung.

Nông sản Lục Yên 'bén duyên' với sàn Postmart
icon

Nhiều nông sản, sản phẩm OCOP của huyện Lục Yên (tỉnh Yên Bái) bắt đầu được đưa lên sàn thương mại điện tử Postmart.vn. Kênh tiêu thụ mới này hứa hẹn mang lại lợi ích bất ngờ với rất nhiều hộ nông dân miền sơn cước.

Bị lừa hơn 600 triệu đồng vì nhấp vào link lừa đảo trên điện thoại
icon

Trong lúc mất cảnh giác, một nữ kế toán ở TP.HCM đã bị lừa mất hơn 600 triệu đồng vì truy cập vào đường link gửi vào điện thoại.  

Giải pháp quản lý chiếu sáng đô thị thông minh giúp tiết kiệm 40% năng lượng
icon

Bộ đèn LED và giải pháp quản lý chiếu sáng thông minh đồng bộ đang được triển khai thử nghiệm tại Đại học Quốc gia, Khu Công nghệ cao TP.HCM, phục vụ Đề án xây dựng TP.HCM trở thành đô thị thông minh.

Doanh nghiệp sản xuất công nghiệp có mức độ sẵn sàng về chuyển đổi số còn thấp
icon

Theo khảo sát về chuyển đổi số của các doanh nghiệp nhỏ và vừa, doanh nghiệp nhà nước tại Việt Nam, doanh nghiệp khu vực 2 (sản xuất công nghiệp) đang xếp sau các khu vực 1, 3 về mức độ sẵn sàng trong nhận thức với chuyển đổi số.

 
123

Giấy phép hoạt động báo chí: Số 09/GP-BTTTT, Bộ Thông tin và Truyền thông cấp ngày 07/01/2019.

Tòa soạn: Tầng 7, Tòa nhà Cục Tần số Vô tuyến điện, 115 Trần Duy Hưng, Quận Cầu Giấy, Hà Nội

Điện thoại: 024 3 936 9966 - Fax: 024 3 936 9364

Hotline nội dung: 0888 911 911 - Email: toasoan@ictnews.vn

123