Cực kỳ ấn tượng: AI của Google có thể thay bạn nói trôi chảy mọi loại ngoại ngữ, bằng giọng điệu của chính bạn!

Hệ thống mới cắt bỏ được nhiều bước nhiêu khê, cho phép dịch nhanh hơn và được một kết quả ấn tượng.

Trước khi biết về công nghệ AI mới của Google, bạn hãy nghe kết quả dự án nghiên cứu trước.

Đây là một câu trong tiếng Tây Ban Nha.

Vẫn là câu đó, được dịch sang tiếng Anh bằng hệ thống thông thường của Google. Các hệ thống dịch thuật khác cũng sẽ có kết quả tương tự, chỉ là giọng khác nhau thôi.

Dịch sang tiếng Anh, câu này có nghĩa là: “Tôi tự hỏi mình cảm thấy sao, và đó là lúc tôi bắt đầu khóc”.

Đây là câu nói nguyên bản được dịch sang tiếng Anh, thông qua hệ thống dịch tự động mới. Nội dung câu nói giờ đã khác: "Larry hỏi tôi cảm thấy thế nào, và đó là lúc tôi bắt đầu khóc". 

Kết quả chưa hoàn hảo, nhưng bạn có thể thấy ngữ điệu, âm sắc trầm bổng trong câu nói được giữ lại phần nhiều. Đây là hệ thống dịch lập tức mới của Google, có thể cho phép người dùng giữ lại chính giọng nói đó.

Đây chính là điểm khác biệt giữa hai hệ thống dịch thuật giọng nói cũ và mới. Trước thời điểm này, mọi câu nói đều được chuyển hóa thành dạng text, được dịch lại thành ngôn ngữ yêu cầu và được đọc lại bằng giọng nói máy móc. Việc này khiến cho ngữ điệu bị mất trong quá trình phiên dịch.

Hệ thống mới, được đặt cho cái tên Translatotron, bao gồm 3 thành phần; cả ba sẽ đều tập trung vào ảnh phổ - hình ảnh đại diện cho một phổ nhất định, rồi thực hiện ba công việc khác nhau.

Phần đầu tiên sẽ sử dụng mạng neural đã được huấn luyện phân tích phổ âm thanh, để tạo ra một phổ âm thanh của ngôn ngữ đầu ra.

Phần thứ hai sẽ chuyển phổ đó thành một sóng âm thanh có thể nghe được.

Phần thứ ba sẽ tách riêng những nét đặc trưng trong giọng nói nguyên bản, để gắn vào đoạn âm thanh cuối cùng.

Cực kỳ ấn tượng: AI của Google có thể thay bạn nói trôi chảy mọi loại ngoại ngữ, bằng giọng điệu của chính bạn! - Ảnh 1.

Cách thức mới không chỉ giữ nguyên được những ngữ điệu (trong nhiều trường hợp là cả hàm ý) người nói trong sản phẩm cuối cùng, trên lyus thuyết, nó còn giảm được lỗi khi cắt bớt được những bước không cần thiết trong các hệ thống dịch thuật cũ.

Translatotron mới chỉ là sản phẩm mẫu mang tính chất chứng minh hệ thống hoạt động được. Trong quá trình thử, các nhà nghiên cứu mới chỉ tập trung vào dịch tiếng Tây Ban Nha sang tiếng Anh, “mới chỉ” có thế mà đã cần tới lượng dữ liệu huấn luyện AI khổng lồ. Nhưng nó hé cảnh cửa hẹp cho ta thấy tương lai có thể sẽ ra sao.

 
 
List comment
 
MISA dành 4 danh hiệu Sao Khuê 2020 và lọt Top 10 sản phẩm CNTT xuất sắc nhất
icon

MISA tiếp tục có một năm vẻ vang khi dành tới 4 danh hiệu tại đấu trường Sao Khuê 2020 - giải thưởng CNTT uy tín hàng đầu trong làng công nghệ Việt. Trong đó, giải pháp về hóa đơn điện tử MISA MEINVOICE đã lọt Top 10 sản phẩm tiêu biểu nhất do tính năng ưu việt và đáp ứng được vấn đề nóng của xã hội.

 
Google Chrome sẽ chặn các quảng cáo gây tốn quá nhiều tài nguyên trên máy tính và di động
icon

Trong một tuyên bố đưa ra mới đây, Google cho biết sẽ bắt đầu thử nghiệm cho phép Chrome ngừng hiển thị những quảng cáo sử dụng quá nhiều nguồn tài nguyên mạng, làm chậm việc chuyển hướng người dùng đến một trang web khác.

 
Nền tảng chuyển đổi số FPT.AI và akaBot của FPT đạt danh hiệu Top 10 Sao Khuê 2020
icon

Nền tảng trí tuệ nhân tạo toàn diện FPT.AI và Nền tảng tự động hóa quy trình nghiệp vụ doanh nghiệp akaBot của FPT vừa được vinh doanh Top 10 Danh hiệu Sao Khuê - Danh hiệu uy tín và danh giá nhất của ngành phần mềm và dịch vụ CNTT Việt Nam.

 
Tổng hợp hình nền “cải trang” smartphone thành Nokia 1280
icon

Nếu muốn thay đổi một chút không khí trên chiếc smartphone, chúng ta có thể sưu tầm về các mẫu hình nền Nokia 1280 rồi thay hình nền cho máy.

 
CEO TechEvo: Làm việc phân tán cho phép doanh nghiệp “đánh cá trên cả đại dương”
icon

Ông Lưu Tiến Thành, CEO TechEvo, quản trị viên cộng đồng Vietnam Remote Workforce cho rằng mô hình làm việc phân tán là cách hiệu quả để vận hành một công ty Bởi lẽ, một công ty làm việc phân tán có thể “đánh cá trên cả đại dương”.

 
Đã có nền tảng họp trực tuyến 'Make in Việt Nam'
icon

Nền tảng họp trực tuyến Zavi sẽ có khả năng cung cấp các cuộc gọi video nhóm với chất lượng cao trên tất cả các thiết bị di động.

Thông qua đề nghị xây dựng Nghị định về CSDL quốc gia Bảo hiểm
icon

Đề nghị xây dựng Nghị định quy định Cơ sở dữ liệu (CSDL) quốc gia về Bảo hiểm vừa được Chính phủ ra Nghị quyết thông qua. Chính phủ giao Bộ Lao động – Thương binh và Xã hội chủ trì xây dựng, trình Nghị định này trong tháng 9/2020.

Ra mắt giọng nói nhân tạo tiếng Việt gần với giọng người thật
icon

Một công ty khởi nghiệp Việt cho ra mắt hai giọng nói trí tuệ nhân tạo mới biểu cảm hơn bản cũ.

Chính phủ yêu cầu đẩy mạnh nghiên cứu và cung cấp các sản phẩm công nghệ số
icon

Chính phủ vừa yêu cầu Bộ TT&TT chỉ đạo các doanh nghiệp công nghệ số Việt Nam tập trung đẩy mạnh nghiên cứu, phát triển và cung cấp các sản phẩm công nghệ số như thương mại điện tử, thanh toán không dùng tiền mặt, chuyển đổi số trong các ngành, lĩnh vực.

Cung cấp miễn phí 24 khóa học online về an ninh mạng đến hết năm 2020
icon

Từ nay đến hết năm 2020, hãng bảo mật Fortinet mở cung cấp miễn phí 24 khóa học nâng cao về an ninh mạng. Trước Fortinet, nhiều đơn vị cũng đã cung cấp miễn phí các công cụ, giải pháp hỗ trợ doanh nghiệp làm việc online an toàn.

 
123

Giấy phép hoạt động báo chí: Số 09/GP-BTTTT, Bộ Thông tin và Truyền thông cấp ngày 07/01/2019.

Tòa soạn: Tầng 7, Tòa nhà Cục Tần số Vô tuyến điện, 115 Trần Duy Hưng, Quận Cầu Giấy, Hà Nội

Điện thoại: 024 3 936 9966 - Fax: 024 3 936 9364

Hotline nội dung: 0888 911 911 - Email: toasoan@ictnews.vn

123