Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và tiếng nói

ictnews Tại cuộc thi VLSP (Vietnamese Language and Speech Processing) lần thứ 6 năm 2019 do Viện Hàn lâm Khoa học và Công nghệ cùng Trường ĐH Khoa học tự nhiên (ĐHQG HN) tổ chức, Zalo đạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.

Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.

VLSP 2019 được phát động từ đầu tháng 9, có 4 hạng mục: Hate Speech Detection on Social Networks (Nhận diện các nội dụng tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc tiếng Việt); Automatic Speech Recognition (Nhận dạng tiếng nói); Text To Speech (Tổng hợp tiếng nói).

Về đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình AI của các đội thi phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.

Điểm khó nhất của đề thi này là là dữ liệu đầu vào khá nhiễu, các đội thi cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có 2 tuần khiến cho nhiều đội thi gặp trở ngại. “Team Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội thi khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo chia sẻ.

 

Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý tiếng nói tiếng Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và tiếng nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, team Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.

Xử lý tiếng nói tiếng Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Ông Nguyễn Quốc Bảo cho rằng, dữ liệu huấn luyện phải từ 2000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng tiếng nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.

Hiện Zalo đang ứng dụng công nghệ xử lý tiếng nói vào phát triển và hoàn thiện trợ lý ảo Ki-Ki, đồng thời, sẽ triển khai tích hợp vào 2 sản phẩm Zing News và Báo Mới trong thời gian tới để mang đến trải nghiệm tốt nhất cho người dùng.

Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện tiếng nói).

 
List comment
 
Quy hoạch thị trường dịch vụ chữ ký số: Vì sao cần?
icon

Trong bối cảnh cung – cầu mất cân đối, nảy sinh nhiều bất cập, thì quy hoạch là việc làm rất cần thiết và cấp bách để đảm bảo sự phát triển bền vững của thị trường dịch vụ chứng thực chữ ký số công cộng tại Việt Nam.

 
Giải pháp chuyển đổi số Make in Vietnam sẽ giúp ích cho người dân Đồng Tháp
icon

Không chỉ Đồng Tháp, nhiều địa phương khác trên cả nước đang tích cực tìm biện pháp để tiến hành chuyển đổi số. Tuy nhiên, rất nhiều nơi trong số đó hiện không biết phải bắt đầu từ đâu.

 
Thành phố Trung Quốc chấm điểm công dân qua ứng dụng di động
icon

 Ban đầu, mỗi cư dân sẽ có 1.000 điểm. Đối với mỗi vi phạm, người dân sẽ bị trừ 50 điểm.

 
Lần đầu tiên Bộ TT&TT cho phép khai hồ sơ cấp đổi thẻ nhà báo online
icon

Dù vẫn nhận hồ sơ bản giấy để kiểm tra, nhưng lần đầu tiên Bộ TT&TT cho phép các cơ quan báo chí khai hồ sơ cấp đổi thẻ nhà báo trên hệ thống phần mềm quản lý tại địa chỉ: thenhabao.mic.gov.vn.

 
Cảnh báo thủ đoạn lừa đảo qua hình thức xem video, đọc báo soát lỗi chính tả
icon

Đọc báo soát lỗi chính tả, xem video, điểm danh hàng ngày hoặc viết review sản phẩm…được quảng cáo là những công việc nhàn hạ, mang lại nguồn thu nhập ổn định hàng tháng, thế nhưng thực tế thì sao?  

 
 
Mua ngay đồng hồ Citizen chính hãng mẫu mới nhất giảm giá đến 40% tại Đăng Quang Watch
icon

Đồng hồ Citizen Nhật Bản sở hữu thiết kế sang trọng, lịch lãm, đầy mê hoặc cùng độ chính xác đáng nể về thời gian khiến Citizen luôn nằm trong top những cỗ máy thời gian bán chạy nhất, được khách hàng yêu thích nhất.

Hai cá nhân bị phạt 15 triệu đồng vì chia sẻ tin giả lên Facebook
icon

Chia sẻ trên tài khoản Facebook cá nhân nội dung thông tin giả mạo phát ngôn của Phó Thủ tướng Vũ Đức Đam về dịch Covid-19, 2 phụ nữ ở Hà Nội vừa bị phạt vi phạm hành chính với mức phạt 7,5 triệu đồng mỗi người.

iPhone 12 và iPad sẽ sử dụng chức năng thoát nước trên Apple Watch
icon

Mặc dù cảm biến áp suất dựa trên gel đã được sử dụng rộng rãi trong vi điện tử, chúng cũng dễ bị hấp thụ nước hoặc ô nhiễm môi trường.  

Con trai bà Tân Vlog bị xử phạt và vấn nạn 'câu view' của YouTuber Việt
icon

Đằng sau con số triệu view là khoản tiền quảng cáo béo bở mà các nhà sáng tạo nội dung nghĩ rằng mình sẽ được YouTube trả.

Bộ TT&TT thúc giục các bộ, tỉnh đẩy nhanh dịch vụ công trực tuyến mức 4
icon

Bộ TT&TT cho rằng, với thực trạng hiện nay, nếu không có sự quyết tâm, vào cuộc của lãnh đạo cao nhất cơ quan nhà nước các cấp, mục tiêu 100% bộ, tỉnh cung cấp tối thiểu 30% dịch vụ công trực tuyến mức 4 sẽ không thể đạt được.

 
123

Giấy phép hoạt động báo chí: Số 09/GP-BTTTT, Bộ Thông tin và Truyền thông cấp ngày 07/01/2019.

Tòa soạn: Tầng 7, Tòa nhà Cục Tần số Vô tuyến điện, 115 Trần Duy Hưng, Quận Cầu Giấy, Hà Nội

Điện thoại: 024 3 936 9966 - Fax: 024 3 936 9364

Hotline nội dung: 0888 911 911 - Email: toasoan@ictnews.vn

123