Google đã có những công bố mới trong bước đi quan trọng đầu tiên với mô hình có thể hỗ trợ hơn 100 ngôn ngữ khác nhau dù hiện nay nó mới chỉ là 10% con số mà Google dự tính trong tương lai.
ChatGPT đang là chủ đề nóng nhất vào lúc này, nhưng thay vì chạy theo xu thế mà ChatGPT tạo ra, Google đã thực hiện đa dạng hóa hoạt động đầu tư vào nhiều mô hình AI khác nhau.
Đặc biệt, một trong những dự án mà công ty đang triển khai nhắm tới mục tiêu tạo ra một mô hình AI dịch thuật, với khả năng hỗ trợ hơn 1.000 ngôn ngữ khác nhau.
Google đã công bố kế hoạch tạo ra mô hình AI ngôn ngữ, được đặt tên là “Mô hình Giọng nói Toàn diện” (USM) vào tháng 11.
USM được đánh giá là một hệ thống các mô hình giọng nói hiện đại với 2 tỷ thông số, và được đào tạo trên các ghi âm giọng nói kéo dài tới 12 triệu giờ, cùng 28 tỷ câu văn bản thuộc hơn 300 ngôn ngữ khác nhau.
Các chức năng của mô hình bao gồm tự động nhận diện giọng nói, đặc biệt là với những ngôn ngữ hiếm, không có nhiều nguồn dữ liệu để sử dụng như tiếng Anh hay tiếng Trung.
Mô hình ngôn ngữ này hiện đã được sử dụng trên mạng xã hội, chia sẻ video YouTube để tạo phụ đề cho các video. Tuy nhiên mới chỉ có 73 trong số 100 ngôn ngữ của USM được hỗ trợ hiển thị trên YouTube.
Google hiện không phải là công ty duy nhất trong lĩnh vực dịch thuật dựa trên AI, nhưng triển vọng áp dụng công nghệ máy học vào dịch thuật là một hướng đi thú vị.
Hà An