Mới đây, 2 đề tài nghiên cứu liên quan đến công nghệ xử lý tiếng nói của nhóm kỹ sư Zalo AI đã được công nhận tại Hội nghị châu Á – Thái Bình Dương về trí tuệ nhân tạo quốc tế – PRICAI 2021.
PRICAI – hội nghị quốc tế tập trung nghiên cứu về AI và ứng dụng trong lĩnh vực kinh tế – xã hội trên phạm vi châu Á – Thái Bình Dương, được tổ chức lần đầu vào năm 1990, năm nay được tổ chức tại Việt Nam. Theo giới nghiên cứu về AI, PRICAI là nơi quy tụ rất nhiều chuyên gia xuất sắc trên thế giới trong trong lĩnh vực tuệ nhân tạo nói riêng và lĩnh vực công nghệ thông tin nói chung.
Các công trình nghiên cứu được công nhận tại hội nghị của nhóm kỹ sư Việt Nam đều liên quan đến công nghệ xử lý giọng nói (Speech Processing): Nghiên cứu về việc chuẩn hóa văn bản đa tác vụ cho hệ thống thống tổng hợp giọng nói (Multi-task Text Normalization Approach for Speech Synthesis) và Nghiên cứu các giải pháp để xây dựng hệ thống tổng hợp giọng nói đa ngôn ngữ (Learning Vietnamese-English Code-Switching Speech Synthesis Model Under Limited Code-Switched Data Scenario). Thực hiện đề tài này là các nhà nghiên cứu trẻ tuổi đến từ Zalo AI với tuổi đời chưa tới 30 là: Trang Trương (1994), Việt Lâm (1995), Cúc Bùi (1997), và Mạnh Cường (1999).
Được biết, đội ngũ đã mất khoảng 6 tháng để nghiên cứu, thử nghiệm và 2 tháng để hoàn thành phần bài báo khoa học. Các đề tài đều xuất phát từ nhu cầu thực tiễn trong quá trình xây dựng các sản phẩm AI để phục vụ người dùng.
“Bọn mình cảm thấy module chuẩn hóa văn bản để tổng hợp giọng nói đang có nhiều hạn chế về từ viết tắt, từ mới, từ sai chính tả, và vấn đề ngắt nghỉ. Điều này có thể ảnh hưởng đến mức độ tự nhiên của giọng nói AI. Vì thế, chúng mình đã cố gắng xây dựng một mô hình nhằm cải thiện vấn đề đang gặp phải”. – Cúc Bùi, thành viên nhóm nghiên cứu chia sẻ.
Hiện tại, cả “Nghiên cứu về việc chuẩn hóa văn bản đa tác vụ cho hệ thống thống tổng hợp giọng nói” và “Nghiên cứu các giải pháp để xây dựng hệ thống tổng hợp giọng nói đa ngôn ngữ” đều đang được ứng dụng vào thực tiễn. Cụ thể là 2 nghiên cứu đang được áp dụng vào hệ thống tổng hợp giọng nói nhằm hỗ trợ sản phẩm thực tế chạy trên trang Báo Mới và loa thông minh Kiki.
Zalo AI hiện là đơn vị dẫn đầu trong nghiên cứu và ứng dụng AI trong nước, tập trung vào 4 mảng chính của trí tuệ nhân tạo là Thị giác máy tính (Computer Vision), Xử lý tiếng nói (Speech processing), Xử lý ngôn ngữ tự nhiên (NLP), và Big Data & Machine Learning (Dữ liệu lớn và máy học).
Minh Vũ
Đường dẫn bài viết: https://tudonghoangaynay.vn/nghien-cuu-ai-cua-viet-nam-duoc-cong-nhan-tai-pricai-2021-7178.htmlIn bài viết
Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản. Copyright © 2024 https://tudonghoangaynay.vn/ All right reserved.