Google muốn phát triển mô hình ngôn ngữ lớn và tiềm năng AI tại Việt Nam

Trí tuệ nhân tạo
13/02/2025 06:06
Đại diện Google tại Việt Nam cho biết, Google muốn hợp tác với Chính phủ và tổ chức trong nước để phát triển mô hình ngôn ngữ lớ và khai thác tiềm năng của AI tại Việt Nam.
aa

Mô hình ngôn ngữ lớn chỉ phát huy hết tác dụng khi được lập trình bằng nguồn dữ liệu tiếng Việt.

Đây là một trong các đề xuất hợp tác được Tổng giám đốc Công ty TNHH Google Việt Nam Marc Woo đề cập tại Hội nghị phát triển khoa học công nghệ, đổi mới sáng tạo, chiều 11/02 ở Hà Nội.

Theo ông Woo, lĩnh vực trí tuệ nhân tạo trong nước thời gian qua có nhiều bước tiến, nhưng để có sự phát triển vượt bậc, Việt Nam vẫn rất cần một lực lượng tri thức, lao động cũng như doanh nghiệp lành nghề, thành thạo công nghệ AI.

Google muốn phát triển mô hình ngôn ngữ lớn và tiềm năng AI tại Việt Nam
Đại diện Google tại Việt Nam cho rằng, mô hình ngôn ngữ lớn (LLM) chỉ phát huy hết tác dụng khi được lập trình bằng nguồn dữ liệu tiếng Việt (Ảnh: VNG Cloud)

Ông Woo cho rằng, dữ liệu và mô hình có thể quyết định sức mạnh của công nghệ AI. Thời gian qua, Google đã dành nhiều nguồn lực xây dựng các mô hình ngôn ngữ lớn, nhưng các mô hình này "chỉ phát huy được hết tác dụng khi chúng được đào tạo bằng nguồn dữ liệu, đặc biệt là tiếng Việt đa dạng và chất lượng cao".

"Chúng tôi rất mong được hợp tác với Chính phủ, các tổ chức, trường đại học, để cùng phát triển mô hình ngôn ngữ lớn, hiện đại và mang đậm tinh hoa tiếng Việt", ông Woo nói.

Đại diện Google tại Việt Nam đánh giá, việc xây dựng bộ dữ liệu quốc gia mở, cho phép khai thác để xây dựng ứng dụng AI là điểm tích cực của Việt Nam, sẵn sàng trao đổi và chia sẻ bài học kinh nghiệm để phát triển.

Về nguồn nhân lực, Tổng giám đốc Công ty TNHH Google Việt Nam cho biết, sẽ tiếp tục cung cấp học bổng và chương trình đào tạo nâng cao kỹ năng AI cho những người đủ điều kiện. Với học sinh, sinh viên và giáo viên, Google sẵn sàng cung cấp tài khoản truy cập miễn phí gói giải pháp Google WorkSpace, Classroom - công cụ hỗ trợ học tập và giảng dạy bằng trí tuệ nhân tạo.

Google muốn phát triển mô hình ngôn ngữ lớn và tiềm năng AI tại Việt Nam
LLM là các chương trình máy tính có thể phân tích và tạo ra văn bản bằng nguồn dữ liệu ngôn ngữ. Trước đó, mô hình LLM của Google đã thành công với nhiều nguồn dữ liệu ngôn ngữ trên thế giới, hiện Google mong muốn LLM được phát huy hết tác dụng với nguồn dữ liệu tiếng Việt (Ảnh minh họa: Internet)

Hiện phần lớn chatbot AI phổ biến đều hỗ trợ tiếng Việt, tuy nhiên khả năng xử lý của các mô hình ngôn ngữ lớn đứng sau có nhiều khác biệt.

Báo cáo tình hình phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt thông qua bộ tiêu chuẩn VMLU được công bố tháng 1/2025 cho thấy, có ít nhất 45 mô hình ngôn ngữ lớn tiếng Việt được xây dựng tính đến cuối 2024 từ các doanh nghiệp, tổ chức trong và ngoài nước.

Trong đó, Llama-3-70B của Meta, KiLM-13b-v24.7.1 của Zalo AI, GPT-4 của OpenAI là những mô hình dẫn đầu năng lực tiếng Việt tổng quát, cao hơn Gemma hay Gemini của Google.

Chính phủ Việt Nam từng đề nghị Google hỗ trợ lập “vườn ươm AI”

Trước đó, ngày 25/09/2024, trong buổi gặp gỡ ông Karan Bhatia, Phó chủ tịch phụ trách Quan hệ Chính phủ và Chính sách công của Google tại New York, Tổng Bí thư, Chủ tịch nước Tô Lâm đã đề nghị Google hợp tác trong hai sáng kiến thúc đẩy nghiên cứu AI tại Việt Nam; tiếp tục có tiếng nói, định hướng các nhà cung ứng của mình mở rộng đầu tư kinh doanh tại Việt Nam; hỗ trợ nâng cao năng lực, giúp doanh nghiệp Việt Nam tham gia vào chuỗi cung ứng của tập đoàn.

Google muốn phát triển mô hình ngôn ngữ lớn và tiềm năng AI tại Việt Nam
Logo Google tại Việt Nam (Ảnh: Lưu Quý)

Đồng thời, Tổng Bí thư, Chủ tịch nước mong muốn có sự hợp tác chặt chẽ giữa Google với Việt Nam về đào tạo lĩnh vực trí tuệ nhân tạo, phối hợp với Trung tâm Đổi mới sáng tạo Quốc gia Việt Nam (NIC) và các cơ quan, viện, trường đại học trong nước triển khai hai sáng kiến: Phát triển trung tâm R&D về AI tại Việt Nam và hỗ trợ thiết lập "vườn ươm AI", để hỗ trợ những ý tưởng mới và sáng tạo trong lĩnh vực này.

Trong buổi gặp gỡ, ông Karan Bhatia khẳng định cam kết của Google, tập đoàn đang và sẽ tiếp tục phối hợp, hỗ trợ Việt Nam trong đào tạo nguồn nhân lực chất lượng cao về AI, đồng thời, tư vấn về môi trường chính sách, pháp lý theo hướng tối ưu hóa để phát triển AI, trong đó có những quy định về dịch chuyển dữ liệu. Google kỳ vọng hỗ trợ Việt Nam về dịch vụ đám mây kết hợp AI, cũng như hợp tác trong lĩnh vực an ninh mạng.

Việt Nam là thị trường có nền kinh tế số phát triển mạnh mẽ, thuộc nhóm dẫn đầu khu vực Đông Nam Á

Năm 2024, tập đoàn Google đã mở văn phòng mới ở TP HCM (Công ty TNHH Google Việt Nam), và mở thêm một số cơ sở sản xuất điện thoại và linh kiện đang hoạt động hiệu quả tại Việt Nam. Theo thông tin trên trang tra cứu về mã số thuế, Google Việt Nam được đăng ký từ tháng 5/2023, có địa chỉ tại TP HCM.

Website của Google cũng đồng thời cập nhật thông tin, các nhà quảng cáo tại Việt Nam sẽ thực hiện thủ tục về thuế thông qua Công ty TNHH Google Việt Nam, thay cho Google Asia Pacific trước đây. Việc chuyển đổi sẽ thực hiện từ ngày 1/4/2024. Các đối tác thực hiện mức thuế 10% theo quy định của Việt Nam từ 1/3/2024.

Trong tham vọng vươn ra quốc tế, Google đánh giá Việt Nam là thị trường có nền kinh tế số phát triển mạnh mẽ, thuộc nhóm dẫn đầu khu vực Đông Nam Á. Bên cạnh đó, Việt Nam là nước có sự đồng lòng, nhất quán của người dân và Chính phủ, chú trọng về phát triển khoa học công nghệ, trong đó có AI và công nghệ số.

ar
Tin bài khác
Mô hình hóa và dự đoán phát thải carbon công nghiệp tại Thành phố Hồ Chí Minh bằng học máy

Mô hình hóa và dự đoán phát thải carbon công nghiệp tại Thành phố Hồ Chí Minh bằng học máy

Nghiên cứu này so sánh bốn mô hình gồm Hồi quy tuyến tính, ARIMA, SVR và Rừng ngẫu nhiên trong dự báo phát thải CO₂ công nghiệp tại Thành phố Hồ Chí Minh. Kết quả cho thấy Hồi quy tuyến tính đa biến (MLR) và SVR tối ưu đạt hiệu năng tốt nhất, với R² lần lượt là 0,932 và 0,923, trong khi Random Forest và ARIMA cho R² âm do hạn chế của bộ dữ liệu chuỗi thời gian nhỏ (n = 52). Phân tích cũng xác nhận giao thông vận tải là động lực ngoại sinh quan trọng nhất đối với phát thải CO₂ công nghiệp của thành phố. Trên cơ sở đó, mô hình MLR ước tính phát thải CO₂ công nghiệp năm 2026 đạt 123,79 Mt CO₂, cung cấp cơ sở tham khảo cho lựa chọn mô hình và ưu tiên giảm phát thải theo ngành.
Nhận định phiên giao dịch ngày 13/4: Có thể giải ngân từng phần tại các nhịp rung lắc

Nhận định phiên giao dịch ngày 13/4: Có thể giải ngân từng phần tại các nhịp rung lắc

Phiên giao dịch ngày mai được dự báo tiếp tục xu hướng hồi phục trong ngắn hạn nhưng sẽ xuất hiện các nhịp rung lắc khi tiến gần vùng kháng cự. Nhà đầu tư có thể cân nhắc giải ngân từng phần, ưu tiên các cổ phiếu có xu hướng tăng rõ ràng.
[E-Magazine] Điều khiển học và giới hạn đạo đức của tự động hóa

[E-Magazine] Điều khiển học và giới hạn đạo đức của tự động hóa

Điều khiển học khởi sinh từ phòng thí nghiệm giữa thế kỷ XX, nhưng hôm nay đã trở thành nền tảng vận hành của quốc gia số. Khi vòng phản hồi không chỉ điều chỉnh máy móc mà điều chỉnh cả hành vi con người, vấn đề không còn là năng suất mà là chủ quyền, trách nhiệm và giới hạn đạo đức của quyền lực công nghệ.
Hội An và Đà Nẵng dẫn đầu bảng xếp hạng điểm đến "ít người biết" nhưng giàu trải nghiệm toàn cầu

Hội An và Đà Nẵng dẫn đầu bảng xếp hạng điểm đến "ít người biết" nhưng giàu trải nghiệm toàn cầu

Hai điểm đến nổi tiếng của Việt Nam là Hội An và Đà Nẵng vừa được vinh danh ở hai vị trí cao nhất trong bảng xếp hạng những địa điểm du lịch độc đáo, chi phí hợp lý do tạp chí Travel + Leisure công bố, tiếp tục khẳng định sức hút của du lịch Việt trên bản đồ thế giới.
Tử vi vòng quay công nghệ ngày 13/4/2026: Tuổi Mùi tình trạng bấp bênh, tuổi Hợi sự nghiệp may mắn

Tử vi vòng quay công nghệ ngày 13/4/2026: Tuổi Mùi tình trạng bấp bênh, tuổi Hợi sự nghiệp may mắn

Những bí ẩn của khoa học đời sống là "món ăn" tinh thần không thể thiếu trong cuộc sống của con người. Tử vi vòng quay công nghệ xem tử vi 12 con giáp ngày 13/4/2026 cho tất cả các tuổi nhằm dự đoán vận hạn về công danh, tiền bạc, tình duyên, sức khỏe...
Sa Pa vào top 53 thị trấn đẹp nhất thế giới

Sa Pa vào top 53 thị trấn đẹp nhất thế giới

Được Condé Nast Traveller vinh danh trong danh sách 53 thị trấn đẹp nhất thế giới, Sa Pa gây ấn tượng khi trở thành đại diện tiêu biểu cho xu hướng du lịch chậm - nơi du khách tìm đến để trải nghiệm sâu, sống chậm và kết nối với thiên nhiên, văn hóa bản địa.
Tin tức ngân hàng nổi bật tuần qua: Eximbank đặt kế hoạch lợi nhuận thận trọng, không chia cổ tức năm 2026

Tin tức ngân hàng nổi bật tuần qua: Eximbank đặt kế hoạch lợi nhuận thận trọng, không chia cổ tức năm 2026

Tuần qua đã có nhiều ngân hàng đã có những động thái quan trọng nhằm mở rộng dịch vụ đầu xuân và thu hút khách hàng với hàng loạt diễn biến đáng chú ý liên quan đến hoạt động kinh doanh: Bảo Việt hưởng lợi lớn từ lãi suất tăng; VietinBank khẳng định vị thế; TPBank tiên phong đạt chuẩn trải nghiệm khách hàng quốc tế ICXS2019...
Tiêu chuẩn ISA/IEC 62443 và vai trò của yếu tố con người trong an ninh mạng công nghiệp

Tiêu chuẩn ISA/IEC 62443 và vai trò của yếu tố con người trong an ninh mạng công nghiệp

Trong kỷ nguyên số hóa sản xuất, an ninh mạng không còn chỉ là vấn đề của hệ thống công nghệ thông tin (IT) mà đã trở thành yếu tố sống còn đối với các hệ thống công nghệ vận hành (OT). Khác với môi trường IT truyền thống, nơi rủi ro chủ yếu liên quan đến dữ liệu, các hệ thống OT liên quan trực tiếp đến quy trình vật lý, thiết bị sản xuất và an toàn con người. Chính vì vậy, tiêu chuẩn ISA/IEC 62443 đang ngày càng được các chuyên gia tư vấn an ninh mạng công nghiệp lựa chọn như một nền tảng quan trọng để bảo vệ hệ thống và đảm bảo vận hành ổn định.
Tử vi vòng quay công nghệ ngày 12/4/2026: Tuổi Tuất khá thăng trầm, tuổi Dần vấp phải trở ngại

Tử vi vòng quay công nghệ ngày 12/4/2026: Tuổi Tuất khá thăng trầm, tuổi Dần vấp phải trở ngại

Những bí ẩn của khoa học đời sống là "món ăn" tinh thần không thể thiếu trong cuộc sống của con người. Tử vi vòng quay công nghệ xem tử vi 12 con giáp ngày 12/4/2026 cho tất cả các tuổi nhằm dự đoán vận hạn về công danh, tiền bạc, tình duyên, sức khỏe...
Các quốc gia cần chủ động dự trữ năng lượng trước sức ép biến động địa chính trị

Các quốc gia cần chủ động dự trữ năng lượng trước sức ép biến động địa chính trị

Biến động địa chính trị tại Trung Đông đang gây áp lực lớn lên thị trường năng lượng, đẩy giá dầu và chi phí logistics tăng cao. Vì vậy, các quốc gia cần có giải pháp xây dựng chiến lược năng lượng dài hạn để chủ động về năng lượng. Đó là nội dung chính trong cuộc Hội thảo “Biến động địa - chính trị và chiến lược đảm bảo năng lượng” diễn ra ngày 9/4, do Viện Chiến lược Thương hiệu và Cạnh tranh tổ chức.
song-gia-tri