Chủ nhật, 18-8-2019 |
---
“TỰ ĐỘNG HÓA” BÁO CHÍ VỚI CÔNG NGHỆ AI
21/06/2019
Tiết kiệm thời gian, chi phí và nguồn nhân lực, tăng tốc độ và hiệu quả, giúp các nhà báo theo kịp quy mô truyền thông tin tức toàn cầu ngày càng mở rộng. Đó là những lợi ích mà Trí tuệ nhân tạo (AI) mang lại cho tòa soạn báo thông qua việc “tự động hóa” một số quy trình mà trước đây các nhà báo, phóng viên hay nhân viên truyền thông phải thực hiện một cách thủ công.

Tiết kiệm thời gian, chi phí và nguồn nhân lực, tăng tốc độ và hiệu quả, giúp các nhà báo theo kịp quy mô truyền thông tin tức toàn cầu ngày càng mở rộng. Đó là những lợi ích mà Trí tuệ nhân tạo (AI) mang lại cho tòa soạn báo thông qua việc “tự động hóa” một số quy trình mà trước đây các nhà báo, phóng viên hay nhân viên truyền thông phải thực hiện một cách thủ công.

Bài viết này nhằm phân tích vai trò nói trên của AI với báo chí hiện đại thông qua các ứng dụng cụ thể tại các tòa soạn báo nổi tiếng trên thế giới. Tuy nhiên, để hiểu tường minh hơn trước tiên tác giả sẽ giới thiệu sơ lược về các khối ứng dụng của AI nói chung để độc giả có cái nhìn bao quát về “năng lực” của công nghệ này.

Sơ lược các khối ứng dụng của AI

AI có lẽ không còn là một khái niệm xa lạ với nhiều người. Mặc dù vẫn còn nhiều định nghĩa khác nhau và khá trừu tượng như “AI có thể làm bất cứ thứ gì con người làm được hoặc có thể là siêu trí tuệ, thậm chí còn làm được nhiều việc hơn con người” hay “AI có thể suy nghĩ và hành động một cách hợp lý hoặc giống như con người”. Tuy nhiên, để gần gũi và dễ hình dung hơn có thể hiểu AI thông qua các ứng dụng hiện hữu như chatbot, xe tự lái, hoặc ứng dụng AI để tìm kiếm trên web, sản xuất trong nhà máy,…

Các ứng dụng của AI hiện nay rất phổ biến nhưng tựu chung lại trong 10 blocks sau:

alt

Các block ứng dụng của AI (Nguồn:Duval Union Consulting)

  • Lập định tri thức (Knowledge engineering): là quá trình hiểu và biểu diễn tri thức của con người trong các cấu trúc dữ liệu, mô hình ngữ nghĩa và (các quy tắc) kinh nghiệm. Lập định tri thức có thể được đưa vào các ứng dụng để giải quyết các vấn đề phức tạp cần đến chuyên môn giống như con người. Chẳng hạn, IBM Watson Health sử dụng lập định tri thức cùng với bộ cơ sở dữ liệu về thuốc và kiến thức y khoa để giúp các bác sĩ chuyên khoa ung thư lựa chọn phương pháp điều trị tốt nhất cho bệnh nhân của họ.
  • Robotics: Robot là thiết bị cơ khí tự động có thể thực hiện các nhiệm vụ và tương tác với thế giới vật lý. Robot có thể được sử dụng để tự động hóa các tác vụ lặp đi lặp lại trong môi trường sản xuất được kiểm soát để xử lý vật liệu, quy trình lắp ráp và kiểm tra chất lượng. Tuy nhiên, khi công nghệ robot tiến bộ hơn, các doanh nghiệp có thể sử dụng nó để tự động hóa một loạt các quy trình kinh doanh, tương tác với khách hàng, hoặc phát triển sản phẩm mới.
  • Nhận dạng giọng nói (Speech Recognization): Công nghệ nhận dạng giọng nói chuyển đổi âm thanh của lời nói thành văn bản, có thể được sử dụng để nhận lệnh từ con người (như Siri của Apple, Google Now, hay Amazon Echo), phiên âm cuộc hội thoại, hoặc tham gia cuộc trò chuyện.
  • Xử lý ngôn ngữ tự nhiên: NPL (Natural language processing) cố gắng hiểu ý nghĩa của các từ trong hội thoại và văn bản, mục tiêu cuối cùng là trích xuất ý nghĩa được thể hiện bằng ngôn ngữ tự nhiên trong các thư viện, internet và các cuộc hội thoại. Ngày nay các doanh nghiệp có thể sử dụng NLP phân tích văn bản để trích xuất các chủ đề, cảm nghĩ, ý nghĩa và tri thức,…
  • Sản sinh ngôn ngữ tự nhiên (NLG - Natural Language Generation): Ngược lại với NLP, công nghệ NLG cho phép AI giao tiếp ngược với con người qua các thông tin mà nó xử lý được. Các ứng dụng sử dụng công nghệ NLG để trò chuyện với con người giống như một trợ lý ảo hoặc chatbots.
  • Phân tích ảnh (Image analysis): là công nghệ nhận dạng và hiểu được thông tin có thể nhìn thấy từ hình ảnh hoặc video như đối tượng, con người hoặc các tình huống, bối cảnh trong đó. Những ứng dụng phổ biến hiện nay như nhận dạng mặt, kiểm định chất lượng, xe tự lái.
  • Học máy (Machine Learning): Bao gồm các công cụ, kỹ thuật và thuật toán để phân tích dữ liệu nhằm tạo ra các mô hình dự đoán hoặc nhận dạng các mẫu trong dữ liệu. Có nhiều lớp thuật toán chuyên biệt tập trung vào các miền vấn đề cụ thể. Ví dụ, một số thuật toán học máy tạo ra các khuyến nghị sản phẩm cá nhân cho khách hàng, một số khác đưa ra dự đoán về hành vi của khách hàng.
  • Học sâu (Deep learning): là một nhánh của học máy, tập trung vào các thuật toán xây dựng các mạng nơ ron nhân tạo phỏng theo các mạng nơ ron sinh học được hình thành trong não người. Với ưu điểm mang lại hiệu quả khi dữ liệu quy mô lớn, hiện nay nhiều doanh nghiệp Internet sử dụng nó để phân tích và dự đoán hành vi trực tuyến, cải thiện khả năng tìm kiếm và gán nhãn các hình ảnh được tải lên.
  • Nhận thức cảm biến (Sensory Perception): Các cảm biến đo lường và thu thập một hoặc nhiều thuộc tính vật lý của con người, địa điểm hoặc những thứ như vị trí, áp suất, độ ẩm, tiếp xúc, giọng nói,… Các ứng dụng AI cần có thông tin về môi trường vật lý để tạo ngữ cảnh.
  • Nhận thức (Cognition): Các ứng dụng có khả năng nhận thức, tương tác, học tập, hành động và phát triển - đó mới hoàn toàn là AI. Nhận thức xảy ra khi tất cả các khối xây dựng AI ở trên kết hợp lại với nhau để tạo ra một ứng dụng có “trí tuệ” của riêng nó - nó có thể sử dụng kiến thức có được để giải quyết vấn đề hướng tới mục tiêu.

AI giúp “tự động hóa” báo chí

Khám phá thông tin

Khả năng khám phá là một trong những xu hướng phát triển của công nghệ AI. Với các block chính như học máy, xử lý ngôn ngữ tự nhiên, lập định trí thức, công nghệ này mang đến khả năng tìm kiếm thông tin nhanh chóng và khám phá liên kết giữa các thông tin. Khả năng này đã được nhiều tòa soạn lớn trên thế giới khai thác nhằm hỗ trợ cho quy trình truyền thông của mình.

Năm 2015, Thời báo New York đã thực hiện dự án AI thử nghiệm với tên gọi Editor. Mục đích của dự án là đơn giản hóa quy trình làm báo. Khi viết một bài báo, nhà báo có thể sử dụng các thẻ (tags) để làm nổi bật cụm từ, tiêu đề hoặc các điểm chính của văn bản.

Theo thời gian, máy tính học cách nhận ra các thẻ ngữ nghĩa này và nhận biết được các phần nổi bật nhất của một bài báo. Bằng cách tìm kiếm thông qua dữ liệu trong thời gian thực và trích xuất thông tin dựa trên các danh mục được yêu cầu, như các sự kiện, con người, vị trí và ngày tháng, Editor có thể giúp cho thông tin dễ truy cập hơn, đơn giản hóa quá trình nghiên cứu và cung cấp khả năng kiểm tra thực tế nhanh chóng và chính xác.

alt

Hoạt động của Editor

BBC là một kho lưu trữ một lượng lớn dữ liệu, từ các tin tức hàng ngày, các tính năng và video, đồng thời cũng có dữ liệu từ các nguồn tin tức khác, nguồn chính phủ và internet. Do đó, cần có một cách để kết nối tất cả các dữ liệu này với nhau để có thể dễ dàng truy cập hơn và có ý nghĩa hơn. Từ năm 2012, BBC News Labs đã sử dụng công cụ trích xuất dữ liệu Juicer để thử nghiệm điều này.

Công cụ này theo dõi các kênh thông tin RSS của 850 hãng tin tức toàn cầu, tổng hợp và trích xuất các bài báo từ BBC và các nguồn bên ngoài. Sau đó nó gán thẻ cho các bài viết và sắp xếp chúng theo một trong 4 danh mục: tổ chức, địa điểm, con người và sự vật. Do đó, nếu một nhà báo đang tìm kiếm những câu chuyện mới nhất về một nhân vật nổi tiếng hoặc những bài báo liên quan đến các công ty hoạt động trong một lĩnh vực nào đó, Juicer sẽ nhanh chóng tìm kiếm trên web và cung cấp một danh sách các nội dung liên quan.

alt

Kết quả tìm kiếm thông qua Juicer

Trong một tương lai không xa, Juicer cũng có thể được sử dụng để nâng cao trải nghiệm người dùng bằng cách tạo ra các sự kiện tin tức pop-up khi người đọc di chuột qua các từ nhất định. BBC Lab cũng đang thử nghiệm thêm khả năng này vào nội dung video bằng cách phủ các sự kiện lên các phần khác nhau của shot hình.

Phân loại tin bình luận của độc giả

Báo điện tử là loại hình báo chí có khả năng tương tác cao với độc giả khi cung cấp chức năng bình luận (comment) ngay dưới mỗi bài viết. Tuy nhiên, các tòa soạn cũng phải tốn nguồn nhân lực cho việc kiểm duyệt bởi có những bình luận mang tính xây dựng, nhưng cũng có những nội dung mang tính quấy phá hay lạm dụng. Hiện nay phần bình luận của Thời báo New York được kiểm duyệt bởi một nhóm 14 người chịu trách nhiệm xem xét thủ công hơn 11 nghìn bình luận mỗi ngày. Tòa soạn này đang thử nghiệm giải pháp AI có thể chuyển đổi việc kiểm duyệt bình luận và mở rộng tính năng bình luận cho nhiều bài viết hơn, hi vọng vừa có thể tiết kiệm chi phí lại vừa mang đến các cuộc trò chuyện hấp dẫn hơn với độc giả.

Công cụ Perspective API được phát triển bởi Jigsaw (thuộc Alphabet, công ty mẹ của Google), sắp xếp các bình luận có liên quan của độc giả để người xem có thể nhanh chóng nhìn thấy những bình luận tiêu cực,… Người xem có thể đọc bình luận bằng cách trượt một thanh ngang trên đầu trang từ trái qua phải. Thanh càng gần bên phải, bình luận càng mang tính tiêu cực. Đây là cách tuyệt vời để người dùng đọc và tương tác với những bình luận mà họ quan tâm và tránh được những bình luận mang tính công kích.

alt

PerspectiveAPI cho phép người dùng tìm kiếm các bình luận theo cảm xúc

Báo chí robot

Báo chí robot (robot journalism hay còn gọi là automation journalism - báo chí tự động) xuất hiện lần đầu vào mùa hè năm 2016 tại Thế vận hội Olympic Rio. The Washington Post đã thử nghiệm viết tin tự động sử dụng phần mềm thông minh Heliograf, tập hợp các tin tức bằng cách phân tích dữ liệu về các trận đấu khi nó diễn ra.

Các thông tin thu thập (dữ liệu thô) sau đó được khớp với các cụm từ có liên quan trong một mẫu tin và phần mềm sẽ bổ sung thêm thông tin để tạo ra một bài viết có thể xuất bản trên các nền tảng khác nhau. Phần mềm này cũng có thể cảnh báo cho các nhà báo về bất kỳ sự bất thường nào mà nó tìm thấy trong dữ liệu. Trong suốt Thế vận hội, Heliograf có thể theo kịp thông tin liên quan đến điểm số và số lượng huy chương trong thời gian thực, qua đó giải phóng các nhà báo để họ có thể tạo ra các nội dung khác.

alt

Giao diện truyền thông chatbot

Xu hướng giao tiếp, trò chuyện với khách hàng thông qua các chatbot đã trở nên khá phổ biến với sự phát triển của các khối ứng dụng như nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên, sản sinh ngôn ngữ tự nhiên. Các toàn soạn hiện cũng đang thử nghiệm ứng dụng này cho hoạt động truyền thông của mình.

Năm 2016, The Guardian ra mắt Chatbot thông qua Facebook. Để tiết kiệm thời gian tìm kiếm các bài phóng sự, chatbot cho phép người dùng chọn từ phiên bản US, UK và Úc của Guardian News, chọn từ 6h, 7h hoặc 8h sáng, nó sẽ lựa chọn và gửi các bài phóng sự hàng ngày thông qua Facebook Messenger.

Nếu người dùng chỉ muốn nắm bắt, theo dõi các tiêu đề và tin tức thể thao, hay chỉ muốn đọc các tin tức khoa học và xu hướng công nghệ, họ có thể bổ sung thông tin đó vào, khi đó giao diện chatbot sẽ trả lời tin nhắn với nội dung liên quan đến truy vấn của người dùng.

alt

Cũng trong thời gian này, Quartz (với sự tài trợ của Knight Foundation) đã thiết lập Bot Studio để tạo ra một bộ công cụ tự động cho các nhà báo. Mặc dù dự án này mới ở giai đoạn sơ khai, nhưng các thử nghiệm BotStudio đã có một giao diện mới giống như “chat”. Người dùng nhắn tin với các câu hỏi về các sự kiện tin tức, con người, địa điểm, và app sẽ trả lời với các nội dung liên quan.

Phân tích và cảnh báo tự động

Phân tích dữ liệu và tự động đưa ra cảnh báo là một tính năng quan trọng của AI. Năm 2013, Associated Press lần đầu sử dụng AI nhằm thu thập dữ liệu và tạo các báo cáo về thể thao và thu nhập (earnings). Hiện nay, tòa soạn này sử dụng công cụ phân tích NewsWhip dẫn đầu xu hướng tin tức trên các phương tiện truyền thông xã hội như Twitter, Facebook, Pinterest và Linkedln. NewsWhip cung cấp các năng lực chính như sau:

- Đánh giá đối thủ cạnh tranh trên tất cả các mạng xã hội;

- Theo dõi và thu hút sự tham gia của khán giả;

- Xác định những người có ảnh hưởng đến hiệu năng thương hiệu.

Bên cạnh việc theo dõi các bài phóng sự, nó có thể phân tích thông tin, sự kiện trong một khoảng thời gian thực hoặc lịch sử theo bất kỳ thang thời gian nào trong khoảng từ 30 phút đến 3 năm và gửi cảnh báo thời gian thực hoặc thông báo hàng ngày cho các phóng viên. Ngoài các lợi ích về tốc độ và phạm vi, các công nghệ AI như NewsWhip có thể tăng độ chính xác dữ liệu và giảm các lỗi trong bản sao.

alt

Phần mềm NewsWhip

Tài liệu tham khảo chính:

  1. Mike Gualtieri (2016), Artificial Intelligence: What’s Possible For Enterprise In 2017, Forrester Research, Inc.
  2. Corinna Underwood (2019), Automated Journalism - AI Applications at New York Times, Reuters,and Other Media Giants, https://emerj.com.

Bùi Thị Vân Anh

Tạp chí Tự động hóa ngày nay, số tháng 6/2019