Cuộc đua AI của các tòa soạn trong đưa tin World Cup 2018

World Cup 2018 đã bế mạc. Đức bị loại từ vòng bảng, Brazil thất trận trước Bỉ, cúp vàng không về nước cùng người Anh, Croatia với dân số 4 triệu người lần đầu lọt vào trận chung kết và chỉ chịu thất bại trước Pháp.

Ngoài việc dán mắt vào màn hình để xem các trận đấu, chúng ta cũng để mắt tới những gì các tòa soạn đã làm bên ngoài sân cỏ nhằm đưa tin về giải đấu… bằng tự động hóa và trí tuệ nhân tạo (AI).

Kênh thể thao Fox Sports (Mỹ) đã phối hợp với IBM sử dụng hệ thống siêu máy tính trí tuệ nhân tạo Watson nhằm tạo ra những video điểm nhấn; tòa báo Pháp Le Figaro thì tạo những tóm tắt trực quan một cách tự động, và tờ Times (Anh) ra mắt tiện ích dùng trợ lý ảo Alexa của Amazon riêng cho mùa World Cup.

Mỹ không lọt vào vòng chung kết World Cup năm nay, nhưng điều đó không ngăn Fox Sports phát sóng toàn bộ 64 trận đấu và hợp tác với IBM để tạo ra một công cụ sản xuất các video điểm nhấn World Cup. Sử dụng siêu máy tính trí tuệ nhân tạo Watson, công cụ này cho phép người dùng tạo ra các đoạn clip theo yêu cầu từ mọi kỳ World Cup tính từ năm 1958 (năm Brazil giành chức vô địch lần đầu tiên). Công cụ này này có thể được sử dụng qua ứng dụng FoxSports và trên trang Fox Sports.com.

Công cụ sản xuất các video điểm nhấn World Cup của Fox Sports.
Công cụ sản xuất các video điểm nhấn World Cup của Fox Sports.

Quét hàng nghìn video trong vài giây

Theo Engadget, công nghệ AI của Watson có thể phân tích 300 trận đấu tại World Cup được lưu trữ. Cụ thể hơn, IBM Watson Video Enrichment, một công cụ siêu dữ liệu lập trình, sẽ phân tích các đoạn video để tạo ra siêu dữ liệu nhằm xác định những gì đang diễn ra trong một cảnh quay ở bất kỳ thời điểm nào, có kèm theo một nhãn thời gian.

“Về bản chất, Watson Video Enrichment hoạt động như một bộ tạo siêu dữ liệu tự động được đào tạo để sử dụng những gợi ý, như các đặc điểm khuôn mặt, hình ảnh thẻ đỏ, âm thanh từ đám đông, phát ngôn của bình luận viên và các đặc điểm khác, để tạo ra siêu dữ liệu nhằm tìm kiếm giữa một biển khổng lồ các video bóng đá,” Phil Kurz của TVTechnology nhận định.

Người dùng có thể tạo video điểm nhấn của mình theo năm thi đấu, đội tuyển, trận đấu, lối chơi, các quả phạt penalty hay bàn thắng. Ví dụ, bạn có thể yêu cầu công cụ này tạo một video điểm nhấn về các bàn thắng của Ronaldo tại tất cả các kỳ World Cup mà anh tham dự. (Máy sẽ trả về 13 bàn thắng và video sẽ dài khoảng 3 phút). Đoạn clip này được tạo ra chỉ trong vài giây – một tốc độ xử lý cực kỳ ấn tượng nếu xét tới số lượng lớn video phải quét và phân tích để tạo ra nó.

Theo Hollywood Reporter, việc thu thập những dữ liệu như vậy thường được làm thủ công, nhưng xét quy mô của World Cup, điều đó gần như là bất khả thi: Chỉ riêng World Cup 2014 có khoảng 98.000 giờ nội dung video.

Công nghệ AI của Watson có thể phân tích 300 trận đấu tại World Cup được lưu trữ.

Tờ báo Pháp đã tạo ra một công cụ để tự động tạo các tóm tắt trực quan về từng trận đấu tại World Cup trong vòng 5 giây sau hồi còi kết thúc trận đấu. “Không con người nào có thể làm việc nhanh như vậy!”, Valentin Paquot, giám đốc công nghệ di động & đổi mới của Le Figaro chia sẻ. Những bài tóm tắt này, được gọi là các Mondial Stories (Những câu chuyện toàn cầu) được tạo thành từ 5 thẻ ảnh hoặc ảnh màn hình khác nhau nhằm cung cấp thông tin về mức độ kiểm soát bóng, thẻ vàng, độ chính xác của các cú sút và các cầu thủ có ít ảnh hưởng nhất trên sân. Nói ngắn gọn, nó tập hợp tất cả mọi thông tin bạn cần biết để vờ như bạn đã xem trọn vẹn trận đấu.

  • 1bnrd8rhcq-1532333028-84.png
  • 1dmn7sirkwx-1532333141-97.png
  • 1fgymztykg7-1532333170-85.png

Đẩy tin nhắn

Paquot cho biết, độc giả mục tiêu của những bản tin tóm tắt này là tất cả những người dùng di động có cài ứng dụng Figaro và Sport24 (bộ phận tin thể thao của Le Figaro). Tại vòng đấu loại trực tiếp, các bản tin chỉ được gửi qua đẩy tin nhắn (Push Notifications) tới những người đăng ký dịch vụ.

Từ vòng tứ kết trở đi, thông báo đẩy về các bản tin này sẽ được gửi tới cho tất cả các fan thể thao (Theo Paquot, 90% người dùng ứng dụng Figaro đã chọn nhận thông báo liên quan đến thể thao.)

Phản ứng từ độc giả cực kỳ tích cực: không có ai chọn ngừng nhận thông báo, cho thấy rằng các thông báo đẩy “khá dễ chịu và không gây phiền hà.”) “Áp lực từ thông báo đẩy là một vấn đề cực kỳ nhạy cảm.”

Tự động hóa: không mất thêm chi phí, không thiên vị nhóm

• Những bản tóm tắt được tạo ra hoàn toàn tự động, nghĩa là không cần phải tốn thêm chi phí để tạo ra những tin tức đó. Chi phí duy trì cũng thấp.

• Công cụ này mang tính trung lập. Nó không ưu tiên cho bất kỳ đội tuyển nào (kể cả đội Pháp), và điều đó giúp nó có được sự khách quan: Dữ liệu mới là thứ quan trọng hơn hết thảy.

• Với việc dự án này là nỗ lực ở phút chót, nhóm vận hành không có nhiều thời gian để cân nhắc khía cạnh kinh doanh, nhưng họ hy vọng có thể cập nhật nó cho UEFA Champions League và Ligue 1 (giải bóng đá nhà nghề nam tại Pháp). Vì lý do này, họ hy vọng được bảo đảm tài trợ bởi một thương hiệu lớn. “Tôi không thể tiết lộ tên nhà tài trợ, nhưng chúng tôi có sự hậu thuẫn rất lớn,” Paquot cho hay.

…Nhưng dữ liệu bị lộn xộn và vướng ràng buộc thời gian

Le Figaro đã hợp tác với Opta Sports để lấy dữ liệu và việc bảo đảm nhận được tất cả dữ liệu chính xác và đúng lúc là một thách thức. Đôi khi họ phải tổng hợp dữ liệu để tìm thông tin đúng.

Do nhóm phụ trách không có nhiều thời gian, họ đã bỏ qua ý tưởng tạo các hoạt ảnh bằng ngôn ngữ lập trình bản địa (swift/kotlin) và thay vào đó là sử dụng HTML5. Họ chưa hề làm điều này trước đây, vì thế họ phải xây dựng cả một thư viện hình hoạt họa mới. Theo Paquot, đảm bảo khả năng hoạt động tốt và hiển thị thông minh trên tất cả các thiết bị là một thách thức lớn. “Chúng tôi đã thử nghiệm trên 25 thiết bị khác nhau tại văn phòng cùng nhiều bộ mô phỏng và cảm thấy hài lòng,” ông nói thêm.

Nếu muốn tạo ra một thứ “hấp dẫn hơn,” họ sẽ cần nhiều nguồn lực hơn để “khắc sâu” mọi cầu thủ tại World Cup và sử dụng hình ảnh thật của họ trong các tin bài. “Điều này sẽ cần rất nhiều nỗ lực từ đội ngũ đồ họa của chúng tôi, và chúng tôi sẽ phải mua bản quyền hình ảnh của tất cả các cầu thủ, tức là bỏ ra một đống chi phí để thu về lợi ích nhỏ,” Paquot cho biết. Với phiên bản cho Champions League, Le Figaro đang đàm phán với UEFA và Paquot hy vọng họ có thể cung cấp cho độc giả các gói tin hình ảnh.

Một thách thức khác là Le Figaro có thể tiếp cận các số liệu thống kê trực tiếp, nhưng lại không được tiếp cận với số liệu lịch sử. Điều này có nghĩa là họ không thể đưa ra những so sánh như “Anh ấy đã chạy 34km trong trận đấu, và trung bình quãng đường anh ấy chạy được là 27.3 km.” Để giải quyết vấn đề này, Le Figaro sẽ cần xây dựng cơ sở dữ liệu của riêng mình – một công việc cũng tốn rất nhiều thời gian.

Mặc dù người Anh vẫn chưa được nâng lại cúp vàng từ sau năm 1966, nhưng World Cup năm nay đã mang lại một tia hy vọng: Đội tuyển Anh đã lần đầu lọt vào bán kết tính từ năm 1990, tiền đạo Harry Kane là cầu thủ ghi nhiều bàn thắng nhất giải đấu, và doanh số bán áo gilê cả nước đã tăng 35% nhờ ảnh hưởng từ huấn luyện viên trưởng (kiêm biểu tượng phong cách) Gareth Southgate.

Thử nghiệm AI giọng nói

Tại tòa soạn The Times, một số hoạt động được thực hiện trên các giao diện bằng giọng nói. Tờ báo này hướng tới AI giọng nói sử dụng bộ kỹ năng trợ lý ảo Alexa cho tin thể thao để hỗ trợ việc đưa tin sâu rộng về giải đấu.

“Alexa, khởi động Times Sport” là tất cả những gì bạn cần ra lệnh để nghe đọc các dòng tít về World Cup trong ngày và những thông tin thú vị bên lề giải đấu. Những người theo dõi hết phần điểm tin sẽ được gợi ý nghe chương trình phát thanh trực tuyến (podcast) về World Cup của The Times do biên tập viên Natalie Sawyer trình bày.

Theo Sam Joiner, biên tập viên tin tức tương tác tại The Times và The Sunday Times, nội dung tin tức của The Times được khóa chặt sau một bức tường phí, vì thế Alexa giống như một công cụ lấy mẫu. “Nó cho người dùng cơ hội lắng nghe thử các tin tức của chúng tôi mà không cần đăng ký theo dõi – hoạt động được yêu cầu với các sản phẩm cốt lõi như trang web hay ứng dụng. Nó hoạt động bên ngoài nền tảng, và do đó quan hệ đối tác của chúng tôi với Amazon mang tính chất thử nghiệm và khám phá: chúng tôi có thể thành công mang lại một sản phẩm dạng âm thanh có chất lượng hay không, và sản phẩm này có người dùng hay không?”

Tiếp cận độc giả mới để thúc đẩy đăng ký theo dõi

Theo Joiner, Alexa mang đến khả năng tiếp cận những độc giả mới. Ông chia sẻ rằng điều này đem lại hai lợi ích: bạn có thể tăng mức độ nhận thức về thương hiệu, và tiếp cận những người có thể chẳng bao giờ mua hay đăng ký theo dõi tin tức trên The Times nhằm tạo khả năng thúc đẩy đăng ký trong tương lai. Lợi ích thứ hai mang tính ngắn hạn, đó là người nghe được thử xem The Times có thể mang đến những gì cho họ, và sau đó tò mò vào trang web hoặc mua một tờ báo để khám phá thêm.

Mặc dù khó xác định phản ứng của độc giả khi không có con đường phản hồi trực tiếp nào như bình luận dưới bài viết hay tweet, Joiner cho biết tờ báo có bằng chứng rõ ràng về việc độc giả nghe đi nghe lại, tức là họ đã quay lại sử dụng phần điểm tin.

“Chúng tôi có thể thành công mang lại một sản phẩm dạng âm thanh có chất lượng hay không, và sản phẩm này có người dùng hay không? Câu trả lời là có. Từ khía cạnh phát triển và sản xuất, việc tung ra một sản phẩm dạng âm thanh có chất lượng là thành công không cần bàn cãi, và những số liệu của chúng tôi cho thấy sản phẩm này có thị trường sử dụng,” Joiner chia sẻ.

Hạn chế: tốc độ

Với Alexa, bạn có nguy cơ bị lạc hậu một cách nhanh chóng. “Chúng tôi phải lên kế hoạch chiến lược nội dung thật cẩn thận để bảo đảm những câu chuyện tin tức của chúng tôi có sự liên quan và thu hút tới khi tin tức tiếp theo được tung ra,” Joiner cho biết. Theo ông, điều này có nghĩa là tập trung vào những dòng tin chuyên sâu và độc quyền hơn với thời gian tồn tại lâu hơn thay vì những tin về đội bóng hay số liệu thống kê trận đấu. Một ví dụ là bản tin của The Times về cách mà môn khúc côn cầu và bóng rổ đã truyền cảm hứng cho các cầu thủ Anh luyện tập trong những tình huống cố định và tiến tới vòng tứ kết. “Rất may là điều này có liên kết chặt chẽ với chiến lược biên tập rộng hơn của chúng tôi nhằm cung cấp những tin tức nguyên bản và hoàn thiện thay vì những mẩu tin vội vàng./.”