Bạn hay Thù?

robot-1483429318-85.jpg

Khoảng năm 2012, Liên chi hội Nhà báo Thông tấn xã Việt Nam có một dự án thử nghiệm đưa máy dịch vào một số đơn vị chuyên biên dịch tin quốc tế cũng như một số tòa soạn. Là những người từng làm công tác dịch thuật lâu năm, đặc biệt là thường xuyên dịch tài liệu cho các tổ chức quốc tế, chúng tôi đều biết máy dịch là một công cụ hỗ trợ quan trọng và rất phổ biến trong những người làm nghề này.

Nhưng chưa có ai đưa máy dịch vào hoạt động báo chí ở Việt Nam trên quy mô lớn. Về lý thuyết, và thực tế công việc đã chứng minh, sử dụng máy dịch có thể tăng hiệu suất lên tối thiểu 30%, với những người có kinh nghiệm và dịch giỏi thì thậm chí lên tới 150%. Kỳ vọng của chúng tôi là biện pháp này sẽ giúp xử lý được số lượng tin nhiều hơn và tránh những lỗi mà con người thường mắc phải. Một ưu điểm khác là thống nhất được văn phong dịch đối với những cụm từ, tên riêng nhất định.

Đã có vài cuộc tọa đàm và hướng dẫn sử dụng, phần mềm cũng được triển khai trên một số lượng máy nhất định ở một số đơn vị để thử nghiệm. Tuy nhiên, phản ứng của hầu như tất cả các biên tập viên là không chấp nhận. Họ nói dịch thử thì thấy chất lượng tệ và ngôn từ ngô nghê chẳng kém gì… Google Translate. Chúng tôi cố gắng giải thích rằng cần phải kiên nhẫn cập nhật nội dung trong ít nhất 6 tháng để cơ sở dữ liệu hiểu rõ hơn và dịch sẽ chuẩn hơn, rằng thực ra không phải máy tự dịch mà chính là máy học người để dịch, v,v… Không ai nghe cả. Và dự án sụp đổ.

Bước tiến của trí tuệ nhân tạo (AI)

Còn đây là câu chuyện đăng trên New York Times vào ngày 21/12/2016 với tiêu đề “Trí tuệ nhân tạo vĩ đại đang tỉnh giấc.”

Jun Rekimoto, một giáo sư danh tiếng người Nhật chuyên về tương tác giữa người và máy tính thuộc Đại học Tokyo, vào một buổi tối muộn đang chuẩn bị cho bài giảng thì bỗng để ý thấy một số dòng trạng thái kỳ lạ chạy trên mạng xã hội. Dường như Google Translate, dịch vụ dịch máy rất thịnh hành, đang có nhiều cải thiện bất ngờ. Rekimoto đích thân kiểm tra hệ thống Translate và bắt đầu thử nghiệm. 

Ban đầu, ông so sánh một số câu trong bản dịch truyện “The Great Gatsby” đã xuất bản của Takashi Nozaki vào năm 1957 và bản gần đây của Haruki Murakami, với bản dịch của Google Translate. Bản dịch của Murakami là thứ “tiếng Nhật rất trau chuốt” nhưng văn vẻ mang “phong cách Murakami.” Ngược lại, bản dịch của Google – tuy có đôi chỗ nhỏ “không được tự nhiên lắm” – nhưng “rõ ràng hơn.”

Tiếp đó Rekimoto thử nghiệm theo hướng khác, dịch từ tiếng Nhật sang tiếng Anh. Ông lấy vài đoạn tự dịch phần mở đầu cuốn “Tuyết trên đỉnh Kilimanjaro” của Hemingway rồi dán lên Google Translate để dịch sang tiếng Anh. Ông đăng song song hai đoạn này lên blog và đề nghị các độc giả đoán xem đâu là sản phẩm của máy.

Phiên bản 1:

Kilimanjaro is a snow-covered mountain 19,710 feet high, and is said to be the highest mountain in Africa. Its western summit is called the Masai “Ngaje Ngai,” the House of God. Close to the western summit there is the dried and frozen carcass of a leopard. No one has explained what the leopard was seeking at that altitude.

Phiên bản 2:

Kilimanjaro is a mountain of 19,710 feet covered with snow and is said to be the highest mountain in Africa. The summit of the west is called “Ngaje Ngai” in Masai, the house of God. Near the top of the west there is a dry and frozen dead body of leopard. No one has ever explained what leopard wanted at that altitude.

Ngay cả với người nói tiếng Anh bản địa, phần nhắc đến con báo là điểm duy nhất để họ cho rằng phiên bản 2 là sản phẩm từ máy. Nhưng 24 giờ sau, Google đã có một phiên bản khác:

Kilimanjaro is 19,710 feet of the mountain covered with snow, and it is said the highest mountain in Africa. Top of the west, “Ngaje Ngai” in the Maasai language, has been referred to as the house of God. The top close to the west, there is a dry, frozen carcass of a leopard. Whether the leopard had what the demand at that altitude, there is no that nobody explained.

Rekimoto thông báo về phát hiện đó cho hàng trăm ngàn follower của ông trên Twitter, và trong vòng vài giờ sau, hàng ngàn người đã tự thử nghiệm với dịch vụ dịch máy này. Một số người thành công, một số vẫn đưa là lời bình luận hài hước. Nhưng khi bình minh lên ở Tokyo, Google Translate là xu hướng số 1 trên Twitter Nhật Bản, còn cao hơn cả series hoạt hình đang ăn khách và một đĩa đơn mới của nhóm nhạc nữ mà nhiều người mong chờ. Ai cũng tự hỏi: Làm thế nào mà Google Translate có thể dịch hay đến thế?

Google Translate đã trở thành một hệ thống hoàn toàn dựa trên trí tuệ nhân tạo để xử lý hầu hết luồng truy cập. Hệ thống hàng trăm ngôn ngữ đang tiếp tục được bổ sung với tốc 8 ngôn ngữ mỗi tháng cho đến cuối năm 2017. Hệ thống trí tuệ nhân tạo mới đạt những cải thiện qua một đêm tương đương những gì mà hệ thống cũ phải làm trong cả một đời.

Video giới thiệu Azuma Hikari

Câu chuyện thứ 2 là về Azuma Hikari, một cô gái hoạt hình nổi ba chiều holographic “sống” bên trong Gatebox, thiết bị thông minh đến từ Nhật Bản, hoạt động giống các trợ lý ảo Siri, Cortana hay Alexa như là kết quả tuyệt vời của công nghệ trí tuệ nhân tạo.

Hikaki gần như đã trở thành một người quản gia toàn diện cho ngôi nhà thông minh. Với các cảm biến, Hikaki có thể nhận ra khuôn mặt, giọng nói và đồng hành với mọi hoạt động của “ông, bà chủ” từ đánh thức người dùng dậy vào buổi sáng, báo cho người dùng các hoạt động trong ngày, nhắc nhở về những điều cần nhớ và thậm chí còn chào đón người dùng trở về nhà.

Đặc biệt, người dùng có thể nhắn tin, nói chuyện với Hikaki ở bất cứ đâu bên ngoài ngôi nhà của mình qua một ứng dụng di động. Ban đầu, Hikari chỉ hiểu, giao tiếp bằng tiếng Nhật nhưng cô trợ lý ảo này hoàn toàn có thể nói-hiểu được các thứ ngôn ngữ khác nhờ “học” các ngôn ngữ.

Trên đây chỉ là hai trong nhiều câu chuyện về sự phát triển của trí tuệ nhân tạo trong năm 2016. Còn phải kể đến rất nhiều ví dụ khác, chẳng hạn như việc lần đầu tiên máy tính dùng trí tuệ nhân tạo AlphaGo đánh bại nhà vô địch thế giới về cờ Go, siêu máy tính Watson của IBM kết hợp với General Motors có thể tìm hiểu sở thích và thói quen của lái xe, nghiên cứu dữ liệu để ra quyết định.

Chúng ta cũng chứng kiến hàng loạt tiến bộ trong việc áp dụng chế độ tự lái cho xe hơi và xe tải mà thông tin gây bất ngờ gần đây nhất là việc xe tự lái Tesla của ông trùm công nghệ Elon Musk có khả năng phán đoán được hai xe phía trước sắp đâm nhau để kích hoạt hệ thống phanh trước cả khi tai nạn xảy ra.

Nghề báo cũng sẽ bị trí tuệ nhân tạo đe dọa
Nghề báo cũng sẽ bị trí tuệ nhân tạo đe dọa

Trí tuệ nhân tạo và báo chí

Vậy trong lĩnh vực báo chí thế giới thì trí tuệ nhân tạo được áp dụng như thế nào? Nghiên cứu của Đại học Oxford đã phỏng đoán rằng những vị trí việc làm trong lĩnh vực báo chí ít có nguy cơ bị máy móc thay thế trong tương lai gần.

Tuy nhiên, từ những gì xảy ra trong vài năm gần đây, có thể thấy robot sẽ không chỉ tồn tại trong các nhà máy. Nghề báo cũng sẽ bị trí tuệ nhân tạo đe dọa bởi một lý do rất đơn giản: máy móc rất phù hợp cho những thông tin được phân loại. Nếu có thể sắp xếp mọi thông tin lên một bảng Excel thì cho dù nó phức tạp ra sao, trí tuệ nhân tạo cũng có thể phân tích và tạo ra những mẩu thông tin có ý nghĩa.

Lấy một ví dụ như sau: khi một dòng điện thoại iPhone ra đời, thông thường phóng viên sẽ viết về những tính năng mới, kích thước màn hình, tuổi thọ của pin, v,v… và so sánh với những đời iPhone trước đó hoặc những dòng điện thoại thông minh tương tự. Sau lễ công bố của Apple, phóng viên sẽ mất chừng 10-15 phút để viết một cái tin đơn giản mô tả toàn bộ thông tin về sản phẩm mới. Sử dụng trí tuệ nhân tạo thì sao? Nó sẽ thu thập mọi thông tin từ sự kiện được truyền trực tiếp, kết hợp với mẫu đưa tin siêu bí mật nào đó để viết ra một bản tin đơn giản, dễ đọc trong vòng chưa đầy 2 phút.

Xiaomingbot là robot viết tin bằng trí tuệ nhân tạo của dịch vụ tin tức Trung Quốc mang tên Toutiao. Nó đã sản xuất ra tới 450 tin trong 15 ngày diễn ra Olympic Rio 2016, tập trung vào các môn cầu lông và bóng bàn. Theo trang Quartz, hầu hết các tin này chỉ có độ dài khoảng 100 từ. Tin được đọc nhiều nhất là trận đơn nữ cầu lông mà phần thắng thuộc về Wang Yihan, người từng giành huy chương bạc lại Olympic London. Tin này hoàn thành chỉ 2 phút sau khi kết thúc trận đấu và có 50.000 lượt đọc.

Giờ đây trí tuệ nhân tạo có thể viết ra những bài “đọc được,” và xử lý những nội dung lặp lại nhanh hơn nhiều so với các biên tập viên cần cù. “Với quy trình tự động hóa, hiện tại chúng tôi có thể sản xuất các báo cáo thu nhập hằng quý cho 4.000 công ty,” Justin Myers thuộc hãng tin Mỹ Associated Press, cơ quan báo chí đầu tiên trên thế giới sử dụng robot trong quy trình tác nghiệp, cho biết. “Trước đây chúng tôi chỉ có thể theo dõi 400 công ty mà thôi.”

Ông này khẳng định rằng việc sử dụng robot vào các công việc vặt vãnh mà nặng nhọc sẽ giải phóng cho các nhà báo để họ có thể theo đuổi những nhiệm vụ cần tư duy nhiều hơn. Theo ông thì phóng viên giờ đây có thể “dừng lại một bước, và thay vì chỉ nhắc lại những gì quan sát được, họ có thể kể những câu chuyện thú vị và mang tính cá nhân.”

Hãng AP khi đó cho biết kế hoạch từ cuối năm 2016 bắt đầu cung cấp cái bài viết tổng hợp về các trận bóng đá, giống như Yahoo làm với các giải Fantasy Football bằng công nghệ tương tự. Đó chính là một chương trình với tên gọi Wordsmith, có khả năng viết hàng ngàn bản tin ngay tức khắc. Phần mềm này đã được áp dụng cho nhiều lĩnh vực, từ việc viết tin cáo phó cho đến cả những bài viết về series truyền hình ăn khách “Game of Thrones.” Automated Insights, công ty sở hữu phần mềm này, đã “viết” 1,5 tỷ tin bài trong năm 2015. Chỉ có 50 nhân viên, nhưng họ là nhà sản xuất nội dung lớn nhất thế giới.

Automated Insights chỉ có 50 nhân viên nhưng đã “viết” 1,5 tỷ tin bài trong năm 2015  
Automated Insights chỉ có 50 nhân viên nhưng đã “viết” 1,5 tỷ tin bài trong năm 2015  

Thomson Reuters cũng xuất bản nhiều tin tức do máy viết, sử dụng công nghệ do họ tự phát minh. Theo Reg Chua, người phụ trách mảng sáng tạo, một cuộc thử nghiệm với cỗ máy thế hệ mới của hãng tin danh tiếng này ấn tượng tới mức những người tham gia phải thừa nhận rằng “bài do máy viết còn dễ đọc hơn các sản phẩm mà con người tạo ra.”

Nhưng dùng trí tuệ nhân tạo trong báo chí không chỉ là về số lượng mà còn quan trọng ở chỗ nhắm trúng mục tiêu. “Nếu khách hàng của chúng tôi là một tờ báo in ở một thị trấn nhỏ và muốn có tin tức về một công ty lớn ngay tại thị trấn đó thì chúng tôi cũng đáp ứng được,” Myers của hãng tin AP khẳng định. Reg Chua của Reuters thì nói: “Trong hơn 150 năm qua, tin tức luôn tập trung vào những câu chuyện mà nhiều độc giả quan tâm nhất. Nhưng bây giờ bản tin tài chính có thể có một đoạn về hoạt động của công ty mà bạn đang sở hữu chứng khoán của họ. Ví dụ ‘thị trường đang tăng nhưng bạn lại đang bị thiệt, và nếu bạn không bán cổ phiếu tuần trước thì có phải bây giờ được giả cao hơn không’.”

Các nhà nghiên cứu cũng đang tìm kiếm những cách thức sử dụng trí tuệ nhân tạo để tạo ra những nội dung mà con người không thể làm được. David Caswell, nhà nghiên cứu tại Học viện Báo chí Donald W Reynolds thuộc Đại học Missouri, đưa ra khái niệm Structured Stories, theo đó “câu chuyện” không đơn giản là một câu chuyện mà là một mạng lưới thông tin có thể ráp nối và đọc giống như một bản tin, thông tin đồ họa hay bất kỳ hình thức nào, kể cả nốt nhạc. Bất kỳ ngân hàng thông tin nào – từ tin tòa án cho tới thông tin thời tiết – rốt cục đều có thể đưa vào một cơ sở dữ liệu kiểu như vậy. Và tiềm năng cho những hệ thống như thế là vô cùng to lớn.

“Một ngày nào đó, máy móc sẽ giành giải báo chí Pulitzer” (Kris Hammond)

“Một ngày nào đó, máy móc sẽ giành giải báo chí Pulitzer” – đó là nhận định của Kris Hammond thuộc Narrative Science, một công ty chuyên về lĩnh vực gọi là “tạo lập ngôn ngữ tự nhân.” “Chúng ta có thể kể những câu chuyện ẩn giấu bên dưới hàng đống dữ liệu,” ông nói.

Những người cổ vũ cho việc sử dụng trí tuệ nhân tạo trong báo chí lập luận rằng các thuật toán sẽ giúp xử lý những công việc lặt vặt mà vất vả của nghề báo, giải phóng cho nhà báo để họ đảm trách những nhiệm vụ có tính chuyên môn cao hơn. Tổng biên tập John Micklethwait Bloomberg gọi tự động hóa là “yếu tố then chốt cho tương lai của báo chí,” còn nhà báo Kevin Roose của tạp chí New York đồng thời cũng là một tác gia nổi tiếng coi việc áp dụng kiểu đưa tin bằng robot là “thứ đẹp đẽ nhất đối với các nhà báo trong suốt một thời gian dài.”

Song những người hoài nghi thì lo ngại rằng robot sẽ thay thế các nhà báo chứ không phải là hỗ trợ cho họ. Nhà báo kỳ cựu Robert Rector dự đoán về một tương lai mà các tổng biên tập báo chỉ đơn giản là “dựng những con robot lên để thay thế các nhà báo” và sẽ “xơi miếng thịt ngon lành này vì nhận thấy hoạt động kinh doanh của họ tốn ít hoặc hoàn toàn không tốn chi phí nào.” Kris Hammond của Narrative Science càng làm cho những nỗi sợ đó tăng lên khi phỏng đoán rằng 90% nội dung tin tức sẽ do máy tính thực hiện vào giữa thập niên 2020.

90% nội dung tin tức sẽ do máy tính thực hiện vào giữa thập niên 2020
90% nội dung tin tức sẽ do máy tính thực hiện vào giữa thập niên 2020

Dự đoán cho năm 2017

Theo một số chuyên gia trong ngành báo chí, trong năm 2017, hệ thống tự động (bot) trong nhiều tòa soạn sẽ bắt đầu tạo ra những tin bài khi có sẵn các dữ liệu – ví dụ tổng hợp các trận đấu, cập nhật thông tin thời tiết, hoặc những bài toàn cảnh về hoạt động của thị trường chứng khoán. Việc này sẽ giúp giải phóng các nguồn lực và giảm chi phí.

Robot sẽ phân tích những nội dung phức tạp bất kể độ dài ra sao, và phản hồi cho các biên tập viên ngồi sau bàn phím. Giống như kiểu Netflix sử dụng dữ liệu để xây dựng loạt phim “House of Cards” bắt trúng tâm lý của người xem, các cơ quan báo chí sẽ có cơ hội điều chỉnh nội dung của mình để các bài viết thu hút độc giả tương tác nhiều hơn.

Trong khi đó, những gã khổng lồ công nghệ là Google và Facebook sẽ sử dụng trí tuệ nhân tạo để xác định tin giả và giúp ngăn chặn việc phát tán những thông tin thất thiệt này.

Người ta dự đoán Apple, Google và Facebook sẽ thống nhất các hệ thống tin tức, tìm kiếm và audio đang bị phân mảnh hiện nay, đồng thời tận dụng trí tuệ nhân tạo để đề xuất các nội dung liên quan thuộc bất kỳ thể loại nào. Chẳng hạn nếu bạn đọc một bài viết trên tờ thì có thể sẽ được giới thiệu một chương trình podcast tương tự của Planet Money. Cách thức này giúp người dùng sử dụng thiết bị và các dịch vụ trong thời gian dài hơn, và điều đó mang lại lợi thế về tài chính cho cả Apple, Google lẫn Facebook.

Các hệ thống tự động (bot) sẽ thay thế cho các ứng dụng của các nhà xuất bản tin tức trên iOS và Android. Nhiều thống kê cho thấy ứng dụng tin tức của các cơ quan báo chí ít được sử dụng trong khi các ứng dụng nhắn tin lại vô cùng phổ biến và lớn mạnh thêm mỗi ngày. Các nhà xuất bản tin tức sẽ rút bớt nguồn lực từ việc duy trì các ứng dụng điện thoại không được sử dụng và chuyển sang tập trung phát triển các hệ thống tự động để trực tiếp đẩy các tin tức liên quan lên những màn hình mà độc giả xem nhiều nhất.

Trí tuệ nhân tạo sẽ giúp các nhà báo kể các câu chuyện hay hơn đồng thời đảm bảo đưa được nội dung đến đúng đối tượng độc giả. 

Các tòa soạn nên tận dụng trí tuệ nhân tạo, giống như cách mà họ tận dụng các công cụ công nghệ khác cho quy trình tác nghiệp. Các nhà nghiên cứu khẳng định trí tuệ nhân tạo sẽ giúp các nhà báo kể các câu chuyện hay hơn đồng thời đảm bảo đưa được nội dung đến đúng đối tượng độc giả.

Vậy còn dự đoán của Hammond rằng một ngày nào đó robot có thể giảnh giải thưởng Pulitzer thì sao. Chuyên gia Justin Myers của hãng AP hoàn toàn tin chắc rằng máy móc sẽ làm được điều này, vì thực tế là nó đã từng làm được trong quá khứ. Bill Dedman đoạt giải Pulitzer cho phóng sự điều tra về tình trạng cho vay thế chấp mang tính phân biệt chủng tộc – một câu chuyện được thực hiện với sự hỗ trợ của máy tính – từ năm 1988.

Ông Reg Chua của hãng Reuters không đặt kỳ vọng quá cao nhưng thừa nhận là trí tuệ nhân tạo có tiềm năng trong lĩnh vực báo chí. Ông cho rằng trong tương lai máy móc có thể không quá vượt trội con người về khả năng viết nhưng để đưa tin về một sự kiện thì nó có thể tạo ra 5 bài chất lượng cao và 500.000 phiên bản cho nhiều đối tượng khác nhau.

Hãy tưởng tượng một bài báo nói cho một độc giả biết những cắt giảm ngân sách của hội đồng địa phương sẽ ảnh hưởng đến gia đình người đó ra sao, hoặc bản thân họ bị ảnh hưởng thế nào bởi một cuộc chiến tranh ở một quốc gia khác. “Tôi nghĩ trong vòng vài năm nữa là chúng ta sẽ nhìn thấy kết quả,” nhà nghiên cứu Caswell khẳng định. “Đó là điều mà nhà báo thông thường không thể làm được.”

Trở lại câu chuyện dịch của Google Translate, nhiều người không hiểu rằng chất lượng dịch của máy phản ánh chính chất lượng dịch của con người. Càng nhiều dữ liệu chuẩn thì máy càng thông minh và đưa ra phương án tốt nhất. Máy thậm chí có thể phân tích, tổng hợp để tự đưa ra phương án tối ưu. Có một thực tế là khi nhìn vào một bản dịch kém, nhiều người Việt Nam luôn có cách nói mỉa mai “lại Google Translate chứ gì,” nhưng chính họ lại rất lười đóng góp để cải thiện chất lượng của công cụ này.

Đại diện Google cũng đã phát động chiến dịch cộng đồng đóng góp nội dung vài lần tại Việt Nam nhưng tình hình không mấy khả quan, và trong khi chất lượng dịch bằng các ngôn ngữ khác đang tiến bộ vượt bậc thì chất lượng dịch sang/từ tiếng Việt cái thiện rất chậm chạp. Máy móc có khả năng tự học, nhưng chúng cần có có chất liệu tốt để học theo và trở nên hoàn thiện. Cùng là một hệ thống, nhưng trong khi Google Translate tiếng Nhật có thể tạo ra bản dịch không khác khả năng dịch của con người như phát hiện của giáo sư Jun Rekimoto thì đối với người dùng Việt Nam, nó vẫn là một thứ không đáng quan tâm.

Song điều đáng lo ngại hơn không chỉ là chuyện máy dịch mà là câu chuyện tổng thể của trí tuệ nhân tạo và sự phát triển của báo chí. Liệu có ai quan tâm đến không?

Trí tuệ nhân tạo không chỉ khiến cho máy móc tự học những điều mới mẻ mà nó cũng khiến chúng ta phải suy nghĩ khác đi để có thể tạo ra những giá trị mới từ cái nhìn của con người.

Nhà khoa học Stephen Hawking từng nói “Sự phát triển lên đến bậc cao nhất của trí tuệ nhân tạo có thể báo hiệu sự chấm dứt của loài người.” Kết cục với loài người có lẽ còn quá xa, nhưng mối đe dọa của trí tuệ nhân tạo với các nhà báo, bên cạnh rất nhiều lợi ích, thì cũng khá gần rồi.

Chúng ta sẽ sớm tìm cách sử dụng trí tuệ nhân tạo trong báo chí, hay cứ để mặc đến một ngày nó tiêu diệt chúng ta?