Các nhà nghiên cứu tại OpenAI – một tổ chức phi lợi nhuận trụ sở tại California – đã phát triển một nhóm cộng sự bằng thuật toán với tên gọi OpenAI Five. Mỗi thuật toán trong nhóm này sử dụng một mạng thần kinh để học không chỉ cách chơi game, mà còn cách cộng tác với các đồng đội AI của nó. Và một điều không ai ngờ tới đã xảy ra: nhóm OpenAI Five đã đánh bại một nhóm người chơi DOTA 2 không chuyên trong một bài thử nghiệm!
Đây là một thành tự quan trọng và lạ thường đối với AI, khi mà từ trước đến nay, các thuật toán thường chỉ hoạt động độc lập. Những phương pháp tiếp cận giúp các thuật toán cộng tác với nhau có thể sẽ đóng vai trò quan trọng khi ứng dụng công nghệ này vào thương mại. Ví dụ, các thuật toán AI có thể làm việc nhóm để vượt qua các đối thủ trong giao dịch trực tuyến hoặc đấu thầu quảng cáo. Các thuật toán có khả năng cộng tác cũng có thể cộng tác với con người.
Trước đó, OpenAI đã trình diễn một thuật toán có khả năng đấu tay đổi với những game thủ hàng đầu trong phần chơi đơn của DOTA 2. Dự án mới nhất này sử dụng các thuật toán tương tự, nhưng được chỉnh sửa để đề cao thành công của cả cá nhân lẫn đội chơi. Các thuật toán này không giao tiếp trực tiếp với nhau, trừ khi chúng tham gia vào cùng một game.
“Những gì chúng ta đã chứng kiến cho thấy sự phối hợp và cộng tác có thể nảy sinh rất tự nhiên từ các động cơ thúc đẩy” – Greg Brockman, một trong các nhà sáng lập của OpenAI cho biết. OpenAI có mục tiêu phát triển trí tuệ nhân tạo theo hướng mở và mang lại các lợi ích cho nhân loại. Ông nói thêm rằng nhóm nghiên cứu đã thử thay thế một người chơi bằng một trong các thuật toán và nó hoạt động rất tốt. “Anh ấy miêu tả rằng bản thân cảm giác được hỗ trợ rất tốt” – Brockman nói.
DOTA 2 là một game chiến thuật phức tạp, trong đó các nhóm gồm 5 người chơi chiến đấu với nhau để giành quyền kiểm soát một đấu trường gồm 3 làn đường. Mỗi người chơi lại có điểm mạnh, điểm yếu và vai trò khác nhau. Game xoay quanh việc thu thập các món đồ, lên kế hoạch tấn công và tác chiến trong thời gian thực.
Việc đưa các chương trình AI vào thi đấu trong các game máy tính là một phương thức quen thuộc để đánh giá tiến trình phát triển của AI đó. DeepMind, một công ty con của Alphabet, nổi tiếng với việc phát triển một chương trình có khả năng học chơi tựa game cực kỳ phức tạp và tinh vi Go với những kỹ năng siêu việt. Một chương trình liên quan sau đó đã dạy chính nó cách làm bá chủ tựa game này và cả game đánh cờ nữa, từ chỗ không biết gì, bằng cách tự đánh với chính nó.
AI của Elon Musk từng đánh bại cao thủ DOTA 2 Danylo “Deldi”
Những chiến thuật đòi hỏi để chơi DOTA 2 về cơ bản là rõ ràng hơn chơi cờ hay Go, nhưng tựa game này vẫn rất khó để nắm vững. Với một cỗ máy, DOTA 2 còn đầy thử thách vì không phải lúc nào nó cũng có thể thấy đối phương dự tính gì, và nó đòi hỏi phải làm việc nhóm.
OpenAI Five đã học bằng cách tự đấu lại nhiều phiên bản của chính chúng. Dần dần, chương trình này phát triển được các chiến thuật rất giống với chiến thuật mà con người sử dụng – phát hiện ra những cách để kiếm được vàng bằng cách “cày”, cũng như nắm một vai trò chiến thuật cụ thể, hoặc chọn một làn đường để đi trong game.
Các chuyên gia AI cho biết thành tựu này là rất đáng kể. “DOTA 2 là một game cực kỳ phức tạp, do đó đánh bại được những người chơi dù không chuyên cũng thực sự rất ấn tượng” – Noam Brown, một nhà nghiên cứu tại Đại học Carnegie Mellon ở Pittsburgh cho biết. “Cụ thể, việc đối mặt với những luồng thông tin ẩn trong một game rộng lớn như DOTA 2 là một thách thức lớn“.
Trước đây, Brown từng phát triển một thuật toán có khả năng chơi poker – một tựa game với các thông tin ẩn tương tự DOTA 2 – với kỹ năng siêu việt. Nếu OpenAI Five có thể cùng nhau đánh bại con người, đó sẽ là một thành tựu lớn trong lĩnh vực AI. Tuy nhiên, ông nói thêm rằng nếu có đủ thời gian, con người sẽ phát hiện ra những điểm yếu trong lối chơi của nhóm AI này.
Các tựa game khác cũng có thể giúp phát triển AI xa hơn – Brown nói. “Thách thức lớn tiếp theo sẽ là các game đòi hỏi giao tiếp, như Diplomacy hay Settlers of Catan, nơi việc cân bằng giữa hợp tác và cạnh tranh là yếu tố sống còn để chiến thắng“.
Tham khảo: MIT Technology Review Nhật ký thống trị Dota 2 của trí tuệ nhân tạo OpenAI: từ “noob” trở thành vô địch võ lâm như thế nào?
Đây là một thành tự quan trọng và lạ thường đối với AI, khi mà từ trước đến nay, các thuật toán thường chỉ hoạt động độc lập. Những phương pháp tiếp cận giúp các thuật toán cộng tác với nhau có thể sẽ đóng vai trò quan trọng khi ứng dụng công nghệ này vào thương mại. Ví dụ, các thuật toán AI có thể làm việc nhóm để vượt qua các đối thủ trong giao dịch trực tuyến hoặc đấu thầu quảng cáo. Các thuật toán có khả năng cộng tác cũng có thể cộng tác với con người.
Trước đó, OpenAI đã trình diễn một thuật toán có khả năng đấu tay đổi với những game thủ hàng đầu trong phần chơi đơn của DOTA 2. Dự án mới nhất này sử dụng các thuật toán tương tự, nhưng được chỉnh sửa để đề cao thành công của cả cá nhân lẫn đội chơi. Các thuật toán này không giao tiếp trực tiếp với nhau, trừ khi chúng tham gia vào cùng một game.
DOTA 2 là một game chiến thuật phức tạp, trong đó các nhóm gồm 5 người chơi chiến đấu với nhau để giành quyền kiểm soát một đấu trường gồm 3 làn đường. Mỗi người chơi lại có điểm mạnh, điểm yếu và vai trò khác nhau. Game xoay quanh việc thu thập các món đồ, lên kế hoạch tấn công và tác chiến trong thời gian thực.
Việc đưa các chương trình AI vào thi đấu trong các game máy tính là một phương thức quen thuộc để đánh giá tiến trình phát triển của AI đó. DeepMind, một công ty con của Alphabet, nổi tiếng với việc phát triển một chương trình có khả năng học chơi tựa game cực kỳ phức tạp và tinh vi Go với những kỹ năng siêu việt. Một chương trình liên quan sau đó đã dạy chính nó cách làm bá chủ tựa game này và cả game đánh cờ nữa, từ chỗ không biết gì, bằng cách tự đánh với chính nó.
Những chiến thuật đòi hỏi để chơi DOTA 2 về cơ bản là rõ ràng hơn chơi cờ hay Go, nhưng tựa game này vẫn rất khó để nắm vững. Với một cỗ máy, DOTA 2 còn đầy thử thách vì không phải lúc nào nó cũng có thể thấy đối phương dự tính gì, và nó đòi hỏi phải làm việc nhóm.
OpenAI Five đã học bằng cách tự đấu lại nhiều phiên bản của chính chúng. Dần dần, chương trình này phát triển được các chiến thuật rất giống với chiến thuật mà con người sử dụng – phát hiện ra những cách để kiếm được vàng bằng cách “cày”, cũng như nắm một vai trò chiến thuật cụ thể, hoặc chọn một làn đường để đi trong game.
Các chuyên gia AI cho biết thành tựu này là rất đáng kể. “DOTA 2 là một game cực kỳ phức tạp, do đó đánh bại được những người chơi dù không chuyên cũng thực sự rất ấn tượng” – Noam Brown, một nhà nghiên cứu tại Đại học Carnegie Mellon ở Pittsburgh cho biết. “Cụ thể, việc đối mặt với những luồng thông tin ẩn trong một game rộng lớn như DOTA 2 là một thách thức lớn“.
Trước đây, Brown từng phát triển một thuật toán có khả năng chơi poker – một tựa game với các thông tin ẩn tương tự DOTA 2 – với kỹ năng siêu việt. Nếu OpenAI Five có thể cùng nhau đánh bại con người, đó sẽ là một thành tựu lớn trong lĩnh vực AI. Tuy nhiên, ông nói thêm rằng nếu có đủ thời gian, con người sẽ phát hiện ra những điểm yếu trong lối chơi của nhóm AI này.
Các tựa game khác cũng có thể giúp phát triển AI xa hơn – Brown nói. “Thách thức lớn tiếp theo sẽ là các game đòi hỏi giao tiếp, như Diplomacy hay Settlers of Catan, nơi việc cân bằng giữa hợp tác và cạnh tranh là yếu tố sống còn để chiến thắng“.
Tham khảo: MIT Technology Review Nhật ký thống trị Dota 2 của trí tuệ nhân tạo OpenAI: từ “noob” trở thành vô địch võ lâm như thế nào?