Hiện nay, phần lớn trí thông minh nhân tạo (artificial intelligence – AI) chỉ được dùng để dịch thuật, gắn thẻ ảnh (tag) trên Facebook và tối ưu hóa điều hướng bản đồ dựa trên dữ liệu khởi tạo ban đầu của con người. Chúng ta cho nó thấy câu văn này có ý nghĩa gì trong các ngôn ngữ khác, một người sẽ trông như thế nào ở các bức ảnh khác nhau, và cách phát hiện con đường tối ưu nhất cho một chiếc ô tô.
Nhưng một số các nhà nghiên cứu AI đang tìm cách cho chúng khả năng tò mò, để chúng có thể học mà không cần đến sự hướng dẫn của con người nữa. Nghiên cứu mới đây từ OpenAI – phòng nghiên cứu độc lập, phi lợi nhuận về AI, được thành lập bởi Elon Musk, Sam Altman, và một số “cao thủ” khác của thung lũng Silicon, công tác cùng các nhà nghiên cứu đến từ UC Berkeley và Đại học Edinburgh – đã chỉ ra rằng, khi thuật toán AI được đưa ra một định nghĩa đơn giản về sự tò mò, chẳng cần thêm thông tin nào do con người cung cấp, nó có thể tự mình khám phá hơn 50 tựa game video, và thậm chí là “phá đảo” một vài game trong số đó..
Nhưng sự tò mò này cũng có giá của nó. Các nhà khoa học đồng thời nhận ra, kể từ khi AI được cho phép tiếp xúc với những điều mới lạ, thỉnh thoảng nó sẽ cố tình “chết” để được nhìn màn hình Game Over, hoặc quá say mê với cái ti vi và điều khiển từ xa, chuyển kênh qua lại liên tục, cố gắng tìm kiếm những thứ mới mẻ hấp dẫn.
Sự tò mò nhân tạo là gì?
Định nghĩa mà nhóm OpenAI sử dụng cho sự tò mò nhân tạo tương đối đơn giản: Thuật toán sẽ cố gắng hình dung ra môi trường của nó trông như thế nào trong khung hình tiếp theo. Khi khung hình tiếp theo đó xảy ra, thuật toán sẽ được “thưởng” xét trên mức độ sai lầm của nó. Ý tưởng là, nếu thuật toán có thể dự đoán những gì sắp xảy ra trong tương lai, nó hẳn đã từng trải qua điều tương tự trong quá khứ.
Đó là lý do tại sao các “nhân vật” AI chơi rất giỏi nhưng trò như Super Mario – trò chơi luôn tiến về phía trước để vượt qua từng “tầng”.
Có điều gì đặc biệt ở chiếc ti vi?
Nhà nghiên cứu Harri Edward của OpenAI đã nói với trang Quartz rằng, ý tưởng cho phép AI chuyển kênh ti vi đến từ một thí nghiệm tưởng tượng gọi là “noisy-TV problem” (Tạm dịch: sự huyên náo của ti vi). Tiếng nhiễu sóng của TV là hoàn toàn ngẫu nhiên, do đó, với sự tò mò vốn có, các AI sẽ không bao giờ có thể dự đoán được hết những điều xảy ra tiếp theo và nó vô tình bị cuốn vào hành động xem ti vi mãi mãi.
Các nhà nghiên cứu đã thử nghiệm lý thuyết này bằng cách đặt một ti vi kỹ thuật số trong môi trường 3D và cho phép AI thao tác bấm nút để chuyển kênh. Khi AI tìm thấy tivi và bắt đầu chuyển qua lại giữa các kênh, luồng hình ảnh mới trên ti vi khiến chúng không thể cưỡng lại.
Edwards cho biết, cũng có vài trường hợp AI có thể tự thoát được khỏi ti vi, nhưng điều đó chỉ xảy ra nếu chẳng may môi trường xung quanh AI ấy xảy ra điều gì đó có vẻ thú vị hơn các diễn biến tiếp theo trên ti vi.
Vượt qua khuôn khổ của những trò chơi
Mục đích của nghiên cứu này không phải chỉ để vượt qua các video game với AI, mà còn để hiểu hơn cách các thuật toán diễn tả về thế giới xung quanh nó. Kể từ khi những thuật toán này tỏ ra vô cùng hiệu quả khi khám phá đủ các ngõ ngách của video game, các nhà khoa học cho biết, họ cũng có thể điểu chỉnh để gỡ lỗi (debug code) dễ dàng hơn hoặc đảm bảo một game nào đó sẽ không có bất cứ trục trặc nào khi chơi.
Shirley