Các nhà khoa học của Facebook AI Research (FAIR) đã công bố một mạng neural có khả năng chuyển đổi âm nhạc từ một thể loại, phong cách, nhạc cụ nhất định, sang một thể loại khác hoàn toàn. Trong tương lai, có thể bạn chỉ cần lôi cái còi ra thổi, và rồi con AI sẽ biến bài hát đó thành cả một bản giao hưởng hoặc một hit nhạc sàn mà chỉ trong mơ bạn mới có được.
Hãy lắng nghe thành quả mà con AI này tạo được ở đây:
FAIR đã trở thành nhóm nghiên cứu AI đầu tiên có thể tạo ra một phương pháp chế tạo lại âm nhạc chất lượng cao bằng mạng lưới neural.
Tuyên bố của nhóm nghiên cứu cho thấy: “Kết quả của chúng tôi, như chúng tôi đã biết, là chưa từng được phát hiện ra. Khi được yêu cầu chuyển đổi một nhạc cụ sang một nhạc cụ khác, mạng lưới của chúng tôi ngang bằng, hay chỉ tệ hơn một chút, so với các nhạc sĩ chuyên nghiệp. Trong nhiều trường hợp, người nghe không thể phân biệt được đâu là file nhạc gốc, và đâu là file đầu ra, sau khi AI bắt chước một nhạc cụ khác hoàn toàn.”
Độ trung thực của âm thanh mà AI này sản xuất ra là nhờ vào quá trình dạy cho mạng neural cách tự động mã hoá âm thanh. Đội nghiên cứu chia sẻ: “Chúng tôi cố gắng không thử chuyển đổi phong cách nhạc, và không thử tìm cách sử dụng các phương pháp đó vì chúng tôi tin rằng giai điệu được chơi bởi một chiếc piano thì không giống với giai điệu được hát bởi một giàn hợp xướng. Quá trình mapping phải được thực hiện ở mức cao hơn, và các sửa đổi sẽ không chỉ đơn thuần là những thay đổi cục bộ đơn giản.”
Cách tiếp cận của FAIR sử dụng một phương pháp mã hoá tự động phức tạp, cho phép mạng lưới xử lý âm thanh đầu vào mà AI chưa từng được huấn luyện để xử lý. Thay vì cố tìm cách làm hợp tông hay ghi nhớ các nốt nhạc, phương pháp học tập không qua giám sát của AI này sử dụng các diễn giải ngữ nghĩa cấp cao. Nó giống như cái cách mà các nhạc công chuyên nghiệp có thể nghe bản nhạc một lần rồi tự mình biểu diễn lại được vậy.
Thành tựu này cũng cho thấy lĩnh vực AI đã tiến bộ rất nhiều trong một vài năm trở lại. Đây có thể là một trong những con AI đầu tiên mà có thể khiến người nghe lầm tưởng là đang nghe một nhạc công thực thu chơi nhạc.
Tham khảo TNW