Engadget, các lập trình viên có khuynh hướng tạo ra những phong cách của riêng họ, nhưng việc tìm kiếm các dấu hiệu về tác giả chương trình không phải là điều khả thi. Bây giờ, điều đó có thể không cần thiết.
Các nhà nghiên cứu đã phát triển một hệ thống máy học có thể “lập trình ẩn danh”, cho dù đó là thông qua mã nguồn thô hoặc các tập tin nhị phân đã biên dịch. Cách tiếp cận này đào tạo một thuật toán để nhận dạng cấu trúc mã hóa của lập trình viên dựa trên các ví dụ về công việc của chúng, và sử dụng chúng để xác định các đặc điểm chung trong các mẫu mã.
Trong một thử nghiệm sử dụng kết quả từ Code Jam của Google, công nghệ dựa trên trí tuệ nhân tạo (AI) là tương đối chính xác. Với 600 lập trình viên và 8 mẫu, hệ thống có thể xác định người sáng tạo ra nó nhanh hơn 83%. Mặc dù con số cải tiến không đáng kể nhưng nó vẫn được đánh giá cao.
Công nghệ này có thể là một lợi ích cho các nhà điều tra nhằm xác định người tạo ra phần mềm độc hại. Nó cũng có thể hữu ích cho các trường hợp đạo văn, nơi máy học có thể phát hiện sự tương đồng nội dung hay sao chép quá mức.
Mặc dù vậy nó cũng có mặt trái khi có thể gây khó khăn cho các lập trình viên muốn đóng góp mã với mục đích ẩn danh thực sự. Về cơ bản, việc triển khai máy học sẽ cần phải cẩn thận để tạo ra sự cân bằng giữa vấn đề bảo mật và sự riêng tư.