Chung kết Champions League diễn ra tháng trước không chỉ là một trò chơi hấp dẫn, nó còn là cơ hội cho các nghiên cứu Big Data. Trong trận này, Mohamed Salah của Liverpool đã bị chấn thương trong pha tranh chấp với Sergio Ramos của Real Madrid. Theo Techradar, đó có thể là tổn thất lớn cho cả Liverpool lẫn Ai Cập. Trận đầu tiên nước này chơi tại World Cup 2018 đã không có Salah và điều này khiến đội bóng không chơi đúng khả năng của mình. Nếu trong các trận đấu tới vẫn không có Salah, cơ hội tiến sâu của Ai Cập chắc chắn sẽ giảm, không thể gây khó dễ cho các đội bóng khác.
Brazil được dự đoán sẽ nâng cúp vàng vô địch.
Điều này cho thấy rằng, Salah là điểm nhấn của đội tuyển Ai Cập và cả chính World Cup. Đó là một điểm mà trong Big Data, khi thiếu nó sẽ ảnh hưởng đến hàng triệu điểm khác. Nói cách khác, việc thiếu Salah sẽ gây tác động không nhỏ đến kết quả, thậm chí là đội vô địch World Cup năm nay.
Từ đó, các chuyên gia đặt ra câu hỏi: Liệu có thể xử lý dữ liệu để đoán trước được kết quả? Liệu có thể dự đoán được phong độ của đội đó? Hay liệu nó có thể dự đoán đội nào chiến thắng tại World Cup 2018?
Opta Sports và Stats là hai công ty đang cố gắng trả lời những câu hỏi như vậy. Là công ty chuyên thu thập dữ liệu thể thao, nhiệm vụ của cả hai là mang về các thông tin và hiểu rõ về khách hàng của họ, bao gồm các đội thể thao và liên đoàn bóng đá. “Mỗi trận đấu, chúng tôi thu thập khoảng 2.000 điểm dữ liệu, chủ yếu là các hành động liên quan đến trái bóng. Sẽ có một nhóm ba người chuyên phân tích mọi thứ xảy ra trên sân, như đường chuyền, tạt góc, cầu thủ chạm bóng… Nó sau đó sẽ lập tức được đưa tới đối tác nhanh nhất có thể, đó là lý do vì sao các đài truyền hình lại có số liệu thống kê để hiển thị trên màn hình vào cuối mỗi hiệp”, Peter Deeley, người đứng đầu Opta giải thích.
Theo Paul Power của Stats, công ty sẽ sử dụng các máy ảnh quanh sân để lấy các thông tin cần thiết. Tuy nhiên, nó vẫn cần đến con người trong các tình huống khó kiểm soát. Ví dụ, một cầu thủ bị đối phương dồn ép, buộc phải chuyền về cho đồng đội. Nhưng nếu là chuyền dài, máy sẽ không hiểu được đó là cú sút hay chuyền bóng và đây là lúc để con người điều chỉnh.
Tuy nhiên, việc để phân tích dữ liệu nhằm đưa ra dự đoán chính xác đội vô địch khó hơn nhiều. Với Opta, Deeley cho biết họ không sử dụng thông tin cá nhân mỗi cầu thủ, thay vào đó là phong độ toàn đội tuyển. “Chúng tôi sẽ đánh giá cơ hội tiến sâu của Ai Cập dựa trên những gì đội thể hiện trước đó và phong độ cầu thủ ở cấp đội tuyển quốc gia thay vì câu lạc bộ, tất nhiên là loại trừ cả trường hợp chấn thương của Salah”, Deeley nói.
Các dữ liệu sẽ được hệ thống phân tích bằng máy tính và có thể chạy đi chạy lại một vấn đề hàng trăm nghìn lần. Thuật toán sẽ có các điều chỉnh sao cho phù hợp với tình hình hiện tại nhất. Điều này sẽ giúp đưa ra dự đoán chính xác hơn thay vì dựa trên một ngôi sao nào đó. Năm 2006, Italy đã vô địch nhờ vào đội hình đồng đều mà không có một cầu thủ nào nổi bật hơn hẳn đã chứng minh điều đó.
Stats lại làm ngược lại, khi thu thập thông tin cầu thủ và đưa vào nhóm gọi là “What if”. Theo Power, cá nhân sẽ quyết định xác suất rất cao đội tuyển đó sẽ thắng hay thua. “Giả sử dựa trên phong độ hiện tại, dữ liệu phân tích Salah sẽ có khoảng 0,3 bàn thắng mỗi trận. Nhưng nếu anh ta không vào sân, xác suất giảm số bàn thắng của Ai Cập có thể giảm 3 đến 10%. Đó là chưa kể yếu tố tinh thần tác động lên toàn đội”, Power nói.
Power tin rằng phương pháp tiếp cận cá nhân (cầu thủ) sẽ đưa ra dự đoán chính xác hơn là dựa trên phong độ toàn đội. “Nếu bạn có đội hình với các vị trí đầy đủ, vấn đề sẽ không lớn bằng việc có đủ cầu thủ trên sân nhưng khiếm khuyết tiền vệ trung tâm hay hậu vệ. Nhân tố sẽ tạo nên mắt xích, từ đó giúp cỗ máy hoạt động trơn tru”, Power giải thích.
Vậy cuối cùng ai sẽ vô địch World Cup năm nay?
Stats đã từ chối trả lời, không phải là họ sợ dự đoán sai, mà bởi đây là thông tin có giá trị và họ muốn bán nó cho đối tác thay vì công khai miễn phí.
Nhưng Opta có đáp án. Dựa trên dữ liệu mà công ty này phân tích, Brazil – đội từng 5 lần vô địch thế giới – sẽ có cơ hội nâng cúp vàng một lần nữa với tỷ lệ lên tới 14,2%. Đức – đương kim vô địch giải đấu – đứng thứ hai với 11,4%.
Trước đó, một chương trình trí tuệ nhân tạo đưa ra dự đoán về đội vô địch World Cup 2018 dựa trên 100.000 mô phỏng, theo Science Alert. Sử dụng cơ sở dữ liệu từ các giải đấu trước đó và ba kỹ thuật khác nhau để xử lý những con số, nhóm nhà nghiên cứu quốc tế nhận định đội tuyển Tây Ban Nha sẽ giành chiến thắng ở trận chung kết. Tây Ban Nha xếp hạng cao nhất với 17,8% cơ hội chiến thắng, tiếp theo là Đức (17,1%), Brazil (12,3%), Pháp (11,2%) và Bỉ (10,4%). Trong khi đó, Arab Saudi được dự đoán không có cơ hội lọt vào vòng chung kết.
Như Phúc
Brazil được dự đoán sẽ nâng cúp vàng vô địch.
Điều này cho thấy rằng, Salah là điểm nhấn của đội tuyển Ai Cập và cả chính World Cup. Đó là một điểm mà trong Big Data, khi thiếu nó sẽ ảnh hưởng đến hàng triệu điểm khác. Nói cách khác, việc thiếu Salah sẽ gây tác động không nhỏ đến kết quả, thậm chí là đội vô địch World Cup năm nay.
Từ đó, các chuyên gia đặt ra câu hỏi: Liệu có thể xử lý dữ liệu để đoán trước được kết quả? Liệu có thể dự đoán được phong độ của đội đó? Hay liệu nó có thể dự đoán đội nào chiến thắng tại World Cup 2018?
Opta Sports và Stats là hai công ty đang cố gắng trả lời những câu hỏi như vậy. Là công ty chuyên thu thập dữ liệu thể thao, nhiệm vụ của cả hai là mang về các thông tin và hiểu rõ về khách hàng của họ, bao gồm các đội thể thao và liên đoàn bóng đá. “Mỗi trận đấu, chúng tôi thu thập khoảng 2.000 điểm dữ liệu, chủ yếu là các hành động liên quan đến trái bóng. Sẽ có một nhóm ba người chuyên phân tích mọi thứ xảy ra trên sân, như đường chuyền, tạt góc, cầu thủ chạm bóng… Nó sau đó sẽ lập tức được đưa tới đối tác nhanh nhất có thể, đó là lý do vì sao các đài truyền hình lại có số liệu thống kê để hiển thị trên màn hình vào cuối mỗi hiệp”, Peter Deeley, người đứng đầu Opta giải thích.
Theo Paul Power của Stats, công ty sẽ sử dụng các máy ảnh quanh sân để lấy các thông tin cần thiết. Tuy nhiên, nó vẫn cần đến con người trong các tình huống khó kiểm soát. Ví dụ, một cầu thủ bị đối phương dồn ép, buộc phải chuyền về cho đồng đội. Nhưng nếu là chuyền dài, máy sẽ không hiểu được đó là cú sút hay chuyền bóng và đây là lúc để con người điều chỉnh.
Tuy nhiên, việc để phân tích dữ liệu nhằm đưa ra dự đoán chính xác đội vô địch khó hơn nhiều. Với Opta, Deeley cho biết họ không sử dụng thông tin cá nhân mỗi cầu thủ, thay vào đó là phong độ toàn đội tuyển. “Chúng tôi sẽ đánh giá cơ hội tiến sâu của Ai Cập dựa trên những gì đội thể hiện trước đó và phong độ cầu thủ ở cấp đội tuyển quốc gia thay vì câu lạc bộ, tất nhiên là loại trừ cả trường hợp chấn thương của Salah”, Deeley nói.
Các dữ liệu sẽ được hệ thống phân tích bằng máy tính và có thể chạy đi chạy lại một vấn đề hàng trăm nghìn lần. Thuật toán sẽ có các điều chỉnh sao cho phù hợp với tình hình hiện tại nhất. Điều này sẽ giúp đưa ra dự đoán chính xác hơn thay vì dựa trên một ngôi sao nào đó. Năm 2006, Italy đã vô địch nhờ vào đội hình đồng đều mà không có một cầu thủ nào nổi bật hơn hẳn đã chứng minh điều đó.
Stats lại làm ngược lại, khi thu thập thông tin cầu thủ và đưa vào nhóm gọi là “What if”. Theo Power, cá nhân sẽ quyết định xác suất rất cao đội tuyển đó sẽ thắng hay thua. “Giả sử dựa trên phong độ hiện tại, dữ liệu phân tích Salah sẽ có khoảng 0,3 bàn thắng mỗi trận. Nhưng nếu anh ta không vào sân, xác suất giảm số bàn thắng của Ai Cập có thể giảm 3 đến 10%. Đó là chưa kể yếu tố tinh thần tác động lên toàn đội”, Power nói.
Power tin rằng phương pháp tiếp cận cá nhân (cầu thủ) sẽ đưa ra dự đoán chính xác hơn là dựa trên phong độ toàn đội. “Nếu bạn có đội hình với các vị trí đầy đủ, vấn đề sẽ không lớn bằng việc có đủ cầu thủ trên sân nhưng khiếm khuyết tiền vệ trung tâm hay hậu vệ. Nhân tố sẽ tạo nên mắt xích, từ đó giúp cỗ máy hoạt động trơn tru”, Power giải thích.
Vậy cuối cùng ai sẽ vô địch World Cup năm nay?
Stats đã từ chối trả lời, không phải là họ sợ dự đoán sai, mà bởi đây là thông tin có giá trị và họ muốn bán nó cho đối tác thay vì công khai miễn phí.
Nhưng Opta có đáp án. Dựa trên dữ liệu mà công ty này phân tích, Brazil – đội từng 5 lần vô địch thế giới – sẽ có cơ hội nâng cúp vàng một lần nữa với tỷ lệ lên tới 14,2%. Đức – đương kim vô địch giải đấu – đứng thứ hai với 11,4%.
Trước đó, một chương trình trí tuệ nhân tạo đưa ra dự đoán về đội vô địch World Cup 2018 dựa trên 100.000 mô phỏng, theo Science Alert. Sử dụng cơ sở dữ liệu từ các giải đấu trước đó và ba kỹ thuật khác nhau để xử lý những con số, nhóm nhà nghiên cứu quốc tế nhận định đội tuyển Tây Ban Nha sẽ giành chiến thắng ở trận chung kết. Tây Ban Nha xếp hạng cao nhất với 17,8% cơ hội chiến thắng, tiếp theo là Đức (17,1%), Brazil (12,3%), Pháp (11,2%) và Bỉ (10,4%). Trong khi đó, Arab Saudi được dự đoán không có cơ hội lọt vào vòng chung kết.
Như Phúc