Đối với Joris Bekkers, dữ liệu bóng đá là thứ còn hấp dẫn hơn cả dịp lễ Giáng sinh.
Một vài mùa đông trước, khi các đồng nghiệp của Bekkers tại Liên đoàn bóng đá Mỹ (USSF) đã về nhà nghỉ lễ, chuyên gia khoa học dữ liệu người Hà Lan vẫn tận dụng thời gian để xây dựng các mô hình dữ liệu bóng đá.
Chính quãng thời gian này cũng cho phép ông theo đuổi niềm đam mê thầm kín là xây dựng một mô hình dữ liệu bóng đá của riêng mình.
Dạy máy tính học chiến thuật bóng đá
Đối với Bekkers và nhiều chuyên gia dữ liệu khác, dạy cho máy tính học chiến thuật bóng đá hấp dẫn hơn cả việc uống rượu và hò hét trước TV ở ngày Boxing Day.
Trả lời The Athletic, Bekkers thừa nhận ông lần đầu bị thu hút bởi một cuộc nói chuyện trên YouTube về việc sử dụng loại trí tuệ nhân tạo có tên mạng nơ-ron thần kinh dạng đồ thị (graph neural networks) để tìm hiểu dữ liệu bóng đá phức tạp.
Như tên gọi của nó, mạng nơ-ron thần kinh là một hệ thống máy tính với các nút kết nối với nhau hoạt động giống như các tế bào thần kinh trong não người để hiệu quả hơn.
Ưu điểm lớn nhất của mô hình này nằm ở việc chúng có thể nghiên cứu một số lượng lớn tài nguyên và dần dần kết nối các dấu chấm lại với nhau để tìm hiểu cách vận hành của bóng đá.
Ý tưởng là thế, nhưng thật không may cho ai nghĩ đến viễn cảnh sa thải HLV thật để thay thế bằng cỗ máy, khoa học dữ liệu không dễ dàng như yêu cầu trợ lý ảo Siri đi xem một nghìn trận đấu và sau đó có thể dẫn dắt một đội bóng.
Đầu tiên, Bekkers phải kết hợp dữ liệu sự kiện (nhật ký hành động của con người với quả bóng) với nhật ký của dữ liệu theo dõi (bản ghi của thị giác máy tính về cách cầu thủ và quả bóng di chuyển) để có được nhật ký theo ngôn ngữ của máy tính và con người về những gì đang diễn ra trong trận đấu.
Sau đó, chuyên gia khoa học dữ liệu người Hà Lan tiếp tục phải dịch tất cả thông tin đó thành dạng biểu đồ để mạng nơ-ron thần kinh có thể hiểu được.
Thực tế, biểu đồ này có phần tương đồng với sơ đồ chuyền bóng được các trang thống kê ghi lại, với các cầu thủ trên sân là những dấu chấm, còn hướng mũi tên sẽ là kết nối giữa họ với đồng đội cùng quả bóng.
Với mạng nơ-ron thần kinh, các chấm và mũi tên trên đồ thị không chỉ đơn thuần là ghi lại vị trí của cầu thủ. Chúng có thể bao gồm toàn bộ bối cảnh về cầu thủ và liên kết xung quanh, chẳng hạn như họ đang di chuyển theo hướng nào, với tốc độ bao nhiêu.
“Bạn thậm chí có thể thêm màu sắc đôi giày của cầu thủ nếu nghĩ rằng điều đó quan trọng”, Bekkers nói đùa. Máy tính sẽ cần một cái nhìn đầy đủ về vị trí và chuyển động di chuyển không bóng của cầu thủ để bắt đầu xử lý những tác vụ về chiến thuật.
Bức tường lớn
Tuy nhiên, vẫn còn một vấn đề lớn là làm thế nào để Bekkers có thể tự xây dựng mô hình của riêng mình và đây cũng là lúc mà chuyên gia này đã va phải một bức tường khổng lồ.
Cụ thể, khi cố gắng chạy mô hình cho các mạng nơ-ron thần kinh của mình, chúng hoạt động không hiệu quả. Bộ não silicon của vị HLV máy tính mà Bekkers dày công nghiên cứu đã bị hỏng.
Cũng đúng lúc này, kỳ nghỉ Giáng sinh đã kết thúc và Bekkers phải quay về công việc bóng đá bình thường tại USSF. Đam mê của Bekkers sẽ mãi còn dang dở nếu không có một tin nhắn bất ngờ từ người có tên Amod Sahasrabudhe.
Khác với Bekkers là một nhà khoa học dữ liệu bóng đá và có hiểu biết sâu về trí tuệ nhân tạo, Sahasrabudhe chỉ tình cờ tham gia dự án này với tư cách sau khi mới tốt nghiệp và cũng là cổ động viên lâu năm của Manchester United.
Theo lời khuyên từ một người bạn, Sahasrabudhe đã xem hết toàn bộ chuỗi video trên YouTube đã truyền cảm hứng cho Bekkers. Chàng sinh viên mới tốt nghiệp chợt nhận ra rằng những người có chuyên môn như thế đang góp sức thực hiện nghiên cứu công nghệ tiên tiến cho một số tổ chức bóng đá lớn nhất thế giới.
Là một người hâm mộ bóng đá cuồng nhiệt, Sahasrabudhe lập tức liên hệ với Bekkers và thuyết phục USSF nhận anh làm thực tập sinh và dùng kiến thức về trí tuệ nhân tạo của mình với nhiệm vụ "giải cứu" dự án mạng nơ-ron thần kinh tưởng chừng đã đi vào ngõ cụt.
Sau một số thử nghiệm cũng như nhận ra nhiều sai sót với các cách khác nhau trong quá trình xây dựng mô hình, Sahasrabudhe và Bekkers cuối cùng đã phát hiện mối quan hệ thú vị giữa chiến thuật trên sân và liên kết phân tử.
“Sự thay đổi hình dạng của một phân tử đồng nghĩa với việc nó sẽ có một tính chất khác. Chúng tôi tin rằng điều đó cũng xảy ra tương tự trong bóng đá", Sahasrabudhe giải thích.
Chỉ với một chút thay đổi về vị trí trên sân, toàn bộ nút thắt về dự án đã được gỡ bỏ. Chẳng bao lâu sau, cả hai đã xây dựng thành công một bộ não máy tính dành riêng cho bóng đá có thể hoạt động trơn tru.
Vấn đề bây giờ là máy tính cần một cái gì đó để học. Sau khi tham khảo ý kiến từ các chuyên phân tích thành tích bên liên đoàn, Sahasrabudhe và Bekkers quyết định tập trung vào một trong những giai đoạn lộn xộn nhất trong một trận đấu là những pha phản công, vốn chiếm khoảng 10% số bàn thắng ở giải nhà nghề Mỹ (MLS).
Điều gì tác động khiến cho một pha phản công là thành công hay thất bại? Chính xác thì một pha phản công là gì?
Theo định nghĩa riêng của USSF, một pha phản công là một chuỗi tình huống mở bắt đầu từ ngay sau khi đội phòng thủ đoạt bóng thành công và di chuyển lên phía trên ít nhất 10 m với vận tốc 4 m/s.
Bekkers và Sahasrabudhe đã thu gọn phạm vi khái niệm này khi đánh dấu một pha phản công thành công nếu đội tấn công xâm nhập được vào vòng cấm của đối phương bằng bất kỳ cách nào ngoại trừ một đường phất bóng dài.
Công việc của mạng thần kinh giờ đây là tìm ra điều gì đã giúp một đội phản công thành công. Với số lần thử đủ lớn, câu trả lời mà máy tính đưa ra nghe có vẻ hơi lố bịch.
Cụ thể, sau khi nghiên cứu hàng nghìn pha phản công, trí tuệ nhân tạo kết luận rằng bí quyết thành công chỉ đơn giản là di chuyển càng nhanh càng tốt.
Tuy nhiên, có một chi tiết khá thú vị là đối với một số pha phản công đặc biệt, mô hình máy tính có thể dự đoán những điều chỉnh giả định nhỏ trong chuyển động của cầu thủ cũng có thể tác động đến tỷ lệ thành công.
Trong một ví dụ, Sahasrabudhe và Bekkers đã chỉ ra rằng nếu một cầu thủ chạy cánh phải cắt vào trong để nhận đường chuyền trong khi cầu thủ chạy cánh trái quyết định dốc biên, đội phản công sẽ có khả năng câu được phạt đền cao hơn khoảng 4%.
Trong bài báo tổng kết về dự án, Sahasrabudhe và Bekkers đề xuất rằng mạng nơ-ron thần kinh hoàn toàn có thể được phát triển thành một công cụ tương tác cho phép các HLV và chuyên gia phân tích thử nghiệm tỷ lệ phần trăm xung quanh các lựa chọn thay thế chiến thuật cho chính họ.
Dù mỗi tình huống phản công đều khác nhau, cũng như các giải pháp khả thi khó mà khái quát hóa được chi tiết, nhưng máy tính sẽ giúp những người làm nghề dễ dàng hơn trong việc điều chỉnh các bước chạy và vị trí để tối ưu hóa lối chơi của đội bóng.