4

Ai không thích cờ vua? Tôi! Chắc chắn, tôi thích ý tưởng về cờ vua - những kẻ chủ mưu trí tuệ chiến đấu với nhau không sử dụng gì ngoài suy nghĩ thuần túy - vấn đề là tôi có xu hướng thua, có lẽ vì tôi không thực sự biết chơi tốt và vì tôi không bao giờ luyện tập. Tôi biết một điều: Các phần khác nhau có giá trị bao nhiêu, giá trị điểm của chúng :

Đây là một trong những điều đầu tiên tôi học được khi tôi được cha dạy cờ vua. Ví dụ, với các giá trị điểm này, sẽ có giá trị khi có một hiệp sĩ trên bảng như có ba con tốt, chẳng hạn. Vậy những giá trị này đến từ đâu? Các giá trị điểm không thực sự là một phần của các quy tắc cho cờ vua, mà chỉ được sử dụng như một hướng dẫn khi giao dịch, và chúng dường như được dựa trên phán đoán chuyên môn của các cơ quan cờ vua. (Theo người bảo vệ sự thật, có nhiều cách định giá thay thế , tất cả trong cùng một sân bóng như trên.) Như tôi mới biết rằng điều rất quan trọng là có thể viết Dữ liệu lớn trên CV của bạn, tôi quyết định xem liệu những giá trị điểm này có có thể được lấy ra bằng cách sử dụng phán đoán chuyên gia bằng không ủng hộ số lượng lớn dữ liệu trò chơi cờ vua.

Phương pháp

Làm cách nào để phân bổ giá trị điểm cho quân cờ chỉ sử dụng dữ liệu? Một cách để làm điều này là tính toán các giá trị dự đoán của các quân cờ. Đó là, cho rằng chúng ta chỉ biết số quân cờ hiện tại trong một ván cờ và sử dụng thông tin đó để dự đoán kết quả của trò chơi đó, mỗi loại quân cờ đóng góp bao nhiêu cho dự đoán? Chúng tôi cần một mô hình để dự đoán kết quả của các trò chơi cờ vua, nơi chúng tôi có các hạn chế sau:

  1. Mỗi loại quân cờ có một giá trị điểm duy nhất đóng góp trực tiếp vào kết quả dự đoán của trò chơi, do đó không có hiệu ứng tương tác giữa các quân cờ.
  2. Giá trị của một mảnh không thay đổi trong suốt quá trình của trò chơi.
  3. Sử dụng không có bối cảnh và cũng không có thông tin vị trí.

Bây giờ những hạn chế này có thể cảm thấy một chút hạn chế , đặc biệt là nếu chúng ta thực sự muốn dự đoán kết quả của các trò chơi cờ vua tốt nhất có thể, nhưng chúng xuất phát từ đó các giá trị điểm ban đầu tuân theo các hạn chế tương tự. Vì các giá trị điểm ban đầu không thay đổi theo ngữ cảnh, chúng ta cũng không nên. Bây giờ, như đồng nghiệp của tôi Can Kabadayi (có ELO trên 2000) nhận xét: Cốt Nhưng bối cảnh là tất cả trong Cờ vua! Tuyệt đối, nhưng tôi không cố gắng làm bất cứ điều gì sâu sắc ở đây, đây chỉ là một bài tập thú vị!

Với các hạn chế, có một mô hình rõ ràng: Hồi quy logistic, mô hình thống kê vanilla tính toán xác suất của sự kiện nhị phân, giống như thua lỗ. Để có được nó, tôi cần dữ liệu và bộ dữ liệu lớn nhất mà tôi có thể tìm thấy là Million Base 2.2 chứa hơn 2,2 triệu trò chơi cờ vua. Tôi đã phải thực hiện một số lượng lớn dữ liệu để chuyển nó thành định dạng mà tôi có thể làm việc, nhưng kết quả cuối cùng là một bảng có rất nhiều hàng trông như thế này:

1
2
pawn_diff rook_diff knight_diff bishop_diff queen_diff white_win 
    1         0           1         -1           0       TRUE


Ở đây, mỗi hàng là từ một vị trí trong trò chơi trong đó số dương có nghĩa là Trắng có nhiều phần hơn. Đối với vị trí trên màu trắng có thêm một con tốt và hiệp sĩ, nhưng một vị giám mục ít hơn Đen. Cuối cùng trong mỗi hàng, chúng ta sẽ biết liệu Trắng thắng hay thua cuối cùng, vì hồi quy logistic giả định kết quả nhị phân tôi đã loại bỏ tất cả các trò chơi kết thúc với tỷ số hòa. Rất tiếc là tôi sẽ không có vẻ tốt vì tôi chưa bao giờ thực sự giải quyết tốt vấn đề Dữ liệu lớn. Hai triệu trò chơi cờ vua là rất nhiều trò chơi và phải mất một ngày, chiếc máy tính xách tay cũ kỹ của tôi mất hơn một ngày để xử lý chỉ 100.000 trò chơi đầu tiên. Sau đó, tôi gặp vấn đề về Dữ liệu lớn cổ điển mà tôi không thể phù hợp với tất cả vào bộ nhớ làm việc, vì vậy tôi chỉ cần vứt bỏ dữ liệu cho đến khi hoạt động. Tuy nhiên, để phân tích, tôi đã kết thúc bằng cách sử dụng mẫu 1.000.000 vị trí cờ từ 100.000 trò chơi đầu tiên trong Million Base 2.2.

Kết quả

Sử dụng ngôn ngữ thống kê R , trước tiên tôi đã trang bị mô hình logistic sau bằng khả năng tối đa (ở đây được mô tả bằng ngôn ngữ công thức của R):


1
white_win ~ 1 + pawn_diff + knight_diff + bishop_diff + rook_diff + queen_diff


Điều này dẫn đến các giá trị mảnh sau:

Ba điều cần lưu ý: (1) Ngoài các giá trị mảnh, mô hình cũng bao gồm một hệ số cho lợi thế đi trước, được gọi là lợi thế của White ở trên. (2) Các giá trị mảnh dự đoán xếp các mảnh theo thứ tự giống như các giá trị mảnh ban đầu. (3) Các giá trị mảnh được đưa ra theo tỷ lệ cược log , có thể hơi khó diễn giải nhưng điều đó có thể dễ dàng chuyển thành xác suất như biểu đồ này hiển thị:

Ở đây, lợi thế của White chuyển đến 56% cơ hội chiến thắng của White (mọi thứ khác đều bằng nhau), là hai hiệp sĩ và một tay đua phía trước nhưng một con tốt phía sau mang lại 92% cơ hội chiến thắng, trong khi một nữ hoàng phía sau chỉ có 8% cơ hội chiến thắng . Mặc dù tỷ lệ cược log rất hữu ích nếu bạn muốn tính toán xác suất, các giá trị mảnh ban đầu không được đưa ra trong tỷ lệ cược log, thay vào đó chúng được đặt tương đối với giá trị của một con tốt được cố định ở mức 1.0. Hãy chia tỷ lệ cược log của chúng tôi để con tốt được cho giá trị mảnh là 1.0:

Bây giờ chúng ta thấy rằng, trong khi xếp hạng gần giống nhau, tỷ lệ được nén so với các giá trị mảnh ban đầu. Một nữ hoàng thường được coi là có giá trị gấp chín lần so với một con tốt, nhưng khi dự đoán kết quả của một trò chơi, một lợi thế của nữ hoàng được tính giống như chỉ có một lợi thế cầm đồ bốn. Một điều thứ hai cần chú ý là các giám mục có giá trị cao hơn một chút so với các hiệp sĩ. Nếu bạn xem trang Wiki về giá trị tương đối của quân cờ, bạn sẽ thấy rằng một số giá trị thay thế có giá trị của giám mục cao hơn một chút so với hiệp sĩ, những người khác sẽ thêm ½ điểm cho một cặp giám mục hoàn chỉnh. Chúng ta có thể thêm nó vào mô hình!


1
white_win ~ 1 + pawn_diff + knight_diff + bishop_diff + rook_diff + queen_diff + bishop_pair_diff

Bây giờ với một cặp giám mục nhận được giá trị riêng của họ, các giá trị của một hiệp sĩ và một giám mục duy nhất gần bằng nhau. Vẫn còn những bí ẩn của người Viking về việc định giá thấp tất cả các mảnh so với con tốt. (Điều này thực sự không phải là một bí ẩn vì không có lý do tại sao các giá trị mảnh dự đoán nhất thiết phải giống với các giá trị mảnh ban đầu). Thay vì neo giá trị của một con tốt lên 1.0, chúng ta có thể neo giá trị của một mảnh khác vào giá trị mảnh ban đầu của nó. Hãy neo hiệp sĩ lên 3.0:

Bây giờ giá trị của các mảnh (không bao gồm cầm đồ) xếp hàng rất độc đáo với các giá trị mảnh ban đầu! Vì vậy, khi tôi không thực sự chơi cờ, tôi không biết tại sao lợi thế cầm đồ lại là một yếu tố dự đoán chiến thắng mạnh mẽ như vậy (so với các giá trị quân cờ ban đầu, đó là). Đồng nghiệp của tôi Can Kabadayi (anh chàng ELO> 2000!) Đã nói như sau:

Trong một trò chơi cao cấp, những con tốt có thể có giá trị hơn - chúng thường là yếu tố quyết định kết quả - người ta thậm chí có thể nói rằng toàn bộ kế hoạch của trò chơi giữa là nhai một con tốt ở đâu đó và sau đó chuyển đổi nó trong trò chơi cuối cùng bằng cách trao đổi các mảnh, do đó làm tăng giá trị của cầm đồ. Các trò chơi Grandmaster có xu hướng đi đến một trò chơi tân binh, trong đó cả hai bên đều có một tân binh nhưng một bên có thêm một con tốt. Không dễ để chuyển đổi các vị trí này thành một chiến thắng, nhưng bạn thấy ý tưởng chung. Một con tốt đã qua (một con tốt không có bất kỳ kẻ thù nào ngăn chặn cuộc diễu hành của nó để trở thành nữ hoàng) cũng là một tài sản quan trọng trong cờ vua, vì chúng là mối đe dọa liên tục để trở thành nữ hoàng.

Cũng có thể đưa cho tôi hai trích dẫn từ cờ vua huyền thoại Grandmasters Jose CapTHER và Paul Keres liên quan đến giá trị của những con tốt:

Chiến thắng của một con tốt trong số những người chơi giỏi thậm chí có sức mạnh thường có nghĩa là chiến thắng của trò chơi. - Jose Cap hiếu

Càng lớn tuổi, tôi càng coi trọng những con tốt. - Paul Keres

Một lưu ý khác là các giá trị mảnh dự đoán có thể trông rất khác nếu tôi sử dụng một tập dữ liệu khác. Ví dụ: những người chơi trong bộ dữ liệu hiện tại đều rất giỏi, có ELO trung bình là 2400 và với 95% người chơi có ELO trong khoảng từ 2145 đến 2660. Tuy nhiên, tôi nghĩ thật tuyệt khi các giá trị mảnh dự đoán khớp với bản gốc giá trị mảnh cũng như họ đã làm!

Bài đăng này ban đầu xuất hiện trên blog của Rasmus Baath có tiêu đề "Công cụ có thể xuất bản." Nó được xuất bản theo Giấy phép Quốc tế Creative Commons Attribution 4.0 . Định dạng đã được thực hiện phù hợp hơn cho DZone.

|