7

Câu hỏi của Gelfands  hỏi liệu có số nguyên dương  n  sao cho các chữ số đầu tiên của  j n  cơ sở 10 đều giống nhau cho  j  = 2, 3, 4, Lỗi , 9. (Cảm ơn  @republicofmath đã  chỉ ra vấn đề này.) bài đăng sẽ khám phá câu hỏi của Gelfand thông qua xác suất.

Các bài viết về câu hỏi MathWorld Gelfand cho biết rằng câu trả lời là không cho các giá trị của  n  ít hơn 100.000. Phạm vi đó dường như nhỏ đối với tôi. Trực giác của tôi là bạn cần thử các giá trị lớn hơn của  n  để có cơ hội tìm giải pháp hợp lý.

Vì vậy, giá trị của  n  bạn nên khám phá như thế nào? Để trả lời câu hỏi đó, hãy xem xét chọn  n  một cách ngẫu nhiên. Nếu các chữ số hàng đầu của  j n  được phân phối ngẫu nhiên, cơ hội nào  n  sẽ thỏa mãn câu hỏi của Gelfand? Các chữ số hàng đầu không phải là ngẫu nhiên, nhưng chúng thường có phân phối thường xuyên.

Giả sử các chữ số hàng đầu được phân phối đồng đều trong khoảng từ 1 đến 9 và các chữ số hàng đầu cho mỗi cơ sở là độc lập. Khi đó xác suất của  j n  bắt đầu bằng 1 (hoặc bất kỳ chữ số nào được chọn khác) cho tất cả  j  từ 2 đến 9 sẽ là (1/9) 8 và xác suất của tất cả các chữ số hàng đầu khớp với bất kỳ chữ số nào sẽ lớn hơn 9 lần. Điều đó có nghĩa là xác suất của tất cả các chữ số hàng đầu phù hợp sẽ theo thứ tự 2 × 10 7 , vì vậy chúng ta nên thử theo thứ tự 10 7  hoặc 10 8  giá trị của  n  để có cơ hội tìm thấy một.

Nhưng có một vấn đề với lập luận trên: các chữ số hàng đầu không được phân phối đồng đều. Luật của Benford nói rằng các chữ số hàng đầu thường được phân phối rất không đồng đều. Khi một hệ thống tuân theo luật của Benford, xác suất của một chữ số hàng đầu là  d  là nhật ký 10 (1 + 1 / d ). Một phân phối không đều của các chữ số hàng đầu làm tăng xác suất rằng tất cả các chữ số sẽ khớp. Nếu các chữ số hàng đầu của  j n  tuân theo luật của Benford và độc lập, thì xác suất của tất cả các kết quả khớp là 6,84 × 10 -5 , cao hơn hai bậc so với giả định phân phối đồng đều.

Các chữ số hàng đầu của  j n có  tuân theo luật của Benford không? Có, ít nhất là xấp xỉ, dựa trên các giá trị thử nghiệm của  n  từ 1 đến 1.000.

Bây giờ, giả sử xác suất của giá trị được chọn ngẫu nhiên của  n  thỏa mãn câu hỏi của Gelfand là  p  = 6,84 × 10 -5 . Nếu chúng tôi đã thử 100.000 giá trị ngẫu nhiên của  n , xác suất không có thành công sẽ là khoảng 0,00107. Vì vậy, trực giác của tôi đã sai. Nếu phương pháp phỏng đoán ngẫu nhiên được đưa ra ở đây là chính xác, chúng ta sẽ có cơ hội tốt để xem giải pháp nếu chúng ta thử giá trị  n  lên tới 100.000.

Trường hợp xác suất heuristic đi sai? Trong giả định rằng các phân phối của các chữ số hàng đầu là độc lập.

Đặt  x j  là dãy  j n  cho  n  chạy từ 1 đến 1000. Một số  x j  có tương quan và một số thì không.

Một số tương quan là dễ dàng để xem. Ví dụ: các chuỗi cho  x 2  và  x 4  có tương quan 0.493. Đó là bởi vì 4 n  = (2 n ) 2 . Vì vậy, nếu bạn biết chữ số đầu tiên là 2 n , bạn thường có thể đoán chữ số đầu tiên là 4 n . Xét về điều này, không có gì đáng ngạc nhiên khi  x 2  cũng tương quan với  x 8 và  x 3  tương quan với  x 9 .

Bạn có thể suy đoán rằng  x j  và  x k  không tương quan khi và chỉ khi  j  và  k  tương đối nguyên tố. Một số trình tự, chẳng hạn như  x 2  và  x 3  hỗ trợ đoán đó. Nhưng  x 4  và  x 5  có mối tương quan ngược chiều,  r  = -0.433, vì những lý do không rõ ràng. Tôi nghi ngờ rằng các mối tương quan tiêu cực là chìa khóa để hiểu câu hỏi.

***

Cập nhật : Tôi đã xác minh rằng câu trả lời cho câu hỏi Gelfand là không cho  n  lên đến 10 9 .

|