機率問題 Grok3 v.s. Chatgpt v.s. Gemini v.s. Deepseek

2月 22, 2025

機率問題 Grok3 v.s. Chatgpt v.s. Gemini v.s. Deepseek

cinematic photo still, glamour shot of an anthropomorphic robot with a board written "Deepseek" on the chest, is throwing the dice beside the gambling table, This photo was taken by using Canon EOS R5 camera, presenting stunning details, extremely detail and intricate, ultra fine, photo style of Mika Ninagawa + Topaz Leung + Escher + Édouard Manet + Wong Kar - Wai, inspired by Cowboy bebop + Sailor moon, cinematic lighting, hyper realistic photography, ultra realistic --ar 71:128 --v 6.1 --q 2

深淵求索 - Deepseek 之道列表

===

今天剛好在看機率有關的書, 看到以前費馬和巴斯卡討論點數分配問題（梅雷問題）

機率學

一時興起, 來讓 AI 做看看, 結果令人驚艷, AI 會正確的思考分析判斷, 並且有些思路是我沒有想到過的; 如問題 1,

接著到了近代統計學, 有了常態分佈和標準差觀念, 出了問題2 如下：

===

問題 1：

Ａ和B在一個公平的賭博遊戲中, 各自下注32枚金幣, 並約定誰先贏十場就贏得全部賭注, 但當Ａ贏了八場, B贏了七場後, 突發事件不得不停止遊戲, 請問要如何公平的分配這64枚金幣？

====

Grok3 : 思考了 89 sec. 有用馬爾可夫鏈來解, 厲害！

由於這是一個公平的賭博遊戲，我們假設每一場比賽都是獨立的，且 A 和 B 贏得每場比賽的機率相等，即各為 1/2。遊戲的目標是任一玩家先達到 10 勝，因此在目前狀態下：

A 已贏 8 場，還需贏 2 場 才能達到 10 勝。

B 已贏 7 場，還需贏 3 場 才能達到 10 勝。

遊戲若繼續進行，將持續到 A 再贏 2 場（總計 10 勝）或 B 再贏 3 場（總計 10 勝）為止，勝者將獲得全部 64 枚金幣。既然遊戲已中斷，公平的分配方法應基於 從當前狀態繼續遊戲時，每位玩家贏得全部賭注的機率，並按此比例分配獎金。

機率計算

我們需要計算：

P(A 贏)：從現在起，A 在 B 贏 3 場之前先贏 2 場的機率。

P(B 贏)：從現在起，B 在 A 贏 2 場之前先贏 3 場的機率。

這可以透過馬爾可夫鏈來建模。定義狀態 (x, y)，其中：

x 是 A 在中斷後額外贏得的場次，初始為 0，最多到 2。

y 是 B 在中斷後額外贏得的場次，初始為 0，最多到 3。

遊戲從狀態 (0, 0) 開始，每場比賽：

A 贏，狀態從 (x, y) 變為 (x+1, y)，機率 1/2。

B 贏，狀態從 (x, y) 變為 (x, y+1)，機率 1/2。

遊戲停止的條件（吸收狀態）：

當 x = 2 時（A 再贏 2 場，總計 10 勝），A 贏得遊戲，對應狀態 (2, y) 且 y < 3。

當 y = 3 時（B 再贏 3 場，總計 10 勝），B 贏得遊戲，對應狀態 (x, 3) 且 x < 2。

狀態定義

暫態狀態（遊戲繼續進行）：(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2)。

吸收狀態：
- A 贏：(2, 0), (2, 1), (2, 2)。
- B 贏：(0, 3), (1, 3)。

（註：狀態 (2, 3) 實際上不可達，因為一旦 x = 2 或 y = 3 遊戲即停止，不會同時滿足兩條件。）

機率方程

令 p_{x,y} 為從狀態 (x, y) 開始，A 贏得遊戲（即先到達 x = 2）的機率。則：

吸收狀態邊界條件：
- 若 x = 2（A 贏），p_{2,y} = 1（y = 0, 1, 2）。
- 若 y = 3（B 贏），p_{x,3} = 0（x = 0, 1）。

暫態狀態遞推關係：
- 對於 x < 2 且 y < 3，p_{x,y} = (1/2) p_{x+1,y} + (1/2) p_{x,y+1}。

我們需要計算 p_{0,0}，即從初始狀態 (0, 0) 開始 A 贏的機率。列出所有暫態狀態的方程：

p_{0,0} = (1/2) p_{1,0} + (1/2) p_{0,1}

p_{1,0} = (1/2) p_{2,0} + (1/2) p_{1,1} = (1/2)(1) + (1/2) p_{1,1}

p_{0,1} = (1/2) p_{1,1} + (1/2) p_{0,2}

p_{1,1} = (1/2) p_{2,1} + (1/2) p_{1,2} = (1/2)(1) + (1/2) p_{1,2}

p_{0,2} = (1/2) p_{1,2} + (1/2) p_{0,3} = (1/2) p_{1,2} + (1/2)(0) = (1/2) p_{1,2}

p_{1,2} = (1/2) p_{2,2} + (1/2) p_{1,3} = (1/2)(1) + (1/2)(0) = 1/2

逐步求解

從末端開始：

p_{1,2} = 1/2

p_{0,2} = (1/2) p_{1,2} = (1/2)(1/2) = 1/4

p_{1,1} = (1/2)(1) + (1/2) p_{1,2} = 1/2 + (1/2)(1/2) = 1/2 + 1/4 = 3/4

p_{0,1} = (1/2) p_{1,1} + (1/2) p_{0,2} = (1/2)(3/4) + (1/2)(1/4) = 3/8 + 1/8 = 1/2

p_{1,0} = (1/2)(1) + (1/2) p_{1,1} = 1/2 + (1/2)(3/4) = 1/2 + 3/8 = 7/8

p_{0,0} = (1/2) p_{1,0} + (1/2) p_{0,1} = (1/2)(7/8) + (1/2)(1/2) = 7/16 + 4/16 = 11/16

因此：

P(A 贏) = p_{0,0} = 11/16

P(B 贏) = 1 - P(A 贏) = 1 - 11/16 = 5/16

分配賭注

公平分配應按贏得全部賭注的機率分配 64 枚金幣：

A 應得：64 × (11/16) = 44 枚金幣

B 應得：64 × (5/16) = 20 枚金幣

驗算：44 + 20 = 64，總數正確。

另一種理解

考慮每位玩家的初始賭注（32 枚）加上預期淨收益：

若 A 贏，淨收益 +32；若 B 贏，淨收益 -32。

A 的預期淨收益 = (11/16) × 32 + (5/16) × (-32) = (11/16 - 5/16) × 32 = (6/16) × 32 = 12

A 總共應得 = 32 + 12 = 44

B 總共應得 = 32 - 12 = 20

結果一致，確認分配合理。

結論

因此，公平分配 64 枚金幣的方式是：

A 獲得 44 枚金幣

B 獲得 20 枚金幣

===

Chatgpt :

花了 15 sec. 立刻發現是著名的點數問題, 厲害！

===

Gemini 2.0 Flash

Gemini 回答很快, 但奇怪的是, 他答錯了...

===

離線版 Deepseek R1 (32B)

Deepseek 的思考有點長, 也答對了, 分析的過程蠻令人驚艷; 而且遞迴的方式是我沒有想到的;

最後的 0.6875 = 11/16 來變回分數和整數運算也很不錯

...

＝＝＝＝

問題 2:

假設某保險公司統計顯示，20%的理賠用戶因被盜索賠。隨機抽查100名理賠用戶，求其中因被盜索賠人數在16至24之間的機率為多少？

Grok3 / chatgpt / deekseek 三個答對都是類似, 答對了;

而我在出題時, 忘記了以常態分佈來近似二項分佈的話, 因為二項分布是離散, 正態分布是連續, 需要做一個連續性校正...

Chatgpt :

Deepseek :

>>>

>>> 假設某保險公司統計顯示，20%的理賠用戶因被盜索賠。隨機抽查100名理賠用戶，求其中因被盜索賠人數在16至24之間的機率為多少？

<think>
嗯，这个问题看起来有点复杂，不过我先试着理清楚。首先，有一个保险公司统计显示，20%的理赔用户是因为被盗索赔。现在随机抽查了100名理赔用户，问其中因被盜索賠的人数在16到24之间的概率是多少。

好，首先，这是一个二项分布的问题，因为每个用户是否因被盜索賠是一个独立事件，成功的概率是20%（p=0.2），失败的概率是80%（q=1-p=0.8）。我们抽取了n=100个样本，所以

X~Binomial(n=100, p=0.2)。

我们需要计算的是P(16 ≤ X ≤ 24)，也就是在16到24之间的人数的概率。由于二项分布的参数较大（n=100），我们可以考虑使用正态近似来简化计算，因为直接计算二项分布的概率会比较繁琐。

首先，计算二项分布的期望值μ和方差σ²：
- μ = n * p = 100 * 0.2 = 20
- σ² = n * p * q = 100 * 0.2 * 0.8 = 16
- 因此，标准差σ = √16 = 4

接下来，我们使用正态近似来计算概率。由于二项分布是离散的，而正态分布是连续的，我
们需要进行连续性修正（continuity correction）。也就是说，在计算P(16 ≤ X ≤24)时，我们将X转换为Z分数，并将边界调整为15.5到24.5。

然后，计算Z分数：
- Z₁ = (15.5 - μ) / σ = (15.5 - 20) / 4 = (-4.5)/4 = -1.125
- Z₂ = (24.5 - μ) / σ = (24.5 - 20) / 4 = 4.5/4 = 1.125

接下来，查找标准正态分布表中Z₁和Z₂对应的累积概率：
- P(Z ≤ 1.125) ≈ 0.8693
- P(Z ≤ -1.125) ≈ 0.1292

因此，P(15.5 < X < 24.5) = P(Z ≤ 1.125) - P(Z ≤ -1.125) ≈ 0.8693 - 0.1292 = 0.7401
所以，概率约为74.01%。

不过，为了更准确，我们可以使用二项分布的精确计算方法，但由于n=100较大，手动计算会非常繁琐。因此，正态近似是一个合理的选择，并且结果已经相当接近真实值。

总结一下：
- 期望值μ=20
- 标准差σ=4
- 使用连续性修正后的Z分数范围为(-1.125, 1.125)
- 计算得到的概率约为74.01%

因此，随机抽查100名理赔用户中，因被盜索賠的人数在16到24之间的概率约为74%。
</think>

**答案：**

随机抽查100名理赔用户中，因被盜索賠的人数在16至24之間的概率约为74.01%。

搜尋此網誌

Neoの世界へようこそ

精選文章

Have you ever had a dream that you were so sure was real

機率問題 Grok3 v.s. Chatgpt v.s. Gemini v.s. Deepseek

機率計算

狀態定義

機率方程

逐步求解

分配賭注

另一種理解

結論

問題 2:

留言

張貼留言

熱門文章

IEEE OUI list

魔術方塊網頁模擬器

精選文章

Have you ever had a dream that you were so sure was real

機率問題 Grok3 v.s. Chatgpt v.s. Gemini v.s. Deepseek

機率計算

狀態定義

機率方程

逐步求解

分配賭注

另一種理解

結論

問題 2:

留言

張貼留言

熱門文章

IEEE OUI list

魔術方塊 網頁模擬器

魔術方塊網頁模擬器