Quod Erat Demonstrandum

2010/01/01

俄羅斯方塊帶給我們的生命教育…

Filed under: Additional / Applied Mathematics,HKALE — johnmayhk @ 12:38 上午
Tags:

這不過是一幅開玩笑的圖,認真便輸了!它算不算「梅菲定律」的一個例子?不知道(儘管我是梅菲定律的受害者)。偶爾傳來類似的「新聞」:某某多年購買同一注彩票(如六合彩),但某次因某偶然的原因沒有購買,結果「天意弄人」,那注正就是該期的頭獎號碼!直觀地,這類事件發生的機會極低,但卻真的發生了,且「不止一次」。

不難理解一個事實:「某事件(可測集)發生的機會率(概率)是零(零測度),它仍有可能發生」,何況是機會率低的事件?這裡是一宗舊聞:

保加利亞2次攪珠相同鬧做馬

(明報)2009年9月18日 星期五 05:05

【明報專訊】保加利亞的國營六合彩,竟然在5天之內兩度開出完全相同的中獎號碼,鬧出「做馬」爭議,負責該國博彩事務的體育部長周三下令徹查。保加利亞官員昨聲稱,調查員認為,「沒有證據」顯示今次攪珠結果有作弊或人為操控,堅稱純屬巧合。

6個中獎號碼4、15、23、24、35和42,首先於9月6日開出,無人中獎。到9月10日再次攪珠,竟又是同一組號碼,而最離奇的是,竟然有人「未卜先知」,在機會極微下,選擇「冧莊」再買同一組號碼,結果這次六合彩頭獎共有18注中,每人派彩10,164保加利亞元(近6萬港元)。到9月13日的攪珠,其中3個數字又再出現。博彩機構否認人為操控,表示兩次攪珠得出的號碼,先後次序都不同,而且全程獲特別委員會現場監控兼由電視直播。當地數學家指出,中獎號碼連續重複出現的比率僅為420萬分之一,儘管這不代表不可能出現。

法新社

資料來源
http://hk.news.yahoo.com/article/090917/4/e9y7.html

不知道保加利亞的情況,若以香港六合彩 49 個數字「攪出」 6 個,假設各期互相獨立,則不用數學家,以古典機率的觀點,普通一個高中學生也能算出:中獎號碼連續重複出現的概率為 1/C_{6}^{49},約為一千四百萬分之一。如果問某注,比如報導中的「4, 15, 23, 24, 35, 42」,連續出現兩次的概率則為 (1/C_{6}^{49})^2

這類極低機會發生的事件,人們偏向相信事件是「造馬」多於「巧合」,但「馬」如何具體地「造」?卻不易解釋。還記得今年九月初,(所謂)幻術師 Derren Brown,在彩票開彩前,成功「估中」6個中獎號碼的那宗事件嗎?去片:

http://www.youtube.com/watch?v=cHZ2mQczkcg

大家相信事件是「巧合」還是「造馬」?深入看看 YouTube 相關的影片,或許你也比較偏向相信那不過是「鏡頭把戲」。

說回保加利亞彩票,這裡有一段引述:

「保加利亞的數學家估計連續兩期獎號完全一致的概率只有1/4200000,這個數字也被各國媒體在報道中廣泛引用。但澳大利亞雪梨大學的數學家克裏·奧斯維爾得出的結論為1/14000000,還有一些數學家認為此概率為1/5200000。」

摘自
http://big5.china.com.cn/sport/txt/2009-09/26/content_18605262.htm

當中落差,教人摸不著頭腦,希望有高人解釋一下他們的算法。我們也明白,媒體有時對比較專門的報導,難以精確,但切忌報導明顯錯誤,比如以下的引述:

「買彩票也是這樣,不買永遠不會中獎,只要你買了,就有中獎和不中獎兩種可能,而兩者的概率一樣,都是50%。」

摘自
http://www.gdlottery.cn:8080/html/bamianlaifeng/20090922/21574.html

這正是我教授概率時「必攪的 Gag」。

這個「一係中,一係唔中,所以中的機會是 50%」的謬誤,較易被說服;但有些謬誤,對某些人,特別是「賭徒」,未必容易改正:

「嘩,連開 9 鋪都係大,今鋪仲唔係開細?」
「嘩,連開 9 鋪都係大,今鋪梗係開大啦!」
「嘩,連開 9 鋪都係大,今鋪開細/開大的機會好大/小。」

這裡就是假設了之前 9 鋪的結果會影響第 10 鋪,這假設合理嗎?「正常」情況,骰子「沒有記憶」,之前的結果應不會影響往後的結果,每次都是獨立事件似乎比較合理。但在賭桌上,人未必能完全順服理性。

「想擲次銀仔 10 次,已經擲左 5 次公;因為擲公或字o既機會一半半,之後將會出現 5 次字。」
「o拿,呢件事成功率係 5 分 1,你之前果 4 個人都失敗o左,咁而家你係第 5 個,咪一定成功囉。」

憑經驗,不難覺察上述說法的問題:對概率的理解有偏差。擲一枚公平硬幣得到公的機會是 1/2,並非說「擲 2 次一定有 1 次公,擲 10 次一定有 5 次公云云」。成功率係 5 分 1(可能是主觀機率)也不是代表「5 次試驗必有一次成功」。

對上述說法,同學未必會犯,但以下陳述,你又怎看?

「擲一枚公平硬幣愈多次,得出『公字各半』的機會愈來愈大。」
「擲一枚公平硬幣愈多次,得出公的比例愈來愈接近 1/2。」

正確嗎?

= = = 停一停,想一想 = = =

考慮一枚公平硬幣,被擲 2n 次,得 n 個公的機會率 = \frac{n(E)}{n(S)} = \frac{_{2n}C_{n}}{2^{2n}}, n = 1 至 10 的情況表列如下:

觀察表中最後一欄,當 n 增加,得 n 個公的機會率似乎愈來愈小。那麼

「擲一枚公平硬幣愈多次,得出公的比例(即頻率機率/實驗機率)是否愈來愈接近 1/2?」

如果以古典機率/理論機率算一算,\lim_{n \rightarrow \infty}\frac{_{2n}C_n}{2^{2n}} 是什麼?是 1/2 嗎?

利用 Stirling 公式,對大數值 n,我們有 n! \approx \sqrt{2\pi n}(\frac{n}{e})^n(非常粗略的寫法,見諒),那麼

\frac{_{2n}C_n}{2^{2n}}
= \frac{(2n)!}{(n!)^22^{2n}}
\approx \frac{\sqrt{2\pi(2n)}(2n/e)^{2n}}{2\pi n(n/e)^{2n}2^{2n}}
= \frac{1}{\sqrt{\pi n}}\frac{(2n/e)^{2n}}{(2n/e)^{2n}}
= \frac{1}{\sqrt{\pi n}}
\rightarrow 0 當 n \rightarrow \infty

\lim_{n \rightarrow \infty}\frac{_{2n}C_n}{2^{2n}} 是零,並非 1/2。

即是說,理論上,擲硬幣的次數愈多,得到「公字各半」的機會就愈低。但實際上呢?

= = = 下次再談 = = =

4 則迴響 »

  1. 「買彩票也是這樣,不買永遠不會中獎,只要你買了,就有中獎和不中獎兩種可能,而兩者的概率一樣,都是50%。」
    以上其實也是一個槪率model, 只不過是一個完全不合理的….當然, 如果我們對該彩票的詳細情況一無所知時, 我們大槪只能用上述model
    說到底, 有不少probability modelling都只是在用一種較容易計算的方法去描述某系統. 如擲銀仔, 如果我們知道所有物理因素, 物理學家應該可以計算出每次擲出來的結果, 我們用槪率去描述, 只是方便計算而矣

    至於文中所述槪率, 我找不到他們的計算方法, 但那差別有可能是由於他們基於不同的probability interpretations去計算. 除了中學所學的classical school外, 還有frequency school和subjective school
    frequency school 是指當一個實驗重複接近無限次時, 該實驗的結果趨向實際(抽象)的"真實"槪率, 和中學的relative frequency有點關係
    subjective school(Bayesian) 是指槪率是主觀的. 每個人對某實驗的知識都不同, 因此他們所assign的pdf (/pmf) 都有所分別, 在計算上, Bayesians要考慮那些主觀上的問題 (prior probabilities)

    注意: 以上均是去年所學, 未必完全正確

    John sir, it’s about the public lecture “Wishart, Wagner and Weather – Eigenvalues
    in Statistics and beyond" in CUHK. I’ve sent that short report to you. But due to the difficulty and my ignorance, I hardly understand the whole lecture. As a result the report is somehow a “blow-water" thing. I am, however, quite certain that this lecture was NEVER a public one. If you just pick one person in the street, he probably could understand not more than 10% of the whole thing. (And for your reference, I heard that a prof in the STA dept had said “我都唔知佢講乜" just after the talk)

    For what I have heard, the whole thing is regarding the estimation of multivariate parameters. The use of eigenvalues is to transform the data matrix into a diagonal one so that the computation can be easily done. Meanwhile, the interaction terms (i.e. xy, xy^2, etc.) are eliminated.

    迴響 由 Fred — 2010/01/01 @ 2:07 上午 | 回覆

    • Fred,非常感謝你出席座談會後,也肯寫一寫報告。這也是我常常想做的事,只是現在無心無力。老師叫學生做讀書報告、音樂會後報告云云,但老師自己又寫什麼報告(指的是對學生有益的報告,不是為 X 而 X 那些)?數學在生物學的應用確實是有趣,感謝 Fred 略略帶出。「我都唔知佢講乜」也是我已往出席座談會(或網上那些)的感覺。

      >「買彩票也是這樣,不買永遠不會中獎,只要你買了,就有中獎和不中獎兩種可能,而兩者的概率一樣,都是50%。」以上其實也是一個槪率model…所以我說那說法有「明顯錯誤」其實錯的應該是我。我沒有學過概率論,對古典機率、頻率機率、主觀機率和形式機率也沒有深入了解,閱讀有關「強大數法則的證明」已力不從心,但總希望可以認真研究一下。

      迴響 由 johnmayhk — 2010/01/01 @ 6:09 下午 | 回覆

  2. [SBA] 先閱讀以下報導

    「機率只有百萬分之9!3年生2元旦寶寶」

    http://www.nownews.com/2010/01/02/91-2553741.htm

    文中稱「醫生說這樣的機率只有百萬分之9」,你同意嗎?試解釋。

    迴響 由 johnmayhk — 2010/01/03 @ 5:07 下午 | 回覆

  3. 這類問題很有趣,照理來說應該不會越擲得多銀,出現公的機會就會越低
    為什麼計算結果會這樣我不太肯定,但我想可能是因為阿sir你在計算中只考慮到必定擲到n次的機率,實際上只是「機率分佈會集中於擲出n次」
    我只是猜測而已,很期待答案

    至於阿sir你那篇「醫生說這樣的機率只有百萬分之9」,我不會質疑醫生在說謊,但取得這個數字的方法有很多種,首先不知道醫生取了多少年、多少人、什麼人的數據來計算,那份新聞不說清楚計算出這個數字的方法的話很難令人信服
    其實新聞不時都有類似這些機率的報導,出現在廣告那些才令人討厭,簡直是欺詐觀眾,例如現在都有播的清熱X廣告,聲稱有80%受訪者會用清熱X不用喉糖,又例如某某牙膏廣告,有99%牙醫推薦……我真係信佢呀!XP

    迴響 由 Sit King Lok — 2010/02/08 @ 1:43 上午 | 回覆


RSS feed for comments on this post. TrackBack URI

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s

在WordPress.com寫網誌.

%d 位部落客按了讚: