[爆卦]班佛定律例子是什麼？優點缺點精華區懶人包

為什麼這篇班佛定律例子鄉民發文收入到精華區：因為在班佛定律例子這個討論話題中，有許多相關的文章在討論，這篇最有參考價值！作者su31tak (su31tak)看板ask-why標題Re: [請益] 班佛定律至少要有300...

作者su31tak (su31tak)

看板ask-why

標題Re: [請益] 班佛定律至少要有3000樣本數是怎麼算的？

時間Wed Nov 10 00:07:36 2021

※ 引述《souldragon (依法不依人)》之銘言：
: 班佛定律老實說很冷門我看了1,20本經濟或統計的書也沒啥人引用過
: 有人說可以用來檢驗選舉或帳目有無人為篡改條件是隨機資料要有3000筆以上
: 隨機資料和隨機抽樣意思差不多就是不能有外部人為干預下自然產生的結果
: 比如統計樣本至少要有1068才能反應母體那3000這數字是怎麼得出來的？
: 若有這限制也無法用來檢驗選舉作票因為每投票所的人口不到3000
: 通常都在2000以下投票率七成則在1500以下數據永遠不到3000筆
: 至少每個投票所母數要有5000 投票率六成以上才能符合門檻值
: 樣本數量根本未達標還有人用這理論在檢驗不是很奇怪??

這定律原意是
當有很多筆數據時，1開頭的數據會佔個三成左右，2345依次遞減
那，一坨數據裡面要有接近什麼%數的1開頭這種事，需要的是這坨數據夠大坨
而不是這坨數據裡面每個資料值都超過3000

舉帳目造假的例子來說
是賣場要有3000筆以上的銷售資料才能用它來驗算
而不是3000元以上的帳單才能應用這個定律

~~
但這個定律除了數據要夠大坨之外，數據的跨度也要夠大才適用

一樣用帳目造假為例
如果大賣場的結帳金額跨度從幾十塊到上萬塊（兩個零到四個零），
那麼一百多/一千多/一萬多佔比高是符合定律描述的

但一個平價便當店，跨度才從五十塊到幾百塊（一個零到兩個零）
那麼5678開頭的結帳單比1開頭的多也不是什麼奇怪事

另一種情形是數據的產出本身就有刻意控制範圍
假設一開始為了平均投票所負擔而故意讓各票所間的選民數在一定範圍內
那麼看首數很顯然的也沒有太大意義

~~
回到選舉造假的問題，
從維基百科附的新聞連結來看，當初抓舞弊的不是首數而是末兩位數
（雖然我不確定看尾數還算不算班佛定律，人家是看首數，不過不管啦...）
此時理論上就是全隨機了
幾千幾百幾十「七」和幾萬幾千幾百幾十「三」的機率應該都是10%
幾千幾百「八十九」和幾萬幾千幾百「六十四」的機率也應該都是1%

但，人類在亂掰數字時很常不小心有偏好
在伊朗的某場選舉之中，一百多個數據裡7結尾的票所有17%，5結尾的只有4%
（相較之下美國每次投票看尾數，都不會有14%以上或6%以下的特定尾數）
統計上出現這麼大偏差的機率只有4%

另一個檢查方式是看末兩位是否相鄰（37/29算不相鄰，21/22/23算有相鄰）
人類亂掰兩位數也很容易有偏好，理論值是七成不相鄰
但上面那場伊朗選舉只有62%，看起來大概也是掰出來的可能性比較大

綜上兩點，任何一場正常選舉產出上面那個結果的可能性只有 1/200
加上當選人在反對派強勢地區的票數也高的不合理
大概就是有造假無誤了

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.136.190.152 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/ask-why/M.1636474062.A.5FC.html

→ su31tak: 啊，回到標題，3000這個數在wiki上面被打citation needed 11/10 00:08

→ su31tak: 也沒查到三千哪來的就是了 11/10 00:08

→ xiaoa: 你們是在雞同鴨講嗎？我看他都誤解自己的問題了，你還指點 11/12 20:06

→ xiaoa: 得津津有味 11/12 20:06

→ souldragon: 樓上誤解的是你吧亂入王 11/12 22:46

→ souldragon: 這理論完全沒解釋 "樣本數下限" 和 "數據範圍得多大" 11/12 22:55

→ souldragon: 3000這數字你知道怎麼來的？說得自己好像很懂秀一下 11/12 22:56

→ xiaoa: 概率性的統計，通常會希望positive result和negative resul 11/13 14:35

→ xiaoa: t都發生最少7~8次，統計的信賴區間才會夠小。但是夠小本身 11/13 14:35

→ xiaoa: 就是個模糊概念，有些人做出只有4~5次，他也照樣可以發pape 11/13 14:35

→ xiaoa: r。只不過信賴區間比較大、統計的準確性比較低，paper的威 11/13 14:35

→ xiaoa: 信度也就比較低。舉例來說，投硬幣就要頭花各出現7~8次， 11/13 14:35

→ xiaoa: 那麼大約就需要投20次，或最少需要投15次。要降低次數，擴 11/13 14:35

→ xiaoa: 大信賴區間、降低數據的可靠性，只丟10次也可以。如果是萬 11/13 14:35

→ xiaoa: 分之一發生的概率，那就需要做7~8萬次左右的抽樣。班佛定 11/13 14:35

→ xiaoa: 律比較複雜，它不是二元的概率分布，但將之簡化成1和非1， 11/13 14:35

→ xiaoa: 也是可以。那麼概率就是大約3成。大概數據只要25~30筆就差 11/13 14:35

→ xiaoa: 不多了。我昨天隨便Google了一下，也就說需要50筆左右。也 11/13 14:35

→ xiaoa: 就兩倍於我的推論。後來我想了想如果把2、3也考慮進去，要 11/13 14:35

→ xiaoa: 求抽樣50確實就合理(抽樣出123的概率，才能看出班佛定律的 11/13 14:36

→ xiaoa: 趨勢嘛)。至於跨度，配合pansci那篇文章裡有一張取了log後 11/13 14:36

→ xiaoa: ，粉紅色區間寬度都變得一樣的圖，會比較好理解。它就表現 11/13 14:36

→ xiaoa: 出1和非1的數據分佈跨度，而且是標準化的(每個顏色間隔都固 11/13 14:36

→ xiaoa: 定)。我現在想不到對應的數學理論或模型。但是同樣用概率 11/13 14:36

→ xiaoa: 來說，我們從前面0開始，走到數據的後段x，會經歷過多少次< 11/13 14:36

→ xiaoa: 1>的區間。假設同樣要求經過<1>的次數也是7~8次。那麼就是 11/13 14:36

→ xiaoa: 從0到8。那就是10^0到10^8這樣的跨度。好像有點大，可能10^ 11/13 14:36

→ xiaoa: 0到10^5就差不多了。總之，我只是用最簡單的概率模型2項分 11/13 14:36

→ xiaoa: 佈硬套在班佛定律身上推算的，肯定不準確，但是其中的數學 11/13 14:36

→ xiaoa: 邏輯是比較接近的，所以推算的結果不會差得太遠。如果你深 11/13 14:36

→ xiaoa: 入研究有關班佛定律的數學模型，肯定可以算出指定的信賴區 11/13 14:36

→ xiaoa: 間、統計檢定範圍內，需要的樣本數和數據跨度是多少。 11/13 14:36

→ xiaoa: 簡單了說吧，最最最簡陋的統計要求要3筆數據，才能定算出 11/13 14:52

→ xiaoa: 有意義的平均值。為什麼要3筆，背後的邏輯就是要算出平均 11/13 14:53

→ xiaoa: 值。那麼，要做出統計檢定p數值接近0.05需要多少樣本？p=0. 11/13 14:53

→ xiaoa: 005又是多少樣本。這需要把統計模型丟進另一個統計模型去 11/13 14:53

→ xiaoa: 推算。而這，已經有人做過了。所以他會告訴你，大約多少個 11/13 14:53

→ xiaoa: 樣本數，你大概率(95%? 99.5%? 99.95%?)可以得到p<=0.05或0 11/13 14:53

→ xiaoa: .005或0.0005。這就是其背後的邏輯。樣本跨度也可以有自己 11/13 14:53

→ xiaoa: 的模型，同樣是大概率(95%? 99.5%?)，讓數據體現出其自然 11/13 14:53

→ xiaoa: 的樣貌。 11/13 14:53

→ xiaoa: 還有你的臭嘴，最好給我道歉 11/13 14:53

[爆卦]班佛定律例子是什麼？優點缺點精華區懶人包

為什麼這篇班佛定律例子鄉民發文收入到精華區：因為在班佛定律例子這個討論話題中，有許多相關的文章在討論，這篇最有參考價值！作者su31tak (su31tak)看板ask-why標題Re: [請益] 班佛定律至少要有300...

你可能也想看看

搜尋相關網站

#1這世界不隨機！談班佛定律（Benford's Law - Medium

#2假帳殺手一號：班佛定律 - 破弊修煉手冊

#3第208 話：「頭文字一」的秘密—班佛定律（Podcast 已上線）

#4一的力量：如何利用「班佛定律」偵破數字詐欺？ - 關鍵評論

#5不要相信你的直覺- PanSci 泛科學

#6班佛定律 - 科學Online

#7班佛定律- 維基百科，自由的百科全書

#8拜登得票數不符合「班佛定律」所以是作票？ - 報橘

#9Benford's Law 班佛定律 - PonnyFrank

#10如何讓鑑識會計人員使用班佛定律來偵查舞弊事件

#11世界其實不完全隨機，「規則總有例外」 - 班佛定律（Benford's ...

#12一眼看穿數字造假「班佛定律」解謎(組圖) - 看中国

#13公司治理專題之一- 般佛定律與「人造數字」偵測

#14學校沒教的邏輯課：發現八卦、婚姻、網拍背後的定理>內容連載

#15[請益] 班佛定律至少要有3000樣本數是怎麼算的？ - 看板ask-why

#16「本福德定律」驗證中共疫情數據造假

#17‪#‎班佛定律‬ - Explore | Facebook

#18如何識別資料造假？用班佛定律檢驗一下 - VITO雜誌

#19舞弊鑑識電腦稽核系列–行員盜用久未往來帳戶+運用班佛定律 ...

#20黃金比例0.618的秘密- kurich 的網誌- udn部落格

#21[問卦] 所以其實賓州票數真的可能有造假？ - Gossiping板

#22直觀顯示班佛定律 - Tableau Help

#23[美國大選]4chan有人用「班佛定律」解釋拜登得票有好大嫌疑

#24班佛定律

#25Page 43 - 1090325小論文

#26時報悅讀:劉炯朗不一樣的邏輯課【全二冊】(1VY0062)

#27學校基本資料表 - 新興高中！

#28為什麼出布容易贏？從球賽、股市到選擇題，在未知中輕鬆致勝 ...

#29Benford分析法需求 - 百度文库

#30Re: [請益] 班佛定律至少要有3000樣本數是怎麼算的？

#31從骰子遊戲到AlphaGo: 擲硬幣、AI圍棋、俄羅斯輪盤, 生活中 ...

#32超展開數學教室(佳作獎

#33劉炯朗不一樣的邏輯課套書（共二冊） - 三民網路書店

#34為什麼你不是富人而是窮光蛋？ 羅傑斯：金融市場恐動盪數年 ...

#35否極未必泰來| 劉曙輝- 灼見名家

#36不要相信你的直覺 - 數學教師知識庫

#372019 年IIA 國際內部稽核研討會

#38墨菲定律 - MBA智库百科

#39誰說樂透不會中兩次？ - 今周刊

#40懶人圖解統計學：統整複雜數據，看穿大數據背後真相

#41質數的新模式與Riemann zeta zeros - Only Perception

#42運用資料分析輔助內部稽核實務

#43最新趨勢觀測站- 班佛定律的推薦與評價，FACEBOOK、PTT

#44是放大人性的機率遊戲：善用數理邏輯解鎖投資心理戰

#45從骰子遊戲到AlphaGo：擲硬幣、AI圍棋、俄羅斯輪盤

#46[達人專欄] 數學與生活的連結！—《超展開數學教室》心得

#47自願性資訊揭露與強制性資訊揭露之盈餘管理

#48Mathematics Wonderland

#49學校沒教的邏輯課：發現八卦、婚姻、網拍背後的定理 - 樂天市場

#50附錄三 - CIRN-十二年國教課程綱要

#51錯誤定律2023-精選在臉書/Facebook/Dcard上的焦點新聞和 ...

#52劉炯朗不一樣的邏輯課【全二冊】 | 蝦皮購物

#53笑話集錦

#54科學記號與10的冪次 - 國家教育研究院

#55圓周率的故事

#56台灣糖業股份有限公司111 年度產學合作班新進工員甄試試題

#57普通高級中學體育班課程綱要總綱 - 教育部主管法規查詢系統

#58看插畫也能學化學／張庭婷、周金城 - 臺灣化學教育

#59新竹市立成德高級中學108學年度第一學期教師公開授課教學 ...

#60歷年名言佳句 - 國立暨南國際大學圖書館

#6107淨空法師學佛答問61-70

#62數學經驗的敘事美學：以歐拉算式為例~(二)

#63基隆市立中山高中109學年度第一學期第一次段考高一仁班化學科

#64林岳数

#65談統計素養

#66吳文成老師：黃金比例：數學、藝術到大自然的瑰寶

#67[問題] 亞佛加厥數的由來- 看板Physics. 阿伏伽德罗常数单位

#68高中化學｜倍比定律 - YouTube

#69中台山月刊85 期本期主題－－知因識果

#70請問有人可以解釋亞佛加厥定律嗎？ 我完全不懂啊啊 - Clearnote

#71「本福德定律」驗證中共疫情數據造假 - 阿波羅網

#72大數法則應用 - 人間福報

#73「世上沒有偶然，有的只是必然。」

#74從鐵人完賽到書籍書版 - iT 邦幫忙

#75生活中意想不到的116個數學謎題 - 香港二樓書店

#76班佛定律 - Wikiwand

#34為什麼你不是富人而是窮光蛋？羅傑斯：金融市場恐動盪數年 ...

#70請問有人可以解釋亞佛加厥定律嗎？我完全不懂啊啊 - Clearnote

#85多州選票數通不過「班佛定律」網友質疑拜登作弊 - 新唐人電視台