班佛定律(大陸稱:本福特定律),快速識別數字造假,不需要計算,只需要看一眼數據,就可以輕鬆判斷數據的真實性。(圖片來源:Adobe Stock)
即使不是會計審計人員,你的一生中也會遇到很多數字,比如說報銷單,運營數據,財報數據等,既使你投資的是一個小賣店或者小餐館,也需要關注每個月銷售數據是否正常。加上今年美國總統選舉疑點重重,原本川普團隊說自己已經贏了,睡了一覺醒來,拜登選票突然「神奇」增加,突然翻盤,後續又爆出某選區6000張投給川普的選票錯投給拜登,使得2020的美國大選存在嚴重舞弊的疑點。(相關閱讀:美國大選笑話:「總統是誰?」)
如何一眼識別出數字是否造假?今天就替大家介紹美國物理學家發現的班佛定律(大陸稱:本福特定律),快速識別數字造假,不需要計算,只需要看一眼數據,就可以輕鬆判斷數據的真實性。
班佛定律(本福特定律)
班佛定律(大陸稱:本福特定律),快速識別數字造假,不需要計算,只需要看一眼數據,就可以輕鬆判斷數據的真實性。(圖片來源:Adobe Stock)
一般人普遍認為,真實的數據中,0-9的十個數字出現機率應該是隨機的,也就是各有10%的機率,如果某個數字出現機率過高,就可能是假數據。
但實際上真實數據卻不是你所想像的這樣,1881年,美國天文學家西蒙·紐康觀察早期用來進行對數計算的手冊較前方的頁面較後方破舊,而發現了現在被稱為本福特定律的統計定律。這現象使他建立了該定律的原則,即任意一個數據列表中,傾向由數字「1」開始的機率較其他數字高。
1935年,美國的物理學家法蘭克·班佛再次發現這個現象,還通過了檢查許多數據來證實這點。他在翻閱對數表時無意間發現,對數表的頭幾頁比後面的頁更髒一些,這說明頭幾頁在平時被更多的人翻閱。
這項發現引起了班佛的好奇心,他進一步統計了生活中的其他大數據,比如人口數據、棒球數據等,發現這些數據中都有一個共同的特徵,就是數據中以1為開頭的數字出現的頻率並不是1/9,而是30.1%。而以2為首的數字出現的頻率是17.6%,往後出現頻率依次減少,9的出現頻率最低,只有4.6%。
意即,1-9出現在數字首位的機率是一條平滑曲線,1的出現機率遠高於其他數字,是9的5倍。這就是著名的班佛定律(本福特定律),它可以用於檢測數據是否造假。當你看數據報表時,只要掃一眼1出現在數字首位的數量是否是9的5倍,即可以在1分鐘內判斷數據的真實性。
班佛定律說明在{\displaystyle b}進位制中,以數{\displaystyle n}起頭的數出現的機率為:
{\displaystyle P(n)=\log _{b}(n+1)-\log _{b}(n)=\log _{b}\left({\frac{n+1}{n}}\right)}
班佛定律不但適用於個位數字,連多位的數也可用。
在十進制首位數字的出現機率(%,小數點後一個位):
班佛定律不但適用於個位數字,連多位的數也可用。(圖片來源:維基百科)
末尾數字造假識別
前面講的本福特定律是通過首位數字識別造假,接著我們再瞭解一下:如何通過末尾的2位數字識別數據造假。
數據最後兩位出現的機率和首位是不一樣的,末兩位出現的機率是均勻分布的,00-99每個數值出現的機率是1%,所以可以通過末兩位數據出現的機率識別數據造假。
末兩位數據造假有幾個常見的特徵:
1,末兩位數據是否會出現遞減現象。有實驗發現,人們在編造數據的時候,會經常出現末尾數據遞減現象,比如末二位數據會經常出現10、21、32、43、54、65、76、87、98等數據。如果你瀏覽數據發現這種現象偏多,那造假的可能性較大。
2,一半編造數據的人很少用00和55這兩個數字當結尾。他們普遍認為這兩個數字顯得不夠「隨機」,所以當你在查看數據報表時,看不到這兩位數字時,可能就要思考一下數據的真實性了。
如何通過末尾的2位數字識別數據造假?(圖片來源:Adobe Stock)
用本福特定律發現假帳的例子
最典型的案例是2001年,美國最大的能源交易商、年收入破千億美元的安然公司破產事件。安然曾在全球500強中排名第七,卻突然申請破產。事後人們用本福特定律對安然公司公布的財務報表進行了檢驗,發現安然財報中公布的每股盈利數據是不符合本福特定律的。
國內股市也有類似案例,2014-2015年金亞科技股價在6個月漲幅超過400%,但是金亞科技的財報數據明顯不符合本福特定律,2016年1月金亞科技承認財務造假。
中國導演英達在美國因涉嫌洗錢被捕
美國實行個人報稅,稅務系統會自動識別虛假報稅嫌疑,最常用的手段也是本福特定律。系統發現異常後,會有專人立案調查。
2017年著名演員英達在美國因洗錢被拘捕。當年英達居住康州,在2011-2012年3月間,先後把46.4萬美元存入他和他妻子的聯名賬戶。根據聯邦法律,美國的金融機構在接收1萬美元以上的現金交易時,會要求客戶填寫「現金交易報告」,英達為了避過監控,每次存錢金額都低於1萬美元,前後分50次存入。
英達夫婦倆還在4家銀行開了6個賬戶,被指控是為了避人耳目。英達的結構性拆分行為,會出現9字頭存款數據過多,不符合本福特定律,因此被稅務局盯上。
據了解,英達出生於演藝世家,身兼演員和導演的身份,與前妻宋丹丹育有一子英巴圖,兩人離婚後,他娶了現任妻子梁歡,再誕下一子,梁歡的父親范榮康是《人民日報》前副主編。
本福特定律也可檢驗數據異常的選舉舞弊。(圖片來源:Adobe Stock)
本福特定律也可檢驗數據異常的選舉舞弊
本福特定律已經成為會計師們判斷銷售數據、財務報表等數據是否造假的依據之一,除此之外,也可用來檢驗選舉中是否存在舞弊現象。例如在本次2020的美國總統大選中,就有網友表示:拜登在包括威斯康星州密爾沃基、伊利諾州芝加哥和賓夕法尼亞州阿勒格尼的曲線均不滿足「本福特定律」,而與此同時,川普在這些相關地區的曲線卻又正好基本符合該定律,舉證此次美國選舉疑似存在舞弊現象,此時就靜待司法調查解開真相了。
密歇根的圖表顯示拜登的選票突然「神奇」增加。(圖片來源:推特截圖)