- 美國大學(xué)畢業(yè)典禮進(jìn)行時(shí),你知道學(xué)位服顏色還有講究嗎?
- 英美德法留學(xué)生經(jīng)常被問的問題 沒事看看好歡樂
- 李冰冰躲在廁所背單詞:開掛的人生,不只把欲望寫在臉上
- 出國留學(xué)不一定有高回報(bào),但一定許你不一樣的人生
- 《華爾街日?qǐng)?bào)》: 名校出身與未來收入到底有多大關(guān)系?
- 紐約時(shí)報(bào):多年以前的亞裔學(xué)霸們,畢業(yè)以后都過得如何?
- 我為什么選擇30歲以后去留學(xué)?當(dāng)你放棄努力,才真正老了!
- 100位海歸爆回國后真實(shí)薪資!內(nèi)情竟然如此......
“When I was at Cornell, I was rather fascinated by the student body, which seems to me was a dilute mixture of some sensible people in a big mass of dumb people” (“當(dāng)我在康奈爾大學(xué)的時(shí)候,我覺得學(xué)生群體很有意思。他們仿佛是一些靠譜的人被稀釋在人數(shù)巨大的傻缺群中。”)
我有幸也曾經(jīng)求學(xué)于美國西岸一所名校。在那里讀書的日子里,有些遭遇也讓我不禁疑惑:我靠,似乎什么人都能進(jìn)這所聞名世界的學(xué)府呀。后來用數(shù)學(xué)推算一下,倒也不奇怪了。
“名校傻X” (原題用詞如此)這個(gè)現(xiàn)象,可以用統(tǒng)計(jì)學(xué)中的 type I & type II error 來解釋。這個(gè)概念又可以被稱作假陽性(false positive)、假陰性(false negative)。簡單來說,就是誤把正的判斷成反的,和誤把反的判斷成正的這兩種錯(cuò)誤。
這兩種誤判往往有著內(nèi)在,不可調(diào)和的對(duì)立。當(dāng)你試圖減低其中一種誤判的時(shí)候,往往不可避免要增加另一種誤判的概率。比如,如果你把每一個(gè)嫌疑犯都判為有罪的話,你就不會(huì)漏掉真兇,但是你也很可能錯(cuò)殺不少無辜。反之你如果假設(shè)所有人都無罪的話,固然不會(huì)冤枉好人,但是也放過不少罪犯。
回到名校里不靠譜同學(xué)這個(gè)話題(原問題中的傻X一詞還是過于重口味哈)。我們假設(shè)那些申請(qǐng)名校的人,或者說社會(huì)上,不靠譜的人本來就很多,比如95%的人都是不靠譜的。而名校的錄取過程是為了盡量篩除這些不靠譜的人,留下那5% 靠譜的同學(xué)。但是名校的申請(qǐng)過程肯定是不完美的,比如會(huì)有以下情況:
靠譜同學(xué)被錄取的概率:80%
不靠譜卻被錄取(admissions mistake)的概率:10%
靠譜同學(xué)的錄取率是不靠譜同學(xué)錄取率的8倍之多,按說這已經(jīng)是一個(gè)不錯(cuò)的錄取流程了。但是我們來看看結(jié)果。假設(shè)有1000人申請(qǐng)。根據(jù)剛才的假設(shè),其中
1000 * 95% = 950 人是不靠譜的。
其中被錄取的 950 * 10% = 95 人
而靠譜的同學(xué)數(shù):
1000 * 5% = 50 人
其中被錄取的:50 * 80% = 40 人
最后錄取總?cè)藬?shù):
95 + 40 = 135 人
其中不靠譜的人數(shù)占比:95 / 135 = 70%
而這是一個(gè)總錄取比例僅有 13.5% (差不多是 Cornell 的水平),并且能夠相當(dāng)準(zhǔn)確甄別靠譜與不靠譜申請(qǐng)者的學(xué)校。
所以,名校中也有大量不靠譜的人存在,只是濃度比社會(huì)均值低了一些而已。
其根本原因是名校再仔細(xì)的刪選機(jī)制,也架不住潮水般的龐大的社會(huì)上的傻缺群體。雖然盡可能降低誤判概率,但是那些漏網(wǎng)的傻缺也足以讓名校中的靠譜同學(xué)稀釋在茫茫的傻缺海洋中了。這也導(dǎo)致了回答開頭所引用的費(fèi)曼先生那句話。
另外,多學(xué)習(xí)基本的數(shù)學(xué)和統(tǒng)計(jì)學(xué)常識(shí),受益終身。
大家可以設(shè)想另一個(gè)(非常真實(shí)的)例子。假設(shè)有一種罕見的絕癥可以通過體檢檢查出來。正常人群中,這個(gè)絕癥的發(fā)病率是 0.1%。如果你身懷該絕癥,被查出的概率是 99.9%;如果你是健康的,卻被誤判成患有該絕癥的概率是 0.1%(這也就是剛才說的 false positive)。按說這個(gè)檢查已經(jīng)是非常準(zhǔn)確了。
假設(shè)你是一個(gè)普通人,體檢中發(fā)現(xiàn)是陽性。你其實(shí)健康的概率是多少?
這里我就不具體推算了。計(jì)算方法跟剛才的 “名校傻缺” 同。結(jié)果是 50%。這不能算什么好消息,但至少還不是一個(gè)已經(jīng)絕望的地步。在你決定把你的余生盡情揮霍和享樂之前,你至少應(yīng)該再去測試一次。
不過這 50% 前提是 "你是一個(gè)普通人“。如果你是屬于該疾病的高危人群,那么就不是這個(gè)結(jié)果了。這就涉及到 Bayesian statistics 中所說的 prior。而我們的整個(gè)推算也是遵循了 Bayesian statistics 的思維。這一切都沒什么難的(樓下一位留言說是初中生可以理解的。我同意)。
但是據(jù)說美國曾經(jīng)把上面這道有關(guān)假陽性的題考了考醫(yī)生,大多數(shù)不能夠正確解答。這說明了基本的數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識(shí)是多么的欠缺,哪怕在受過高度教育的人中。
不要成為這樣一個(gè)人。學(xué)好數(shù)學(xué)和統(tǒng)計(jì)學(xué)。
這可能在你人生的某個(gè)時(shí)刻,讓你做出關(guān)乎生死存亡的正確決定。