名校也有傻缺?這是再正常不過的事情了

閱讀:8512 來源:北美留學(xué)生日?qǐng)?bào)
分享: 
我有幸也曾經(jīng)求學(xué)于美國西岸一所名校。在那里讀書的日子里,有些遭遇也讓我不禁疑惑:我靠,似乎什么人都能進(jìn)這所聞名世界的學(xué)府呀。后來用數(shù)學(xué)推算一下,倒也不奇怪了。

“When I was at Cornell, I was rather fascinated by the student body, which seems to me was a dilute mixture of some sensible people in a big mass of dumb people” (“當(dāng)我在康奈爾大學(xué)的時(shí)候,我覺得學(xué)生群體很有意思。他們仿佛是一些靠譜的人被稀釋在人數(shù)巨大的傻缺群中。”)

我有幸也曾經(jīng)求學(xué)于美國西岸一所名校。在那里讀書的日子里,有些遭遇也讓我不禁疑惑:我靠,似乎什么人都能進(jìn)這所聞名世界的學(xué)府呀。后來用數(shù)學(xué)推算一下,倒也不奇怪了。

“名校傻X” (原題用詞如此)這個(gè)現(xiàn)象,可以用統(tǒng)計(jì)學(xué)中的 type I & type II error 來解釋。這個(gè)概念又可以被稱作假陽性(false positive)、假陰性(false negative)。簡單來說,就是誤把正的判斷成反的,和誤把反的判斷成正的這兩種錯(cuò)誤。

這兩種誤判往往有著內(nèi)在,不可調(diào)和的對(duì)立。當(dāng)你試圖減低其中一種誤判的時(shí)候,往往不可避免要增加另一種誤判的概率。比如,如果你把每一個(gè)嫌疑犯都判為有罪的話,你就不會(huì)漏掉真兇,但是你也很可能錯(cuò)殺不少無辜。反之你如果假設(shè)所有人都無罪的話,固然不會(huì)冤枉好人,但是也放過不少罪犯。

回到名校里不靠譜同學(xué)這個(gè)話題(原問題中的傻X一詞還是過于重口味哈)。我們假設(shè)那些申請(qǐng)名校的人,或者說社會(huì)上,不靠譜的人本來就很多,比如95%的人都是不靠譜的。而名校的錄取過程是為了盡量篩除這些不靠譜的人,留下那5% 靠譜的同學(xué)。但是名校的申請(qǐng)過程肯定是不完美的,比如會(huì)有以下情況:

靠譜同學(xué)被錄取的概率:80%

不靠譜卻被錄取(admissions mistake)的概率:10%

靠譜同學(xué)的錄取率是不靠譜同學(xué)錄取率的8倍之多,按說這已經(jīng)是一個(gè)不錯(cuò)的錄取流程了。但是我們來看看結(jié)果。假設(shè)有1000人申請(qǐng)。根據(jù)剛才的假設(shè),其中

1000 * 95% = 950 人是不靠譜的。

其中被錄取的 950 * 10% = 95 人

而靠譜的同學(xué)數(shù):

1000 * 5% = 50 人

其中被錄取的:50 * 80% = 40 人

最后錄取總?cè)藬?shù):

95 + 40 = 135 人

其中不靠譜的人數(shù)占比:95 / 135 = 70%

而這是一個(gè)總錄取比例僅有 13.5% (差不多是 Cornell 的水平),并且能夠相當(dāng)準(zhǔn)確甄別靠譜與不靠譜申請(qǐng)者的學(xué)校。

所以,名校中也有大量不靠譜的人存在,只是濃度比社會(huì)均值低了一些而已。

其根本原因是名校再仔細(xì)的刪選機(jī)制,也架不住潮水般的龐大的社會(huì)上的傻缺群體。雖然盡可能降低誤判概率,但是那些漏網(wǎng)的傻缺也足以讓名校中的靠譜同學(xué)稀釋在茫茫的傻缺海洋中了。這也導(dǎo)致了回答開頭所引用的費(fèi)曼先生那句話。

另外,多學(xué)習(xí)基本的數(shù)學(xué)和統(tǒng)計(jì)學(xué)常識(shí),受益終身。

大家可以設(shè)想另一個(gè)(非常真實(shí)的)例子。假設(shè)有一種罕見的絕癥可以通過體檢檢查出來。正常人群中,這個(gè)絕癥的發(fā)病率是 0.1%。如果你身懷該絕癥,被查出的概率是 99.9%;如果你是健康的,卻被誤判成患有該絕癥的概率是 0.1%(這也就是剛才說的 false positive)。按說這個(gè)檢查已經(jīng)是非常準(zhǔn)確了。

假設(shè)你是一個(gè)普通人,體檢中發(fā)現(xiàn)是陽性。你其實(shí)健康的概率是多少?

這里我就不具體推算了。計(jì)算方法跟剛才的 “名校傻缺” 同。結(jié)果是 50%。這不能算什么好消息,但至少還不是一個(gè)已經(jīng)絕望的地步。在你決定把你的余生盡情揮霍和享樂之前,你至少應(yīng)該再去測試一次。

不過這 50% 前提是 "你是一個(gè)普通人“。如果你是屬于該疾病的高危人群,那么就不是這個(gè)結(jié)果了。這就涉及到 Bayesian statistics 中所說的 prior。而我們的整個(gè)推算也是遵循了 Bayesian statistics 的思維。這一切都沒什么難的(樓下一位留言說是初中生可以理解的。我同意)。

但是據(jù)說美國曾經(jīng)把上面這道有關(guān)假陽性的題考了考醫(yī)生,大多數(shù)不能夠正確解答。這說明了基本的數(shù)學(xué)和統(tǒng)計(jì)學(xué)知識(shí)是多么的欠缺,哪怕在受過高度教育的人中。

不要成為這樣一個(gè)人。學(xué)好數(shù)學(xué)和統(tǒng)計(jì)學(xué)。

這可能在你人生的某個(gè)時(shí)刻,讓你做出關(guān)乎生死存亡的正確決定。

標(biāo)簽: 留學(xué)經(jīng)驗(yàn)分享 大學(xué) 51offer編輯:Alice