
-
實力 發達集團副總裁
-
來源:哈拉閒聊
發佈於 2021-03-14 09:21
精準預測美國疫情 90後華裔小伙子一戰成名
時間回到去年春季,當時美國民眾試圖了解新冠肺炎疫情會如何發展,而最受矚目的預測模型,當屬倫敦帝國理工學院和美國華盛頓大學健康指標和評估研究所(IHME)提出的模型。
數據顯示,這兩種模型的預測結果天差地遠。倫敦帝國理工學院的模型去年示警,疫情在夏季前最多可能奪走美國200萬條人命,IHME的模型則保守多了,預測8月前可能會有6萬人死亡。
結果這兩個機構的預測都失準,美國的死亡人數在去年8月初前達到16萬人。
預測數據出現如此巨大的落差,引起華裔資料科學家顧悠揚(Youyang Gu)的注意。當時年僅26歲的顧悠揚,擁有麻省理工學院(MIT)電子工程暨電腦科學碩士學位,以及數學碩士學位,但未受過醫藥、流行病學等疫情相關領域的正式訓練。儘管如此,他仍認為自身具備的資料模型背景,應能在疫情期間派上用場。
去年4月中,當時與父母在加州聖塔克拉拉同住的顧悠揚,用一周時間建立新冠肺炎死亡人數預測模型,以及一個顯示病故人數的網站。
很快這個模型跑出來的數據,開始比專業機構更準確,而這些機構背後有數億美元資金的支持,並累積數十年經驗。顧悠揚建立的新穎模型,採用機器學習演算法。
顧悠揚從MIT畢業後,在金融業工作數年,負責編寫高頻交易系統的演算法;他的演算法必須提供準確預測結果,否則可能飯碗不保。
顧悠揚持續比較模型預測與最終死亡人數,並不斷調整機器學習軟體,以獲得更加精準的預測。雖然這項工作須投入的時間等同於一份全職工作,顧悠揚卻無償付出,並靠著自己的積蓄過活,因為他希望自己的數據不帶有任何利益衝突或政治偏見。
儘管他的模型不算完美,但推出以來就不同凡響。他在去年4月底預測美國5月9日前的病故人數為80000人,實際死亡人數為79926人,IHME則推估到去年底死亡人數不會超過80000人。
顧悠揚並預估美國的病故人數到去年5月18日和5月27日,將分別增至90000人及100000人,結果他再度神準預測死亡人數。在政府實施社交距離等防疫措施的情況下,IHME預料美國將逐漸擺脫新冠肺炎病毒陰影,顧悠揚則認為許多州解封將引爆第二波疫情。
華盛頓大學生物學教授柏格斯壯(Carl Bergstrom)去年4月底在推特上提到顧悠揚的模型,不久後美國疾病控制與預防中心(CDC)的疫情預測網站,開始納入顧悠揚的數據。隨著疫情持續發展,這位在伊利諾州和加州長大的華裔移民,成為CDC定期會議的一員,與會者包括模型專家和流行病學家。
顧悠揚在疫情爆發前,曾希望創立新創公司,可能投身運動分析領域,但如今他考慮留在公衛領域,希望從事具有高度影響力的工作,不涉及政治、偏見,也不用背負大型機構常有的包袱。他表示:「公衛領域還有很多不足之處,和我擁有相同專長的人可提供協助。」