AMD 承認 EPYC Rome 伺服器晶片有個奇妙Bug:運行 1044 天會當機、暫無計畫修復
cnBeta 發表於 2023年6月05日 15:30
收藏此文
![](https://cdn2.techbang.com/system/excerpt_images/106924/post_inpage/241c6451694e796ae949258df24c0727.jpg?1685937137)
AMD 在近日發佈的 EPYC 7002 「Rome」伺服器晶片指南中,承認由於時鐘倒計時器存有個BUG,導致第二代 EPYC 晶片正常運行 1044 天後出現核心卡死情況。
訂閱T客邦電子日報,升級科技原力!
立即訂閱使用這款 EPYC 晶片的伺服器,需要每隔 2.93 年時間重新啟動一次,但AMD 官方表示不會修復上述 BUG。
AMD 在指南中表示,導致這個問題的原因是核心無法脫離 CC6 省電模式(Core C6 State),進入該模式之後,會降低電壓和時脈頻率。AMD 澄清說,誤差的時間可能取決於擴頻調製和 REFCLK 頻率參考。
![](https://cdn0.techbang.com/system/images/678783/original/c9c4f3abc1612e08cc3de7ea7bb10d80.jpg?1685937073)
Reddit 使用者 acid_migrain 經過詳細的演算,認為實際導致卡死的時間並非 1044 天,而是 1042 天 12 個小時。
AMD 於 2018 年推出 EPYC “Rome”系列伺服器晶片,部分客戶已經向 AMD 反應遇到了這個問題。
AMD 表示沒有計畫修復該漏洞,外媒 technewsspace 判斷,不修復的理由原因之一是修復成本太高,不然就是受影響用戶規模不大。