OpenAI神祕搞事！引爆社群熱議GPT-4.5、GPT-5上線？奧特曼大賣關子

chen2929 發達集團總裁: 來源：財經刊物發佈於 2024-05-01 05:41

OpenAI神祕搞事！引爆社群熱議GPT-4.5、GPT-5上線？奧特曼大賣關子

2024/05/01 00:13

1個名為“gpt2-chatbot”神秘模型，一夜間讓所有人瘋狂，並在AI社群引爆熱議（法新社）
〔財經頻道／綜合報導〕1個名為“gpt2-chatbot”神秘模型，一夜間讓所有人瘋狂，並在AI社群引爆熱議，由於其性能直接超越很多開源模型和GPT-4！網友們展開猜測，有說它是GPT-4.5的，有說是GPT-5的，還有人猜它是GPT-4+Q*，或GPT-2+Q*，在猜測滿天飛之際，OpenAI執行長奧特曼（Sam Altman）也在線圍觀，並賣起關子：「我確實對gpt2情有獨鍾。」
外媒報導，週一夜晚，LMSYS Chatbot Arena（1個專門評測大型語言模型（LLM ）性能的平台）上出現了1個神秘的模型，這個名為gpt2-chatbot的模型一上線不僅殺出重圍，更讓所有人都瘋狂了！
這個模型吸引了大量網友的圍觀和測試，結果很多人發現，gpt2-chatbot 的能力似乎與GPT-4 保持在同一水準，甚至在一些任務上的表現比GPT-4 Turbo 還要好。
由於機器人的測試效果出奇的好，讓人們對其背後的技術產生了濃厚的興趣。
因此，網友紛紛猜測，gpt2-chatbot 是GPT-4 的某個新版本，例如GPT-4.5，或GPT-5 的測試版。
還有人扯到了消失了很久的OpenAI 首席科學家Ilya Sutskever，說gpt2-chatbot 其實是Ilya 在答題。
就在網友對於gpt2-chatbo身份進行猜測之際，在線圍觀的奧特曼，也賣起關子表示，「我確實對gpt2情有獨鍾。」
不管gpt2-chatbot 最終是什麼，我們先來看看它在哪些任務上表現更強。
如數學方面，gpt2-chatbot 可以1次性地解答國際數學奧林匹克（IMO）問題。
對於一些邏輯推理題，gpt2-chatbot 也更擅長，並強於其他大模型。例如，當問gpt2-chatbot「我今天有3 個蘋果，昨天吃了1個。現在有幾個蘋果？」它給的回應很準確（3個），並解釋了原因（昨天吃了1個並不影響現在有幾個蘋果）。很少能有模型回答對這個典型的推理題。
此外，gpt2-chatbot 在一些哲學問題上也答得很好，在完整性和基本事實方面，與GPT-4 Turbo 相比，具有非常相似的解答思路。
整體來說，這些測驗結果讓我們看到了gpt2-chatbot 在畫圖、數學、邏輯推理等任務上的不俗能力。
gpt2-chatbo引起的熱議，讓圖靈獎得主Yann LeCun 也趕來圍觀，不過，他並不看好這個模型，並表示人工智慧的炒作已經變成了諷刺。
LeCun 之所以這樣說，是因為有人問gpt2-chatbot「1個農夫帶著1隻羊和1隻山羊站在河的左岸，旁邊有1艘船。船隻能裝下1個人和2個動物。農夫如何帶著羊和山羊到達河的右岸，並儘可能減少旅行次數？
對於這個問題，正常來說只需1趟就可以了，但gpt2-chatbot 把答案弄得非常複雜，還分了5 步驟完成。



644 次閱讀 ⋅ 2 條評論 ⋅ 舉報

認同 (0) 打賞 (0) 轉發 (0) 收藏 (0)

評論請先登錄或註冊

最新點讚感謝文討論文全部評論（2）

OpenAI神祕搞事！引爆社群熱議GPT-4.5、GPT-5上線？奧特曼大賣關子

熱門資訊

chen2929 的粉絲

發達資訊

發達社區

關於我們

關註我們

官方客服