chen2929 發達集團總裁
來源:財經刊物   發佈於 2024-05-01 05:41

OpenAI神祕搞事!引爆社群熱議GPT-4.5、GPT-5上線?奧特曼大賣關子

2024/05/01 00:13  
1個名為“gpt2-chatbot”神秘模型,一夜間讓所有人瘋狂,並在AI社群引爆熱議(法新社)
〔財經頻道/綜合報導〕1個名為“gpt2-chatbot”神秘模型,一夜間讓所有人瘋狂,並在AI社群引爆熱議,由於其性能直接超越很多開源模型和GPT-4!網友們展開猜測,有說它是GPT-4.5的,有說是GPT-5的,還有人猜它是GPT-4+Q*,或GPT-2+Q*,在猜測滿天飛之際,OpenAI執行長奧特曼(Sam Altman)也在線圍觀,並賣起關子:「我確實對gpt2情有獨鍾。」
外媒報導,週一夜晚,LMSYS Chatbot Arena(1個專門評測大型語言模型(LLM )性能的平台)上出現了1個神秘的模型,這個名為gpt2-chatbot的模型一上線不僅殺出重圍,更讓所有人都瘋狂了!
這個模型吸引了大量網友的圍觀和測試,結果很多人發現,gpt2-chatbot 的能力似乎與GPT-4 保持在同一水準,甚至在一些任務上的表現比GPT-4 Turbo 還要好。
由於機器人的測試效果出奇的好,讓人們對其背後的技術產生了濃厚的興趣。
因此,網友紛紛猜測,gpt2-chatbot 是GPT-4 的某個新版本,例如GPT-4.5,或GPT-5 的測試版。
還有人扯到了消失了很久的OpenAI 首席科學家Ilya Sutskever,說gpt2-chatbot 其實是Ilya 在答題。
就在網友對於gpt2-chatbo身份進行猜測之際,在線圍觀的奧特曼,也賣起關子表示,「我確實對gpt2情有獨鍾。」
不管gpt2-chatbot 最終是什麼,我們先來看看它在哪些任務上表現更強。
如數學方面,gpt2-chatbot 可以1次性地解答國際數學奧林匹克(IMO)問題。
對於一些邏輯推理題,gpt2-chatbot 也更擅長,並強於其他大模型。例如,當問gpt2-chatbot「我今天有3 個蘋果,昨天吃了1個。現在有幾個蘋果?」它給的回應很準確(3個),並解釋了原因(昨天吃了1個並不影響現在有幾個蘋果)。很少能有模型回答對這個典型的推理題。
此外,gpt2-chatbot 在一些哲學問題上也答得很好,在完整性和基本事實方面,與GPT-4 Turbo 相比,具有非常相似的解答思路。
整體來說,這些測驗結果讓我們看到了gpt2-chatbot 在畫圖、數學、邏輯推理等任務上的不俗能力。
gpt2-chatbo引起的熱議,讓圖靈獎得主Yann LeCun 也趕來圍觀,不過,他並不看好這個模型,並表示人工智慧的炒作已經變成了諷刺。
LeCun 之所以這樣說,是因為有人問gpt2-chatbot「1個農夫帶著1隻羊和1隻山羊站在河的左岸,旁邊有1艘船。船隻能裝下1個人和2個動物。農夫如何帶著羊和山羊到達河的右岸,並儘可能減少旅行次數?
對於這個問題,正常來說只需1趟就可以了,但gpt2-chatbot 把答案弄得非常複雜,還分了5 步驟完成。

評論 請先 登錄註冊