GPT-5「龍蝦」模型現身?匿名測試平台驚見超強神秘模型,網友:真的打爆 Grok-4!

GPT-5 真的快來了?近期 AI 社群在匿名模型評測網站 WebDev Arena 上發現一款代號「Lobster(龍蝦)」的神秘模型,結果引爆一波熱烈討論:這個可能就是 GPT-5 的預覽版本!
有網友實測後直呼:「比 Grok-4 好太多,完全不在同一個檔次上!」
神秘「Lobster」模型曝光!互動畫面驚艷全場
在 WebDev Arena 上,測試者使用相同提示詞比較多款語言模型的輸出,結果有使用者發現一款代號「Lobster」的模型,生成出來的互動畫面美到令人屏息。
測試者輸入的 prompt 是這樣的:
建立一個令人驚嘆的神經網路或類腦圖形結構互動動畫,需使用藝術性色彩、平滑過渡與沉浸式視覺效果,不要按鈕,只有滑動或連續動畫,整體風格要震撼人心。
結果?左邊是「Lobster」生成的畫面,右邊是 Grok-4。差距非常明顯,許多網友當場投下「Lobster」一票。
GPT-5 真身疑似曝光!還有「迷你」與「奈米」版本
根據目前社群整理出的資料,OpenAI 可能正以各種奇怪代號測試不同版本的 GPT-5:
-
GPT-5 主模型:Lobster
-
GPT-5-mini:Nectarine
-
GPT-5-nano:Starfish
這些模型已經在代碼生成、網頁互動與推理任務中展現出驚人表現,甚至有用戶表示:「已經全面超越 Claude 了!」
OpenAI 正在偷偷測試?o3 請求被悄悄轉發到 GPT-5!
Reddit 社群中有使用者發現,OpenAI 目前正將部分 o3(即 ChatGPT-4 的原始模型)請求暗中轉向一個匿名模型處理,這個模型被標記為「zenith」,據說就是 GPT-5 測試名之一。
而在各項極難題測試中,這個新模型成功率顯著提高,風格也與原本 GPT-4 o3 明顯不同。
幾位提前獲得預覽權限的開發者透露,GPT-5 在程式碼理解、老舊系統重構與複雜工程問題的處理上遠勝過任何現有 AI 模型。
其中一位直言:「以前只有 Claude 能搞定的那些真實工程屎山,現在 GPT-5 也能搞得定了。」
OpenAI 顯然瞄準了自動化編程助手這塊高利潤市場,目標直指像 Cursor、Replit 等靠 Claude 年營收破億美金的應用。
更強大的推理、更少的浪費、更精準的資源分配
根據體驗者說法,GPT-5 能根據問題難度動態調整邏輯推理深度。簡單問題就不會浪費資源,複雜問題才會全力開火,這種「智慧調度」也讓它在處理程式設計、資料查詢與多步驟分析上更有效率。
這也呼應了 OpenAI 的戰略目標:將 GPT-系列與 o-系列(推理模型)整合,打造一個統一入口,但後端根據問題自動切換。
GPT-8 都在規劃中?OpenAI:「我們還能再衝三代!」
更驚人的是,有投資人爆料,OpenAI 高層曾私下透露,他們不用換架構也有信心做到 GPT-8!
這意味著未來幾代 GPT 將重點放在 後訓練強化學習、資料調度與推理機制最佳化,而不是瘋狂增加參數量。
目前尚未有明確發表時間,但 OpenAI CEO 山姆・奧特曼(Sam Altman)最近在多個場合「暗示」已經在使用全新模型,業界普遍預期,GPT-5 有望於 2024 下半年~2025 年初正式亮相。
- 延伸閱讀:研究曝ChatGPT、Gemini可能被亂碼騙過,新型「資訊過載攻擊」能讓AI越獄
- 延伸閱讀:研究指出人類語言正被 AI 「文化滲透」,GPT 用語滲透日常對話
- 延伸閱讀:OpenAI 的盤算:靠 ChatGPT 電商功能,讓免費仔也能變現
加入T客邦Facebook粉絲團