他以自身經驗為例，4 月 15 日 Anthropic 旗下 Claude 系列服務出現全面降級，包含 claude.ai、API 與 Claude Code 均顯示「Degraded Performance」。這並非單純變慢或偶發錯誤，而是回應品質明顯崩盤，甚至出現無法正常使用的情況，導致其當日三個開發任務全數延誤。

這類情境對個人開發者而言或許只是效率下降，但對企業 IT 團隊來說，影響則被成倍放大。當一個團隊有多名工程師同時依賴 AI 工具進行 coding、文件撰寫與流程自動化，一次模型降級，意味著整體生產力在同一時間出現集體下滑，進而轉化為可觀的時間與成本損失。

AI 感覺變笨了？數據證實「早已降級」

Wisely Chen 指出，「GPT 變笨」、「Claude 不如以前」這類說法在社群流傳已久，但長期缺乏客觀數據支撐。直到近期出現持續監控模型品質的平台，這種現象才首次被量化。

其中，StupidMeter 對包括 OpenAI、Anthropic、Google 等主流模型進行 24 小時自動化測試，追蹤正確性、推理能力與穩定性等指標。與傳統一次性 benchmark 不同，這類系統更接近企業監控 API 或服務可用性的方式，觀察模型在實際使用環境中的表現波動。

數據結果相當直觀：目前多數主流模型均處於警告或降級狀態，僅少數模型維持正常。這意味著模型品質的不穩定，並非單一產品問題，而是整體產業的普遍現象。

LLM 偷降智，影響 AI 工作流企業穩定性

對企業而言，這樣的變化代表 AI 已從「提升效率的工具」，轉變為「影響穩定性的變數」。倘若企業日常工作流程從寫程式、做 code review，到產出文件與分析報告都已高度依賴 LLM。一旦模型在某一天出現推理能力下降、回答品質不穩，這些問題不會像傳統軟體 bug 一樣局部發生，而是會同時滲透進所有使用 AI 的環節。

更關鍵的是，這種波動往往難以預測，也難以即時察覺。多數企業並不具備持續監控模型品質的機制，通常是在產出結果異常、或團隊效率下降後，才意識到問題來自模型本身。在這樣的情境下，「降智」不再只是使用者的主觀感受，而是一種會直接影響企業營運節奏的系統性風險。

當 AI 成為水電，穩定性成為新的關鍵指標

Wisely Chen 將 LLM 的角色比喻為「現代企業的水電」。當 AI 已深入日常營運，成為不可或缺的基礎能力，其穩定性的重要性也隨之提升。

過去企業評估 AI 工具，多聚焦於模型能力、價格與功能，但隨著「降智」現象浮現，另一個更關鍵的指標正在浮現，那就是穩定性。當模型品質可能在未通知的情況下變動，企業不再只是「使用 AI」，要開始承擔一種新型態的基礎設施風險。更絕望的是，只看前沿的大型語言模型的話，基本上在算力問題未解決前，都可能會繼續發生。

這篇文章數據曝「Claude 降智」並非都市傳說，AI 模型不穩定成企業風險最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

威剛、周杰倫賺翻？GD 經紀公司密會杜拜王室，討論 IPO、AI 與機器人

股票 AI 行業動態

韓國娛樂科技公司 Galaxy Corporation 近期進軍中東市場，成立杜拜法人「Galaxy ME」，並與阿聯酋王室成員會晤，探索 AI 與內容整合。公司已選定證券商進行 IPO，去年營收達3000億韓元，並吸引周杰倫及威剛等投資。該布局旨在推動中東娛樂生態系的發展，強調其全球化戰略的重要性。

鏈新聞abmedia1小時前

中國團隊 EvoMap 怒控爆紅 Hermes Agent 抄襲：自進化體系存在高度相似性

AI Agent AI 行業動態

中國團隊EvoMap指控Nous Research的Hermes Agent抄襲其Evolver/GEP架構，認為兩者在多個關鍵模組上存在高度相似性。EvoMap指出，Hermes的設計未引用或致謝其先前公開的內容，爭議引發社群廣泛關注，部分中國網友聲援EvoMap，並批評Hermes的抄襲行為。儘管Nous研究團隊尚未針對指控逐條反駁，但事件已迅速在AI輿論中擴散。

鏈新聞abmedia1小時前

OpenAI 早期投資人青睞！腦機新創 Sabi 最快年底出貨「思考就能寫字」的毛帽

AI 行業動態

矽谷新創 Sabi 宣布正在開發一款無需侵入性手術的穿戴式腦機介面，使用者只需「思考」就能將文字輸入螢幕，預計2026年底推出。該裝置將配備高達十萬顆微型感測器，有助於精確解讀腦部活動，Sabi 也強調數據的隱私保護。

鏈新聞abmedia1小時前

OpenAI 更新 Codex 為可控桌面、能自動化開發工作流程的 AI 代理

AI Agent AI 行業動態

OpenAI 升級版 Codex 正在從編碼助理演進為桌面環境的自主代理，能夠管理應用程式、自動化工作流程，並與超過 100 款應用整合。這種轉變提升了任務連續性與工作流程自動化，反映出 AI 編碼工具領域的競爭態勢。

GateNews2小時前

Google 將 AI 搜尋整合進 Chrome，讓使用者進行對話式網頁瀏覽

AI 行業動態

Google 正在用 AI 驅動的搜尋功能強化 Chrome，讓使用者能以對話方式瀏覽並獲得具情境感知的回應。這項新功能也包含多分頁整合，透過整併已開啟分頁並提供量身打造的資訊，改善使用者在各種任務中的體驗。

GateNews2小時前

新世界集團終止與 OpenAI 的合作，改與 Reflection AI 建立夥伴關係，調整零售策略

AI 行業動態

新世界集團已停止與 OpenAI 的合作，轉而選擇與 Reflection AI 進行更大規模的合作，以強化零售營運中的 AI。此一決策旨在簡化工作流程，並針對對 AI 商務成效的疑慮作出回應。

GateNews3小時前

留言

0/400

暫無留言