數據曝「Claude 降智」並非都市傳說,AI 模型不穩定成企業風險

鏈新聞abmedia

在 AI 成為企業標配工具之後,一個過去被視為「體感問題」的現象,正在快速浮上檯面:LLM(大型語言模型)正在「變笨」。網友 Wisely Chen 指出,所謂「LLM 降智」並非都市傳說,而是已能透過數據被持續追蹤,且正對企業工作流程造成實質影響。

他以自身經驗為例,4 月 15 日 Anthropic 旗下 Claude 系列服務出現全面降級,包含 claude.ai、API 與 Claude Code 均顯示「Degraded Performance」。這並非單純變慢或偶發錯誤,而是回應品質明顯崩盤,甚至出現無法正常使用的情況,導致其當日三個開發任務全數延誤。

這類情境對個人開發者而言或許只是效率下降,但對企業 IT 團隊來說,影響則被成倍放大。當一個團隊有多名工程師同時依賴 AI 工具進行 coding、文件撰寫與流程自動化,一次模型降級,意味著整體生產力在同一時間出現集體下滑,進而轉化為可觀的時間與成本損失。

AI 感覺變笨了?數據證實「早已降級」

Wisely Chen 指出,「GPT 變笨」、「Claude 不如以前」這類說法在社群流傳已久,但長期缺乏客觀數據支撐。直到近期出現持續監控模型品質的平台,這種現象才首次被量化。

其中,StupidMeter 對包括 OpenAI、Anthropic、Google 等主流模型進行 24 小時自動化測試,追蹤正確性、推理能力與穩定性等指標。與傳統一次性 benchmark 不同,這類系統更接近企業監控 API 或服務可用性的方式,觀察模型在實際使用環境中的表現波動。

數據結果相當直觀:目前多數主流模型均處於警告或降級狀態,僅少數模型維持正常。這意味著模型品質的不穩定,並非單一產品問題,而是整體產業的普遍現象。

LLM 偷降智,影響 AI 工作流企業穩定性

對企業而言,這樣的變化代表 AI 已從「提升效率的工具」,轉變為「影響穩定性的變數」。倘若企業日常工作流程從寫程式、做 code review,到產出文件與分析報告都已高度依賴 LLM。一旦模型在某一天出現推理能力下降、回答品質不穩,這些問題不會像傳統軟體 bug 一樣局部發生,而是會同時滲透進所有使用 AI 的環節。

更關鍵的是,這種波動往往難以預測,也難以即時察覺。多數企業並不具備持續監控模型品質的機制,通常是在產出結果異常、或團隊效率下降後,才意識到問題來自模型本身。在這樣的情境下,「降智」不再只是使用者的主觀感受,而是一種會直接影響企業營運節奏的系統性風險。

當 AI 成為水電,穩定性成為新的關鍵指標

Wisely Chen 將 LLM 的角色比喻為「現代企業的水電」。當 AI 已深入日常營運,成為不可或缺的基礎能力,其穩定性的重要性也隨之提升。

過去企業評估 AI 工具,多聚焦於模型能力、價格與功能,但隨著「降智」現象浮現,另一個更關鍵的指標正在浮現,那就是穩定性。當模型品質可能在未通知的情況下變動,企業不再只是「使用 AI」,要開始承擔一種新型態的基礎設施風險。更絕望的是,只看前沿的大型語言模型的話,基本上在算力問題未解決前,都可能會繼續發生。

這篇文章 數據曝「Claude 降智」並非都市傳說,AI 模型不穩定成企業風險 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

威剛、周杰倫賺翻?GD 經紀公司密會杜拜王室,討論 IPO、AI 與機器人

韓國娛樂科技公司 Galaxy Corporation 近期進軍中東市場,成立杜拜法人「Galaxy ME」,並與阿聯酋王室成員會晤,探索 AI 與內容整合。公司已選定證券商進行 IPO,去年營收達3000億韓元,並吸引周杰倫及威剛等投資。該布局旨在推動中東娛樂生態系的發展,強調其全球化戰略的重要性。

鏈新聞abmedia1小時前

中國團隊 EvoMap 怒控爆紅 Hermes Agent 抄襲:自進化體系存在高度相似性

中國團隊EvoMap指控Nous Research的Hermes Agent抄襲其Evolver/GEP架構,認為兩者在多個關鍵模組上存在高度相似性。EvoMap指出,Hermes的設計未引用或致謝其先前公開的內容,爭議引發社群廣泛關注,部分中國網友聲援EvoMap,並批評Hermes的抄襲行為。儘管Nous研究團隊尚未針對指控逐條反駁,但事件已迅速在AI輿論中擴散。

鏈新聞abmedia1小時前

OpenAI 早期投資人青睞!腦機新創 Sabi 最快年底出貨「思考就能寫字」的毛帽

矽谷新創 Sabi 宣布正在開發一款無需侵入性手術的穿戴式腦機介面,使用者只需「思考」就能將文字輸入螢幕,預計2026年底推出。該裝置將配備高達十萬顆微型感測器,有助於精確解讀腦部活動,Sabi 也強調數據的隱私保護。

鏈新聞abmedia1小時前

OpenAI 更新 Codex 為可控桌面、能自動化開發工作流程的 AI 代理

OpenAI 升級版 Codex 正在從編碼助理演進為桌面環境的自主代理,能夠管理應用程式、自動化工作流程,並與超過 100 款應用整合。這種轉變提升了任務連續性與工作流程自動化,反映出 AI 編碼工具領域的競爭態勢。

GateNews2小時前

Google 將 AI 搜尋整合進 Chrome,讓使用者進行對話式網頁瀏覽

Google 正在用 AI 驅動的搜尋功能強化 Chrome,讓使用者能以對話方式瀏覽並獲得具情境感知的回應。這項新功能也包含多分頁整合,透過整併已開啟分頁並提供量身打造的資訊,改善使用者在各種任務中的體驗。

GateNews2小時前

新世界集團終止與 OpenAI 的合作,改與 Reflection AI 建立夥伴關係,調整零售策略

新世界集團已停止與 OpenAI 的合作,轉而選擇與 Reflection AI 進行更大規模的合作,以強化零售營運中的 AI。此一決策旨在簡化工作流程,並針對對 AI 商務成效的疑慮作出回應。

GateNews3小時前
留言
0/400
暫無留言