用 AI 提升產出還是降低成本?百倍效率沒換來百倍營收,但矽谷沒人敢喊停

鏈新聞abmedia

五源資本合夥人孟醒,近日發表矽谷考察報告,提出一個讓他自己都改變記筆記習慣的判斷:矽谷正在進入一個連造浪的人都被浪淹沒的階段。AI 的迭代速度已經從「按月」變成「按週」,連矽谷自己都跟不上自己。

當 AI 把一個團隊的生產力放大五倍,你可以減少八成人力維持原本產出,也可以維持人數做五倍的事。孟醒這次矽谷的觀察,等於是在現場給出了答案的初稿:當 100 倍效率沒有換來 100 倍營收,當 token 預算逼近人力成本,當蒸汽機還跑不過馬車卻沒人敢停下,矽谷現在選的是「先把速度衝上去再說」。但這條路最終會走到「擴張能力」還是「壓縮成本」,目前沒有定論。

YC 從領先指標變成落後指標

孟醒今年 3 月坐在 YC W26 batch Demo Day 觀眾席,聽到第五家公司路演時就放下了筆。原因是這一屆超過一百家公司中,約 80% 都在做垂直 agent,例如幫律師整理文件、幫客服分發工單、幫 HR 篩選履歷。

如果是去年 10 月看到這些題目,他會覺得「挺有想法」。但 Claude Code 從開發者工具變成幾乎人人可用的介面、Opus 4.6 把 vibe coding 的門檻壓到地板之後,這些垂直 agent 在尚未建立業務壁壘前,一個普通工程師花一個週末就能複製出來。

YC 的批次制度從申請、篩選、入營、打磨到路演,是按一個更慢的世界設計的。在當前 AI 的迭代速度下,5 個月足夠發生數輪典範轉移。孟醒形容,YC 正從過去的領先指標逐漸變成落後指標。

Meta 全員用對手的產品寫程式

孟醒這次矽谷之行最大的衝擊,是 Meta 整間公司全員都在使用 Claude Code。一家市值兆級的公司,讓幾萬名工程師用競爭對手的 API 接觸自家程式碼,這在半年前完全不可想像。

Meta 內部曾推出名為 myclaw 的工具試圖解決程式碼安全問題,但「不好用,沒人用」。最後公司直接放寬政策,只要不涉及客戶資料,員工可自由使用 Claude Code,並開始召開「如何變成 AI native 組織」的內部會議與培訓。

Google 因安全考量原則上禁止員工使用對手工具,但 DeepMind 是例外,負責 Gemini 與內部應用的幾個團隊都在用 Claude Code。Google 自家內部編碼工具 Antigravity 號稱目前約 50% 的新程式碼由 AI 編寫,仍無法阻擋 DeepMind 的偏好。

其中一個關鍵是 Anthropic 為其做了私有化部署,而且 Anthropic 的推理與訓練本來就大比例跑在 Google Cloud 的 TPU 上,雙方有信任基礎;其他大廠則沒有這層關係,是真的把程式碼安全暫時擱在一邊,先把速度衝上去。

工程師的 token 花費,比工程師本人還貴

孟醒在 Palo Alto 走訪的數家 AI-native 新創公司中,一個工程師一年的 token 預算約為二十多萬美元,這個數字已經接近一個工程師的年薪。看似公司用 AI 裁人省錢,實際上總成本可能根本沒降,只是把人的成本換成了 token 成本。

Meta 把這件事推到極致,內部設立了一個 token 消耗排行榜,誰用得多誰上榜,末尾可能被裁,員工為此卷出了一個叫做「token legend」的非官方頭銜。但同一段時間,Meta 接連兩輪裁員、規模合計上萬人。一邊全員衝 token、一邊大規模裁員並不矛盾,這是同一件事的兩面。

孟醒實地看了一家 C 輪公司,技術負責人打開 Slack 給他看,全是 agent 在跑,背後並行十幾個 Cursor agent,再開一個 Claude Code 視窗負責調度。工程師圈最流行的焦慮,是睡覺前不知道我那十幾個 agent 要幹什麼,就很慌。

100 倍效率,沒有換來 100 倍營收

很多 CTO 興奮地告訴孟醒,「以前 60 個人花 1 年做的事,現在 2 個人加 Claude Code 一週就能搞定」,所謂「百倍工程師」、「十倍效率提升」。

但孟醒冷靜下來後問了一個問題:好,效率提升了 100 倍,那公司的營收增長 100 倍嗎?產品線擴張了 100 倍嗎?他沒有得到正面回答。事實是 100 倍的效率提升落到營收上,常常只體現了 50% 或一倍。差距在哪,現在沒人能說清楚。

「用了這麼多 token,公司應該基因突變成另外一種公司才對。但到底變成什麼,我也不知道。」一位創辦人這樣告訴他。連 Anthropic 自己也有跟不上的場景。孟醒問一位 Anthropic 朋友「你們自己用 agent 最痛苦的場景是什麼」,答案是 oncall 即時響應。

當 API 響應變慢、推理節點掛掉、用戶反饋輸出異常時,oncall 工程師需要快速定位是程式碼 bug、算力分配還是模型本身的問題。Anthropic 是全世界 coding agent 最強的公司,這個場景離他們的核心能力近得不能再近,他們內部的 oncall agent 仍然不好用。

蒸汽機跑得還沒馬車快,但沒人敢停下來等

孟醒形容當下的狀態:蒸汽機已經被發明出來,但有時候跑得還沒馬車快。關鍵是所有人都知道蒸汽機終將跑得更快,所以程式碼安全也不管了、token 預算爆了、排行榜卷起來了。至於蒸汽機什麼時候真的跑過馬車,沒人知道,但沒人敢停下來等那一天,因為停下來的代價,可能比燒錯 token 更大。

而 token 消耗大概率不是線性增長。孟醒援引研究機構 METR 的數據:衡量 AI agent 能以 50% 成功率完成多長任務(按人類專家完成時間算)的指標,2025 年 3 月時 Claude 3.7 Sonnet 還是 50 分鐘,到 2025 年底 Claude Opus 4.6 已經做到 14.5 小時。

過去兩年這個指標的翻倍週期,從 7 個月壓縮到 4 個月。一旦 agent 可靠性再上一個台階,token 消耗就不是每年加 50% 的問題,而是一夜之間上一個數量級。孟醒也提到一個朋友圈內共識的預測:到今年年底,不少公司(包括科技大廠)實際上只需要 20% 的人。

(回答一個問題:AI 讓你效率提升五倍,你要減少 80% 成本,還是做五倍的事?)

筆者今年 4 月曾在一篇文章中問過:當 AI 把一個團隊的生產力放大五倍,你可以減少八成人力維持原本產出,也可以維持人數做五倍的事。Aaron Levie 在 a16z Podcast 上提出,未來一間公司的 agent 數量可能是員工的 100 到 1,000 倍;黃仁勳則直言,如果世界沒有新的創意,AI 帶來的生產力提升最終只會轉化為失業。問題不在 AI,而在於決策者是否具備想像力。

孟醒這次矽谷的觀察,等於是在現場給出了答案的初稿:當 100 倍效率沒有換來 100 倍營收,當 token 預算逼近人力成本,當蒸汽機還跑不過馬車卻沒人敢停下,矽谷現在選的是「先把速度衝上去再說」。但這條路最終會走到「擴張能力」還是「壓縮成本」,目前沒有定論。

孟醒在文章結尾留下一個更平衡的視角:他這半個月看到那麼多「跟不上」確實讓人焦慮,但如果 AI 真的能在幾年內讓癌症變成慢性病、讓材料科學快進二十年,這場「跟不上」可能是人類發展史上最大的一次提速。

對企業決策者而言,真正的問題從來不是 AI 會不會取代人,而是當生產力被放大五倍、十倍、一百倍之後,你選擇用它去裁掉更多人,還是去做更多事。這個選擇,正在矽谷與全球企業的會議室裡同時發生。

這篇文章 用 AI 提升產出還是降低成本?百倍效率沒換來百倍營收,但矽谷沒人敢喊停 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Mac Studio 跑大模型實測:M3 Ultra、集群方案與 M5 Ultra 預期

2026 年 4 月,DeepSeek V4 Pro、Kimi K2.6 等 1 兆參數級模型相繼釋出,把「在自家機器跑前沿開源 LLM」這件事變成可行選項。對不想自建 H100 工作站、又想擁有完整本地推論能力的工程師與小型團隊,\\Mac Studio M3 Ultra 256GB\\ 是現階段最具性價比的單機方案,搭配 Thunderbolt 5 集群更可上探 1T 參數的領域。本文整理 M3 Ultra 跑大模型的實測數據、集群方案、MLX 框架優勢,以及 M5 Ultra 預期時程。 M3 Ultra 規格現況:256GB 統一記憶體、819

鏈新聞abmedia2分鐘前

Musk 起訴 OpenAI,因非營利任務轉向而控告微軟

根據 Reuters 報導,埃隆・馬斯克(Elon Musk)在針對 OpenAI、山姆・奧特曼(Sam Altman)、格雷格・布羅克曼(Greg Brockman)以及微軟(Microsoft)的 2024 年訴訟中,陪審團遴選將於開始。馬斯克指控他們在 2019 年透過建立一家營利性實體來背叛 OpenAI 的非營利使命。馬斯克正為 OpenAI 的求償尋求美金 US$150 billion 的賠償金

Crypto Frontier4分鐘前

英特爾股價飆升 110%:AI 轉型重塑科技產業

Gate 新聞訊息,4 月 27 日——英特爾的股價今年已上漲 110%,並於週五創下新的歷史最高點,這標誌著這家晶片製造商在距離上次高峰 25 年後迎來重大的逆轉。這波反彈反映了科技產業更廣泛的轉變:隨著 AI 轉型推進,產生了截然不同的勝負分野——建置 AI 基礎設施的硬體公司正蒸蒸日上,而軟體與服務公司則面臨愈加沉重的壓力。 在標普 500 指數(S&P 500)的資訊科技板塊中,截至目前年初至今已上漲 8%,硬體與軟體之間已出現急劇分歧。半導體設備製造商(例如 Applied Materials 和 Lam Research)股價已大幅上漲,約 63%;而 IT 顧問公司(包括 Accenture、IBM 和 Cognizant)則下跌將近 28%。這種模式反映了經典的「創造性毀滅」循環:創新同時催生新產業,並使既有產業面臨動盪——而這一動態先前曾分別透過 PC 重塑主機架構、以及透過行動裝置改寫 PC 的命運。 英特爾的契機源自不斷演進的 AI 基礎設施需求。GPU 製造商(例如 Nvidia)率先引領了最初的熱潮,因為企業需要圖形處理器來訓練 AI 模型。此後又擴展到記憶體晶片製造商、供電公司以及資料儲存業者。如今,由英特爾製造的 CPU(中央處理器)正逐漸成為日常 AI 推論與部署不可或缺的關鍵。「CPU 正重新成為 AI 時代不可或缺的基礎,」英特爾執行長 Lip-Bu Tan 在公司週五的投資人電話會議上表示。 然而,科技轉型中的早期贏家並不一定能夠一直延續優勢。電信公司曾在網際網路時代充當「挖金者與賣鏟子的人」(picks-and-shovels),但最終未能守住其獲利成果。相反地,微軟從 PC 時代的下滑中借助雲端運算而得以復甦;蘋果則完成從 PC 到打造行動時代的轉型。正如分析師 Ed Yardeni 所指出的:「你要嘛成為創造者,要嘛就會被摧毀」——這也凸顯了即使是今天的領先者,結果同樣充滿不確定性。

GateNews15分鐘前

螞蟻集團推出 Ling-2.6-1T:為以 token 為導向的任務執行進行優化的萬億參數模型

Gate News 訊息,4 月 27 日——螞蟻集團的 inclusionAI 已發布 Ling-2.6-1T,這是一款全新的萬億參數旗艦指令模型,屬於 Ling 系列。與長鏈推理模型不同,Ling-2.6-1T 採用「快思考」機制,旨在以最少 token 消耗實現精準任務執行

GateNews27分鐘前

Silicon Valley Tech Executives Boost Security Details After Recent Attacks on Altman, Others

Gate News 訊息,4 月 27 日——在近期針對知名科技領袖的攻擊之後,包括對 Sam Altman 位於舊金山的住處以及 UnitedHealthcare 執行長的攻擊,矽谷的科技高管正顯著升級個人安全措施。日益高漲的反人工智慧情緒,結合這些高調事件,已促使科技創辦人重新評估私人安全安排,從先前對僱用保鑣的猶豫,轉而將全面防護視為標準做法。 安全風險來自線下抗議與線上的威脅。根據安全專業人士的說法,社群媒體能在幾天內迅速將公眾的不滿集中指向特定個人;而公開分享的照片、行程與地點資訊,會產生可被利用的漏洞。科技高管面臨的威脅涵蓋範圍從人身防護與住宅安全,到出行風險評估以及線上威脅監測。 企業披露反映了這一趨勢。根據 Equilar 對 S&P 500 代理申報文件的分析,2025 年有 37.8% 的公司為至少部分高管提供安全福利,高於 2024 年的 33.5%。在提供此類福利的公司中,中位數安全支出從 108,700 美元上升至 130,500 美元。Meta 在 2026 年的代理申報文件中披露,因 Mark Zuckerberg 的高知名度以及特定安全威脅,公司為他提供了全面的安全安排,於 2025 年用於住宅與個人出行安全的支出約為 8.50 百萬美元,並另有一筆額外的 百萬美元(稅前)安全津貼。私人安全公司也在調整其服務模式,正逐步遠離過去那種穿著西裝、戴著耳麥的保鑣做法,轉向能夠融入高管董事會會議、晚宴與家庭場景的人員。

GateNews1小時前
留言
0/400
暫無留言