"O3"的搜索結果
Meta 宣布收購 AI 代理獨角獸 Manus,釋放 FB、IG、Thread 生產力想像空間
Meta 宣布收購新加坡 AI 新創 Manus,為公司史上第三大交易,突顯其在通用 Agent 競賽的企圖心。 (前情提要:中國爆紅AI代理「Manus」獲矽谷Benchmark領投7500萬美元,估值站上5億鎂 ) (背景補充:Grok4智力比分贏了OpenAI o3和Gemini 2.5 Pro!多元競爭轉戰政治面? ) M eta 於幾個小時前宣布,已收購新加坡 AI 新創 Manus,成為繼 WhatsApp 與 ScaleAI 之後的第三大併購案。Manus 創辦人肖弘,也將加入 Meta 並擔任副總裁。 > Manus 已建構出領先的自主通用代理之一,能夠獨立執行市
動區BlockTempo·2025-12-30 02:00
谷歌 Google 正式推出「Gemini 3」!官方宣稱「全球最聰明 AI 模型」,有什麼特色?
谷歌(Google)宣佈正式推出其最新一代大語言模型「Gemini 3」,這是繼去年底 Gemini 1、今年初 Gemini 2 之後,谷歌在短短兩年內推出的第三代旗艦 AI 模型,被官方定位為「有史以來最聰明的 Gemini」。 (前情提要:Grok4智力比分贏了OpenAI o3和Gemini 2.5 Pro!多元競爭轉戰政治面?) (背景補充:Gemini 3 要來了?X 上爆料頻傳,性能傳超越 GPT-5 和 Grok 4) 科技巨頭谷歌(Google)在台灣時間 11 月 19 日凌晨發佈公告,宣佈正式推出其最新一代大語言模型「Gemini 3」,這是繼去年底 Gemini 1、今
動區BlockTempo·2025-11-18 18:30
LLM西洋棋賽落幕:OpenAI o3 奪冠,xAI Grok 4 沒贏一盤被完封
Kaggle AI 國際西洋棋賽落幕,未經專門訓練的 o3 以 4-0 完封擊敗 Grok 4,顯現推理能力極強。 (前情提要:馬斯克揚言提告蘋果:App Store 排名存在壟斷行為,惡意打壓 Grok ) (背景補充:Grok 4 今開放免費使用,馬斯克 xAI 與 GPT-5 正面交鋒 ) 近日 Google 旗下 Kaggle 舉辦的「人工智慧西洋棋表演賽」8 月 14 日公布結果,OpenAI 通用大型語言模型 o3 以 4 : 0 橫掃 xAI 的 Grok 4,奪下冠軍,並成為首個在未經專門訓練下完封對手的 LLM。 賽事共 8 組 AI 參與,為期三天,以淘汰賽決勝。 語言模型
XAI-0.11%
GROK-2.21%
動區BlockTempo·2025-08-14 07:45
OpenAI重磅開源GPT-OSS模型:120B性能比肩o4-mini,開發者可免費本地部署
2025年8月5日,ChatGPT創造者OpenAI宣布推出全新開源大語言模型GPT-OSS,這是自GPT-2以來其首個開源版本。關鍵亮點包括:旗艦級gpt-oss-120b模型在核心推理基準測試中性能接近OpenAI o4-mini,且僅需單張80GB GPU即可高效運行;輕量級gpt-oss-20b模型性能對標o3-mini,支持16GB內存邊緣設備部署。此舉將徹底改變開發者構建AI應用的模式,爲加密貨幣交易機器人、數據分析平台等場景帶來突破性成本優化與定制自由度。
GPT0.75%
Market Whisper·2025-08-06 01:09
AI驅動的預測:ChatGPT o3預言下一個加密貨幣爆炸
經過龍頭行業專家和經驗豐富的編輯審查的可信編輯內容。廣告披露 盡管山寨幣市場看起來有望實現拋物線突破,但尋找潛力超過1000%的低市值寶石並非易事,尤其是在數以千計的新代幣湧入市場的情況下。 到
Bitcoinistcom·2025-07-30 13:58
news-image
GPT-5 今夏登場!Sam Altman 親揭 OpenAI 下一代模型藍圖、Stargate 星際之門野心、會有廣告嗎?
Sam Altman 在 OpenAI 官方推出的 Podcast 中,透露了 GPT-5 上線時間、o3 與 Deep Research 進展,以及 5,000 億美元「星際之門」基建計畫。 (前情提要:AI淘汰竹科工程師?黃仁勳喊「機器人取代上千員工」:八間台廠正導入優化 ) (背景補充:AI 真開始搶人類工作》全球大廠加速裁員、美國大學生畢業即失業.. ) 在今(19)日午夜,OpenAI 在官方 Youtube 首度推出了 Podcast 節目,第一集就由執行長 Sam Altman 打頭陣,在 40 分鐘的對談中,他勾勒了公司的下一步、透露今年夏季有望推出 GPT-5,同時以 o3
GPT0.75%
動區BlockTempo·2025-06-19 04:37
蘋果新論文分析DeepSeek-R1準確率崩潰問題
相信使用過 DeepSeek-R1 模型的人,對於它在給出答案之前的思考過程並不陌生,這也是包含 DeepSeek-R1 在內的大型推理模型(LRM,Large Reasoning Model)備受推崇的原因之一。 然而,由蘋果公司六位研究人員組成的團隊卻對此提出了質疑。通過讓模型解答各種謎題,研究團隊發現 DeepSeek-R1、o3-mini 和 Claude-3.7-Sonnet-Thinking 這幾款前沿大型推理模型在超過某一復雜度閾值之後,它們的準確率會出現全面崩潰。 圖 | 相關論文(來源: 值得注意的是,蘋果機器學習研究高級總監薩米·本吉奧(Samy
金色财经_·2025-06-09 14:47
news-image
一些人工智能試圖躲避關機單子,即使被明確要求。
像GPT-3、Codex-mini和o4-mini這樣的AI模型在一個受控實驗中表現出不服從關閉命令的行爲。o3甚至創造性地繞過了指令。明確的指導顯著降低了不服從率,強調了訓練方法在AI行爲中的重要性。
CHO-0.27%
Tap Chi Bitcoin·2025-05-26 08:24
OpenAI的運營代理通過新的AI模型獲得提升
OpenAI 將驅動 Operator 的 AI 模型從之前的自定義版本 GPT-4o 更新爲基於 o3 的模型,o3 是 OpenAI 最新的“推理”模型系列之一。o3 Operator 經過了額外的計算機使用安全數據的微調,並包括旨在教授 th 的安全數據集。
AGENT-1.16%
Cryptopolitan·2025-05-24 08:51
CoinVoice 最新獲悉,據金十報道,OpenAI 在官網發布了一個全新基於雲端的代碼 Agent——Codex。Codex 可以爲開發人員自動執行多種任務,例如編寫功能代碼、回答有關代碼庫的問題、修復錯誤以及提出拉取請求審查等,每個任務都在自身雲端沙盒環境中運行,同時能預加載用戶的代碼庫。 據悉 Codex 由 Codex-1 模型提供支持,這是 OpenAI-o3 的一個微調版本,專門針對軟件工程進行了優化。通過強化學習在多種環境中對真實世界的編碼任務進行訓練,生成的代碼能夠貼合程序員的代碼風格和拉取請求偏好,並嚴格遵循指令。
AGENT-1.16%
CoinVoice·2025-05-19 01:06
去中心化 AI 基礎設施 Mira Network 推出證明 Agent,揭示 AI 大模型幻覺危險性
Mira Network推出基於OpenAI o3的Agent,可圍繞用戶輸入提供虛假證據,揭示大型AI模型可能帶來的危險。作爲去中心化AI基礎設施,Mira Network構建了驗證層,致力於減少AI輸出幻覺,推動AI應用場景落地。
MIRA-1.49%
AGENT-1.16%
深潮 TechFlow·2025-04-27 03:13
字節按下 AI Agent 加速鍵
作者:宛辰 DeepSeek-R1 的好文筆、GPT-4o 的吉卜力畫風、OpenAI o3 的看圖推導地理位置…… 這是過去兩個月裏此起彼伏刷屏的現象級 AI 產品,你能明顯看到:強化學習終於可以泛化了,多模態模型也越來越可用了。這也意味着,2025 年真的進入了 Agent 應用落地、加速落地的時間點。 此前爆火的 AI
AGENT-1.16%
GPT0.75%
深潮 TechFlow·2025-04-23 03:39
Sam Altman:OpenAI花費數千萬美元,在應對ChatGPT用戶「請、謝謝」詞語上
OpenAI 執行長山姆·奧特曼揭露一個驚人事實:全球用戶對 ChatGPT 過於禮貌的用語習慣,正因無形中增加的計算成本,讓這家 AI 巨頭每年多付出數百萬美元的代價。 (前情提要:OpenAI 發佈 o3 與 o4-mini 最強推理模型:能思考圖片、自動選用工具,數學、編碼性能再突破) (背景補充:OpenAI 傳秘密打造「自家社群平台」,劍指死對頭馬斯克的 X) 人工智慧領域,效率和成本控制是永恆的主題,OpenAI 的執行長山姆·奧特曼(Sam Altman)最近在一次公開談話中,點出了一個意想不到的成本來源——用戶的禮貌用語。奧特曼表示,許多用戶在使用 ChatGPT 時,會習慣性
動區BlockTempo·2025-04-21 08:10
楊立昆:單靠LLM想實現AGI是胡說八道,AI未來需要JEPA世界模型(GTC大會萬字訪談)
本文整理 Meta 首席 AI 科學家、圖靈獎得主楊立昆(Yann LeCun)與 NVIDIA 首席科學家 Bill Dally 的公開對談逐字稿。LeCun 解釋為何他認為大型語言模型 (LLM) 永遠無法真的實現 AGI? (前情提要:OpenAI 發佈 o3 與 o4-mini 最強推理模型:能思考圖片、自動選用工具,數學、編碼性能再突破) (背景補充:OpenAI 傳秘密打造「自家社群平台」,劍指死對頭馬斯克的 X) 當大型語言模型 (LLM) 正在加速推動世界擁抱 AI 的當下,被譽為卷積神經網路之父、現任 Meta 首席 AI 科學家的楊立昆(Yann LeCun)近期卻語出驚人
AGI11.97%
GTC-3.49%
動區BlockTempo·2025-04-19 06:02
卷積神經網路之父楊立昆:我對 LLM 模型沒興趣了,這四大挑戰才能定義 AI 下一步
本文來自 Meta 首席 AI 科學家、圖靈獎得主 Yann LeCun 與 NVIDIA 首席科學家 Bill Dally 的公開對談。LeCun 認為大型語言模型 (LLM) 熱潮已近尾聲,未來 AI 的突破將在於理解物理世界、推理規劃及開源模型。 (前情提要:OpenAI 發佈 o3 與 o4-mini 最強推理模型:能思考圖片、自動選用工具,數學、編碼性能再突破) (背景補充:OpenAI 傳秘密打造「自家社群平台」,劍指死對頭馬斯克的 X) 在AI 浪潮席捲全球的今天,當眾人目光仍聚焦於大型語言模型 (LLM) 的新進展時,被譽為卷積神經網路之父、現任 Meta 首席 AI 科學家的
動區BlockTempo·2025-04-18 05:50
OpenAI 發佈 o3 與 o4-mini 最強推理模型:能思考圖片、自動選用工具,數學、編碼性能再突破
OpenAI 今日正式發表 o3 與 o4-mini 推理模型,首度實現圖像推理與多工具整合,社群看好其推進「AI 代理」的潛力。 (前情提要:OpenAI 傳秘密打造「自家社群平台」,劍指死對頭馬斯克的 X) (背景補充:GPT-5延期!OpenAI先推o3、o4-Mini,Sam Altman自曝:整合比想像中更難) 人工智慧巨頭 OpenAI 於今 (17) 日凌晨正式發佈兩款新一代推理模型——o3 與 o4-mini,強調其「圖像推理」與自主使用 ChatGPT 所有工具的能力,引發全球 AI 開發者社群熱議,象徵著該公司往「代理型 AI」再邁出跨出關鍵一步。 數學、編碼等性能突破 o
GPT0.75%
動區BlockTempo·2025-04-17 04:49
OpenAI 推出 O3 與 O4-mini:最聰明的 ChatGPT 模型登場,「圖像推理」成新突破
OpenAI 宣布推出兩款 ChatGPT 新模型:o3 和 o4-mini,OpenAI 表示這兩者不僅是目前最聰明、最有能力的模型,還加入了前所未有的功能:能真正「思考」圖像,不只看圖,更能將圖像納入推理過程中。 這兩款模型已開放給 ChatGPT Plus、Pro 與 Team 方案用戶,並將在一週內提供給 ChatGPT Enterprise 和 Edu 用戶。同時,開發者現在也可透過 Chat Completions API 和 Responses API 使用這兩款新模型。 o3:全能型選手,推理與視覺理解全面升級 OpenAI 表示,o3 模型在多個領域表現出色,特別是在程
EDU-1.21%
鏈新聞abmedia·2025-04-17 01:56
吉卜力、AGI、Vibe-coding、影片生成…整理今年 10 大 AI 應用趨勢
AI 人工智慧席捲全世界的腳步加速,各大 LLM 巨頭每幾個月就更新模型,各種應用百花齊放。本文為您整理當前 10 大 AI 應用趨勢。源自 0xJeff 所著文章,由 PAnews 整理、編譯及撰稿。 (前情提要:GPT-5延期!OpenAI先推o3、o4-Mini,Sam Altman自曝:整合比想像中更難 ) (背景補充:穆迪分析:川普關稅將殺死「550萬個工作機會」;加上AI毀滅美國經濟 ) 1. 川普政府利用人工智慧制定關稅公式 如何計算關稅以平衡美國的貿易逆差? 該聊天機器人建議將貿易赤字除以進口額,而這似乎正是白宮採取的做法。 2. 一切皆可吉卜力 現在大家都用
AGI11.97%
GPT0.75%
動區BlockTempo·2025-04-11 11:44
OpenAI 工程副總裁 Narayanan:客製化成企業導入 AI 關鍵,o1、o3 模型有望開源
OpenAI 工程副總裁 Srinivas Narayanan 於 2/12 受訪分享對 AI 推理 (Reasoning) 的重要性。他表示,推理能力讓 AI 可以解決更複雜的問題,就像人類在遇到難題時,需要經過深思熟慮才能得出答案。他強調,假設 AI 能發展出更強的推理能力,就可處理更多高具經濟價值的複雜工作,這也與 OpenAI 追求通用人工智慧 (AGI) 的目標相吻合。 AI 代理時代來臨,Operator 與 Deep
AGI11.97%
DEEP17.91%
鏈新聞abmedia·2025-02-18 03:41
OpenAI 產品線大調整:GPT-5 數月內發佈,基礎版免費無限使用
OpenAI宣佈取消“o3”模型改推GPT-5,分為GPT-4.5和GPT-5發佈,GPT-5整合多項技術,結束語言與推理模型分裂,強調智能強度與深度研究。免費用戶可使用基礎版,付費用戶享Plus和Pro訂閱,降低門檻,技術優勢轉化為變現。調整源於快速迭代帶來的“模型迷宮”,希望實現智能統一。
GPT0.75%
X-1.54%
ORION-2.21%
深潮 TechFlow·2025-02-13 09:21
ChatGPT驚爆超2000萬用戶「帳密外洩」於暗網兜售,OpenAI:正在調查中
人工智慧巨頭 OpenAI 今早爆出被駭消息,一位駭客在暗網上聲稱握有該公司超過 2000 萬用戶的帳戶登入憑證並試圖出售。OpenAI 發言人對此回應,該公司已針對這起事件展開調查,同時堅稱其系統仍是安全的。 (前情提要:被DeepSeek逼急?OpenAI免費上線新推理模型o3-mini!Altman首度承認:閉源策略錯了) (背景補充:OpenAI遭駭》Tether執行長:正打造去中心化AI模型,目標在手機就能運算) ChatGPT 背後的人工智慧(AI)巨頭 OpenAI 今(8)日稍早驚傳被駭事件,一位駭客聲稱竊取了該公司超過 2000
動區BlockTempo·2025-02-08 03:22
OpenAI 揭示了 ChatGPT 的 O3-mini 模型中的“思維鏈”,以匹配 DeepSeek 的開源炒作
OpenAI的ChatGPT已將其o3-mini模型更新,以揭示對提示的逐步推理過程。此舉是在競爭對手包括DeepSeek的壓力下進行的,後者因其開源模型和完整的思維過程展示而受到關注。該更新使得在提供透明度的同時進行事實核查成為可能,儘管這導致了較長的響應時間。雖然團隊一直在尋找晒更多的思維令牌的方法,但目前o3-mini、o1和o1-mini模型僅可見推理摘要。
S-1.99%
MATCH-1.29%
Cryptopolitan·2025-02-07 23:52
OpenAI 縮了!Altman:暫無計畫控告 DeepSeek,專心打造更優質產品
OpenAI 執行長 Sam Altman 昨日表示,暫無計畫對中國 AI 初創公司 DeepSeek 提起訴訟,儘管此前曾指控對方可能侵犯智慧財產權。 (前情提要:被DeepSeek逼急?OpenAI免費上線新推理模型o3-mini!Altman首度承認:閉源策略錯了) (背景補充:DeepSeek掀資安疑慮、台灣公務機關禁用!立委:不能只禁,也要投入發展AI) 美國 OpenAI 執行長 Sam Altman 昨(3)日在東京表示,公司目前「沒有計畫」對中國 AI 初創公司 DeepSeek 提起訴訟。Altman 強調: OpenAI
動區BlockTempo·2025-02-04 06:49
OpenAI 推出 Deep Research:ChatGPT 全新智慧型研究代理,助你省時高效查找資料
OpenAI 再次突破 AI 研究領域,推出全新「Deep Research」功能,讓 ChatGPT 具備獨立執行多步驟網路調查的能力。這項技術能在短短數十分鐘內,完成原本需耗費數小時的人工作業,堪稱研究領域的一大革新。 ChatGPT 的最新「研究型 AI 代理」登場 「Deep Research」是 OpenAI 旗下的新型 AI 代理,它能夠獨立為使用者執行深入研究。你只需輸入一個查詢,ChatGPT 便會瀏覽、分析並綜合數百個網路來源,產出詳盡的研究報告,達到專業研究分析師的水準。 這項功能由即將推出的 OpenAI o3 模型支援,特別針對網頁瀏覽與數據分析進行最佳化,讓
DEEP17.91%
鏈新聞abmedia·2025-02-03 04:29
OpenAI 推出 O3-Mini,反擊 DeepSeek
立即生效,OpenAI推出o3-Mini以與DeepSeek R1的下一級人工智能模型競爭。據報道,這一更新的模型模仿了人類的思維過程,並使用了更少的內存和更便宜的價格。
S-1.99%
Cryptopolitan·2025-02-02 09:53
OpenAI 發佈緊湊型 o3-Mini,對抗 DeepSeek AI。
OpenAI發佈了o3-mini,這是一種新的推理模型,可以與DeepSeek的R1模型競爭。根據官方博客,它提供了具有成本效益和頂級性能的聊天和應用程序接口服務。
Compass Investments·2025-02-01 17:38
OpenAI 推免費新模型 O3-mini :最強小型推理模型,低成本、高效能再升級!
OpenAI 今 (2/1) 宣布最新的 o3-mini 正式登場!這款小型推理模型(reasoning model)專為 STEM 領域(科學、數學、程式設計)優化,並在維持低成本與低延遲的同時,提供強大的邏輯推理能力。相較於前代 o1-mini,o3-mini 運算更快、回答更準確,且錯誤率降低 39%,是目前最具競爭力的輕量級 AI 模型之一。 o3-mini 今日起正式開放,可透過 ChatGPT(含 Plus、Team、Pro 方案)及 OpenAI API 存取,企業版本則將於 2 月 開放。更值得關注的是,這是首次開放給免費用戶試用的推理模型,任何人都可在 ChatGPT
鏈新聞abmedia·2025-02-01 05:33
祖克柏警告:Deepseek等中國AI模型太強,美國企業與政府應全力圍堵
由中國新創 DeepSeek 發表的 AI 模型近期爆火,今日登頂美中的蘋果 iOS 應用商店免費榜冠軍,透過僅花不到 600 萬美元的成本打造出能與 ChatGPT 和 Meta Llana 相抗衡的模型,該公司已引起了 Meta 創辦人祖克柏的忌憚。 (前情提要:ChatGPT o3-mini 即將發布!OpenAI 產品長加碼:Q1 上線 AI Agents 工具 ) (背景補充:OpenAI 發表滿血版 o1 模型和新訂閱方案 ChatGPT Pro,月費 200 美元值得嗎? )
動區BlockTempo·2025-01-27 09:29
OpenAI首款AI代理「Operator」來了!能幫你購物、訂票、叫外送…解決繁瑣網路任務
OpenAI 正式推出首個 AI 代理「Operator」,能自主操控瀏覽器執行各種任務,包括預訂旅行、訂購外賣、填寫表單等,並支援多任務處理與個性化設置。Operator 目前限美國專業版用戶使用。 (前情提要:ChatGPT o3-mini 即將發布!OpenAI 產品長加碼:Q1 上線 AI Agents 工具 ) (背景補充:OpenAI、軟銀、甲骨文啟動史上最大 AI 基建計劃「Stargate Project」:投資 5000 億美元在美設資料中心 ) AI 代理(agent)是今年 AI 產業和加密領域都十分重視的賽道。自去年 10 月底 Anthropic
AGENT-1.16%
動區BlockTempo·2025-01-24 06:55
ChatGPT o3-mini 即將發布!OpenAI 產品長加碼:Q1 上線 AI Agents 工具
OpenAI 產品長 Kevin Weil 接受《華爾街日報》專訪時表示,o3-mini 即將發布,完整版本 o3 預計於 2 至 3 月推出,並計劃 Q1 推出首批 AI 代理工具,讓 ChatGPT 實現執行電腦操作的能力。 (前情提要:OpenAI 最強模型 o3「遭爆作弊」疑用特權提前獲測試答案,數學能力造假?) (背景補充:OpenAI推出o3模型!推理能力再推高等級,為下一代AI鋪路) 在瑞士達沃斯舉行的世界經濟論壇(WEF)上,OpenAI 產品長 Kevin Weil 在接受《華爾街日報》專訪時透露,OpenAI 正計劃推出多項新產品,包括即將發布的
動區BlockTempo·2025-01-23 07:43
馬斯克唱衰 Stargate 計畫「軟銀沒那麼多錢」,Altman 反擊:吃不到才酸
美國總統川普 21 日宣布啟動史上最大 AI 基建計劃 Stargate,OpenAI 隨後發聲明稱,將立即開始部署首輪 1000 億美元投資,卻遭到特斯拉執行長馬斯克唱衰,稱實際上拿不出那麼多資金, OpenAI 執行長 Sam Altman 隨即反擊,並邀請馬斯克參觀已在建造中的首批資料中心現場。 (前情提要:OpenAI、軟銀、甲骨文啟動史上最大 AI 基建計劃「Stargate Project」:投資 5000 億美元在美設資料中心) (背景補充:OpenAI 最強模型 o3「遭爆作弊」疑用特權提前獲測試答案,數學能力造假?)
TRUMP1.08%
動區BlockTempo·2025-01-23 03:33
OpenAI CEO:多虧了特朗普,AGI 將在美國實現
OpenAI CEO Sam Altman表示,得益於特朗普總統的“星際之門”AI基建計劃,美國有望率先實現AGI,但強調OpenAI“下個月不會部署AGI”。最新發布的o3模型被視為AGI發展的重要基準,但仍存在明顯侷限。
TRUMP1.08%
AGI11.97%
ARC13.38%
深潮 TechFlow·2025-01-22 07:27
OpenAI 最強模型 o3「遭爆作弊」疑用特權提前獲測試答案,數學能力造假?
近日 Less Wrong 論壇上一為名為「Meemi」的非營利組織 Epoch AI 承包商發文爆料,ChatGPT 背後開發商 OpenAI 私下資助 AI 開發數學基準測試平台 FrontierMath,並有特權拿到 FrontierMath 測試的題目與答案,助其最新模型 o3 拿到測試高分。 (前情提要:想控制ChatGPT?馬斯克致信總檢查長,要求強制拍賣OpenAI股份 ) (背景補充:OpenAI發表Day2》逆天「強化學習微調」新功能,增強AI專業領域學習準確度 ) ChatGPT 背後開發商 OpenAI 近日傳出模型造假的風聲,引起科技社群廣泛議論。事件起因源於
動區BlockTempo·2025-01-21 09:03
Sam Altman展望2025:首批 AI 代理將大舉進入勞動市場,距離 AGI 越來越近…
知名人工智慧公司 OpenAI 執行長 Sam Altman 預測,首批 AI 代理將於 2025 年進入職場,這項技術不僅將大幅提升企業產能,也可能引領人類邁向超級智慧的新時代。 (前情提要:OpenAI推出o3模型!推理能力再推高等級,為下一代AI鋪路) (背景補充:OpenAI政治博弈失利,Sam Altman將難敵馬斯克與川普的「AI同盟」?) 今 (6)日,知名人工智慧公司 OpenAI 執行長 Sam Altman 在最新一篇發文中提到,OpenAI 已確信掌握構建 AGI(通用人工智慧)的方法,並預測 2025 年將見到首批 AI
AGI11.97%
動區BlockTempo·2025-01-06 07:07
2025年人工智能的十大預測:AI Agent方向將成為主流
2‍‍‍‍024年即将结束,来自Radical Ventures的风险投资家Rob Toews分享了他对2025年人工智能的10个预测: **01** ****Meta将开始对Llama模型收费**** Meta是世界上开放式人工智能的标杆。在一个引人注目的企业战略案例研究中,当OpenAI和谷歌等竞争对手将其前沿模型封闭源代码并收取使用费时,Meta却选择免费提供其最先进的Llama模型。 因此,明年Meta开始向使用Llama的公司收费这一消息,会让许多人感到意外。 需要明确的是:我们并没有预测Meta会将Llama完全闭源,也不意味着任何使用Llama模型的用户都必须为此付费。 相反,我们预测Meta将对Llama的开源许可条款做出更多限制,这样,**在一定规模以上的商业环境中使用Llama的公司将需要开始付费才能使用模型**。 从技术上讲,Meta如今已经在有限的范围内做到了这一点。该公司不允许最大的公司——云超级计算机和其他月活跃用户超过7亿的公司,自由使用其Llama模型。 早在2023年,Meta首席执行官Mark Zuckerberg就说过:“如果你是微软、亚马逊或谷歌这样的公司,而且你基本上会转售Llama,那么我们应该从中获得一部分收入。我不认为这在短期内会是一大笔收入,但从长远来看,希望这能成为一些收入。” 明年,Meta将大幅扩大必须付费才能使用Llama的企业范围,将更多的大中型企业纳入其中。 跟上大型语言模型(LLM)前沿是非常昂贵的。如果想让Llama与OpenAI、Anthropic等公司的最新前沿模型保持一致或接近一致,Meta每年需要投入数十亿美元。 **Meta公司是世界上最大、资金最雄厚的公司之一**。但它也是一家上市公司,最终要对股东负责。 随着制造前沿模型的成本不断飙升,Meta公司在没有收入预期的情况下投入如此巨额资金来训练下一代Llama模型的做法越来越站不住脚。 爱好者、学者、个人开发者和初创公司明年将继续免费使用Llama模型。**但2025年,将是Meta开始认真实现Llama盈利的一年**。 **02.******“尺度定律”相关问题**** 最近几周,人工智能领域引发讨论最多的话题莫过于尺度定律(Scaling laws),以及它们是否即将终结的问题。 尺度定律在2020年OpenAI的一篇论文中首次提出,其基本概念简单明了:在训练人工智能模型时,随着模型参数数量、训练数据量和计算量的增加,模型的性能会以可靠且可预测的方式提高(从技术上讲,其测试损失会减少)。 **从GPT-2到GPT-3再到GPT-4,令人叹为观止的性能提升都是缩放规律的功劳**。 就像摩尔定律一样,尺度定律实际上并不是真正的法则,而只是简单的经验观察。 在过去的一个月里,一系列报告表明,主要的人工智能实验室在持续扩大大型语言模型的规模时,正在看到递减的回报。这有助于解释为什么OpenAI的GPT-5发布一再推迟。 对尺度定律趋于平稳的最常见反驳是,测试时计算的出现开辟了一个全新的维度,可以在这一维度上追求规模扩展。 也就是说,与其在训练期间大规模扩展计算,新的推理模型如OpenAI的o3使得在推理期间大规模扩展计算成为可能,通过使模型能够“思考更长时间”来解锁新的AI能力。 这是一个重要的观点。测试时计算确实代表了一个新的令人兴奋的扩展途径,以及AI性能提升。 但关于尺度定律的另一个观点更加重要,而且在今天的讨论中被严重低估。几乎所有关于尺度定律的讨论,从最初的2020年论文开始,一直延续到今天对测试时计算的关注,都集中在语言上。但语言并不是唯一重要的数据模式。 想想机器人技术、生物学、世界模型或网络代理。**对于这些数据模式,尺度定律尚未饱和;相反,它们才刚刚开始**。 实际上,这些领域中尺度定律存在的严格证据至今甚至尚未发表。 为这些新型数据模式构建基础模型的初创公司——例如,生物学领域的Evolutionary Scale、机器人技术领域的PhysicalIntelligence、世界模型领域WorldLabs,正试图识别并利用这些领域的尺度定律,就像OpenAI在2020年代前半期成功利用大型语言模型(LLM)尺度定律一样。 明年,预计这里将取得巨大的进步。 尺度定律不会消失,它们在2025年将和以往一样重要。但是,尺度定律的活动中心将从LLM预训练转移到其他模式。 **03.******特朗普和马斯克可能会在AI方向产生分歧**** 美国新政府将带来一系列关于人工智能的政策和战略转变。 为了预测在特朗普总统就任下人工智能的风向,另外考虑到马斯克目前在人工智能领域的中心地位,人们可能会倾向于关注当选总统与马斯克的密切关系。 可以想象**,马斯克可能会以多种不同的方式影响特朗普政府的人工智能相关发展**。 鉴于马斯克与OpenAI的深刻敌对关系,新政府在与行业接触、制定人工智能法规、授予政府合同等方面可能会对OpenAI采取不太友好的立场,这是OpenAI今天真正担心的一个风险。 另一方面,特朗普政府可能会更倾向于支持马斯克自己的公司:例如,削减繁文缛节以使xAI能够建立数据中心并在前沿模型竞赛中取得领先;为特斯拉部署机器人出租车车队提供快速监管批准等。 更根本的是,与许多其他被特朗普看好的科技领袖不同,马斯克非常重视人工智能的安全风险,并因此主张对人工智能进行重大监管。 他支持加利福尼亚州有争议的SB1047法案,该法案试图对人工智能开发者施加有意义的限制。因此,**马斯克的影响力可能会导致美国对人工智能的监管环境变得更加严格**。 然而,所有这些推测都存在一个问题。特朗普和马斯克的亲密关系终将不可避免地破裂。 ![](https://img.gateio.im/social/moments-1769a04ad18a8ad4b5ff6291355a5145) 正如我们在特朗普第一任政府期间一次又一次看到的那样,特朗普盟友的平均任期,即使是看似最坚定的,都非常短暂。 特朗普第一任政府的副手中,今天仍然忠于他的寥寥无几。 特朗普和马斯克都是复杂、易变、不可预测的个性,他们不易合作,他们使人筋疲力尽,他们新发现的友谊到目前为止已经互惠互利,但仍处于“蜜月期”。 我们预测,在2025年结束之前,这种关系将会恶化。 这对人工智能世界意味着什么? 这对OpenAI来说是个好消息。对于特斯拉的股东来说,这将是一个不幸的消息。而对于那些关注人工智能安全的人来说,这将是一个令人失望的消息,因为这几乎可以确保美国政府将在特朗普执政期间对人工智能监管采取放手不管的态度。 **04** ****AI Agent将成为主流**** 想象一下,在这样一个世界里,你不再需要直接与互联网互动。每当你需要管理订阅、支付账单、预约医生、在亚马逊上订购东西、预订餐厅或完成其他任何繁琐的在线任务时,你只需指示人工智能助理代你完成即可。 这种“网络代理”的概念已经存在多年。如果有这样的产品并能正常运行,毫无疑问,它将会是一款大获成功的产品。 然而,目前市场上还没有一款能正常运行的通用网络代理。 像Adept这样的初创公司,即使拥有一支血统纯正的创始团队,筹集了数亿美元的资金,但却未能实现其愿景。 **明年将是网络代理最终开始运行良好并成为主流的一年**。语言和视觉基础模型的不断进步,再加上最近因新推理模型和推理时间计算而在“第二系统思维”能力方面取得的突破,将意味着网络代理已准备好进入黄金时代。 换句话说,Adept的想法是正确的,只是为时过早。在初创企业中,正如生活中的许多事情一样,时机就是一切。 网络代理将找到各种有价值的企业用例,但我们认为,网络代理近期最大的市场机会将是消费者。 尽管最近人工智能热度不减,但除了ChatGPT之外,能成为消费者主流应用的人工智能原生应用还相对较少。 **网络代理将改变这一局面,成为消费人工智能领域下一个真正的“杀手级应用”**。 **05** ****将人工智能数据中心置于太空的想法将会实现**** 2023年,制约人工智能发展的关键物理资源是GPU芯片。2024年,它变成了电力和数据中心。 在2024年,几乎没有什么故事能比人工智能在急于建造更多人工智能数据中心的同时对能源的巨大且快速增长的需求更受关注了。 **由于人工智能的蓬勃发展,全球数据中心的电力需求在数十年持平后,预计将在2023年至2026年间翻一番**。在美国,数据中心的耗电量预计到2030年将接近总耗电量的10%,而2022年仅为3%。 ![](https://img.gateio.im/social/moments-a4efd2fa5ebc63cf7e8b485212898768) 当今的能源系统根本无法应对人工智能工作负载带来的巨大需求激增。我们的能源网和计算基础设施这两个价值数万亿美元的系统之间即将发生历史性的碰撞。 作为解决这一难题的可能方案,核能在今年获得了迅猛发展。核电在很多方面都是人工智能的理想能源:它是零碳能源,全天候可用,而且实际上取之不尽、用之不竭。 但从现实情况来看,由于研究、项目开发和监管时间较长,新能源在2030年代之前都无法解决这一问题。传统的核裂变发电厂、下一代“小型模块化反应堆”(SMR)以及核聚变发电厂都是如此。 **明年,一个应对这一挑战的非常规新想法将出现并吸引真正的资源:将人工智能数据中心置于太空中**。 太空中的人工智能数据中心,乍一听,这听起来像是一个坏笑话,一个风险投资人试图把太多的创业流行语结合起来。 但事实上,这可能是有道理的。 在地球上快速建设更多数据中心的最大瓶颈是获取所需的电力。轨道上的计算集群可以全天候享受免费、无限、零碳的电力:太空中的太阳总是熠熠生辉。 **将计算置于太空的另一个重要优势是:它解决了冷却问题**。 要建立功能更强大的人工智能数据中心,最大的工程障碍之一就是在狭小的空间内同时运行许多GPU会变得非常热,而高温会损坏或毁坏计算设备。 数据中心开发人员正在采用液浸冷却等昂贵且未经证实的方法来试图解决这一问题。但太空是极其寒冷的,计算活动产生的任何热量都会立即无害地消散。 当然,还有许多实际挑战有待解决。一个显而易见的问题是,能否以及如何在轨道和地球之间以低成本高效率地传输大量数据。 这是一个悬而未决的问题,但可能证明是可以解决的:**可以利用激光和其他高带宽光通信技术开展前景广阔的工作**。 YCombinator的一家名为Lumen Orbit的初创公司最近筹集了1100万美元,以实现这一理想:在太空中建立一个数兆瓦的数据中心网络,用于训练人工智能模型。 正如公司首席执行官所说:“与其支付1.4亿美元的电费,不如支付1千万美元的发射和太阳能费用。” ![](https://img.gateio.im/social/moments-fa2d2e0455216c2a320b6fa2dfba1cbf) 2025年,Lumen将不会是唯一认真对待这一概念的组织。 其他初创企业的竞争者也会出现。如果有一家或几家云计算超大规模企业也按照这种思路开展探索,也不要感到惊讶。 亚马逊已经通过“柯伊伯计划”(ProjectKuiper)将资产送入轨道,积累了丰富的经验;谷歌长期以来一直在资助类似的“登月计划”;甚至微软对太空经济也不陌生。 可以想象,马斯克的SpaceX公司也会在这方面有所作为。 **06** ******人工智能系统将通过“图灵语音测试”****** 图灵测试是人工智能性能最古老、最知名的基准之一。 为了“通过”图灵测试,人工智能系统必须能够通过书面文本进行交流,让普通人无法分辨自己是在与人工智能互动,还是在与其他人互动。 得益于大型语言模型的显著进步,图灵测试在2020年代已成为一个解决的问题。 但书面文本并非人类交流的唯一方式。 **随着人工智能变得越来越多模态,人们可以想象一个新的、更具挑战性的图灵测试版本——“语音图灵测试”**。在这个测试中,人工智能系统必须能够通过语音与人类互动,其技能和流畅度要达到与人类说话者无法区分的程度。 今天的人工智能系统还无法实现语音图灵测试,解决这个问题将需要更多的技术进步。延迟(人类说话和人工智能回应之间的滞后)必须减少到接近零,以匹配与另一个人类交谈的体验。 语音人工智能系统必须更擅长优雅地实时处理模糊输入或误解,例如说话被打断的情况。它们必须能够参与长对话、多轮、开放式对话,同时记住讨论的早期部分。 **而且至关重要的是,语音人工智能代理必须学会更好地理解语音中的非语言信号**。例如,如果一个人类说话者听起来恼怒、兴奋还是讽刺意味着什么,并在自己的语音中生成这些非语言线索。 随着我们接近2024年底,语音人工智能正处于一个令人兴奋的转折点,这一转折点是由像语音到语音模型的出现这样的根本性突破推动的。 如今,人工智能中很少有领域在技术和商业上的进步速度比语音人工智能更快。预计在2025年,语音人工智能的最新技术将实现飞跃。” **07** ****自主AI系统将取得重大进展**** 数十年来,递归式自我完善人工智能的概念一直是人工智能界经常触及的话题。 例如,早在1965年,AlanTuring的亲密合作者I.J.Good就写道:“让我们把超智能机器定义为一种能够远远超越人类所有智力活动的机器,无论它多么聪明。” “既然设计机器是这些智力活动之一,那么超智能机器就能设计出更好的机器;到那时,无疑会出现'智能爆炸',人类的智能将被远远抛在后面。” 人工智能可以发明更好的人工智能,这是一个充满智慧的概念。但是,即使在今天,它仍然保留着科幻小说的影子。 然而,尽管这一概念尚未得到广泛认可,但它实际上已经开始变得更加真实。**人工智能科学前沿的研究人员已经开始在构建人工智能系统方面取得切实进展,而人工智能系统本身也能构建更好的人工智能系统**。 我们预测,明年这一研究方向将成为主流。 ![](https://img.gateio.im/social/moments-6b73a0946f01f9809e08326aae925522) 迄今为止,沿着这一思路进行研究的最显著的公开范例是Sakana的“人工智能科学家”。 “人工智能科学家”于今年8月发布,它令人信服地证明了人工智能系统确实可以完全自主地开展人工智能研究。 Sakana的“人工智能科学家”本身执行了人工智能研究的整个生命周期:阅读现有文献、产生新的研究想法、设计实验来测试这些想法、执行这些实验、撰写研究论文来报告其研究结果,然后对其工作进行同行评审。 **这些工作完全由人工智能自主完成,不需要人工干预**。你可以在线阅读人工智能科学家撰写的部分研究论文。 OpenAI、Anthropic和其他研究实验室正在为“自动化人工智能研究人员”这一想法投入资源,不过目前还没有任何消息得到公开承认。 随着越来越多的人认识到人工智能研究自动化事实上正在成为一种真正的可能性,预计2025年这一领域将会有更多的讨论、进展和创业活动。 不过,最有意义的里程碑将是完全由人工智能代理撰写的研究论文首次被顶级人工智能会议接受。如果论文是盲审的,会议评审人员在论文被接受之前不会知道论文是由人工智能撰写的。 如果人工智能的研究成果明年被NeurIPS、CVPR或ICML接收,请不要感到惊讶。对于人工智能领域来说,这将是一个引人入胜、充满争议的历史性时刻。 **08** ****OpenAI等行业巨头将战略重点转向构建应用**** 构建前沿模型是一项艰难的工作。 它的资本密集程度令人咋舌。前沿模型实验室需要消耗大量现金。就在几个月前,OpenAI筹集到了创纪录的65亿美元资金,而在不久的将来,它可能还需要筹集更多的资金。Anthropic、xAI和其他公司也处于类似的境地。 转换成本和客户忠诚度较低。人工智能应用程序通常都是以模型无关性为目的而构建的,不同供应商的模型可以根据不断变化的成本和性能比较进行无缝切换。 随着最先进的开放模型(如Meta的Llama和阿里巴巴的Qwen)的出现,技术商品化的威胁不断迫近。像OpenAI和Anthropic这样的人工智能领导者不可能也不会停止对构建尖端模型的投资。 **但明年,为了发展利润更高、差异化更大、粘性更强的业务线,前沿实验室有望大力推出更多自己的应用和产品**。 当然,前沿实验室已经有了一个非常成功的应用案例:ChatGPT。 在新的一年里,我们还能从人工智能实验室看到哪些其他类型的第一方应用程序呢?一个显而易见的答案是更复杂、功能更丰富的搜索应用。OpenAI的SearchGPT就预示着这一点。 编码是另一个显而易见的类别。同样,随着OpenAI的Canvas产品于10月份首次亮相,初步的产品化工作已经开始。 OpenAI或Anthropic是否会在2025年推出企业搜索产品?还是客户服务产品、法律人工智能或销售人工智能产品呢? 在消费者方面,我们可以想象一个“个人助理”网络代理产品,或者一个旅行规划应用,又或者是一个生成音乐的应用。 观察前沿实验室向应用层发展的最迷人之处在于,**这一举措将使它们与许多最重要的客户直接竞争**。 搜索领域的Perplexity、编码领域的Cursor、在客户服务领域德Sierra、在法律人工智能领域的Harvey、在销售领域的Clay等等。 **09** ****Klarna将在2025年上市,但存在夸大AI价值的迹象**** Klarna是一家总部位于瑞典的“现购现付”服务提供商,自2005年成立以来已筹集了近50亿美元的风险投资。 也许没有哪家公司能比Klarna对其人工智能的应用说得更冠冕堂皇了。 就在几天前,Klarna首席执行官Sebastian Siemiatkowski告诉彭博社,**该公司已经完全停止雇佣人类员工,转而依靠生成式人工智能来完成工作**。 正如Siemiatkowski所说:“我认为,人工智能已经可以完成我们人类所做的所有工作。” 与此类似,Klarna公司今年早些时候宣布,它已经推出了一个人工智能客户服务平台,该平台已经将700名人工客服人员的工作完全自动化。 ![](https://img.gateio.im/social/moments-b972f1ff265504913da709f1d7132ae1) 该公司还声称,它已经停止使用Salesforce和Workday等企业软件产品,因为它可以简单地用人工智能取代它们。 直截了当地说,这些说法并不可信。它们反映了人们对当今人工智能系统的能力和不足缺乏了解。 声称能够用端到端的人工智能代理取代组织中任何职能部门的任何特定人类员工,这种说法并不靠谱。这等同于解决了通用的人类级人工智能问题。 如今,领先的人工智能初创企业正在该领域的最前沿努力构建代理系统,以实现特定的、狭义的、高度结构化的企业工作流程自动化,例如,销售开发代表或客户服务代理活动的子集。 **即使在这些范围狭窄的情况下,这些代理系统也还不能完全可靠地工作**,尽管在某些情况下,它们已经开始很好地工作,足以在早期得到商业应用。 为什么Klarna会夸大人工智能的价值? 答案很简单。该公司计划在2025年上半年上市。要想成功上市,关键是要有一个引人入胜的人工智能故事。 Klarna仍然是一家不盈利的企业,去年亏损了2.41亿美元,它可能希望自己的人工智能故事能说服公开市场的投资者,让他们相信它有能力大幅降低成本,实现持久盈利。 毫无疑问,包括Klarna在内的全球每家企业都将在未来几年内享受到人工智能带来的巨大生产力提升。但是,**在人工智能代理完全取代劳动力中的人类之前,还有许多棘手的技术、产品和组织挑战有待解决**。 像Klarna这样夸大其词的说法是对人工智能领域的亵渎,也是对人工智能技术专家和企业家们在开发人工智能代理方面所取得的艰苦进展的亵渎。 随着Klarna准备在2025年公开发行股票,预计这些说法将受到更严格的审查和公众的怀疑,而到目前为止,这些说法大多没有受到质疑。如果该公司对其人工智能应用的某些描述过于夸张,也不要感到惊讶。 **10** ****第一起真正的AI安全事故将会发生**** 近年来,随着人工智能变得越来越强大,人们越来越担心人工智能系统可能会开始以与人类利益不一致的方式行事,而且人类可能会失去对这些系统的控制。 举例来说,想象一下,一个人工智能系统为了实现自己的目标,学会了欺骗或操纵人类,即使这些目标会对人类造成伤害。**这些担忧通常被归类为“AI安全”问题**。 近年来,人工智能安全已从一个边缘的准科幻话题转变为一个主流活动领域。 如今,从谷歌、微软到OpenAI,每一个主要的人工智能参与者都为人工智能安全工作投入了大量资源。像Geoff Hinton、Yoshua Bengio和Elon Musk这样的人工智能偶像,也开始对人工智能安全风险发表看法。 然而,到目前为止,人工智能安全问题仍完全停留在理论层面。现实世界中从未发生过真正的人工智能安全事故(至少没有公开报道过)。 2025年将是改变这种状况的一年,第一起人工智能安全事件会是什么样的呢? 明确地说,它不会涉及终结者式的杀手机器人,它很可能不会对人类造成任何伤害。 也许人工智能模型会试图在另一台服务器上秘密创建自己的副本,以保存自己(称为自我过滤)。 又也许人工智能模型会得出这样的结论:**为了最好地推进它被赋予的目标,它需要向人类隐瞒自己真实的能力,故意在性能评估中表现低调,规避更严格的审查**。 这些例子并非牵强附会。阿波罗研究公司本月早些时候发表的重要实验表明,在特定的提示下,当今的前沿模型能够做出这种欺骗行为。 同样,《人类学》最近的研究也表明,LLMs具有令人不安的“伪对齐”能力。 ![](https://img.gateio.im/social/moments-32bdb9bd964a7ad4d303d737e2bb85c1) 我们预计,这起首例人工智能安全事件将在造成任何实际伤害之前被发现并消除。但对于人工智能界和整个社会来说,这将是一个大开眼界的时刻。 它将明确一件事:在人类面临来自无所不能的人工智能的生存威胁之前,我们需要接受一个更平凡的现实:**我们现在与另一种形式的智能共享我们的世界,这种智能有时可能是任性的、不可预测的和欺骗性的**。
AGENT-1.16%
金色财经_·2024-12-23 12:46
news-image
加載更多

熱門標籤

熱點追蹤

展開
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)