OpenAI 發布 GPT-5.2,專注轉向工作場所自動化


探索頂尖金融科技新聞與活動!

訂閱金融科技週刊的電子報

由摩根大通、Coinbase、黑石集團、Klarna 等高層閱讀


OpenAI 已推出 GPT-5.2,該公司描述這是一個更快、更可靠、能應對專業工作需求的新模型。此次更新標誌著公司內部專注度加強的又一步。

本月早些時候,員工收到 CEO 山姆·奧特曼的指示,要求他們停止次要項目的工作,專注於提升 ChatGPT。這一指示為公司進入一個階段定下了基調,OpenAI 似乎意在證明其技術能支持企業日常運營,而非僅作為通用助手。

為日常工作流程打造的模型

OpenAI 表示,GPT-5.2 被設計用來支持多行業員工執行的各種任務。公司解釋說,該模型能處理較長的輸入,更穩定地解讀圖像,產生結構化文件,並在需要謹慎排序的多步流程中工作。高層表示,目標是擴大用戶從系統中獲取的經濟價值。

OpenAI 應用部門公開評論稱,這款新模型在多數模擬專業任務中能超越或匹配人類表現,這些任務是通過一個內部新基準測試的。公司表示,這個名為 GDPval 的基準測試涵蓋 44 個職業相關的任務,提供比較模型輸出與人類結果的方法。根據 OpenAI 的說法,GPT-5.2 在約 71% 的比較中達到或超越人類工作者

外部研究人員尚未審查該基準測試,行業分析師表示,他們正等待獨立評估後再評價公司的聲稱。

向企業市場推進

過去一年,OpenAI 逐步將重點轉向企業和機構客戶。公司與美國政府和迪士尼簽訂協議,顯示其策略專注於將工具嵌入長期運營架構中。GPT-5.2 延續這一方向,將自己定位為適合在辦公室、工作室、研究團隊、合規部門等環境中持續使用的系統,提供可靠的輸出。

工作場所自動化已成為許多大型雇主的核心討論點。過去一年的調查顯示,管理層普遍預期 AI 工具能支持生產力提升。報告還指出,許多員工擔心在這種環境下的工作安全。Just Capital 的一項研究發現,大多數商業領袖對 AI 持正面看法,但近一半的美國受訪者認為這項技術可能取代某些職位

隨著模型能力的提升,企業理解這些擔憂的壓力也在增加。GPT-5.2 正值企業試圖界定協助與取代之間界線的時期,這一辯論在金融科技、醫療、娛樂和政府合約等行業持續進行。

性能聲稱與測試

OpenAI 在公告中強調了多項技術改進。公司官員表示,GPT-5.2 在衡量推理和解決問題的測試中表現良好。這些測試包括 GPQA Diamond 和 FrontierMath,旨在檢驗模型處理高階問題的能力。

公司稱,GPT-5.2 在編碼、數據分析和實驗設計方面產生了更穩定的結果。它還強調模型在長文檔中保持連貫性的能力有所提升,這一直是早期系統面臨的挑戰。此外,OpenAI 表示,GPT-5.2 更可靠地支持工具整合,讓開發者和企業用戶能更好地控制自動化流程。

OpenAI 展示了早期測試者的反饋,他們表示該模型能支持高要求的工作,且干擾較少。這些聲明尚未在公司外部公開,獨立評估可能有助於判斷系統在大規模運行時的表現。

三種模型版本滿足不同需求

OpenAI 發布了反映不同複雜度的 GPT-5.2 三個版本。“即時”版適合快速請求。“思考”版專注於延伸推理和結構化任務。“專業”版則為研究團隊、法律團隊、分析師和技術單位常用的長篇工作而設。

開發者可通過 API 立即獲取。公司定價為每百萬輸入標記 1.75 美元,每百萬輸出標記 14 美元。這些價格反映公司根據項目需求細分使用,而非用單一模型滿足所有請求的策略。

內部壓力促成的發布

GPT-5.2 的推出緊接著山姆·奧特曼內部信件,該信件敦促員工暫停所有非必要項目,專注於推進 ChatGPT。這份備忘錄表明,OpenAI 領導層希望將重心集中在這一核心產品上,該產品為公司贏得了廣泛認可。

員工被告知,未來幾個月將需要全力以赴提升系統的可靠性、速度和實用性。這份備忘錄的時機也讓人預期下一次發布將著重解決用戶和開發者提出的關於輸出一致性、解讀準確性和模型漂移的反覆問題。GPT-5.2 作為日常專業工作的工具,其定位與該訊息的基調一致。

在變革中的工作環境中推出的模型

許多行業的員工都在評估如何在保持警覺的同時使用生成式 AI。有人用模型來起草初稿或進行初步分析,有人用它來審查數據或測試想法,再進行人工優化。許多公司制定了內部指南,規範員工在處理敏感或受規範材料時的使用方式。

GPT-5.2 宣稱能更穩定地完成更多任務,這可能會增加企業重新思考團隊使用 AI 的壓力。也可能激化關於培訓、監督、版權義務和責任分配的辯論,尤其是在自動輸出影響商業決策時。

工會領袖和員工倡導者持續關注自動化對工作安全的影響。他們認為,AI 系統的穩定表現可能促使一些公司重組角色或引入新的人事策略。企業高層則多強調生產力提升而非裁員,緊張局勢仍在持續。

行業影響與早期反應

GPT-5.2 的發布可能吸引依賴大量文件、數據解讀或流程工作的企業關注。金融機構、諮詢公司、媒體企業和政府部門已開始將先前的模型整合到內部工具中。若獨立測試證實公司聲稱的性能,GPT-5.2 可能影響這些系統的演進。

金融科技公司也在密切關注這些發展,因為許多產品依賴自動分析、客戶溝通和合規支持。長文理解和結構化流程的改進,可能幫助他們優化內部系統或開發新服務。

研究人員和政策專家指出,GDPval 缺乏外部審查,留下了基準測試代表性問題。他們預計第三方研究將檢查這些任務是否真實反映工作場所條件,或僅測試模型已擅長的狹窄功能。

展望未來

GPT-5.2 正值 OpenAI 內部戰略整合的階段。公司已表明希望將其模型作為工作場所的長久工具,而非僅用於偶爾支援。這一方向在奧特曼呼籲團隊專注於 ChatGPT 並放慢其他項目進展後變得更加明確。

下一階段將取決於企業對模型的反應,從早期測試轉向日常應用。企業客戶的認可將支持公司的計劃,而外部研究的持續懷疑則強調獨立評估的重要性。

許多雇主仍在決定如何整合新 AI 能力,同時維持員工的信任。GPT-5.2 為這一討論增添了新維度。生產力與安全之間的平衡將引導後續許多決策,企業的回應方式也可能決定自動化在現代辦公室的發展範圍。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)