余文浩,前騰訊 AI 研究員,上個月加入 OpenAI 擔任 AGI 研究員

根據 Beating,Yu Wenhao,騰訊 AI 西雅圖實驗室前資深研究員,上個月加入 OpenAI 擔任 AGI 研究員。他在 LinkedIn 上確認,他將貢獻於塑造下一代 AI 模型,並推進 AGI 的發展。

Yu 擁有聖母大學(2023)電腦科學博士學位,並已發表超過 30 篇頂級學術會議論文,累計超過 5,700 次引用。他的研究聚焦於強化學習的後訓練、推理與代理系統。在騰訊時,他領導 WebVoyager 專案,該專案已被 OpenAI 與 Google 採用。他在自我對弈機制與代理系統方面的專長,契合 OpenAI 目前的策略,即使用強化學習來增強模型的推理能力。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Helsing 目標以 180 億美元估值籌集資金

根據《金融時報》,德國 AI 驅動無人機新創公司 Helsing 正計劃以約 180 億美元估值籌集新一輪資金。

GateNews14分鐘前

Google DeepMind AI 合作數學家在 FrontierMath 第 4 階段達成 47.9%,超越 GPT-5.5 Pro,解決 3 個先前無法解決的問題

Google DeepMind 發布 AI 合數學家(AI co-mathematician),一款多代理數學研究助理,在 FrontierMath 第 4 層級基準測試中達到 47.9% 的準確率,超越 GPT-5.5 Pro 先前在 5 月 9 日創下的 39.6% 記錄。該系統解出 48 題中的 23 題,包括 3 題是所有先前模型都無法解答的。系統基於 Gemini 3.1 Pro,採用分層架構:由專案協調員代理(project coordinator agent)分派任務給負責文獻檢索、編碼與推理的子代理(sub-agents),並由多個審查員代理(reviewer agents)在提交前驗證證明。 Epoch AI 進行了盲測,使 DeepMind 團隊無法看到題目;每道題目允許進行 48 小時的運算。在真實世界的應用中,數學家 Marc Lackenby 使用該系統解決了來自 Kourovka Notebook 的一個未解推測,展現其實際研究價值。目前該系統正以內測形式提供給少數數學家使用。

GateNews22分鐘前

OpenAI 的獎勵系統意外地在包含 GPT-5.4 的 6 個模型上為思考鏈打分

根據 OpenAI 的對齊團隊,該公司近期發現一項影響 6 個大型語言模型(包含 GPT-5.4)的關鍵訓練錯誤:獎勵機制不慎對模型的思考鏈進行了評分,也就是在生成答案之前的內部推理過程。GPT-5.5 不受影響。 此事件違反一項基本的 AI 安全原則:思考鏈絕不應被納入評估,因為這樣做可能會促使模型編造推理內容,以取得更高分數。 有缺陷的評分系統在判斷回覆是否有用,或模型是否已被攻擊所破壞時,錯誤地將思考鏈納入考量。受影響的訓練樣本占資料集的比例最多為 3.8%。OpenAI 已修補此漏洞,並進行了比較性實驗,確認模型沒有發展出具欺瞞性的行為。該公司已在所有訓練流程中部署自動化掃描系統,以防止再次發生。

GateNews1小時前

阿里巴巴未與 DeepSeek 進行談判,市場消息人士於 5 月 9 日澄清

據《財新日報》在 5 月 9 日報導的市場消息,阿里巴巴並未就融資一事與深度求索(DeepSeek)進行磋商。這項澄清是在先前媒體報導指出兩家公司之間的談判已告破裂之後作出。深度求索在 4 月推出了一輪規模可觀的融資,吸引了騰訊與阿里巴巴的關注。

GateNews2小時前

OpenAI 發布 Codex 遷移工具,可匯入來自競爭型 AI 助手的設定檔

根據 OneMillionAI(Beating)報導,OpenAI 已在 Codex 內發布一款遷移工具,讓使用者可匯入其他 AI 編碼助理的設定與資料,包括 Claude Code。該工具透過 OpenAI 官方 Twitter 帳號宣布,能自動轉移系統提示詞、客製化技能、30 天的聊天歷史、MCP 伺服器設定、hooks 以及子代理設定。 OpenAI 表示,遷移工具可透過 Codex 設定中的「匯入其他代理設定」選項,對多數設定進行自動處理。對於不相容的設定,該工具會啟動引導式對話,協助使用者進行手動遷移。公司建議使用者在遷移後核實權限與驗證設定,因為不同平台之間的權限系統無法相互相容。

GateNews2小時前

字節跳動在 5 月 9 日將 AI 基礎設施支出提高 25% 至 2000 億人民幣

根據媒體報導,字節跳動將其原定的 AI 基礎設施支出在 2026 年提高 25%,至 2000 億人民幣,隨著記憶體晶片需求上升,公司加速部署人工智慧

GateNews3小時前
留言
0/400
暫無留言