Gate News 訊息,4 月 23 日——Google 研究人員(包含 He Kaiming 和 Xie Saining)發表了一篇論文,介紹 Vision Banana:一款通用型視覺理解模型。該模型是透過對該公司的 Nano Banana Pro (Gemini 3 Pro Image) 影像生成模型進行輕量指令微調所打造。這項關鍵創新將所有視覺任務的輸出統一為 RGB 影像,使得能夠在不使用任務特定架構或損失函數的情況下,透過影像生成來完成分割、深度估計與表面法向預測。
在語意分割方面,Vision Banana 在 Cityscapes 上相較專用模型 SAM 3 領先 4.7 個百分點;在指代表達式分割(referring expression segmentation)方面,它超越了 SAM 3 Agent。不過在實例分割(instance segmentation)上,它落後於 SAM 3。對於 3D 任務,度量深度估計在四個標準資料集上達到 0.929 的平均準確率,超過 Depth Anything V3 的 0.918。推論時僅使用合成資料,沒有任何真實深度資訊或相機參數。表面法向估計在三個室內基準測試中取得了最先進的結果。
微調涉及將極少量的視覺任務資料混入原始影像生成訓練,同時保留模型的生成能力——在生成品質測試中的表現與原始 Nano Banana Pro 相同。論文提出:視覺中的影像生成預訓練與語言中的文字生成預訓練相類似;模型在生成過程中學習用於影像理解的內部表徵,而指令微調只是釋放這種能力。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
頂尖律所每小時收費逾兩千美元,法庭文件遭踢爆「AI 幻覺、錯誤連篇」
美國頂尖律師事務所蘇利文·克倫威爾因曼哈頓破產案提交的法庭文件出現約三十處 AI 生成錯誤、虛假案例與捏造條文而向法官道歉。雖有高額每小時費用與內部培訓政策,實際準備時未落實審核,該事件再度引發對法律界 AI 使用與道德責任的討論。
鏈新聞abmedia3分鐘前
DeepSeek 開源 TileKernels:大型模型訓練與推理用 GPU Kernel 庫
Gate News 訊息,4 月 23 日 — DeepSeek 已在 MIT 許可證下開源 TileKernels,這是一個以 TileLang 編寫的 GPU kernel 庫,用於大型語言模型的訓練與推理。TileLang 是 tile-ai 團隊所開發的領域特定語言,用於在 Python 中表達高效能的 GPU kernel,
GateNews11分鐘前
Samsung SDS擴大Google Cloud合作夥伴關係,以AI與安全服務服務受監管領域
門戶新聞訊息,4月23日——Samsung SDS擴大了與Google Cloud的合作,提供AI、雲端運算和安全服務,面向受監管產業,包括政府與金融服務。
該公司將為需要數據本地化、低延遲和具韌性的基礎設施的客戶部署Google Distributed Cloud
GateNews35分鐘前
Sullivan & Cromwell 因法庭文件中的 AI 幻覺而致歉:含 40 則錯誤引文
Gate News 訊息,4月23日——Sullivan & Cromwell 是一家大型華爾街律師事務所,在提交了一份包含約 40 則錯誤引文及其他因 AI 幻覺(hallucinations)造成的錯誤之後,向一名聯邦法官道歉。該事務所全球重整團隊的共同負責人 Andrew Dietderich &
GateNews51分鐘前
騰訊發布並開源鴻蒙 Hy3 預覽版,擁有 295B 參數
Gate News 消息,4 月 23 日——騰訊發布並開源了鴻蒙 Hy3 預覽版,這是一種混合式「專家混合(Mixture-of-Experts)」語言模型,融合了快速與慢速思考。該模型總參數量為 2950 億,啟用參數為 210 億,支援最高上下文長度 256K
GateNews1小時前
南韓、越南簽署70+份人工智慧、能源與數據基礎設施諒解備忘錄
Gate 新聞訊息,4月23日——南韓與越南在李在明總統於4月23日進行對河內的國是訪問期間,簽署了超過70份諒解備忘錄 (MOUs),涵蓋人工智慧、能源、基礎設施與電信等領域。由超過500名高管參與的商務論壇討論了人工智慧與電力產業生態系統,其中包括三星、SK、LG與現代在內的主要韓國大型企業均有代表。
GateNews1小時前