10,000 USDT 悬赏,寻找Gate广场跟单金牌星探!🕵️♀️
挖掘顶级带单员,赢取高额跟单体验金!
立即参与:https://www.gate.com/campaigns/4624
🎁 三大活动,奖金叠满:
1️⃣ 慧眼识英:发帖推荐带单员,分享跟单体验,抽 100 位送 30 USDT!
2️⃣ 强力应援:晒出你的跟单截图,为大神打 Call,抽 120 位送 50 USDT!
3️⃣ 社交达人:同步至 X/Twitter,凭流量赢取 100 USDT!
📍 标签: #跟单金牌星探 #GateCopyTrading
⏰ 限时: 4/22 16:00 - 5/10 16:00 (UTC+8)
详情:https://www.gate.com/announcements/article/50848
谷歌開源Gemma 4全系MTP投機解碼模型,最高提速3倍
幣界網消息,谷歌發布並開源了Gemma 4系列的多token預測(MTP)草稿模型。該模型採用投機解碼架構,能夠在主模型保留最終驗證權的基礎上,實現最高3倍的推理提速,且不損耗輸出質量。MTP方案利用閒置算力,提前預測多個未來token,再交由重型目標模型並行驗證。若目標模型同意草稿,就會一次性接收整段序列。草稿模型共享目標模型的激活狀態和KV快取,針對E2B和E4B模型,團隊在嵌入層引入聚類技術。目前,MTP模型已全面開源,支持VLLM、SGLang和Ollama等主流推理框架。這次優化顯著降低了應用門檻,使開發者能在普通消費級顯卡上流暢運行26B MOE和31B稠密模型,也能在移動設備上以更低功耗支援即時AI交互。