2026-04-10 12:04:04

Gemma 4在llama.cpp上终于稳了

4月2号Google发了Gemma 4，第一天就有llama.cpp支持但bug多。现在所有问题都修完了
E2B、E4B、26B MoE、31B Dense
31B在Arena AI排行第3，26B排第6
开源模型最强梯队
用--chat-template-file加载interleaved模版
建议开--cache-ram 2048
上下文长度根据显存来
去年本地最好的是Llama 3.1 70B量化版，勉强能用
现在Gemma 4 31B Q5在Mac Studio上流畅跑，接近GPT-4级别
不依赖API的AI应用开始有商业可行性。数据不出本机，成本为零，延迟极低
对于一人企业，本地模型是真正的基础设施。竞争对手在付API费，你的边际成本是电费
Gemma 4 + llama.cpp = 本地推理最优解，可以上生产了

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

1人点赞了这条动态

赞赏
1
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate上线Pre-IPOs
20.51万热度
#
Gate现货衍生品双双冲进全球前三
959.11万热度
#
原油小幅上涨
117.55万热度
#
美伊停火协议谈判再生变故
56.38万热度
#
加密市场回升
5.21万热度

热门 Gate Fun
查看更多

1
JKWI
Jokochan
市值:$2268.96持有人数:1
0.00%
2
Loveyou
Loveyou
市值:$0.1持有人数:0
0.00%
3
NMM
NoMoon
市值:$0.1持有人数:0
0.00%
4
God light
God light
市值:$2272.41持有人数:1
0.00%
5
Putincoin
Putincoin
市值:$2265.51持有人数:1
0.00%

Gemma 4在llama.cpp上终于稳了

热门话题

Gate上线Pre-IPOs

Gate现货衍生品双双冲进全球前三

原油小幅上涨

美伊停火协议谈判再生变故

加密市场回升

热门 Gate Fun

JKWI

Jokochan

Loveyou

Loveyou

NMM

NoMoon

God light

God light

Putincoin

Putincoin

置顶