2026-04-10 17:30:37

Oumi这家初创公司的一项研究发现，Google Gemini这款ИИ-помощник在日常模式下会生成数百万条事实性错误。根据分析，每十个回答中就包含不准确之处；而在Google一年约五万亿次请求的规模下，这将导致每小时超过57,000,000个错误回答，几乎相当于每分钟接近1,000,000条。

Gemini精确度问题的规模
Oumi这家初创公司使用SimpleQA基准测试对Google AI Overviews进行了测试，该基准包含4,326个查询。2025年10月，当针对复杂问题采用Gemini 2模型时，准确率为85%。2026年2月，在升级到Gemini 3之后，该指标提升至91%。因此，尽管有所改善，每十个回答中仍有一个保持错误。

在每年处理约五万亿次请求的规模下，即便这种精确度也意味着大量不准确信息的持续涌入。用户每小时会收到数千万条错误回答——这相当于每分钟出现数十万次错误。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

1人点赞了这条动态

赞赏
1
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate上线Pre-IPOs
21.58万热度
#
Gate现货衍生品双双冲进全球前三
959.98万热度
#
原油小幅上涨
118.12万热度
#
美伊停火协议谈判再生变故
56.76万热度
#
加密市场回升
5.31万热度

热门 Gate Fun
查看更多

1
reset2026
reset2026
市值:$0.1持有人数:1
0.00%
2
madrid
real madrid
市值:$2300持有人数:1
0.00%
3
LPGO
LPGO
市值:$2320.33持有人数:2
0.00%
4
msnxs
永青侯
市值:$2300持有人数:1
0.00%
5
x
gooda
市值:$0.1持有人数:1
0.00%

热门话题

Gate上线Pre-IPOs

Gate现货衍生品双双冲进全球前三

原油小幅上涨

美伊停火协议谈判再生变故

加密市场回升

热门 Gate Fun

reset2026

reset2026

madrid

real madrid

LPGO

LPGO

msnxs

永青侯

x

gooda

置顶