Gate News 消息,4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客《Into Asia》中透露,字节跳动完成一次完整的大型语言模型训练 (预训练循环还需 )与后训练,而据称谷歌只需要三个月。张驰将这种速度差异视为中国公司在 AI 开发上难以追赶的核心原因。
张驰描述了 Seed 内部的“基准测试文化”,即团队负责人会根据其所负责的基准分数来被评估,所有成员都专注于提升数据。然而,他指出这在实践中并不会转化为更好的用户体验。尽管从纸面上看,中国头部公司的模型似乎与美国的前沿模型具有竞争力,但在实际使用中却有所欠缺。Seed 的目标是达到全球顶级水平,但张驰表示他不认为团队已经达成,且也未达到国内领导层目标。
到 2024 年底,Seed 认为自己与 GPT-4o 水平相当,但在 DeepSeek 发布之后,团队意识到差距仍然存在。张驰加入时,这个团队的整个组正紧急转向强化学习,以弥补不足。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
DeepSeek V4-Flash 登上 Ollama Cloud、美國主機:Claude Code、OpenClaw 一鍵串接
Ollama Cloud 已上架 DeepSeek V4-Flash,推理在美国主机,提供三组一键指令接入 Claude Code、OpenClaw、Hermes。V4-Flash/V4-Pro 采用 MoE 架构、原生支持 1M 上下文,并以 Token-wise 压缩+DSA 稀疏注意力降低成本,1M 情境下单 token FLOPs 降低 27%、KV 缓存降低 10%。API 相容 OpenAI ChatCompletions 与 Anthropic,便于多工作流切换,降低成本与数据主权风险。
鏈新聞abmedia1小时前
Web3 AI 基础设施 AIW3 完成 $2M 种子轮融资,Buffalo Capital 牵头
Gate News 消息,4月24日——Web3 AI 基础设施平台 AIW3 宣布完成一轮 $2 百万美元种子轮融资。本轮融资由 Buffalo Capital 牵头,GalaXin Capital 和 Three-stones Ventures 参与作为共同投资方。
AIW3 正在向 Agent-as-a-Service
GateNews1小时前
Cohere 收购德国 AI 公司 Aleph Alpha,斩获 $600M 投资用于欧洲扩张
Gate 新闻消息,4月24日——加拿大 AI 公司 Cohere 宣布计划收购德国 AI 公司 Aleph Alpha,以加强其在欧洲的布局。Aleph Alpha 的支持方 Schwarz Group 计划在 Cohere 的 E 轮融资中投资 $600 百万。
预计该融资轮将于 202
GateNews2小时前
小鹏、Redmi 牵头:北京车展上的车载 AI 推进
快讯,4月24日——随着中国加速推进 AI Plus 战略,并寻求在国外半导体方面获得更大独立性,中国车企在4月24日的北京车展上展示了先进的车载 AI 系统。
小鹏展示了语音控制泊车功能,允许驾驶员“通过
GateNews2小时前
OpenAI 工程师 Clive Chan 挑战 V4 硬件建议,称其相较 V3 存在错误与模糊之处
Gate News 消息,4 月 24 日——OpenAI 工程师 Clive Chan 就 V4 技术报告中的硬件建议章节提出了详细异议,称其“出人意料地平庸且容易出错”,与备受赞誉的 V3 版本相比尤为如此。V3 的硬件指导,其中包括问答(Q&A)环节
GateNews3小时前
Naver 推出 AI Tab 测试版,Google Gemini 进入韩国搜索市场
Gate News 消息,4 月 24 日——Naver 宣布,其新的对话式搜索功能 AI Tab 将启动封闭测试版,此前谷歌已在韩国于 Chrome 中推出 Gemini。
AI Tab 将与 Naver 现有的搜索标签并列出现,为用户提供一个专门用于对话式
GateNews3小时前