摘要: 构建自主代理,支持规划、应用内导航和任务执行,并原生支持函数调用功能。
讨论: Gemma-4模型发布,包含26B A4B、31B、E2B、E4B等版本。性能基准显示在MMLUP、GPQA等任务中,Gemma-4与Qwen 3.5存在差异,部分指标如ELO评分被指出存在误导性。用户反馈显示,31B版本存在输出异常问题,而26B A4B在工具调用和推理速度上表现较好。测试案例表明Gemma-4在代码生成任务中效率低于Qwen 3.5,但工具调用逻辑更清晰,部分场景存在幻觉问题。模型支持Apache 2.0协议,适合移动端和OCR场景,团队已回应技术问题。
原文标题:Google releases Gemma 4 open models
原文链接:https://deepmind.google/models/gemma/gemma-4/
讨论链接:https://news.ycombinator.com/item?id=47616361