摘要: Gemini 2.5 Flash-Lite是最新发布的稳定版本,是Gemini 2.5模型家族中最快、成本最低的模型(输入每1M tokens 0.10美元,输出每1M tokens 0.40美元)。它旨在提供高性价比,具有可选的推理能力,适用于对延迟敏感的任务,如翻译和分类。该模型在速度和成本效率方面表现出色,同时保持了高质量。它还提供了1百万token的上下文窗口、可控的思维预算以及原生工具支持。此外,该模型已经在多个应用场景中取得成功,包括卫星数据处理、视频内容自动化、产品演示文档化等。
讨论: 用户讨论了关于某个软件版本(可能是Flash 2.5 Lite)的性能表现。serjester指出,相比于Flash 2.0,这个版本在多个基准测试中表现不佳,认为开发团队更注重编码而非性能优化。同时,即使是考虑了思考变体的版本,在非编码方面的提升也微乎其微。hyuuu询问了Lite版本是否在token输出速度或首次token生成时间上有优势。mortsnort提到了一个重大更新,即模型名称中去掉了“_preview”。AbuAssar对使用“Flash”前缀表示Lite版本表示疑问。
原文标题:Gemini 2.5 Flash-Lite is now stable and generally available
原文链接:https://developers.googleblog.com/en/gemini-25-flash-lite-is-now-stable-and-generally-available/
讨论链接:https://news.ycombinator.com/item?id=44648926