Gemini 2.5 Flash-Lite 现已稳定并正式发布。

摘要： Gemini 2.5 Flash-Lite是最新发布的稳定版本，是Gemini 2.5模型家族中最快、成本最低的模型（输入每1M tokens 0.10美元，输出每1M tokens 0.40美元）。它旨在提供高性价比，具有可选的推理能力，适用于对延迟敏感的任务，如翻译和分类。该模型在速度和成本效率方面表现出色，同时保持了高质量。它还提供了1百万token的上下文窗口、可控的思维预算以及原生工具支持。此外，该模型已经在多个应用场景中取得成功，包括卫星数据处理、视频内容自动化、产品演示文档化等。

讨论： 用户讨论了关于某个软件版本（可能是Flash 2.5 Lite）的性能表现。serjester指出，相比于Flash 2.0，这个版本在多个基准测试中表现不佳，认为开发团队更注重编码而非性能优化。同时，即使是考虑了思考变体的版本，在非编码方面的提升也微乎其微。hyuuu询问了Lite版本是否在token输出速度或首次token生成时间上有优势。mortsnort提到了一个重大更新，即模型名称中去掉了“_preview”。AbuAssar对使用“Flash”前缀表示Lite版本表示疑问。

原文标题：Gemini 2.5 Flash-Lite is now stable and generally available
原文链接：https://developers.googleblog.com/en/gemini-25-flash-lite-is-now-stable-and-generally-available/
讨论链接：https://news.ycombinator.com/item?id=44648926