谷歌推出Gemini 2.5 Flash模型,主打高效低延迟AI应用场景

报道 4月10日消息,据TechCrunch报道,谷歌发布全新AI模型Gemini 2.5 Flash,专为高效处理、高吞吐量和低成本场景设计。该模型即将在谷歌Vertex AI平台上线,支持用户调节速度、精度与成本间的平衡,适用于客服、文档解析等实时任务。Gemini 2.5 Flash作为“推理型”模型,可在回答前进行自我验证。谷歌还计划于今年Q3将该模型部署至本地环境,通过Google Distributed Cloud与Nvidia Blackwell系统实现合规落地。

发表评论

您的电子邮箱地址不会被公开。