Google发布Gemini 2.5计算机使用模型

在今年早些时候的 Google I/O 开发者大会上,Google宣布将为 Gemini API 引入计算机使用功能。今天,Google发布了 Gemini 2.5 计算机使用模型,这是一个全新的专用模型,旨在为能够与用户界面 (UI) 交互的代理提供支持。Google声称,该新模型在多个 Web 和移动控制基准测试中均优于其他同类模型 。

Gemini API computer_use 工具的工作原理如下:

虽然 Gemini 2.5 计算机使用模型针对网页浏览器进行了优化,但 Google 声称该模型在移动 UI 控制任务中也表现出色。Google特别提到 ,该模型尚未针对桌面操作系统级别的控制进行优化。正如您在下面的基准测试中看到的,Gemini 2.5 计算机使用模型在几个关键基准测试中都取得了最佳结果。

Gemini 2.5 计算机使用模型现已公开预览,开发人员可以通过 Google AI Studio 和 Vertex AI 上的 Gemini API 访问它。

展开阅读全文

更新时间:2025-10-09

标签:科技   模型   计算机   操作   基准   功能   单击   截图   屏幕   测试   工具

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020- All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号

Top