【小哈划重点:该工具名为ChatGPT agent,结合了OpenAI之前多种智能体工具的功能,包括Operator点击网站的能力,以及Deep Research从数十个网站中综合信息生成简洁研究报告的能力。OpenAI表示用户只需通过自然语言提示ChatGPT即可与该智能体进行交互。】
7月18日消息,OpenAI今日凌晨宣布将在ChatGPT中推出一款通用型AI智能体,该公司表示该智能体可以帮助用户完成各种基于计算机的任务。
OpenAI介绍称,该智能体可以自动生成可编辑的演示文稿和幻灯片、查看用户的日历来简要介绍即将到来的客户会议、计划并购买制作家庭早餐的食材,以及运行代码等。
该工具名为ChatGPT agent,结合了OpenAI之前多种智能体工具的功能,包括Operator点击网站的能力,以及Deep Research从数十个网站中综合信息生成简洁研究报告的能力。OpenAI表示用户只需通过自然语言提示ChatGPT即可与该智能体进行交互。
为了开发这个新工具,OpenAI将其背后的Operator和Deep Research团队合并为一个统一的团队。外媒The Verge报道称,这个新团队由产品和研究部门共20~35人组成。
OpenAI表示ChatGPT智能体比其之前的任何产品都要强大得多,可以访问ChatGPT连接器,允许用户连接像Gmail和GitHub这样的应用,智能体可以根据用户的提示找到相关信息。此外,OpenAI表示ChatGPT智能体可以访问终端,并可以使用API来访问某些应用。
根据OpenAI的说法,ChatGPT智能体的底层模型在多个基准测试中提供了最先进的性能。ChatGPT智能体模型在Humanity's Last Exam(pass@1)中得分率为41.6%,这是一项由数千个问题组成的、涵盖超过一百个学科的困难测试。这个分数大约是OpenAI o3和o4-mini得分的两倍。
在已知最难的数学基准测试之一FrontierMath中,OpenAI表示,当ChatGPT智能体可以访问工具(IT之家注:如用于代码执行的终端)时,其得分为27.4%,之前的最佳分数来自o4-mini(得分仅为6.3%)。
(原文标题:《OpenAI 史上最强 ChatGPT 智能体发布:浏览网站、写代码、做 PPT 样样精通
》。哈希力量节选收录)
https://www.ithome.com/0/868/961.htm