零分Trader

OpenAI发布自主智能体Operator:AI代理用户执行网页操作,ChatGPT Pro会员抢先体验

作者头像
分析师熊大 本文作者

2025-1-24 阅读 232 约 5分钟读完

评论0

当地时间周四,OpenAI 发布了自主代理 Operator。继本月OpenAI推出新功能Tasks,被认为产品方向开始转向AI代理后,OpenAI又采取了更实质性的行动。

据OpenAI介绍,Operator可以代表用户执行基于Web的操作,例如查看、输入、点击和滚动网页。 Operator是OpenAI最早的代理之一。目前,Operator仍是研究预览版,存在功能限制。美国的ChatGPT Pro会员可以使用此功能。

在20多分钟的介绍视频中,OpenAI演示了如何使用Operator来处理各种复杂的网页任务,例如填写表格和订购商品。演示中,操作员要求操作员在晚上7点在某餐厅预订座位,操作员会自动打开网页并进入预订网站,搜索餐厅并完成预订。当运营商发现当时餐厅座位已被预订时,会询问用户是否将预订更改为7:45餐厅。如果您上传包含鸡蛋、菠菜、蘑菇、鸡肉等食物的购物清单图片,运营商会打开网页并搜索这些商品并将其添加到购物车中。运营商还可以帮助用户订外卖。

从视频来看,Operator的操作页面与ChatGPT页面非常相似,用户可以在对话框中向Operator提出请求。据OpenAI介绍,支持Operator的模型是CUA(ComputerUsageAgent)模型。 CUA 将 GPT-4o 的视觉功能与高级推理功能相结合。 CUA可以与用户的图形界面进行交互,“看到”屏幕上的按钮、菜单和文本,还可以执行鼠标和键盘可以执行的操作。在CUA能力的支持下,当遇到困难或犯错时,Operator会利用其推理能力进行自我纠正或将控制权交还给用户。

在安全和隐私方面,当Operator执行任务时,人们可以控制流程。当用户输入支付信息等敏感信息时,运营商会要求用户接管。在此过程中,运营商不会收集用户输入的信息。据报道,运营商也会拒绝一些有害的请求。未来,OpenAI计划开放CUA的使用接口,以便开发者可以使用它来构建自己的智能代理。目前,可以使用 Operator 的用户数量是有限的。 ChatGPT Pro 用户的每月会员费达到 200 美元。运营商计划未来向ChatGPT Plus、Team和企业用户开放。

Operator发布后,OpenAI总裁兼联合创始人Greg Brockman在社交媒体上表示,2025年是智能代理年。此前,OpenAI多次放出开发智能代理的信号。

当被问及下一个模型更新时,OpenAI首席执行官Sam Altman去年曾提到,接下来会有更好的模型,但他相信下一个重大突破将是智能代理。本月早些时候,萨姆·奥尔特曼在一篇长篇博客文章中表示,他相信到 2025 年,人们将看到第一批人工智能代理“加入劳动力队伍”,并从根本上改变公司的生产方式。当地时间1月14日,OpenAI还推出了名为Tasks的新测试版功能,允许用户创建和管理未来的任务提醒。该功能还具有一定的代理属性。

有研发人员告诉记者,智能代理的关键在于AI模型具有更强的主动性。在国内,智普AI是最早研发智能机器人的企业之一。去年11月,智普AI发布了PC端智能GLM-PC并开始邀请测试。智能座席的功能还包括叫外卖、发送微信等。该代理最近发布了更新,推出了“深度思考”模式,并添加了专用于逻辑推理和代码生成的功能。

智浦华章总裁王少兰去年12月表示,2025年AI领域有两个重要的发展方向,其中之一是智能代理技术,这是使用大型模型的工具。 “现在手机APP仍然需要人性化的操作方式,可想而知,能够熟练使用工具对于行业意味着什么。”

上一篇 天齐锂业2024年预亏71亿至82亿元,股价触及近4个月低位,锂产品市场波动成主因 下一篇 2025年上海春节档预售破4亿,创影史纪录,再度问鼎票房第一城
评论
更换验证码