OpenAI 发布首款 AI 智能体 Operator,可像人类一样自主操控浏览器

OpenAI 正式发布了备受期待的 AI 智能体 Operator(意为操作员),它能够代理用户执行基于网页的操作,如点击、滚动和输入文字,完成诸如购买杂货、预订餐厅以及提交费用报告等任务。

Operator

在此之前,包括 微软SalesforceWorkday 等商业软件公司已纷纷推出了各自的智能体。近期,谷歌 和人工智能初创公司 Anthropic 也推出了类似的工具,它们与 OpenAI 的 Operator 相似,能够浏览网页并与菜单和按钮进行交互。

Operator 的核心优势:CUA 系统

与其他智能体相比,Operator 最大的特点是其通过 CUA 系统(计算机使用智能体)进行复杂的思维链反思和步骤规划。这一功能显著提高了其完成任务的精度和复杂性,使其无需针对具体任务进行精细调整,即可泛化完成多种复杂任务。

在直播的实机演示中,OpenAI 展示了 Operator 网购、订餐等基础操作。然而,在后续的用户测试中,它甚至能够完成在 Arxiv 上进行论文分类搜索、阅读多篇论文并整理综述的复杂任务,这些工作显然无法被传统的“意图理解”框架所涵盖。

此外,CUA 在网页控制和系统控制方面达到了 SOTA(当前最优技术水平)。虽然与人类操作仍有差距,但在演示中其整体行动相当流畅。

Operator 的发布与推广计划

目前,Operator 以“研究预览”的形式向美国 ChatGPT Pro 用户开放,订阅费用为每月 200 美元。这一服务专为需要高级 AI 功能的专业用户设计,提供无限制访问包括 GPT-4oo1 在内的高级模型。

OpenAI 计划将 Operator 功能逐步推广到 ChatGPT PlusTeamEnterprise 用户。在直播活动中,OpenAI 首席执行官 山姆·奥特曼(Sam Altman)提到,Operator 将很快在其他国家推出,但欧洲地区可能需要更长时间。

OpenAI 首席运营官 布拉德·莱特卡普(Brad Lightcap)表示,Operator 在家庭和工作中具有节省时间的“巨大潜力”,尤其是在自动化常见任务方面。他指出:“Operator 从根本上改变了人们与计算机的交互方式。这是一个艰巨的技术挑战,其价值取决于它的实用性。”

此外,OpenAI 正在与包括 InstacartUbereBayPricelineOpenTableEtsy 在内的科技公司合作,以便让用户在 Operator 主页上更便捷地访问这些公司的网页。

CUA 的工作原理

Operator 背后的核心技术是 CUA(Computer-Using Agent),它结合了 GPT-4o 的视觉能力与通过强化学习实现的高级推理能力。CUA 经过训练,能够像人类一样与图形用户界面(GUI)交互,包括屏幕上的按钮、菜单和文本框。这种能力使其能够灵活地执行数字任务,无需依赖特定操作系统或网页的 API。

CUA 的开发基于多年在多模态理解和推理领域的基础研究。它通过以下步骤执行任务:

  1. 感知:计算机的屏幕截图被纳入模型的上下文中,为模型提供计算机当前状态的视觉快照。
  2. 推理:CUA 通过思维链推导下一步操作,综合考虑当前和过去的屏幕截图及已执行的动作。
  3. 行动:CUA 执行点击、滚动或输入等操作,直至任务完成或需要用户干预。

尽管 CUA 能自动处理大多数步骤,但在涉及敏感操作(如输入登录信息或响应验证码)时,会寻求用户确认。

局限性与风险

尽管 AI 智能体潜力巨大,但其广泛应用仍面临挑战。例如,Apple Intelligence 虽已推出,但尚未被广泛使用。企业 AI 智能体也大多处于测试阶段,以避免暴露公司机密数据或引发网络安全风险。

OpenAI 指出,Operator 可能面临的风险包括恶意网站欺骗用户、用户试图欺骗代理,以及“提示注入”攻击。为应对这些风险,Operator 推出了“接管模式”,要求用户手动输入支付详情或登录信息,并在执行高风险任务(如发送邮件)前征求用户批准。


👉 野卡 | 一分钟注册,轻松订阅海外线上服务

上一篇 2025年6月27日
下一篇 2025年6月27日

相关推荐

  • 如何通过3种方法轻松取消iPhone上的订阅

    更新于 欧丽莎 你好!我的iPhone上有些订阅服务,但我不确定如何管理或取消它们。我已经改变了主意,想要取消这些订阅。你能帮我解决这个问题吗?非常感谢你的帮助! iPhone支持多种订阅服务,如Ap…

    2025年8月8日
  • GPT5 如何使用?GPT5 如何订阅?GPT5 功能全面解析

    结论是:GPT2 很糟糕 ,GPT3 很糟糕 ,GPT4 可以 ,但 GPT5 会很好。 如果想要升级ChatGPT,可以直接通过 野卡 | 一分钟注册,轻松订阅海外线上服务 开通一张虚拟卡,1分钟就…

    2025年6月27日
  • OpenAI 推出 ChatGPT Pro:o1 模型正式上线,月费 200 美元

    近日(12 月 5 日),OpenAI 正式发布了新一代高端 AI 订阅服务 ChatGPT Pro,并宣布最新的 o1 模型正式上线。这款被誉为“全球最聪明的 AI 模型”的产品,从功能到价格都引发…

    2025年2月10日
  • 虚拟卡和实体信用卡的区别全解析

    在数字支付盛行的今天,虚拟信用卡和实体信用卡成为两种主流的支付方式。随着电商和线上消费的普及,虚拟卡的应用场景也越来越多。然而,很多人对这两者的区别仍存在疑惑。本文将详细介绍虚拟卡和实体卡的异同,帮助…

    文章 2025年7月8日
  • Bybit 交易所高级认证与银行卡申请指南:大陆证件实名支持

    为什么选择 Bybit? Bybit 是全球排名第 4 的顶级加密货币交易所,不仅提供安全可靠的交易环境,还推出了专属的银行卡服务。通过Bybit 注册链接注册,新用户最高可获得 5,030 USDT…

    文章 2025年7月17日
  • 国际支付新选择:虚拟信用卡的全攻略

    在全球化的今天,许多国际在线平台如美国的苹果iTunes商店、谷歌Google Play和亚马逊,通常要求使用美国本地信用卡进行交易。这对于中国用户来说,往往构成了不小的挑战。本文将详细介绍如何利用虚…

    文章 2025年2月14日
  • 外贸人如何利用 Facebook 进行高效引流?

    在国际社交推广领域,Facebook 是效果最佳的平台之一。它不仅适用于推广独立站点和第三方店铺,还能有效推广自己的应用程序。Facebook 的优势之一是其精准的定位功能,可以根据客户的性别、年龄、…

    文章 2025年3月11日
  • 一键生成信用卡号:满足您的多种需求

    如今,信用卡已成为生活中不可或缺的支付工具,无论是在线购物、订阅服务,还是测试软件试用版,信用卡都发挥着重要作用。然而,有时我们并不想使用真实的信用卡信息,这时信用卡生成器便成为了理想选择。本文将详细…

    文章 2025年7月15日
  • [野卡 虚拟信用卡指南] 如何轻松订阅海外服务?

    本教程将详细介绍如何使用 野卡 虚拟信用卡快速订阅国外服务,包括注册、激活和使用方法,帮助你轻松完成支付。 什么是虚拟信用卡? 虚拟信用卡平台提供传统信用卡的数字版服务,功能与实体卡相似,主要用于在线…

    2025年7月22日
  • 如何订阅 Midjourney?从入门到精通的全流程指南

    1. 什么是 Midjourney? Midjourney 是一款基于人工智能技术的 AI 绘画工具,能够将文本描述转化为精美的图像。与其他文生图工具不同,Midjourney 的图像生成完全在云端进…

    文章 2025年4月22日
  • 如何使用 ChatGPT-4o?全面指南:购买与订阅教程

    本文将详细介绍如何使用 ChatGPT-4o,以及如何购买和订阅这一先进的 AI 模型。无论你是想体验免费版还是升级到付费版,本文都将为你提供实用的教程。 👉 野卡 | 一分钟注册,轻松订阅海外线上服…

    2025年4月19日
  • 如何免费使用Perplexity AI体验GPT-4的强大功能

    一、Perplexity AI是什么? Perplexity AI是一款高质量的智能搜索工具,旨在为用户提供简洁清晰的搜索体验。该工具内置了基于GPT-4的Copilot搜索功能,用户每四小时可以免费…

    2025年3月22日
  • 如何使用美国信用卡虚拟卡在亚马逊购物

    随着全球在线购物的普及,亚马逊等大型电商平台逐渐成为消费者的首选。许多用户希望通过美国信用卡虚拟卡进行跨境支付和在线购物。虚拟信用卡作为一种便捷且安全的支付工具,尤其适合国际购物和订阅服务。本文将详细…

    文章 2025年7月21日
  • 如何申请日本万德虚拟信用卡?全面指南

    由于日本独特的支付习惯和严格的法律,申请日本信用卡(无论是虚拟卡还是实体卡)可能会面临诸多挑战。本文将为您详细解析申请日本万德虚拟信用卡的流程、难点及优缺点,帮助您更轻松地完成申请。 申请日本虚拟信用…

    文章 2025年7月9日
  • 如何开通 Midjourney 会员:详细订阅与充值教程

    Midjourney 是目前最受欢迎的 AI 绘画工具之一。由于其高效的生成能力和独特的艺术风格,越来越多的人选择使用 Midjourney 进行创作。不过,新用户已经没有免费使用次数,因此开通 Mi…

    文章 2025年7月28日
  • 使用 野卡 快速升级 ChatGPT Plus-Pro 指南

    1. 登录 OpenAI 账户 首先访问 chat.openai.com,点击 Login 按钮,输入您的邮箱和密码完成登录。 2. 点击升级按钮 登录成功后,点击页面左下角的 Upgrade to …

    2025年3月27日
  • ChatGPT支付全攻略(2025最新):解锁支付宝、信用卡、礼品卡订阅方法

    引言:开启ChatGPT Plus的智能体验 随着人工智能技术的飞速发展,ChatGPT已成为全球用户不可或缺的智能助手。然而,对于许多中国用户来说,如何顺利完成ChatGPT Plus的支付订阅仍是…

    2025年5月3日
  • 新手必看:如何轻松订阅 ChatGPT Plus 和 OnlyFans 会员

    在订阅海外服务如 ChatGPT Plus 或 OnlyFans 时,许多用户面临支付方式的限制。国内信用卡或借记卡通常无法直接用于这类海外订阅服务。今天,我们将介绍一种简单、安全且高效的解决方案——…

    文章 6天前
  • OpenAI 开发者安全绑卡与充值指南:野卡 推荐

    2023年更新提醒 2023-11-28 更新:切勿使用微软账号登录注册 OpenAI,微软可能提供国家信息,导致账号封禁风险增加。 2023年10月亲测成功案例 作为一名开发者,我计划开发基于 Ch…

    文章 2025年6月10日
  • 手机上的虚拟信用卡如何提现?虚拟信用卡可以取现吗?

    虚拟信用卡是一种没有实体卡的线上信用卡账户,很多用户对它的取现功能感到好奇。本文将详细介绍不同银行虚拟信用卡的取现方式以及相关注意事项。 建行虚拟信用卡取现方法 建行虚拟信用卡可以通过以下方式实现取现…

    文章 2025年3月6日
  • ChatGPT4使用指南:快速掌握应用技巧

    一、野卡虚拟卡简介:常见问题解答 野卡虚拟卡是一款专为订阅海外服务设计的虚拟信用卡,帮助用户轻松订阅如ChatGPT等国外软件。以下是使用野卡的常见问题解答: 什么是野卡虚拟卡? 野卡虚拟卡是一种在线…

    文章 2025年4月23日
  • Claude AI:探索其功能与成本

    在当今科技迅猛发展的时代,人工智能已经成为生活中不可或缺的一部分。其中,Claude AI作为一款备受瞩目的产品,引起了广泛关注。那么,Claude AI究竟是什么?它是否可以免费使用呢? Claud…

    文章 2025年2月2日
  • Stripe 与 Payoneer:哪个更适合您的需求?

    选择适合的商业银行平台并非易事,它需要满足您的银行业务需求,同时提供详尽的功能以实现自主操作。您可能还需要一些内置功能来制定预算和跟踪财务状况。此外,您希望避免支付高额交易费用,并能够在需要时快速获得…

    文章 2025年8月1日
  • 解决ChatGPT iOS无法订阅和无法使用问题的完整指南

    你是否也遇到过在iPhone上使用ChatGPT时,发现无法订阅或使用的情况?别担心,这篇文章将详细教你如何解决ChatGPT iOS无法订阅和无法使用的问题。无论你是由于所在国家的限制,还是遇到Ap…

    2025年5月5日
  • 如何取消和删除 Azure 订阅

    Microsoft Azure 是云计算领域的领导者,但如果你不再需要某个 Azure 订阅,了解如何正确取消和删除它非常重要。本文将为你提供详细的步骤和注意事项。 本文内容 取消 Azure 订阅的…

    文章 2025年3月31日