OpenAI 发布首款 AI 智能体 Operator,可像人类一样自主操控浏览器

OpenAI 正式发布了备受期待的 AI 智能体 Operator(意为操作员),它能够代理用户执行基于网页的操作,如点击、滚动和输入文字,完成诸如购买杂货、预订餐厅以及提交费用报告等任务。

Operator

在此之前,包括 微软SalesforceWorkday 等商业软件公司已纷纷推出了各自的智能体。近期,谷歌 和人工智能初创公司 Anthropic 也推出了类似的工具,它们与 OpenAI 的 Operator 相似,能够浏览网页并与菜单和按钮进行交互。

Operator 的核心优势:CUA 系统

与其他智能体相比,Operator 最大的特点是其通过 CUA 系统(计算机使用智能体)进行复杂的思维链反思和步骤规划。这一功能显著提高了其完成任务的精度和复杂性,使其无需针对具体任务进行精细调整,即可泛化完成多种复杂任务。

在直播的实机演示中,OpenAI 展示了 Operator 网购、订餐等基础操作。然而,在后续的用户测试中,它甚至能够完成在 Arxiv 上进行论文分类搜索、阅读多篇论文并整理综述的复杂任务,这些工作显然无法被传统的“意图理解”框架所涵盖。

此外,CUA 在网页控制和系统控制方面达到了 SOTA(当前最优技术水平)。虽然与人类操作仍有差距,但在演示中其整体行动相当流畅。

Operator 的发布与推广计划

目前,Operator 以“研究预览”的形式向美国 ChatGPT Pro 用户开放,订阅费用为每月 200 美元。这一服务专为需要高级 AI 功能的专业用户设计,提供无限制访问包括 GPT-4oo1 在内的高级模型。

OpenAI 计划将 Operator 功能逐步推广到 ChatGPT PlusTeamEnterprise 用户。在直播活动中,OpenAI 首席执行官 山姆·奥特曼(Sam Altman)提到,Operator 将很快在其他国家推出,但欧洲地区可能需要更长时间。

OpenAI 首席运营官 布拉德·莱特卡普(Brad Lightcap)表示,Operator 在家庭和工作中具有节省时间的“巨大潜力”,尤其是在自动化常见任务方面。他指出:“Operator 从根本上改变了人们与计算机的交互方式。这是一个艰巨的技术挑战,其价值取决于它的实用性。”

此外,OpenAI 正在与包括 InstacartUbereBayPricelineOpenTableEtsy 在内的科技公司合作,以便让用户在 Operator 主页上更便捷地访问这些公司的网页。

CUA 的工作原理

Operator 背后的核心技术是 CUA(Computer-Using Agent),它结合了 GPT-4o 的视觉能力与通过强化学习实现的高级推理能力。CUA 经过训练,能够像人类一样与图形用户界面(GUI)交互,包括屏幕上的按钮、菜单和文本框。这种能力使其能够灵活地执行数字任务,无需依赖特定操作系统或网页的 API。

CUA 的开发基于多年在多模态理解和推理领域的基础研究。它通过以下步骤执行任务:

  1. 感知:计算机的屏幕截图被纳入模型的上下文中,为模型提供计算机当前状态的视觉快照。
  2. 推理:CUA 通过思维链推导下一步操作,综合考虑当前和过去的屏幕截图及已执行的动作。
  3. 行动:CUA 执行点击、滚动或输入等操作,直至任务完成或需要用户干预。

尽管 CUA 能自动处理大多数步骤,但在涉及敏感操作(如输入登录信息或响应验证码)时,会寻求用户确认。

局限性与风险

尽管 AI 智能体潜力巨大,但其广泛应用仍面临挑战。例如,Apple Intelligence 虽已推出,但尚未被广泛使用。企业 AI 智能体也大多处于测试阶段,以避免暴露公司机密数据或引发网络安全风险。

OpenAI 指出,Operator 可能面临的风险包括恶意网站欺骗用户、用户试图欺骗代理,以及“提示注入”攻击。为应对这些风险,Operator 推出了“接管模式”,要求用户手动输入支付详情或登录信息,并在执行高风险任务(如发送邮件)前征求用户批准。


👉 野卡 | 一分钟注册,轻松订阅海外线上服务

上一篇 2025年6月27日
下一篇 2025年6月27日

相关推荐

  • 如何取消 Adobe 七天试用?详细教程分享

    Adobe 软件功能强大,但不少用户在试用期结束后面临需要取消订阅或延长试用期的需求。本文将详细介绍如何取消 Adobe 七天试用,以及一些常见问题的解决方案。 一、取消 Adobe 七天试用的步骤 …

    文章 2025年6月15日
  • 使用虚拟信用卡充值20美元激活WISE账户并用于后续入金

    在之前的文章中,我们已经多次介绍了WISE的注册、费用以及使用过程中的相关规定。然而,用户最关心的问题始终是:如何为WISE充值20美元以激活美元账户?近年来,我提供了大量的WISE代充激活服务,见证…

    文章 2025年4月22日
  • GPT-4 扣费机制与银行卡信息安全指南

    在人工智能技术的飞速发展中,自然语言处理(NLP)领域的进步尤为显著。GPT-4,作为最新一代的语言模型,不仅在语言理解和生成方面取得了巨大突破,还在商业应用中扮演着越来越重要的角色。随着GPT-4的…

    文章 2025年3月16日
  • 教程:如何轻松购买 ChatGPT Plus 服务

    在使用 ChatGPT 的强大功能时,许多用户希望升级到 ChatGPT Plus 以获得更高级的体验。本教程将为您详细讲解如何购买 ChatGPT Plus 服务,确保整个过程顺畅无阻。 👉 野卡 …

    文章 2025年2月15日
  • 2025最新指南:如何订阅GPT-4?轻松解决支付难题

    自从ChatGPT 3.5发布以来,其强大的语言处理能力便吸引了全球用户的关注。而作为升级版的GPT-4,凭借其更高的稳定性、无字数限制、更精准的回答能力以及支持AI绘图等强大功能,更是成为了众多用户…

    文章 2025年2月16日
  • GPT-4o:新一代多模态人工智能模型全面解析与使用指南

    自ChatGPT首次亮相以来,短短17个月内,OpenAI再次震撼科技界,推出了一款仿佛来自科幻电影的超级AI——GPT-4o,并且对所有人完全免费。这一创新不仅展示了OpenAI的技术实力,也为全球…

    2025年6月22日
  • 挖宝指南:手把手教你寻找 Facebook 群组

    Facebook 不仅仅是一个社交平台,随着其商业化的发展,它的功能已经远超单一的社交需求。除了通过平台投放广告来达到营销目的,还有一种被许多人忽略的方法——利用 Facebook 群组功能。本文将详…

    2025年5月15日
  • 3 分钟快速申请美国 Visa 万事达虚拟卡及 USDT 充值全攻略

    虚拟信用卡(VCC)已成为海淘、国际支付和订阅服务的重要工具,尤其是在需要绑定 Visa 或万事达卡的场景。本文将详细介绍虚拟卡的用途及 USDT 充值教程,帮助您轻松开启全球支付体验。 野卡 虚拟信…

    文章 2025年3月29日
  • 如何取消 ChatGPT Plus 订阅 _ Digital Trends

    ChatGPT-4 是迄今为止最强大的 AI 聊天机器人,可以在我们的计算机、智能手机和平板电脑上运行。尽管 OpenAI 的这个版本是锁定在每月 20 美元的付费墙后面,但 ChatGPT Plus…

    文章 2025年3月3日
  • 虚拟信用卡是什么?野卡如何使用?新手也能轻松掌握的详细指南

    一、什么是虚拟信用卡? 虚拟信用卡是一种基于真实信用卡发行的数字卡片,通过生成的虚拟卡号、CVV和有效期,可以在一定范围内代替实体卡片进行支付。与实体信用卡不同,虚拟信用卡通常只限在线上使用,在极大程…

    2025年5月2日
  • 虚拟信用卡与实体卡的区别解析 – Visa虚拟信用卡开卡指南

    在数字化的浪潮下,虚拟信用卡逐渐成为了现代支付的新宠。它不仅为客户提供了便捷、安全的支付方式,还以其独特的优势改变了人们的消费习惯。本文将为您详细解析 Visa 虚拟信用卡的申请流程及其与实体信用卡的…

    2025年4月17日
  • 亚马逊平台费用包括什么?详细费用解析!

    作为一个亚马逊卖家,你需要支付的费用到底有哪些?了解这些费用后,又该如何优化成本,降低支出呢?本文将详细解析亚马逊平台的各类费用,帮助卖家更好地规划经营策略。 一、平台订阅费 亚马逊根据不同站点收取不…

    文章 2025年5月18日
  • 国内开通 ChatGPT Plus 会员订阅和 API 绑定信用卡教程

    刚刚成功绑定了 野卡 虚拟信用卡,并且开通了 ChatGPT Plus 会员,记录如下。 之前试过很多平台,但都不太好用。推荐 野卡 主要是因为注册简便、开卡速度快,最重要的是支持支付宝付款。其他平台…

    2025年3月7日
  • 野卡 虚拟卡:国内合法性解析与使用全指南

    内容简介本文详细解析了 野卡 虚拟卡在国内的合法性,同时介绍了其主要功能及使用方法,为用户解决跨境支付问题提供清晰指引。以下是核心总结:– 野卡 是一款便捷、安全的虚拟信用卡。&#8211…

    文章 2025年7月7日
  • Depay信用卡实测:从USDT到美元和人民币的无缝支付体验

    更新(2024年10月20日):由于政策原因,Depay和OneKey Card已进入维护阶段,请用户注意账户资金安全。目前,野卡提供类似服务,支持轻松订阅海外线上服务。 无论你身处何地,无论你持有何…

    文章 2025年7月20日
  • FotonCard 虚拟信用卡平台:福田卡 Visa 虚拟卡无限开卡与 USDT 充值指南

    什么是 FotonCard 虚拟信用卡平台? FotonCard 是一家专注于跨境电商、Facebook 广告投放、营销工具付费订阅等场景的虚拟信用卡平台。通过与多家银行发卡机构合作,FotonCar…

    2025年5月30日
  • 2025年苹果App Store退款指南:简单一步即可完成

    你是否曾在App Store误购应用或无意间被订阅扣费?别担心,这些情况都可以申请退款!本文将详细介绍最简单、高效的退款步骤,帮助你挽回不必要的损失。 退款条件与注意事项 在开始退款之前,请先了解以下…

    文章 2025年8月11日
  • 如何在 App Store 中取消订阅?

    在日常使用苹果设备时,订阅各种应用服务是非常常见的。但有时我们可能不再需要使用某些服务,这时就需要取消订阅。本文将为您详细介绍如何在 App Store 中取消订阅,以及一些常见问题的解决方法。 取消…

    文章 2025年5月20日
  • 更改 App Store 国家-地区的 3 种实用方法

    1. 使用 VPN 更改 App Store 国家/地区 当您的 IP 地址与您尝试访问的 App Store 国家/地区不匹配时,Apple 会使用 GPS 位置来确定您的 Apple ID 所在的…

    文章 2025年8月11日
  • 美区App Store礼品卡购买与充值完整指南

    iOS用户通常都会接触到美区Apple ID,但要在美区App Store购买某些应用或服务时,往往需要绑定支付方式。对于国内用户来说,直接绑定支付方式可能会比较麻烦。不过,通过购买美区App Sto…

    文章 2025年2月17日
  • Cursor 软件中文版设置教程:轻松切换语言界面

    在日常使用 Cursor 软件时,许多用户希望将界面语言设置为中文,以便更高效地操作和理解。本文将详细介绍两种设置 Cursor 软件中文版的方法,分别是使用拓展程序和配置语言设置。通过简单的步骤,您…

    文章 2025年3月1日
  • ChatGPT 助力写作:从入门到精通

    之前,我曾分享过一篇关于如何利用 ChatGPT 进行编程的文章。对我而言,ChatGPT 不仅仅是一个有趣的聊天机器人,它更是一个强大的生产力工具。 在尝试了一段时间的 Stable Diffusi…

    文章 2025年7月4日
  • 从零开始构建外币虚拟信用卡

    编辑导读:随着全球化的不断深入,跨国贸易日益频繁,外币虚拟信用卡应运而生。本文将详细解析如何从零开始搭建外币虚拟信用卡系统,帮助您在跨境支付领域迈出重要一步。 最近,我参与了一个外币虚拟信用卡的项目,…

    2025年5月3日
  • Perplexity AI 简介及国内注册升级指南

    Perplexity AI 是一款功能强大的免费人工智能答案引擎,能够为用户提供快速、准确且可信的信息。与传统的搜索引擎如谷歌和百度相比,Perplexity AI 不仅减少了广告干扰,还通过智能处理…

    2025年2月9日
  • 虚拟信用卡的有效期是多久

    虚拟信用卡的有效期通常由发卡银行或支付平台设定,一般为几个月到一年的时间。有效期到期后,该卡片将失效,用户需重新申请或生成新的虚拟卡以继续使用。具体有效期会因不同服务提供商而异,建议用户在申请时仔细查…

    2025年2月17日