最新!OpenAI发布o3及o3 mini推理模型

前情回顾

OpenAI在圣诞前连续12天发布了一系列重要更新,以下是每日发布的简要回顾:

  • Day 1:发布o1满血版,ChatGPT Pro最贵订阅版本200美元/月
  • Day 2:发布强化微调新功能,用少量训练数据即可在特定领域构建专家模型
  • Day 3:发布视频生成模型Sora
  • Day 4:Canvas全面开放,升级代码功能
  • Day 5:展示OpenAI与苹果智能合作功能
  • Day 6:发布高级实时视频理解功能
  • Day 7:发布Projects In ChatGPT功能
  • Day 8:搜索功能全面开放,支持语音搜索
  • Day 9:o1 API开放,实时API更新
  • Day 10:拨打1-800-ChatGPT热线电话,可访问ChatGPT
  • Day 11:展示Mac桌面版App与各类App的互操作性

本期亮点:Day 12发布o3及o3 mini推理模型

在OpenAI为期12天的圣诞系列发布活动的高潮时刻,终于揭晓了备受期待的重磅新品——o3,这是其迄今为止最先进的前沿推理模型的升级版。OpenAI宣称,在特定条件下,o3的性能已经接近于通用人工智能(AGI)的水平。

在直播环节中,OpenAI的首席执行官Sam Altman表示:“我们视o3为人工智能发展的新篇章。这些模型能够处理日益复杂且需要深度推理的任务。”他还特别强调了o3在编程领域的卓越表现,称其为“不可思议”。

o3模型发布

o3系列模型:性能卓越,接近通用人工智能(AGI)

模型介绍

OpenAI推出了o3系列,包括两款模型:

  1. OpenAI o3:旗舰版,性能强大。
  2. OpenAI o3 mini:轻量级,速度快,成本低,性价比高。

开放计划

o3系列目前不向普通用户开放,OpenAI计划先进行外部安全测试,预计明年1月正式发布。感兴趣的人可以提交申请:OpenAI安全测试申请

性能提升

o3模型在多个基准测试中表现出色:

  • 在SweepBench Verified基准测试中,准确率达到71.7%,比o1高出20%。
  • 在Codeforces编程竞赛平台上,得分2727,远超o1的1891分。
  • 在美国数学竞赛AIME 2024测试中,准确率为90.67%,高于o1的83.3%。
  • 在GPQA Diamond测试中,得分87.7%,比o1的78%高。
  • 在EpochAI Frontier Math测试中,得分超过2457分,远超其他模型。

o3模型性能
o3模型性能

AGI领域的进展

o3在ARC-AGI基准测试中表现出色,得分75.7分。在提高算力和思考时间后,得分达到87.5%,超过大多数真人。

o3 mini模型的特点

o3 mini继承了o1 mini的数学和编程能力,成本极低,并向安全研究人员开放测试申请。它支持低、中、高三种推理时间模式,可根据任务复杂度调整思考时间。在Codeforces Elo评分中,随着推理时间增加,得分持续攀升。o3 mini还能自我测试,在GPQA数据集测试中,准确率达到61.62%。

数学和编程能力

在AIME数学基准测试中,o3 mini低推理模式性能与o1 mini相当,中等推理模式超越o1 mini。o3 mini还支持函数调用、结构化输出和开发者指令等API功能。

市场影响

OpenAI在AI领域领先竞争对手约两年,但随着市场份额被蚕食,ChatGPT的光环正在褪去。竞争对手如Anthropic和Google开发出性能接近的新模型,OpenAI的竞争优势正在减弱。尽管如此,作为用户,我们将成为这场变局中的最大赢家。

o3模型市场影响

👉 野卡 | 一分钟注册,轻松订阅海外线上服务

上一篇 2025年6月5日
下一篇 2025年6月5日

相关推荐

  • 跨境电商入门:从亚马逊到速卖通,你需要知道的五大平台!

    跨境电商跨境电子商务是指分属不同关境的交易主体,通过电子商务平台达成交易、进行支付结算,并通过跨境物流送达商品、完成交易的一种国际商业活动。 一、五大跨境电商平台注册与使用指南 1.1 开店门槛与费用…

    文章 2025年3月10日
  • 【2025年】野卡订阅GPT-4.0防封号指南:安全使用全攻略

    近期,许多用户反馈在使用GPT账号时遭遇封号问题,尤其是在使用野卡订阅GPT-4.0时,缺乏有效的防封策略。本文将为您详细解答以下内容:什么是野卡?如何正确订阅GPT-4.0?封号的原因是什么?以及如…

    文章 2025年4月8日
  • 申请Vandle日本虚拟信用卡完整攻略

    前言 日本特有的支付习惯和严格的法律规定使得申请日本信用卡(无论是实体卡还是虚拟卡)成为一项复杂任务,尤其对于外国人而言。主要难点包括: 身份认证要求:在日本银行系统,外国护照通常无法作为申请信用卡的…

    文章 2025年3月10日
  • 如何取消 Amazon Music Prime-Unlimited 订阅?

    亚马逊音乐以其丰富的音乐库和优质的服务吸引了大量用户。然而,随着市场上越来越多的音乐流媒体平台的出现,您可能想要尝试其他服务,或者因为同时订阅了多个平台而考虑取消其中之一。 无论出于何种原因,如果您决…

    2025年6月14日
  • 使用Depay完成ChatGPT Plus和Midjourney充值的详细教程

    在订阅类似GPT Plus、Midjourney等海外服务时,通常需要绑定一张VISA卡。如果你没有国际信用卡,别担心,下面将为你详细介绍如何使用Depay虚拟卡完成充值,摆脱对传统支付方式的依赖。 …

    文章 2025年5月14日
  • 【实测有效】Claude3账号注册指南:解决封号和手机验证码问题

    前言 OpenAI不可战胜的神话已被打破。随着Claude 3的发布,它不仅在性能跑分上全面超越了GPT-4,还坐上了全球最强大模型的新王座。 Claude 3 提供了多个版本,其中“中杯”(Sonn…

    文章 2025年7月6日
  • 如何获取美国虚拟信用卡(详细指南)

    申请美国信用卡的流程 在美国申请信用卡主要有四种方式: 1. 通过银行网站申请 访问银行官网填写申请表。如果有银行工作人员协助,流程会更加顺利。 2. 使用Pre-approved Offer 收到银…

    文章 2025年7月9日
  • 如何使用虚拟 Visa 信用卡:全面指南

    Visa® 已成为美国最受欢迎的支付卡网络之一。根据 Statista 的统计,2021 年超过 60% 的卡交易是通过 Visa 卡完成的。随着虚拟 Visa 卡的普及,许多用户可能对其使用方式感到…

    文章 2025年6月11日
  • Suno AI:轻松创作属于自己的音乐 _ 保姆级使用教程

    视频推荐 以下是一些关于 Suno AI 的视频教程,帮助你快速上手: 怒肝三个小时!全网最全 Suno AI 教程 时长:10:22 作者:AI 灵玉 视频简介:详细讲解 Suno AI 的使用方法…

    文章 2025年8月13日
  • Twitter-X 订阅全攻略:从注册到订阅,一文搞定!

    常见问题 博主总结了关于 Twitter/X 的常见问题,帮助你快速解决疑惑: Q:Twitter/X 是什么?有什么用? A:Twitter/X 是国外知名的社交媒体平台,类似于国内的微博。你可以订…

    文章 2025年5月7日
  • 【保姆级教程】如何订阅Patreon?虚拟信用卡购买支付全攻略

    👉 野卡 | 一分钟注册,轻松订阅海外线上服务 1. 引言 什么是Patreon? Patreon是一个在线平台,允许内容创作者通过订阅服务的模式从粉丝那里直接获得资金或打赏。该平台支持各类创作者,包…

    2025年7月30日
  • [野卡 虚拟信用卡指南] 如何轻松订阅海外服务?

    本教程将详细介绍如何使用 野卡 虚拟信用卡快速订阅国外服务,包括注册、激活和使用方法,帮助你轻松完成支付。 什么是虚拟信用卡? 虚拟信用卡平台提供传统信用卡的数字版服务,功能与实体卡相似,主要用于在线…

    2025年7月22日
  • 如何轻松开通 Twitter 会员服务?

    Twitter 会员服务(如 Twitter Blue)为用户提供了一系列增强功能,包括编辑推文、优先排序、减少广告等,适合希望提升使用体验的用户。对于中国地区的用户,付费开通会员需要解决支付工具限制…

    文章 2025年4月24日
  • 如何轻松申请美国虚拟信用卡?

    拥有一张美国虚拟信用卡,可以显著提升您访问和使用国际服务的便利性,例如订阅 ChatGPT Plus、支付 OpenAI API 账单、购买 MidJourney 会员,以及进行海外购物或服务器租赁。…

    2025年7月5日
  • 如何申请并绑定Google Play收款账户

    一、基础信息 提现手续费:标准手续费为0.7% 支持主体:Google Play注册公司为美国、香港、新加坡、欧洲公司或个人开发者 收款币种:USD、HKD已全量开放,SGD、EUR白名单测试开放 二…

    文章 2025年7月6日
  • 亚马逊虚拟信用卡绑定卖家号店铺扣月租费教程

    亚马逊公司(Amazon,简称亚马逊;NASDAQ:AMZN),是美国最大的一家网络电子商务公司,位于华盛顿州的西雅图。自1995年成立以来,亚马逊从最初的网络书籍销售业务,逐步扩展到涵盖图书、影视、…

    文章 2025年2月26日
  • Claude 高级用户每日对话限制解析

    在人工智能领域,Claude 作为一款备受瞩目的 AI 工具,其功能和付费政策成为许多用户关注的焦点。尤其是对于高级用户而言,了解每日对话次数的限制显得尤为重要。 对话次数限制 根据官方政策,Clau…

    文章 2025年4月18日
  • AI 给开发经验 3-5 年程序员的职业与生活建议

    引言 作为一名资深CTO,我深知程序员在职业道路上的成长充满挑战。针对开发经验在3-5年的程序员,本文从职业和生活两个方面,提供一些具体的建议,助力你们的未来发展。 职业篇 1. 深化专业技能,拓宽技…

    文章 2025年6月4日
  • 香港四大虚拟银行“虚拟卡”全面解析

    2020年3月,香港金管局发放了首批虚拟银行牌照,吸引了70多家机构申请。此后,香港分三批共发放了8张虚拟银行牌照,多个拥有国内金融机构或互联网背景的企业成功入选。 今年,香港虚拟银行从试业到陆续开业…

    文章 2025年6月7日
  • 如何从 Google Play 商店获得退款

    就像您购买实体产品一样,数字商品也可以获得退款。Google Play 商店提供应用程序、游戏、电影、书籍等多种数字内容。以下是详细的退款指南,帮助您轻松取回您的钱。 Google Play 商店退款…

    文章 2025年7月16日
  • 国内用户如何注册ChatGPT并充值Plus:美区App Store注册指南

    为什么注册ChatGPT这么难? 目前,ChatGPT对中国大陆、香港、澳门、台湾、韩国和俄罗斯等地区进行了屏蔽服务。这意味着,使用这些地区的支付方式(包括PayPal、VISA、MasterCard…

    文章 2025年8月19日
  • 虚拟信用卡可以提现吗?

    虚拟信用卡一般无法直接提现,主要用于在线消费和保护用户隐私。用户可以通过虚拟信用卡进行网上购物或支付,但不能像实体信用卡那样直接提取现金。如果需要现金,建议使用实体信用卡或其他方式进行取现。务必仔细阅…

    2025年7月6日
  • 能用ChatGPT挑选股票吗?探索AI选股的潜力与局限

    引言 GPT-4相比于前代版本有了显著提升,但它在股票分析中仍存在一些基本问题。本文将探讨ChatGPT在选股中的表现,以及它的优势和不足。 ChatGPT选股的优势 GPT-4的性能提升:最新版本的…

    文章 2025年8月20日
  • 虚拟 Visa 信用卡注册指南:详细步骤与优势

    在数字化时代,虚拟 Visa 信用卡因其便捷性和安全性,成为在线支付和跨境消费的理想选择。本文将为您详细介绍如何注册虚拟 Visa 信用卡,并解析其核心优势。 什么是虚拟 Visa 信用卡? 虚拟 V…

    文章 2025年2月8日
  • 2025 年最新 Midjourney 使用指南:从注册到订阅一步到位

    Midjourney 简介 Midjourney 是一个独立的研究实验室,致力于探索新的思维方式并扩展人类的想象力。该实验室由一支自筹资金的小型团队组成,专注于设计、人类基础设施和人工智能领域。Mid…

    文章 2025年5月23日