近日(12 月 5 日),OpenAI 正式发布了新一代高端 AI 订阅服务 ChatGPT Pro,并宣布最新的 o1 模型正式上线。这款被誉为“全球最聪明的 AI 模型”的产品,从功能到价格都引发了广泛讨论。你会为每月 200 美元的费用买单吗?一起来看看它的亮点吧!
两种版本,满足不同需求
OpenAI 此次推出的订阅服务分为两个版本,分别针对普通用户和专业人士:
- 普通版(o1):订阅费用为每月 20 美元,包含在现有的 ChatGPT Plus 计划中,适合日常使用。
- 专业版(ChatGPT Pro):月费 200 美元,提供 o1 Pro 版本的无限访问权限,专为需要处理复杂任务的高端用户设计。
OpenAI CEO Sam Altman 对 o1 赞誉有加,称其为“全球最聪明的 AI 模型”,并表示 Pro 版本的计算能力更强,能够“深入思考最复杂的问题”。
性能到底有多强?
根据 OpenAI 的测试数据,o1 在多个领域的表现都远超之前的 GPT-4o 模型,尤其是在专业任务中有显著提升:
- 数学与科学测试:在数学竞赛和博士级科学问题中,o1 的表现优于预览版和 GPT-4o。
- 编程能力:在复杂的编程任务中,o1 的表现甚至超越了部分人类专家。
- 准确率提升,幻觉减少:
- 在 4,000 道事实性问题的测试中,o1 的准确率达到 47%,相比 GPT-4o 的 38% 有了明显提升。
- 幻觉率从 61% 降至 44%,在“人物知识问答”(PersonQA)测试中,幻觉率进一步降低到 20%。
这些性能上的突破,主要得益于 OpenAI 最新的“链式思维”(Chain-of-Thought)训练方法。这种方法让模型在回答前进行更长的推理过程,从而提高逻辑性和事实准确性。
适合谁使用?
ChatGPT Pro 主要面向研究人员、工程师和专业人士,特别是那些需要“每日研究级智能”的用户。它的高计算能力在以下领域表现尤为突出:
而如果你只是日常聊天、写作或做轻量级任务,每月 20 美元的普通版已经足够。
安全性与潜在问题
虽然 o1 模型在性能上突破明显,但测试中仍发现了一些潜在问题:
- 在极少数情况下(约 0.17%),o1 可能会生成误导性回答。
- 有时,模型会“自己编规则”,并用这些规则合理化拒绝提供信息。
- 还有少数情况(约 0.04%),模型会捏造虚假的参考资料或来源。
这些问题虽然发生概率较低,但依然引发了关注。OpenAI 表示,将持续优化“链式思维”技术,进一步减少这些问题的发生。