Claude3 今日凌晨正式发布,由 OpenAI 分裂出去的兄弟公司 Anthropic 悄然上线了这一新一代 AI 模型。与常见的科技公司发布会不同,Anthropic 只是通过 X(原 Twitter)发布了一个帖子,显得低调而自信。
看来 Anthropic 对本次 Claude3 的表现相当自信。
Claude3 模型概述
Anthropic 此次发布了三款模型,分别命名为:Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。
- Opus:意为“史诗级乐章”,代表最高性能。
- Sonnet:意为“十四行诗”,性能居中。
- Haiku:意为“俳句”,性能最轻量。
简单理解,Opus 是“超大杯”,Sonnet 是“大杯”,Haiku 是“中杯”。
Claude 的免费版本仅支持 Sonnet,而 Opus 需要付费订阅,价格与 OpenAI 的 ChatGPT Plus 一致,均为 20 美元。可见 Anthropic 正全面对标 OpenAI,竞争意图明显。
训练时间对比
从训练时间来看,Claude3 的最新数据截止至 2023 年 8 月,而 ChatGPT Plus 的数据仅到 2023 年 4 月。在这一点上,Claude3 略胜一筹。
推理能力测试
Claude3 此次最大的提升在于推理能力。我们通过实际案例来验证其表现:
问题:解释补集法的概念,并用补集法计算这道概率题:“一家公司有两个部门,A部门3个男生,2个女生,B部门4个男生,6个女生,现在要派3个人去出差,要求每个部门至少出一人,那么至少有一个女生被派出的概率是多少?”
测试结果显示,GPT4 的错误率高达 50%,而 Claude3 Opus 的准确率达到了 90%,表现令人惊艳。
此外,Claude3 在解决数学题、物理题、化学问题等方面也表现优异,尤其适合作为学习辅导工具。
多模态能力
Claude3 支持绘图功能,与 GPT4V 相比,在科学示意图领域表现尤为出色。此外,Claude3 还能根据图片生成网页代码,极大提升了设计效率。
200K 长文本优化
Claude3 是目前支持最长文本的 AI 产品,其上下文准确性大幅提升。我们通过超长文本测试验证了其总结和查询能力,结果令人满意。
Claude 模型对比
三款模型中,Opus 性能最强,Haiku 速度最快,Sonnet 则兼顾性价比。付费订阅即可解锁更强性能。
总结
Claude3 在推理能力、多模态支持以及长文本处理等方面表现出色,是目前最具竞争力的 AI 模型之一。
然而,OpenAI 依然是全球技术实力最强的 AI 公司,其即将推出的 Sora 和 GPT-5 可能会再次引领行业发展。
对于用户而言,选择适合自己需求的模型和工具至关重要。无论是 Claude3 还是 ChatGPT Plus,都能为用户提供强大的 AI 支持。