在上一篇文章中,我们简要介绍了 ChatGPT 的背景和基本概念。本文将进一步深入探讨 ChatGPT 的设计理念、技术架构、使用场景以及其在大模型时代的定位。
随着国内多个企业的大模型获得许可并向公众开放,大模型时代正逐渐向我们走来。如果你对这个系列的文章感兴趣,建议从第一篇文章开始阅读。
什么是 GPT?
很多不太熟悉科技的朋友常常将“ChatGPT”误称为“ChatGTP”或“Chatgpt”,其实这都是错误的写法。要正确理解“ChatGPT”,首先需要了解“GPT”的含义。
GPT 是“Generative Pre-trained Transformer”(生成式预训练 Transformer 模型)的缩写,下面我们将逐一解析这些关键词:
-
Generative(生成式):表示模型能够生成内容。例如,当你向 ChatGPT 提出问题时,它会生成连贯的文本作为回应。这种逐个词语输出的“流式传输”方式正是基于其生成式的特点。
-
Pre-trained(预训练):模型在特定任务前已经在大规模文本数据上进行了预训练。这种训练使模型能够学习语言结构、语境和常识等信息。基于 GPT-3.5 的 ChatGPT 使用了包含 1750 亿个参数、8000 亿个单词、原始数据规模达 45TB 的语料库进行训练。
-
Transformer(Transformer 结构):这是一种深度学习模型架构,广泛用于自然语言处理任务。Transformer 通过“注意力机制”捕捉输入数据中的模式,特别适合处理文本等序列数据。
ChatGPT 是基于 GPT 架构的具体应用,其名称中的“Chat”表明它专为与用户进行对话而优化和训练。得益于大规模的训练数据,ChatGPT 能够胜任回答问题、生成文本甚至进行深度对话等多种任务,堪称一位“百科全书型学者”。
OpenAI 如何运营 ChatGPT?
OpenAI 最初将 ChatGPT 作为公开测试产品推出。在此之前,OpenAI 已构建了完整的 API 服务体系。因此,目前我们能接触到的“ChatGPT”实际上由“ChatGPT”和“OpenAI API”两种产品构成。
ChatGPT 产品
ChatGPT 是 OpenAI 面向普通用户的产品,用户只能通过官方网址 https://chat.openai.com/ 使用它。某些第三方客户端虽然存在,但违反 OpenAI 的服务条款(TOS)。此外,访问链接中的 cf_
参数是 OpenAI 接入 Cloudflare CDN 和防护服务的结果,不影响网页访问。
ChatGPT 提供免费版和 20 美元/月的 Plus 订阅服务。Plus 用户可访问 GPT-4 模型以及插件等高级功能。
OpenAI API
API(Application Programming Interface)是应用程序间交互的规范,而 OpenAI API 允许开发者调用 OpenAI 训练的模型(如 GPT-3.5)来完成各种任务。目前大多数第三方 ChatGPT 服务都是通过 OpenAI API 实现的。
OpenAI API 采用按量计费,根据输入和输出的总 Token 数收费。注册 ChatGPT Plus 不会增加 API 余额。
如何使用 ChatGPT?
ChatGPT 的使用
免费用户可以使用 GPT-3.5 模型,而 ChatGPT Plus 用户则可以使用 GPT-4 模型(有 3 小时 50 条的使用限制)以及插件、高级数据分析等功能。Plus 用户的 GPT-3.5 生成速度显著提升,甚至可能比 API 更快。
OpenAI API 的使用
OpenAI API 按 Tokens 计费,包括输入和输出两部分。对于中文内容,一个汉字可能占用多个 Tokens。你可以使用 OpenAI 的 Token 计算工具 了解具体使用情况。
由于 OpenAI 的严格风控政策,国内用户申请 API 并不容易。不过,微软已将 OpenAI 的服务整合到 Azure 平台,用户可以通过 Azure OpenAI Studio 部署 ChatGPT API。需要注意的是,Azure 对内容生成有更严格的审查。
如何在国内使用 ChatGPT?
对于任何用户,在合适的网络环境下,注册 OpenAI 账号即可免费使用 GPT-3.5 模型。然而,OpenAI 禁止了中国地区的手机号、支付方式和 IP 使用其服务。国内用户无法通过真实信息注册 OpenAI 账户。
我们推荐通过 👉 野卡 和 Azure 结合的方式使用 ChatGPT 服务。野卡 提供美国家庭网络环境、邮箱、手机号和虚拟银行卡,是注册和使用 OpenAI 服务的理想选择。