人工智能(AI)的世界大致可分为三个主要领域(尽管这种分类过于简化):
1. 大型语言模型(LLM)
大型语言模型属于通用型模型,例如 GPT-4 或 Chinchilla。这些模型通过摄取网络内容或其他文本/语言数据,转换为能够执行多种任务的智能系统。它们可以用于生成法律文件摘要、优化搜索引擎查询,甚至作为聊天机器人提供友好的交互体验。
2. 图像生成
图像生成领域包括 Midjourney、Dall-E 和 Stable Diffusion 等模型,以及一些易用的视频制作工具和 NeRF 3D 模型。用户只需输入提示,这些模型就能生成相应的图像,广泛应用于创意设计、影视制作等领域。
3. 其他应用领域
这一类别涵盖了广泛的技术和市场,例如机器人技术、自动驾驶汽车、蛋白质折叠等。尽管这些领域的模型架构和终端市场各不相同,但为了简化讨论,我们在此将其归为一类。
生成式人工智能的细分与未来
当人们谈论“生成式人工智能”时,往往将这些领域混为一谈。然而,每个领域都有其独特的底层 AI 模型架构、计算需求、扩展能力、质量标准和应用场景。分开分析这些领域,有助于更好地理解它们可能带来的未来变革。
图像生成的多领域应用
图像生成技术可能改变多个行业,包括:
– 社交产品和图像处理(如 Lensa 的未来版本或与社交平台的整合)
– 图形与可视化设计
– 影视、漫画、动漫
– 视频游戏
– 计算机辅助设计(CAD)
– 建筑
– 电子商务
– 以及其他更多领域
高性能视频和语音技术也将开辟新的应用场景。
语言模型的优势
虽然图像生成的应用范围广泛,但与语言模型相比,其社会经济影响力仍然较小。语言是 B2B 交互、社交产品、商业及其他领域的基础,因此大型语言模型(LLM)在短期内的重要性远高于图像生成。
图像生成与 LLM 的成本对比
图像生成模型的训练成本通常较低。例如,最新版的 Stable Diffusion 可能需要数十万至数百万美元的 GPU 时间即可完成训练。相比之下,大型语言模型的训练成本则显著更高。
大型语言模型的核心应用领域
大型语言模型在以下领域表现出色:
– 搜索引擎优化
– B2B 交互、销售、ERP、文档管理、电子邮件等
– 代码生成、数据交互、SQL、Excel 等
– 金融服务
– 社交与消费产品
– 聊天、短信及其他通信应用
– “智能副驾”——支持白领工作(如法律、会计、医学等)
市场结构与未来展望
大型语言模型的市场结构对其生态体系至关重要,它决定了谁将成为经济、人才、利润和创新的主要赢家。👉 野卡 | 一分钟注册,轻松订阅海外线上服务 无论是 LLM 还是图像生成,人工智能的未来都将深刻影响各行各业的运作方式。
通过对 AI 领域的细分分析,我们可以更清晰地预见其在未来的广泛应用和深远影响。