娱乐媒体内容制作
生成式AI最常见的应用场景之一是娱乐媒体内容的辅助生产。通过文字续写、纠错、文字转语音、智能图像编辑和视频剪辑等功能,AI不仅替代了部分专业性机械劳动,还能为用户提供创作灵感,满足娱乐需求。
随着生成式AI技术的不断成熟,部分专业内容生产者将被替代。随着数据和算力的提升,AI将能够生成个性化定制内容,甚至达到专业内容生产者的水平,从而替代文字作者、翻译人员、插画创作者、配音人员、音乐制作人和视频编辑人员等。
内容创作领域的应用
AICG(AI生成内容)大幅降低了数字内容生产的成本,突破了人类想象力和知识水平的限制。它广泛应用于文本生成、音频生成、图像生成、视频生成、跨模态生成及游戏领域,满足了数字时代日益增长的内容需求。
对话机器人、新闻稿撰写
文本生成是生成式AI最早应用的领域之一,已在对话机器人、内容续写、新闻稿撰写、诗歌小说创作等领域广泛应用。
-
对话机器人:包括问答型、闲聊型、任务型、知识图谱型和多轮对话机器人,在智能客服场景中显著降低企业人力成本。
-
新闻稿撰写:全球许多新闻机构使用AI生成稿件,尤其是在体育、天气、股市变动、公司业绩等结构性新闻报道中。例如,自然语言生成公司Automated Insights在2014年就生成了10亿篇新闻稿,每秒可撰写多达2000篇。
ChatGPT的集大成者
OpenAI推出的ChatGPT采用对话形式与人交互,能够回答问题、承认错误、挑战不正确的前提,并拒绝不适当的请求。
ChatGPT不仅在日常对话、专业问题回答、信息检索、内容续写、文学创作和音乐创作方面表现出色,还能生成代码、调试代码以及为代码添加注释。
ChatGPT发布仅5天用户就突破百万,而GPT-3用了近两年才达到这一里程碑。
音频生成:歌曲创作
AI在音乐领域的应用包括作词、作曲、编曲等。具体功能包括旋律生成歌词、歌词生成旋律、不同曲风旋律生成、和弦生成和音乐续写等,广泛应用于音乐欣赏、游戏音效和实体场景配乐等领域。
-
天工乐府SkyMusic:2022年由昆仑万维推出的商业级作曲AI模型,支持31种语言的歌词生成、多曲风旋律生成、多轨道编曲、VOCAL生成和智能缩混等,已在全球多个音视频平台发行近20首AI生成歌曲。
-
Playform AI:与音乐专家合作,续写了贝多芬《第十交响乐》,并于2021年由波恩贝多芬管弦乐团成功演出。
图像生成
2022年下半年,AI通过文本生成图像的技术迅速走红,多款相关应用火爆。目前对大众开放的图片生成模型包括:
-
Stable Diffusion:开源模型,用户数量最多,全渠道用户超1000万。
-
OpenAI的DALL-E 2:广受欢迎的图像生成工具。
-
Midjourney:同样备受关注。
此外,谷歌在2022年5月推出了由文本生成高清图像的模型Imagen,并宣称其生成的图像质量已超越DALL-E 2,但目前尚未对外公开使用。