(报告出品方/作者:华泰证券,朱珺、周钊)
AI 赋能虚拟数字人,行业发展有望加速
AI 技术助力虚拟数字人实现多模态交互
传统意义上,虚拟数字人指通过计算机图形学、图形渲染、语音合成技术、动作捕捉、深 度学习、类脑科学等聚合科技创设的非物理世界的可交互虚拟形象。
拟人化是虚拟数字人的核心特征
参考中国传媒大学《中国虚拟数字人影响力指数报告(2021 年度)》等相关研究,虚拟数 字人的核心特征是拟人化,具体表现出三方面特征: 1、 外观形象拟人化:具有“人”的形象,如特定相貌、性别等特征; 2、 行为表达拟人化:具有“人”的性格行为特征,如语言表达、面部表情、肢体动作等; 3、 思想交互拟人化:具有类“人”的互动能力,如觉察外界环境、交流互动等。
虚拟数字人的分类方式多样。由于虚拟数字人的核心价值是提供类“人”服务与体验,通 常从交互能力和拟人化视觉风格两方面分类: 1、按交互能力划分:虚拟数字人分为交互型和非交互型,划分标准为是否具有交互能力。 对于交互型虚拟数字人,进一步又可以按照驱动技术划分为 AI 驱动型和真人(中之人)驱 动型两类。相较于真人驱动型的虚拟数字人,AI 驱动型虚拟数字人能够通过智能系统自动 读写识别外部信息,自主决策并驱动人物模型完成用户交互。 2、按拟人化视觉风格划分:虚拟数字人可以分为二次元型、超写实型和数字孪生型。其中, 二次元型具有动漫风格,超写实型近似真人,数字孪生型是创造一个虚拟的“数字分身”。
AI 助力虚拟数字人多模态交互体验,“一站式”实现虚拟数字人生产全流程
AI 技术对虚拟数字人的赋能体现在两个方面: 1、 AI+虚拟数字人具有无需人工干预的自动交互能力,提供多模态交互体验。在 AI 技术 助力下,虚拟数字人交互方式发生转变,从文本语音拓展至图片、音视频等,提升交互体 验。在单模态大模型的自然语言处理技术下,虚拟数字人与用户的交互方式局限于文本、 语音等单一模式,如聊天机器人等。随着 AI 模型及应用向多模态的升级迭代,自然语言处 理能力与计算机视觉、图片与音视频生成能力得到有效结合,经过丰富数据库预训练,多 模态大模型应运而生。如 ChatGPT、文心一言等。 2、 AI 技术帮助实现虚拟数字人的创建、驱动与内容生成“一站式”全流程。传统的虚拟 数字人的核心技术流程主要包括 CG 建模(Computer Graphics)和 NLP(Natural Language Processing)交互技术,前者运用计算机技术完成虚拟数字人外观设计,后者用于建立对 话交互能力。AI 技术将帮助“一站式”实现虚拟数字人的创建、驱动与内容生成全流程, 降低相关成本。
未来趋势:虚拟数字人发展迈向 AI 驱动、工具化、系统化、低成本新阶段
当前,AI+虚拟数字人的发展趋势,主要包括如下三点:
1、 驱动方式迭代:从真人(中之人)驱动型向 AI 驱动型迭代。真人驱动型虚拟数字人的 人物语音动作、面部捕捉技术、动作捕捉技术和音视频合成等均需要中之人于后台配合完 成。随着 AIGC 全面赋能虚拟数字人,AI 驱动型虚拟数字人能够通过深度学习模型、神经 网络渲染、自然语言处理等技术的有机结合,使之具有感知、表达等无需人工干预的自动 交互能力,摆脱中之人的技术局限。同时,AI 驱动型虚拟数字人具有根据不同应用场景特 点配置相应的交互与内容创造能力,并“一站式”实现虚拟数字人的创建、驱动与内容生 成全流程。
2、 底层架构转变:迈向工具化与系统化,拓宽应用领域。一方面,AI 技术形成便捷开发、 高效系统的底层技术新架构,AI+虚拟数字人可以通过训练模型完成对不同行业知识图谱的 学习与应用、为用户提供高效率、低成本的实时服务。另一方面,AI+虚拟数字人应用领域 较传统虚拟数字人更广泛,未来有望从传统的虚拟偶像、游戏等核心领域,向外辐射至直 播、电商、教育、医疗、文旅、社交乃至全行业。
3、 成本转变:降低人力与开发运营成本,实现规模效益。首先,AI 技术助力完成文本、 图片、音视频等多模态内容的“一站式”智能化生成,有助于摆脱传统的“中之人”技术 对人力的依赖,降低人力成本。同时,随着底层架构的工具化与系统化,虚拟数字人开发 成本大幅下降,相关算法优化迭代也将降低运营传播成本。再者,此轮大模型变革催生出 的平台型基础技术架构,将大幅降低虚拟数字人的研发与推广成本,AI 交互技术门槛的降 低,也将带动 AI+虚拟数字人在多行业全领域的覆盖,实现规模效益。
AI+虚拟数字人行业处于高速发展期,政策环境友好
AI+虚拟数字人处于高速发展期,市场规模天花板高
根据头豹研究院《2023 年中国 AI 驱动虚拟数字人行业词条报告》,AI+虚拟数字人的发展 历程大致划分为三个阶段: 1、萌芽期(2010 年-2015 年):受限于 CG 技术、语音合成技术等的不成熟性,AI+虚拟数 字人市场规模小,仍处于技术探索的初级阶段; 2、探索期(2015 年-2020 年):随着愈发成熟的 AI 技术的加持,AI+虚拟数字人的应用场 景日趋多元,步入产业融合的探索期。2016 年 12 月,全球首个虚拟主播“绊爱”开设 YouTube 频道;2018 年,银行业出现首个数字虚拟员工;新华网和搜狗联合研发“AI 合成主播”; 3、高速发展期(2020 年至今):近年来,深度学习模型向多模态发展带来 AI+虚拟数字人 的多模态高速发展新阶段。AI 技术在全方位渗透全产业的基础上,进一步融合文字、语音、 图片、音视频等多模态方式促进虚拟数字人产业走向新的阶段。各公司把握行业发展机遇, 积极研发出一系列 AI+虚拟数字人,如创壹科技的虚拟美妆达人“柳夜熙”、元圆科技虚拟 偶像天妤、百度推出的全球首个实现 AIGC 的虚拟偶像希加加等,在艾媒咨询《2023 年中 国虚拟人百强榜》中表现亮眼。
我国虚拟数字人市场规模天花板高、潜在空间大。根据 iMedia Research 艾媒咨询数据, 近年来,我国虚拟数字人市场规模呈现加速增长趋势。2022 年虚拟数字人市场规模已达 120.8 亿元,带动周边市场规模为 1,866.1 亿元。当前,随着 ChatGPT、“文心一言”等大 语言模型的发布,AI+虚拟数字人的发展领域将进一步拓宽。艾媒咨询预计到 2025 年,核 心市场规模将达到 480.6 亿元,带动周边市场规模近 6,402.7 亿元。
虚拟数字人产业链由基础技术层、平台层和应用层组成,覆盖多领域应用场景
虚拟数字人产业链由上游基础技术层、中游平台层和下游应用层组成,覆盖多领域应用场 景。AI+虚拟数字人背后的技术流程较为复杂,基于虚拟数字人生产开发及应用过程中涉及 的不同阶段,其产业链主要由上游基础技术层、中游平台层和下游应用层组成。
1、 上游基础技术层:基础软硬件设施。以英伟达、Meta、Epic Games、Unity 等企业为 代表,为虚拟数字人的生产制造提供底层技术支持,包括 2D/3D 显示设备、数据采集所用 的传感器、承载算力的计算设备、数据预处理所用的芯片、动作捕捉所用的光学器件等基 础硬件设施,以及虚拟数字人三维建模、外形渲染引擎等基础软件设施;
2、 中游平台层:AI 厂商、综合性互联网厂商一站式技术支持。以微软、腾讯等综合性互 联网厂商,科大讯飞、商汤科技等 AI 专长类厂商,原力数字、相芯科技等 CG(Computer Graphics)和 XR(Extended Reality)技术厂商,以及魔珐科技、拟仁智能等垂直虚拟数 字人厂商为代表。平台层企业对上游基础硬软件技术加以融合,结合自然语言处理、计算 机视觉等虚拟数字人核心技术,为下游应用层提供动捕、建模、渲染等制作环节的进一步 技术支撑以及一站式虚拟数字人解决方案;
3、 下游应用层:从泛娱乐行业向全方位多领域应用场景辐射。运营方赋予虚拟数字人内 容生态和应用场景,包括影视、游戏、媒体等领域的数字角色、虚拟演员、虚拟主播、虚 拟主持人,教育领域的虚拟老师,医疗领域的虚拟问诊医生,金融领域的虚拟客服、虚拟 理财顾问,文旅领域的虚拟导游、虚拟讲解员,零售领域的虚拟代言人等。下游应用层企 业将虚拟数字人技术与传统行业相互融合,实现多领域应用场景覆盖。
国家高度重视支持,虚拟数字人行业政策环境友好
在人工智能、虚拟现实等技术快速发展和成熟的背景下,中国虚拟数字人行业进入高速发 展阶段,市场规模不断扩大,受到国家各级政府的高度重视。例如,浙江省政府办公厅近 日印发《关于进一步扩大消费促进高质量发展若干举措》中,倡导发展数字人虚拟主播、 元宇宙新消费场景等新业态新模式。近年来,国家也出台一系列政策鼓励和支持虚拟数字 人行业的发展和创新。
AI+虚拟数字人多场景应用:全方位赋能升级
按照是否有 IP 影响力,虚拟数字人分为身份型虚拟数字人和服务型虚拟数字人: 1、身份型虚拟数字人通过制定个性化 IP 吸引流量。以虚拟偶像、虚拟 IP 为代表的身份型 虚拟数字人的商业模式是设计定制个性化身份 IP 吸引流量变现,当前以真人驱动(中之人) 型为主,虚拟偶像、虚拟 IP、虚拟代言人等均属于此范畴,如虚拟美妆达人柳夜熙、创意 复现虚拟数字人苏小妹等; 2、服务型虚拟数字人通过提供定制化服务,直接变现。服务型虚拟数字人旨在代替真人服 务以降低服务业人力成本,涵盖领域包括营销、政务、文旅、金融等全行业,过去受到技 术限制,主要应用于代替基础标准化业务,交互能力不高。 AI 技术助力两类虚拟数字人行业发展,我们将从游戏、偶像文娱、新闻媒体、营销、电商、 社交、金融和教育文旅八个维度展开对 AI+虚拟数字人应用的场景分析。
游戏:虚拟数字人提升游戏体验,实现人格化
虚拟数字人从游戏中来:游戏行业是 AI 技术运用的前沿先行者,游戏技术研发推动虚拟数 字人行业发展。 1、游戏产业是 AI 技术赋能虚拟数字人的先行者。游戏行业在 AI 技术运用方面走在前沿, AI 技术通过生成游戏角色的动画表情、提供角色外型定制化、生成游戏角色的智能行为等, 使玩家在游戏中获得栩栩如生的虚拟数字人形象,增强玩家在游戏互动中的沉浸感,提升 游戏的可玩性、趣味性和互动性。 2、游戏产业推动虚拟数字人行业的形成和发展。游戏行业由于自身特点,在角色制作、IP 搭建、用户交互等方面积极研发与探索,在人物建模、动作捕获、虚拟数字人 IP 运营等方 面积累的了一系列经验,推动虚拟数字人行业的形成与发展。 3、游戏产业推动 AI技术迭代创新,打破虚拟数字人发展技术壁垒。如当前 Unreal Engine、 Creation 等游戏引擎已经基本上使虚拟数字人实现了从“很像”到“很真”的跨越。今年 4 月,世界上第 1 款基于 ChatGPT 制作的游戏《生成智能体:人类行为的交互式模拟》在斯 坦福大学和谷歌研究院诞生,开发者通过使用 25 个数字人填充一个类似模拟人生的沙盒 RPG 游戏。
虚拟数字人到游戏中去:打造虚拟游戏人 IP,AI 技术赋能下反哺游戏产业。 1、在游戏中加入 AI 驱动型虚拟 NPC,增强游戏人格化与陪伴感。2023 年 2 月 15 日,网 易旗下开放世界武侠手游《逆水寒》宣布实装国内首个游戏版 ChatGPT,让智能 NPC 能 和玩家自由生成对话,并基于对话内容,自主给出有逻辑的行为反馈,这也是国内类 ChatGPT 首次应用在游戏。据《逆水寒》官方介绍,游戏中智能 NPC 的所有对话文字、 表情、语音、镜头均由 AI 自由生成,其中语音为临时的机械版本,待正式上线时还会根据 NPC 性格进行迭代提升。通过使用和 ChatGPT 同源的底层 AI 技术,网易打造出了“会呼 吸的 NPC”,具备随机自由交互的能力,带动游戏情节延展;国产头部游戏 IP《仙剑奇侠 传》推出的首位虚拟数字人“龙葵”以轻短剧的形式登陆各大主流短视频平台,未来将实 现与玩家在虚拟世界跨次元互动,增强游戏人格化,提供更好的游戏体验;汤姆猫围绕“会 说话的汤姆猫家族”的虚拟形象,通过 AI 技术实现 IP 价值的深度变现。根据 23 年 3 月 6 日-8 日公告,公司已尝试应用 GPT-3.5 模型进行 AI 语音互动产品功能原型测试,已将汤姆 猫 IP 形象植入产品功能原型中,加入语音识别、语音合成、性格设定、内容过滤等功能, 并测试了语音交互、连续对话等产品性能,提高汤姆猫虚拟数字人 IP 的交互体验。
2、打造数字代言人,拓宽游戏变现模式。头部游戏公司推出的 AI 虚拟数字代言人如《QQ 炫舞》的星瞳和《和平精英》的吉莉,引发广大关注。吉莉就是典型的产生于游戏,终又 反哺游戏的代表,参加央视的《五四青年节特别节目》,出席联合国妇女署活动进行演讲, 打破了虚拟与现实间的墙壁。
偶像文娱:升级虚拟偶像,AIGC 赋能
虚拟偶像的盈利模式是平台流量变现,变现途径多元化。我国虚拟偶像主流活动身份分为: 虚拟歌手、虚拟 up 主(发布内容以视频为主)和虚拟博主(发布内容以图片和文字为主) 三类。当前,中国虚拟偶像行业进入高速发展期,根据艾瑞咨询《2022 年中国虚拟偶像行 业研究报告》预测,中国虚拟偶像行业 2019 年以来保持较高增速,未来随着 AI 技术加持, 有望开启新一轮高速增长。基于平台变现的商业模式,虚拟偶像商业变现途径多元,在广 告、电商主播、演出、代言、旅游、宣传等多领域辐射,实现粉丝经济变现。上海禾念信 息科技有限公司旗下虚拟歌手洛天依等 Vsinger 歌手以二次元形象出道,除推出个人专辑外, 还会售卖手办、生日卡片、节日礼盒等周边;其他创收渠道还包括品牌联动、代言等。在 2023 年(第二届)中国虚拟数字人产业大会暨 AIGC 创新发展论坛中,公司旗下虚拟歌手 洛天依、言和、乐正绫、乐正龙牙、墨清弦等均入围艾媒咨询《2023 年中国虚拟数字人百 强榜单》。
摆脱中之人,走向可交互的 AI 驱动虚拟偶像。当前,我国虚拟偶像驱动仍主要通过真人动 捕设备由中之人实时扮演虚拟偶像完成;在 AI 技术加持下,依靠 AIGC 能力的 AI 驱动型虚 拟偶像应运而生。如百度推出的国内首个可交互虚拟偶像度晓晓,基于百度大脑 7.0 技术展 现出强大交互能力;百度推出的全球首个实现 AIGC 虚拟偶像希加加,可以进行 AI 思维创 作,实现 AI 剪辑、AI 作画、AI 作曲等,成为麦当劳产品首位虚拟推荐官。
AI 赋能虚拟偶像的内容创作、平台支持等。除升级虚拟偶像的创建外,AI 在底层技术、内 容创作、平台支持等多领域赋能虚拟偶像产业。
1、赋能内容创作,推动 AI+音乐发展。一系列生成式 AI 大模型的出现,降低 AI 翻唱的技 术门槛。“冷门歌手”孙燕姿在 5 月重新成为活跃乐坛的顶流,“AI 孙燕姿”靠翻唱再次走 红,哔哩哔哩创作者“陈墨瞳 1995”“罗斯特_x”“Eternity | L”发布《下雨天》《发如雪》 等翻唱视频收获视频播放量破百万,开创华语乐坛复兴新模式。科大讯飞推出的 AI 虚拟歌 手 Luya,是旗下讯飞音乐在 AI+音乐领域的又一探索。作为 AI 虚拟歌手,Luya 出道的意 义不仅在于唱歌,更重要的是 AI 深度赋能音乐领域发展。Luya 与上海音乐学院合作,未来 会从唱歌进一步延伸到 AI 辅助作词、作曲等领域,和上音一起进行不同类型音乐风格的融 合实验,比如利用技术手段匹配风格相近的歌曲、拆解和弦和旋律走向、融合曲目等,从 而推动音乐在基础理论、创作方面进行创新和拓展。
2、推出数字藏品,走向超写实时代。格兰莫颐文化艺术集团推出的虚拟偶像 ALiCE,是国 内首个实现 AI 深度运用的超写实虚拟偶像,也是国内首个情绪艺术智能。ALiCE 以音乐、 时尚、艺术的多元身份在不同领域游走,已成为国内独一无二的时尚符号。出道以来,虚 拟数字人 ALiCE 已先后与多家知名品牌合作,其中包括 GUCCI、GIVENCHY、Urban Decay 等。2023 年 2 月,虚拟数字人 ALiCE 在唯一艺术平台推出 CODA 化身-R 主编 ALiCE 系列 数字藏品,讲述虚拟数字人眼中的元宇宙。虚拟数字人代言的产品具有收藏价值,能够抓 住更多年轻消费群体,实现价值变现。
3、搭建虚拟平台,IP 矩阵赋能多元领域。AI 技术还能搭建虚拟平台实现“底层技术-虚拟 偶像-平台支持”三位一体发展模式,如百度集团以度晓晓、希加加为核心的数字人 IP 矩阵, 兼具科技感基因属性、超强知识属性和独一无二的性格人设,有效满足品牌方的情感需求、 流量需求,全面赋能内容营销。AI 将向多领域辐射,如元圆科技推出的以天妤、安思鹤、 颜之初为代表的虚拟 IP 矩阵框架,通过“科技+文化”“小人物、大情怀”等形式讲述故事, 收获百万粉丝的喜爱。基于对元宇宙经济的敏锐洞察和对数字经济机遇的把握,元圆科技 以“前沿科技+多元化内容+全流程运营服务”,助力文旅抢占数智时代发展新机遇。未来, 元圆科技将加持“创意+内容+技术+运营”的行业优势,进一步实现 AI 技术对虚拟展厅、 数字藏品等的赋能。
新闻媒体:赋能新闻行业,推动媒体融合
在媒体行业,人工智能的应用最为突出的就是内容创作,AI 生成的文章、视频、音频等内 容已经逐渐成为了不可或缺的一部分。当前,AIGC 作为一种新兴且有前景的技术,在重塑 媒体业态中发挥着越来越重要的作用,AI 技术的引入不仅极大地提高了内容的生产效率, 而且还大大提高了内容的质量和个性化水平。
央视频手语主播“聆语”,正是腾讯云小微基于新一代多模态人机交互技术所打造的全新数 智人矩阵中的产品之一,依托于腾讯云小微深厚的 NLP、知识图谱、视觉等全栈 AI 底层能 力,这类 AI 虚拟数字人具有强大的形象表现力、识别力和感知理解能力,还可以根据不同 的媒体平台的特点和能力,生成适合其展示和传播的内容,并根据不同的媒体产品和受众, 调整其平台的选择和组合。能提高媒体平台效率、增强其呈现效果,同时增强媒体平台之 间的互动和融合。 新华社联合搜狗公司推出的全球首位 3D 版 AI 合成主播“新小微”,是以新华社记者赵琬微 为原型,基于多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前 沿技术,使机器可以基于输入文本生成逼真度极高的 3D 数字人视频内容。“新小微”不仅 立体、灵活,可控,还具有同时支持多机位多景深,360°任意角度呈现内容等能力,在应 用空间上拥有更多的可能性,为新闻节目多样化制作和呈现带来了更多选择。随着 3D 虚拟 场景不断拓展,“新小微”将走出演播室,在不同场景中更好地满足新闻呈现的多样化需求, 帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。
创新自媒体/短视频创作,扩大流量影响。AI+虚拟数字人具有真人不具备的一系列优势: 1、 从工作时长看,能够持续吸引流量。AI+虚拟数字人不知疲倦,不会辞职,保证 24 小 时无休等,能够源源不断地吸引流量; 2、 从成本看,降低人力和物力成本。AI+虚拟数字人没有培训费、月薪等软投入,只需在 前期缴纳一笔几千元的定制服务费,大大降低了人力成本和物力成本; 3、 从工作效率看,具有轻资产、冷启动短、效率高的特征。对各类短视频创作者或自媒体 而言,AI+虚拟数字人具有轻资产、冷启动短、效率高的特征,缓解了真人出镜的种种麻烦, 提高工作效率。
据新榜,目前已有不少网络大 V 借助虚拟数字人协助短视频制作,例如润米咨询创始人“刘 润”,“骆骆整理说”,“大巫聊装修”等。2022 年 10 月,刘润就透露其在短视频上的内容大部 分是数字虚拟数字人分身完成的。刘润抖音账号基本实现短视频日更,对于数字虚拟数字 人分身完成的短视频,屏幕侧边都打上了“本视频部分画面使用 AI 技术制作”的字样,从 效果来看,短视频里的数字人刘润五官神情生动、手势丰富多样、衬衫领处的褶皱都清晰 可见。
营销:创新营销模式,促进业务增长
AIGC 可以根据品牌、产品或服务的特点和目标,自动生成各种形式的营销内容,如广告语、 口号、标语、海报、视频等,并根据不同的市场、竞争对手和用户画像,调整内容的策略、 方向和效果。可提高营销内容的创意、针对性和转化率,同时降低营销成本。在 AIGC 和 ChatGPT 技术的加持下,虚拟数字人可变身为企业的数字员工,通过与各应用场景持续深 度融合,成为企业降本增效的重要帮手。 升级企业品牌代言,提升品牌影响力。华凌作为专注跟年轻人打交道的年轻家电品牌,抢 先占领了家电市场的元宇宙赛道。华凌为美的集团旗下面向年轻人群体的品牌,从 2019 年 就开始布局虚拟现实应用,探索年轻消费者的独特审美品味与消费需求,实现品牌与年轻 消费者的深度互动,并打造了“凌魂少女”作为品牌的形象代言人,与前卫先锋、年轻躁 动的 Z 世代消费者打成一片。而如今面对元宇宙的新数字化趋势,华凌进一步布局自有品 牌 IP 的数字化升级迭代,从二次元进阶为超写实虚拟数字人,始终以虚拟数字人“凌魂少 女”形象统领企业从产品端到消费者使用端的体验,通过商业、营销、产品应用,创新呈 现品牌“智能家居”形象,为企业创造营收。
产出定制内容 IP,深化品牌价值。海尔开创深度内容营销的先河,1995 年更推出 212 集动 画作品《海尔兄弟》,通过有趣的故事传播科学和人文知识,成功地将海尔品牌植入当时“小 朋友”的心中。在元宇宙时代,虚拟人技术赋能海尔兄弟“爷青回”,以 3D 全新形象重回 短视频平台。海尔兄弟内容 IP 的成功,是深入的内容营销,对品牌价值的生动诠释,对品 牌故事的完整讲述。伴随着时代和技术的进步,海尔兄弟仍可以在内容传播和社会互动方 面巩固品牌“基盘”,也收获了大量年轻粉丝和订单。