克隆虚拟主播陪伴防老年痴呆,腾讯数智人这样赋能产业
25日,腾讯云智能举办“数智人媒体沟通会”,数字经济学者“刘兴亮”开讲。其实,真正出席的是他的“数智分身”,这个形象近似真人,表情、唇型匹配自然,甚至对本人特色口音也模拟得惟妙惟肖的虚拟主播,正是腾讯云智能小样本数智人。
五分钟视频即可生成
做一个数智分身要多久?只需3分钟真人口播视频、100句语音素材,便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。据悉,此举将数字化使用的门槛降低到了千元级别。
腾讯想到的是小样本数智人如何帮助小商户、小微企业数字化,如为短视频创作、知识分享、带货直播等场景应用提供赋能。
以知识分享口播视频生产为例,小样本数智人可以代医生、律师等专业人士出镜,节省视频录制时间。浙江树兰医院盛国平就表示,按日更计算,如果以“妆发+调试+录制”平均两小时/期来算,一周就可以省下14个小时。
上海医微讯数字科技股份有限公司创始人兼CEO潘耿则介绍,该公司早期用3D虚拟仿真帮助医生和患者更好学习和掌握医学知识,也帮助医生做手术模拟,后来慢慢开始接触虚拟现实、虚拟仿真、AI直播,真正转向对数智人投入是在疫情防控期间,医生培训、患者沟通无法实时进行,视频会议、电话问诊也难做到,但如果借助“数智人”,以真人的形象有助于提升培训效果。
他说,很多医院都在推智能挂号、智能缴费平台,机器摆了一排,但机器面前还得配备志愿者——很多上岁数的患者对触屏有天然排斥;就医时,排队2小时、就诊5分钟,“患者希望多和医生有互动,但医生也很辛苦,一天一百多个号”。
“‘数智人’就可以起到辅助作用,未来患者从进到门诊大厅开始,从挂号到门诊室再到住院部,都有数智分身帮忙回答、交互和指引。”潘耿说,普通的视频片子无法起到互动效果。
他甚至提到,不少患者因为喉癌而无法发声,他们希望通过“数智人”的声音克隆技术,将做手术之前的声音保存下来,以便将来作为自己发声用;在老龄化社会,通过“数智人”方式,录制亲人声音,陪伴老年人防止痴呆。
像工厂一样快速生产
在推动数智人落地进程中,腾讯云智能提出自动化“AI+数智人工厂”的方向,“开箱即用”的数智人生产服务,不需要算法、研发经验,只要在平台导入视频、语音训练素材,即可通过“自助式”服务,完成大批量数智人形象、音色定制。
腾讯云智能数智人产品总经理提到,腾讯数智人将重点朝向两个方向,一是通过AI技术,提升智能性,二是更懂行,进入到各种各样的行业和场景,做深入的场景集成,使行业know-how(诀窍)积累下来,进而提升行业的服务效能。
怎样体现更懂行?陈磊介绍,从2018年到现在,腾讯数智人落地了数十个行业、上百个具体业务场景,从金融、传媒到文旅等等,从此前做大企业专属,到如今每个人都可能有自己数字化分身;前者产品研发周期、时间成本都比较长,后者则是很多人都能便捷拥有自己的数智人分身。
他透露,整个制作已经流程标准化,每个人都可以在腾讯云上开账号、上传素材,再下订单生产属于自己的数智分身,还可以用到交互服务平台、播报服务平台,实时用自己的数智分身生产视频、提供交互服务等。
对用户来说,新技术如何帮助实现商业化。潘耿坦言,在医疗领域,其一定的公益属性决定无法完全商业化,就目前来说,当下比较有前景的是药企和器械厂商投入,由于药品广告受约束,传统营销模式、推广模式受到限制,新的模式必然就会形成一个出口,在合规前提下,以及学术推广的大背景下,药企买单可以给中国医疗带来新的价值。
【南方+记者】郜小平 叶丹
【作者】 郜小平;叶丹
【来源】 南方报业传媒集团南方+客户端