10月21日上午,2023智能视听大会在青岛举办。人民网研究院在开幕式暨主论坛发布《新技术浪潮下的智能视听步入深度变革新阶段——2023年人工智能赋能网络视听产业观察报告》(以下简称《报告》)。
《报告》围绕综合视频、短视频、网络直播和网络音频四种视听形态梳理了2023年人工智能赋能网络视听创新应用的典型案例,以及人工智能相关法规政策与行业规范发布情况,并探讨了行业未来发展趋势,为智能视听未来发展提供参考。
人工智能推动网络视听行业“质量与效率”变革
《报告》指出,2023年,人工智能技术的突破式发展与创新应用,给视听行业带来了“质量与效率”变革,推动视听产品实现更多创意、更高效率、更新体验与更高品质。
在综合视频领域,2023年,随着AI大模型和多模态AI技术的融合发展,人工智能生成内容的创作能力、通用化能力以及工业化水平快速提升。影视创作中的AI前沿技术应用进入新阶段,贯通影视内容策划、开发、制作和宣发等各个环节。
相对于专业的影视制作,AI技术在短视频方面的应用门槛相对更低。在关键词自动提取、字幕自动生成等基本操作基础上,文本自动配音、文本转视频、数字人播报、个性化文案、多元风格等升级功能在2023年加速发展。作为创作基础工具的AI模型与产品、平台加速发展,初步获得可观的商业流量。
网络直播领域,人工智能技术进一步应用到电商直播、音乐会直播、体育直播等多种场景中。其中,大批数字人虚拟主播涌入直播间带货,成为当前网络直播行业的火热景象。不过,数字人直播目前处在发展应用的初期,效果有待提升优化,数字人在一些平台的使用规则尚处于探索中。
网络音频领域,2023年,部分垂直类音频平台通过引入AI大模型,促进AI前沿技术在音频产业落地应用。未来,AI音频行业将触发各细分应用场景全面变革,围绕音频生成、语音交互、识别翻译、个性化推荐等领域,应用产品将覆盖在线办公、移动社交、广告营销、学校教育、体育比赛、居家养老等多元场景。
法规政策与行业规范陆续出台划定行业发展“红线”
《报告》还梳理了近一年来我国出台的人工智能相关的法规政策与行业规范,包括《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《科技伦理审查办法(试行)》等。
随着人工智能技术的进一步成熟和应用场景的扩展,人工智能创新应用给行业和全社会带来的治理挑战不容忽视。国家相关部门及时出台法规政策,相关行业规范及平台自治规定也陆续发布,推动人工智能技术合理有效利用,及时划定发展“底线”与“红线”。
生成式人工智能迭代升级打造视听行业深度变革新起点
最后,《报告》展望了人工智能赋能网络视听的未来发展趋势,主要包括以下四个方面:
一是网络视听将成为AI大模型垂直应用探索落地核心场景。AI技术发展的重点未来将转向实用性和可持续性方向,关注如何将大模型与实际应用场景相结合,实现真正的商业化应用。网络视听始终是信息网络新技术创新应用的前沿领域,未来也将进一步成为大模型垂直应用探索落地的核心场景,催生新业态新模式。
二是生成式人工智能迭代升级打造视听行业深度变革新起点。目前,生成式人工智能的底层技术和产业生态已形成了新格局,未来该技术在更多行业的海量应用场景有望打开。在此背景下,“平均水平的基础劳动”加速被取代,未来视听创作焦点更多转向高质量创意、艺术审美与内容共情,推动更高水平竞争。技术应用与生产范式的突破性创新,也将成为整个视听产业新变局的起点,推动视听形态、场景、体验、产业布局的多维变革,并对文化发展、社会交往等方面产生深远影响。
三是新技术交叉融合发展将助力“视听+”产业新生态。当前,人工智能新技术的发展演进不是单一升级,而是与5G、VR等新技术发展相互融合、多点突破,以技术的融合发展应用提升创新密度、解决复杂问题、丰富产品体验。另一方面,在“万物皆媒”的时代,视听具备巨大的信息交流“基础设施”优势,使得网络视听行业不断与各行业交叉融合发展,推动形成“大视听”的产业发展新生态。随着技术融合与产业融合相互促进,跨模态、多元化、边界消融将成为重要特征。
四是治理协调性有效性的加强促使AI治理框架逐步完善。在人工智能快速发展过程中,如何建立合理审慎的AI伦理和治理框架,塑造负责任的AI生态,越来越受到社会各界的重视。在当前政策措施基础上,下一阶段围绕人工智能技术应用的敏捷治理、分类分级管理将进一步加强,人工智能治理体系逐步完善。在智能视听方面,尤其需要统筹推进“技术”监管与“内容”治理,实现发展与规范的动态平衡。
《报告》还认为,2023年,面对人工智能新浪潮带来的巨大冲击,一方面防止“高估一项技术在短期内的影响”,另一方面防止“低估其在长期内的影响”,人工智能赋能视听行业的创新探索仍任重道远。
(大众日报客户端记者 齐静 报道)