今年以来,人工智能引发持续关注。在近日举行的2023年亚布力中国企业家论坛第十九届夏季高峰会上,与会嘉宾热议人工智能大模型。
机器深度学习的革命
GPT是一种先进的自然语言处理模型,通过预训练可以适应各种任务,以实现更高的语言理解和生成能力。360集团创始人周鸿祎表示,OpenAI最大的创新是首次突破局限性,可以用人类所有的知识训练大模型。
“机器深度学习的革命大致经历了三波,一浪比一浪大。”地平线创始人、CEO余凯回顾说,第一波在2010年左右,语音识别取得突破,用深度学习取代了马尔可夫模型,取得了前所未有的效果;第二波是2012年卷积神经网络在图像识别方面取得突破性进展,超出了人们的想象;最近的第三波是ChatGPT,它搭载的语言模型,接近甚至超过人类水平,颠覆了过去四五十年计算语言学、自然语言处理的研究,是革命性的技术突破。
深圳人工智能与机器人研究院常务副院长丁宁表示,大模型的关键,是方法里有一个预训练的步骤,“以前机器学习是人类指导或机器琢磨。预训练是自己构建一种世界常识体系,基于世界运行的规则来相互关联。这种关联是通过常识构建起来的,效果超出想象”。
“大模型是一种全新的方法论,让AI拥有人类般的智慧。”深圳云天励飞技术股份有限公司创始人兼CEO陈宁介绍,大模型实际是把跨领域、多行业的人类知识体系,通过超大规模算力输入类人脑神经网络的数学模型里,通过计算范式,在很多领域拥有内容生产、逻辑推理能力。
我国仍在追赶阶段
在新一轮AI竞争中,我国能否快速跟上?余凯表示,构建一个大模型至少需要几千颗芯片,大算力需要芯片之间互联,而芯片互联需要超高速带宽。目前,我国大模型在整体综合实力和创新发展上,较头部企业仍有较大差距。
“大模型还存在应用和成本问题,当前,芯片的成本,尤其是训练和推理的成本较高。”陈宁表示。
据介绍,AI芯片可分为训练芯片和推理芯片两大类。对大模型、AI算法而言,训练不是目的,推理和应用才是最终目的。在训练芯片方面,受限于生产制造的设备、工艺,我国许多企业仍在追赶阶段。在推理领域则蕴藏着诸多机遇,由于场景碎片化,还没有任何国际标准和垄断性的企业。
周鸿祎表示,人工智能是一次工业革命,大家都很关心人工智能如何跟产业数字化相结合,实现行业化、企业化、专业化、垂直化。虽然在原始创新上需要时间追赶,但我国人口众多、企业众多、场景众多,会产生很多创新机会。
行业有望迎来爆发期
我国能做出比肩ChatGPT这样的产品吗?
“创新需要生态的力量、好奇心的力量。”陈宁表示,最近两年颠覆式创新特别多,未来一定会有更多的科技创新涌现出来。我国应用场景数据体量大,但缺乏一套行业标准体系,没有把差异化优势真正通过技术工具发挥出来。要用行业标准和技术标准去衡量各类场景开放的目标和效果。
“每一代新技术出现时,最大受益者都是对技术最敏感的人,关键是行业需求跟技术结合要做到最好。”余凯表示,人工智能是效率极高的生产工具,很快就会对千行百业产生影响。
“未来每个人可能都会拥有3台机器人:家里1台服务机器人,办公室1台工作机器人,还有1台出行机器人——无人驾驶汽车或者低空载人无人机。这3台机器人可能都是由大模型或者大模型演变的新技术路径和AI能力驱动,希望这里面都有我们自主研发的芯片。”亚布力论坛数字前沿技术委员会主席、亚信联合创始人田溯宁表示,将来还有机器人来帮助我们更好地工作、生活、出行。围绕人工智能、数字经济、下一代芯片、应用场景,整个行业未来有望迎来爆发期。(经济日报记者 杨阳腾)