本文来源:时代财经 作者:李杨
自今年年初以来,人工智能行业在ChatGPT和GPT-4的带动下,再次回到话题中心。
8月28日,人工智能龙头企业商汤科技公布了2023年上半年业绩,亏损同比收窄,与大模型相关的业务业绩表现突出。
报告期内,商汤科技实现营收14.33亿元,同比增长1.3%;亏损净额比去年同期收窄2.0%,经调整亏损净额按年收窄6.7%。截至2023年6月底,商汤科技的总资金储备为148.2亿元。
值得一提的是,在2023年上半年,商汤科技生成式AI相关收入实现了670.4%的增长。
“商汤迎来了极其关键的发展时期。”商汤集团董事会执行主席兼首席执行官徐立在谈到财报表现时这样说道。
在2023年过去的上半年,大模型相关赛道群雄逐鹿。百度、腾讯、华为、阿里、字节等互联网公司争相入局。根据科技部5月底发布的《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型至少已经发布79个。
作为人工智能领域的资深选手,商汤早在2018年起开始了AI大模型的研发,同样也是最早发布大模型系列产品的厂商之一。今年4月,商汤科技发布了“日日新SenseNova”的大模型体系,并推出了自研中文大语言模型“商量SenseChat”等多个垂直领域大模型和应用,早早秀了一波“内功”。
大模型之争,考验的是积累
在业内看来,大模型之争,本质上是各家公司的长期以来AI技术能力的集中展现。
大模型并非一日之功。以Open AI为例,从发布首款GPT-2模型到正式对外推出ChatGPT,中间经过了三年的时间,是无数次的重复训练和持续的投入。根据国盛证券估算,GPT-3每训练一次的成本约为140万美元。
训练大模型对背后的算力需求十分旺盛。早在五年前,商汤科技就已布局AI大装置SenseCore,基于自身在视觉识别领域的多年探索,将其应用到自动驾驶、智慧城市等多个不同领域的商用人工智能模型实际开发之中。作为人工智能的基础设施,AI大装置SenseCore为加快大模型的产出以及规模化生产奠定了基石。
最新财报显示,商汤AI大装置SenseCore上线GPU数量已经由2023年3月底的27000块提升至约30000块,算力规模提升20%至6 ExaFLOPS。这也意味“日日新SenseNova”大模型的迭代速度有望进一步提升。
从投入来看,2023年至今,在大语言模型的研发上,商汤科技已经联合多家国内顶尖科研机构,投入了约10000张GPU。报告期内,商汤科技的研发投入为17.83亿元,是总营收的124%。
某种程度上来说,谁能率先在这一赛道抢占一席之地,就掌握了下个时代的通关密码。
今年4月,“日日新SenseNova”大模型发布后,仅2个月左右,商汤科技联合上海AI实验室等多家国内顶尖科研机构又推出了首个综合能力超越GPT-3.5-turbo的基模型书生·浦语(InternLM),参数量为1040亿,使用1.6万亿token的多语言语料训练,支持语言达20多种。
紧接着,8月,新模型InternLM-123B完成训练,在全球51个知名评测集(包括MMLU, AGIEval, ARC, CEval, Race, GSM8K等)共计30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B等模型。
大约每两个月,InternLM就要经历一轮迭代。这也是国内各大厂商的共同思路,不仅要在这一赛道“抢跑”,更要持续加速迭代,将领先优势进一步扩大。
此外,“喂养”大模型的原始语料数据也尤为关键,直接影响大模型的理解能力和计算能力。在财报中,商汤科技透露,已实现每月产出约2万亿token的高质量数据,预计年底高质量数据储备将突破10万亿token。
基于上述迭代能力,商汤科技已经支持了数十款生成式AI应用和6款核心AI产品,包括聊天助手商量SenseChat、AI图片创作平台秒画SenseMirage、数字人生成服务如影SenseAvatar、三维重建大模型琼宇SenseSpace、3D内容生成平台格物SenseThings以及数据标注平台明眸SenseAnnotation。
其中,秒画3.0核心算法在COCO benchmark上超过了Imagen与DALL•E 2,出图效果已经跻身全球前三。升级后的4.0版本秒画也将在今年的第三季度上线。
同时,商量SenseChat在8月31日起也已经全面向广大用户开放服务,能够更进一步积累数据资料和用户反馈,从而在后期的大模型混战中占据优势地位。
商汤大模型如何落地
经过了大半年的热议,一个新的赛道共识是,大模型不一定要越大越好,针对垂直细分领域数据和知识的“小模型”,在应用场景范围或许更具实际价值,成本也更经济。
妙鸭相机的爆火就是实例。过去一个月内,这款面向C端的生成式AI应用在社交网络上掀起热潮。支付9.9元,就能在人脸识别的基础上,生成不同风格的专属AI写真相册。关于大模型的讨论焦点转移到了实际的商业前景。
目前看来,面向B端市场的行业应用是大模型商业化落地的主要方向。在技术升级的同时,锚定特定的应用方向。数字人、智能驾驶、办公、教育等多个行业,均有大模型企业身影布局。
在大模型推出初期,商汤科技就已经在思考商业化的空间。面智慧商业、智慧生活、智能汽车和智慧城市四个主要业务的客户,提供了相应的服务。
财报显示,在智慧商业方面,商汤科技为能源、金融、地产、人力资源、传媒、工业制造、咨询等10个垂直领域定制行业大模型。上半年,这一板块实现收入8.54亿元,同比增长50.2%,单客户收入实现59.9%增长。
在智慧生活版块,通过AI大模型对手机、移动互联网行业上百个客户提供服务。例如,通过如影SenseAvatar生成数字人,在电商、直播、银行客服场景发挥实际作用, 央视、广电、工商银行等都是商汤科技的服务对象。智慧生活板块收入同比增长6.7%至3.12亿元,收入占比提升至 21.8%。
值得一提的是,商汤科技在财报中透露,旗下智能汽车平台绝影的量产业务实现573%的同比增长。
“未来在智能汽车领域,商汤科技希望成为通用人工智能核心供应商。”在今年7月举办的2023世界人工智能大会上,商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁 王晓刚强调。
目前,基于日日新大模型的能力,商汤科技打造了多款车舱中文交互产品,绝影上搭载了健康问诊、旅游规划、儿童伴读和AR说明书四项功能。这只是初步,在座舱之外,大模型也为自动驾驶、车路协同打开了更多的想象空间。
从应用落地的效果上来看,2023年上半年,智能汽车和智慧生活业务的客户数分别同比增加了70.0%和47.5%,在企业级用户方面获得了一定的认可。
越来越多的企业开始意识到,单纯地追求技术能力的领先是不足以实现长期商业价值的。将大模型技术能力转化为可规模化落地的解决方案,与实际业务结合,是实现商业价值的关键所在。
随着应用场景的拓展和技术的不断进步,大模型将在更多领域实现商业化落地,推动产业升级和变革。在这个趋势下,大模型赛道选手们也在不断拓展自身的业务范围和服务领域,以满足不同行业和客户的需求。
随着大模型商业化落地进程的加速,各大选手也将继续加大技术研发和创新力度,不断优化自身的商业模式和服务体系,以适应不断变化的市场需求和行业发展趋势。