中国小康网讯 记者金朝晖 4月23日,深兰科技创始人、董事长陈海波在全国工商联物联网委员会年会暨物联网与人工智能高峰论坛上透露,深兰科技正在开发面向个人数字化的硅基知识大模型。
据介绍,深兰科技的硅基知识大模型不同于ChatGPT,是一款针对垂直领域、特定用户、细分应用场景的,用户可训练的生成式大语言模型。
深兰科技认为就像人是一切需求的奇点,个人的数字化基于持续的生成式能力,也是最具未来的数字产业。为深度布局个人数字化,深兰科技从2017年开始从研究如何创建个人“数字分身”,在硅基世界中长久留存个人的记忆和知识,深兰metamind团队置身于该领域的科技“无人区”,走过了复杂艰辛的探索之旅。
据公开资料显示,深兰科技于2017年8月申请注册了metamind商标,并在2018年9月获批。在2018年底推出第一款脑电感知产品“深兰脑肌对话仪”,成功地实现了远程意念交互,以及利用意识和肌肉信号完成“俄罗斯方块”游戏,在脑电生物信号和电信号感知和交互方面取得进展。继一系列脑机接口、认知智能等前沿技术研发后,今年2月,深兰科技开发的国内第一款面向个人数字化领域的移动终端应用——metamind APP开始内测。
深兰科技认为,人类最大的浪费不是水、电等资源型浪费,不是金钱财富的浪费,而是每个人的智慧因为脑细胞的衰亡流失而无法留存,而人类文明就是由无数个体的智慧构建起来的。如何尽可能多地把每个人一生的所思所说所想所发布的内容,通过技术进行采集转化为可交互、可挖掘、可传承、可存储的计算机语言,将对文明的高爆发升级和发展提供巨大数据支撑。
深兰科技相关负责人介绍,metamind致力于个人的知识发现、知识积累和知识应用,提供个人的硅基知识采集、文本生成、提炼归纳、数字存储、交互和知识传承为一体的个人数字服务,打造基于数字永生的“硅基生命”。在metamind中提供CV、NLP、TTS、OCR、AutoML等技术服务,为每个人建立一个数字分身。通过不断的影像、语音、对话、文字的采集和计算,生成个人“数字生命”,存储自己的知识和记忆。metamind根据个人信息生成一个“数字的自我”,构建符合用户真实知识和思维的数字人。
未来,metamind还可以结合脑机接口等技术,最终完成个人的知识传承和交易,甚至在碳基生命结束后进入基于硅基载体的“硅基生命”阶段,实现“数字永生”,满足人类最普遍的“永生”需求,正像metamind宣扬的“you are always there ”。
metamind项目的核心技术就是深兰科技自主研发的大模型——硅基知识大模型。该模型主要用于进行知识的个性化和专业化预训练,实现用户终生上下文学习、垂直领域知识嵌入与表示、在垂直应用中有效减少AI反事实、提供持续一致的更加可控的服务等,做到“负责任的AI、可信的AI、易用的AI”。
深兰的硅基知识大模型除了使用公开数据集外,还自主积累了40TB原始语料,同时生成10-100G高质量语料进行模型迭代,最终训练出6B大模型。另外,深兰工程师还训练了注入阅读理解和信息抽取等上下游任务模型,加以集成知识图谱与搜索引擎服务,进行知识校验和溯源。同时工程师采取大模型的热插拔训练模式,降低训练成本和难度,增加了大语言模型垂直应用的灵活性,支持用户终生自训练和基于长期记忆的对话服务。
为了留存用户的知识和记忆,深兰科技启动了AIPDC建设。根据深兰科技的构想,AIPDC是为了建立数字生命所必需的个人数据和算力中心,具备平台服务能力,包括能够对个人知识记忆进行数字化存储和安全访问、管理;能够生成与个人意愿相符的个人知识记忆数字孪生体;能够进行记忆思维的仿生对话;集成 AI 创作能力。AIPDC不仅能为个人用户提供长期的基于专业化、个性化、易用性的数字化服务,也能服务企业用户,让他们快速开发并进行有价值的商业活动。
编辑:刘彦华