允中 发自 凹非寺
量子位 | 公众号 QbitAI
5月27日,面壁智能联合知乎在“2023中国国际大数据产业博览会”上发布了最新的大语言模型成果,这是双方继“知海图AI”大模型后的第二次联合公开发布。发布会上,面壁智能开源自研模型 CPM-Bee 10B ,并推出对话类模型产品“露卡”(Luca)。
在发布会,面壁智能将自研 CPM-Bee 10B 模型开源在 OpenBMB开源社区。CPM(Chinese Pretrained Model) 系列大模型是面壁团队自研模型,享誉已久,其中包括国内首个中文大模型 CPM-1。最新项目是百亿大模型训练直播项目 CPM-Live,CPM-Bee 为第二期训练成果。
CPM-Bee 模型从零开始自主训练,基于Transformer架构,中英双语表现优秀,拥有百亿量级参数、万亿级高质量语料,并且配套 OpenBMB 大模型系统生态支持。
在中文的ZeroCLUE评测基准上,CPM-Bee可以大幅超越其他模型,稳居中文大模型第一。在英文评测基准上,CPM-Bee也展现出了和开源模型LLaMA相当的效果。
△ZeroCLUE 榜单(2023.05.27)
△英文评测
CPM-Bee10B 将全面开源,并允许商用。如需将模型用于商业用途,只需企业实名邮件申请并获得官方授权证书,即可商用使用。面壁智能声称一直坚持开源路线,未来也会持续拥抱开源,促进大模型领域技术和生态的繁荣。
CPM-Bee商用申请通道:发送申请邮件至cpm@modelbest.cn 获取授权证书CPM-Bee:https://github.com/OpenBMB/CPM-Bee
基座模型在经过微调后,可以进一步完成进阶任务,以对话为媒介成为专家级的AI助手。以 CPM-Bee 作为基座模型,面壁智能公司在发布会也带来了智能大语言模型产品“露卡”(Luca)。
在发布会现场演示中,“露卡”(Luca)展示了多项能力,既能与帮助人了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感;还可以利用海量知识数据,帮助人更好地获取信息、做出规划、解决问题。此外,“露卡”(Luca)拥有优秀的多模态理解能力,甚至可以查找论文并生成摘要。
目前“露卡”(Luca)支持多轮对话与深度语义理解,可以根据输⼊文本语境和创作要求⾃动⽣成原创文案,并进一步进行改写或翻译,可以具体运用到诸多办公生活场景。发布会现场,“露卡”(Luca)自己给自己写了发布会的策划案。
不仅如此,在简单的对话提示下,他还继续写了邀请媒体朋友参加发布会的邮件并翻译成英文版本。
由于这次发布会是在贵阳进行,发布者让“露卡”(Luca)介绍了贵州并撰写旅游攻略,给出的答案流畅精彩。
“露卡”(Luca)还支持结构化内容生成,可以一键生成表格和和代码。它列了一个表格对比了甜粽和肉粽的区别,并且还能写一个网页代码来展示这个表格。
除了自动化内容生成等基本功能,“露卡”(Luca)还具备多模态输入理解的能力,能够识别和解读图片,升级了传统自然语言理解任务处理(情感分析、信息抽取等)的能力。比如,发布会中上传了一张男孩的图片,“露卡”(Luca)就判断分析出了男孩的年纪和情绪。
在支持多轮对话、多模态深度语义理解的基础上,“露卡”(Luca)最炫酷的功能就是联网借助进行信息搜索和摘要。示例中,输入“我想速读gpt4技术报告这篇论文 ”的需求,露卡(Luca)就反馈生成了一个图文并茂、结构清晰的论文概要,还能根据论文内容进一步回答用户提出的相关问题。
不得不说,面壁推出的“露卡”(Luca) 在一众大模型产品中还是相当惊艳的,不仅生成文字、表格、代码和多模态理解等基础功能都齐全,还有 独特的联网摘要功能。该产品功能背后的技术底座,应该是面壁前段时间发布的工具学习引擎BMTools。
“露卡”拥有强大的工具使用能力。大模型与外部工具的有机结合可以弥补当前主流大模型的能力短板。可以想象,当模型学会了像人类一样“上网”,并具备分析复杂问题的逻辑推理能力,那么我们离AGI(通用人工智能)就更近了一步。据了解,“露卡”(Luca) 的名字取自地球上第一个生命形式 Luca(The Last Universal Common Ancestor),面壁智能称“露卡”(Luca) 产品是他们开启AGI 征途的起点。
看到这里,相信大家都非常想体验“露卡”(Luca)了。但目前“露卡”(Luca)将首先定向邀请部分用户先行试用并提供宝贵反馈。基于反馈,面壁智能会继续迭代打磨,推动模型能力不断升级,待产品进一步成熟再对公众开放测试。
期待面壁智能“露卡”(Luca)的最终的开放,也非常看好面壁智能和知乎的合作。作为一家创业公司,能有如此大动作,团队底气十足。面壁智能创始团队来自清华大学自然语言处理实验室,深耕技术前沿,前期成果丰硕。知乎合伙人、首席技术官李大海就曾评价面壁智能:
面壁智能团队是国内最早开展大规模语言模型研究的团队。公司储备大模型研究和应用的全栈技术能力,包括微调技术和加速技术等,研发能力处于行业领先地位。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态