okx

【腾讯云】王登宇:AIGC数据处理与存储解决方案

存储

4月20日,2023全球分布式云大会·北京站正式召开。作为本次AIGC数智中国科技周的重要组成部分之一,大会以“云智相生”为主题,着眼于分布式云和人工智能,以分布式云促进人工智能发展,以人工智能降低分布式云上云和用云门槛,为构建数智中国夯实基础设施和技术底座。

本次大会,全球分布式云联盟携手腾讯云、华为云、中国电信、中国移动、中国联通、玖章算术、F5等海内外云计算领军企业和运营商,共同开启分布式云智能化新纪元。

腾讯云 王登宇

在上午举办的分布式领袖论坛上,腾讯云存储专家架构师 王登宇发表了题为《AIGC数据处理与存储解决方案》的精彩演讲。

AIGC触发了内容生成革命,引爆众多行业颠覆式创新,王登宇表示,AIGC的核心要素包括内容生成,内容审核,内容智理三个维度。

围绕上述三个维度,腾讯云提供了端到端解决方案,基于腾讯云高性能计算集群HCC、TACO训练加速、TCCL网络加速、GooseFS数据加速,构建AIGC大模型训练和推理应用平台。

大模型训练,依靠的是算力和海量的数据。海量数据通过COS对象存储数据湖作为统一存储,腾讯云有着丰富的经验。近年来,腾讯云服务了大量人工智能相关领域客户,特别是算力和存储需求极大的自动驾驶领域,训练数据量级可达数百PB规模,在兼顾存储成本的同时,腾讯云自研的GooseFS数据加速,为AI训练提供高性能缓存服务。

模型训练算力方面,腾讯云的高性能计算集群HCC通过自研服务器提供最新代次A800、H800实例,通过TACO训练加速套件,发挥软件、硬件结合优势,总体训练性能提升30%以上。模型训练期间,对集群网络通讯效率要求非常高,基于腾讯云自研星脉网络架构,提供最高3.2Tbps RDMA网络,结合自研拥塞控制算法及TCCL集合通信库加速分布式训练通信效率。

当前大模型主要在NLP领域取得了突破性进展,并逐步拓展到了结合图片、视频的多模态领域。腾讯云针对于不同大模型的存储需求,做了针对性的领域细分解决方案。

以NLP场景为例,ChatGPT 3.5的训练数据在45TB左右,随着更新迭代未来将达到百TB级别,针对这个量级的训练数据,可以基于GPU节点的内存,构建一个MEM-Based Global Cache,每个GPU节点只需要提供部分内存,整个GPU训练集群就可以构建一个统一命名空间,数十TB的缓存空间,训练数据集通过内存缓存后,既可大幅提升数据访问效率。

基于图片的大模型训练场景,通常训练数据在PB量级,GooseFS使用GPU节点配备的NVMESSD作为缓存介质,结合上百台规模,可以构建成PB量级的统一命名缓存空间,满足图片训练数据集的缓存需求。

而对于自动驾驶场景,训练数据量级规模更大,GooseFS可以利用独立的存储集群构建全闪缓存系统,满足自动驾驶海量数据的训练需求。

从整体方案来看,GooseFS结合COS数据湖,可以提供多层数据加速能力。最底层是COS数据湖,所有数据都持久化存储在数据湖内。通常训练过程中数据集是处于不停更新滚动状态,在缓存和数据湖之间,GooseFS提供数据自由流动的能力,缓存系统可以与数据湖做到完全打通。由于缓存空间有限,部分数据在缓存里如果一段时间没有访问,会按照淘汰机制被自动淘汰,达到缓存空间被高效利用的目的。

GooseFS 集群具备弹性伸缩能力,根据业务对性能的需求,可以实时在线扩缩容。针对于AIGC大模型训练场景,在早期做模型的预研阶段,前期算力和数据相对较少,可以构建小规模的缓存系统,当开始大规模训练任务时,通过按需的弹性伸缩能力,在业务无感的情况下扩大GooseFS集群,缓存更多的数据,以匹配训练任务。训练任务结束后,可以选择将GooseFS集群销毁,精准控制缓存数据生命周期,降低成本。

GooseFS也支持私有化部署,来构建混合云缓存方案。基于数据湖搭建混合云大模型训练平台,做到一份Dataset,多地训练。通过这个方案,在数据湖上保存一份数据,可以通过缓存的机制把数据带到任何计算相关的地点去。

​下图是大模型训练集群的最佳实践,训练节点采用8卡A800,内存配置2TB,网络一个是RDMA 1.6Tbps的网络,用于模型之间通讯;另一个是VPC 100Gbps网络,与数据湖存储打通。架构上GooseFS分为三部分,一部分是左边的元数据Master节点,提供元数据服务,可以独立部署,不需要部署到GPU节点;第二部分是Worker节点,提供数据缓存服务,推荐部署到GPU节点,利用GPU节点的NVME SSD作为缓存介质;第三部分是FUSE客户端,部署到GPU节点,提供POSIX兼容语义的Mount Point。

AIGC的内容安全方面,AI 生成的内容具有高效、不确定性强的特点,如何保证生成的内容合法合规是企业可以健康、高速发展的关键。

腾讯云数据万象结合对象存储推出的内容审核服务,从内容识别、存储安全、访问安全多方面发力,打造出一套最全面的存储内容安全解决方案。

  • 基于业界领先的语义模型和海量的违规词库,以毫秒级的响应快速识别出用户输入信息中包含的违规、低俗内容。
  • 基于深度学习的图片、音视频检测技术,结合腾讯深耕内容领域积累的海量训练数据,可以精准高效识别出生成数据中的敏感信息。

帮助开发者们最大程度的降低因内容违规而带来的业务损失。

同时,随着AIGC大规模的应用,将会产生海量内容数据,如何高效的管理内容是一个很大挑战。腾讯云的企业网盘产品,通过结合AIGC应用,实现对用户的数据集、Fine-tuned models、生成的内容进行高效管理,并可以方便快捷的将存储内容分享给其他用户。

此外,借助于多模态检索模型对图片、文本、视频进行的特征预提取,网盘内可实现基于文本语义的快速多模态检索,大幅提升检索效率。企业网盘还可以将海量内容用以对接下游业务,如腾讯会议、企业微信,以及其它第三方应用,将网盘打造为企业办公中的数据中台。

演讲最后,王登宇总结道,围绕AIGC,腾讯云提供生成、审核、智理全生命周期的存储解决方案,提供完整的数据智能管理能力。

相关内容

扎实推动高质量发展在湖南农信系统落地生根

洪 樱 成依潇 刘雯娟 黄利飞 新型农业经营主体贷款余额177.2亿元,累计涉农贷款余额达6264.5亿元; 普惠型小微企业贷款余额达2182亿元,支持普惠型小微企业户数50.8万户; 新版手机银行客户数1244万户,收单商户数79万户,线···

全国港口前三季度吞吐量出炉

1-9月,全国港口集装箱吞吐量前10名分别是:上海港(第1)、宁波舟山港(第2)、深圳港(第3)、青岛港(第4)、广州港(第5)、天津港(第6)、厦门港(第7)、苏州港(第8)、北部湾港(第9)、日照港(第10)。图片来源于港口圈1-9月,···

定安打出组合拳推动知名企业纷纷落地

海南日报记者 李豌 特约记者 孙国富蜜雪冰城全球供应链总部基地和全国冷链物流总部基地项目、煌上煌集团……近年来,大企名企纷纷落地定安。国际投资单一窗口综合管理系统数据显示,2020年5月至今年9月,定安县在库项目36个,签约金额达158.9···

45年·45人·45个典型改革案例丨熊维政:一定要把信阳茶油做上市

□本报记者 胡巨成 刘宏冰潜心医药行业40余年,将一家作坊式医药小厂,做成大别山革命老区和全国贴膏剂药业首家上市企业,打造出“百亿级贴膏剂生产基地”的羚锐制药前“掌门人”熊维政,在他60岁时急流勇退,放手交棒,转身创办了信阳信锐油茶股份有限···

山东区划设想,二分滨州,组建渤海市,利津改区,邹平与高青互换

近年来,随着我国产业结构的不断调整,经济增长方式也在持续优化,特别是随着交通等基础设施的完善,区域经济开始朝着一体化发展方向迈进。如果用《射雕英雄传》中的一句话来形容,江苏是“东邪”、广东是“南帝”、四川是“西毒”,那么山东则是“北丐”,此···

为什么河南经济是最没有希望的?上车,带你深度了解河南的问题

“河南小孩出生就是为了离开河南”,这是我最近一个关于河南经济评论文章下点赞最高的评论。这句话我深深刺痛着自己,因为我自己就是河南人,深知这里面包含了多少无奈和心酸。当人们在聊地域之争的话题时,大家都会为自己的省份争辩几句,然而只有河南人,会···

关注双11丨“88VIP”淘宝天猫全网商品都能用花呗分期免息

2023天猫“双11”活动今晚8点正式开始。今年“88VIP”大额券总规模达到200亿,用户可领券额度最高可达860元。支付宝针对“88VIP”淘宝天猫用户还推出花呗分期免息服务,消费者购买大件商品又多了一重实惠。“88VIP”用户购买单价···

每日新闻,60秒知晓世界热点

2023年10月31日,星期二,农历九月十七1、31省份前三季度人均可支配收入公布:上海北京首超6万元位居全国前列,浙江天津江苏同属4万+梯队紧随其后;长三角万亿城市经济三季报:合肥增速第一,宁波增速超上半年;2、工行、农行、中行、建行、邮···

2024年城乡居民参保调整,一次性补缴5.9万,每月能领2300元吗?

随着时间的推移,社会保障制度也在不断地完善和调整。2024年城乡居民参保也将迎来新的一轮调整。据相关政策规定,未来居民参保需要一次性补缴5.9万,每月能领2300元。这个政策引起了很多人的关注和讨论。对于这个政策,有些人认为一次性补缴5.9···

老百姓:第三季度净利润同比增长32.78% “聚焦发展”战略优势凸显

中证网讯(记者 段芳媛)老百姓10月30日晚间披露2023年第三季度报告。公司前三季度实现营业收入160.42亿元,同比增长16.44%;实现归属于上市公司股东的净利润7.17亿元,同比增长17.54%。其中,第三季度实现营业收入52.31···

紧抓机遇开展差异化竞争 骆驼股份积极开拓国际市场

骆驼股份 黄剑波/供图 彭春霞/制图证券时报记者 韩忠楠越来越“卷”的新能源汽车赛道,既充满挑战,也酝酿着新的机遇。近期,受益于华为与赛力斯联合打造的全新问界M7的热销,与之相关的汽车产业链在A股市场的热度也随之升温。这当中,为问界M5/M···

宝山罗店:罗南二村 半年跌幅近乎恐怖 郊区老破小太可怕

前几天,我们写了几个宝山区二手房系列,美兰湖板块的万科琥珀郡园以半年跌幅近五分之一位列榜首,我以为就是跌幅极限。然后,今天现场去看了位于美兰湖南侧的罗南新村,在那周围详细地看了看,然后比较了一下罗南二村最近成交与4月份左右的成交记录,愕然发···

压倒许家印并不是造车,而是恒大童世界,砸几千亿搞了十几个鬼城

恒大集团以其高调的投资和建设项目而闻名,最近引起了人们的广泛关注。与传统地产业务不同,恒大集团的新尝试是在娱乐旅游领域建设恒大童世界。这一巨大的投资计划引发了广泛的争议和讨论。恒大童世界的建设规模之大令人瞩目。据报道,恒大集团计划投资数千亿···

《人民日报》警告奏效?98款,突破1亿台!华为正式宣布

导语:在科技的浪潮中,华为从遭遇“极限施压”,到芯片突破和鸿蒙生态的自研,始终展现出卓越的技术实力和坚韧不拔的创新决心。华为面对挑战:技术封锁与自主创新在2019年,《人民日报》发送《人民日报评华为遭"极限施压":科技自立,时不我待》一文,···

中国钢铁大王戴国芳,入狱5年东山再起,再造500强民企狂赚1957亿

他从一个收废品的穷小子,摇身一变,登上了中国400富豪榜。他的钢铁厂年销售额已超过1个亿,手下员工超过1千人,他就是钢铁大王戴国芳但是这个钢铁界的王者,却因为一时错误,被捕入狱,还坐了5年牢。出狱后,他不忘初心重操旧业,不仅再次创办炼钢厂,···

油价暴跌倒计时,专家透露:11月国内高油价将消失!

随着外资油站的进入,国内加油站市场的竞争格局正在发生重大变化。近日,多位专家在接受记者采访时表示,预计11月国内高油价将不复存在。这一预测的背后,是外资油站的入驻带来的市场冲击和国内油价的持续波动。外资油站的进入,打破了国内加油站的垄断格局···

共话中国经济新机遇丨专访:中国经济展现出发展韧性

新华社日内瓦10月30日电 专访:中国经济展现出发展韧性——访联合国贸发会议资深经济学家梁国勇新华社记者陈斌杰联合国贸发会议资深经济学家梁国勇日前接受新华社记者书面专访时表示,中国经济今年前三个季度的增长态势展现出了发展韧性和潜力。中国国家···

润达医疗:目前在上海、北京等地区部分医疗机构已开展LDT相关业务的试行

润达医疗近期接受投资者调研时称,目前在上海、北京等地区部分医疗机构已开展LDT相关业务的试行,公司在上海等地区积极和相关部分医疗机构展开合作,共同推进LDT相关业务在医疗机构的开展。未来随着相关政策法规进一步完善,LDT相关业务将给公司带来···

国航率先公布第三季度财报,疫情后首度扭亏

在阅读此文之前,希望用您发财的小手点一下“关注”,文章内容来源于网络但是最后会有小编的个人感悟,如有不足之处可以评论指出,谢谢您的支持。民航行业近期公布的积极消息显示了行业的积极向上趋势。多家航空公司在财报中宣布扭亏为盈,旅客运输量也逐步恢···

竹塑革命!中国发改委推动“以竹代塑”三年行动计划。

近日,中国国家发展和改革委员会发布了一份重要通知,名为《加快“以竹代塑”发展三年行动计划》,这一举措旨在推动“以竹代塑”产业体系的快速建立。这个消息将给与竹制品、造纸等行业密切相关的产业带来利好消息。竹子作为中国特色植物,广泛应用于造纸、包···