okx

缓解AI推理算力焦虑,高带宽GDDR6成杀手锏?

日报

作者 | ZeR0编辑 | 漠影

芯东西5月22日报道,生成式AI的日益火爆,正对数据中心内存性能提出更加苛刻的要求。无论是云端AI训练还是向网络边缘转移的AI推理,都需要高带宽、低时延的内存。迈向高性能GDDR6内存接口已是大势所趋。

近日,推出业界领先24Gb/s GDDR6 PHY的美国半导体IP和芯片供应商Rambus,其两位高管与芯东西等媒体进行线上交流,分享了Rambus在GDDR6领域的技术创新及行业发展趋势。

Rambus成立于20世纪90年代,现拥有约750名全球员工、3000多项技术专利,在中国大陆和中国台湾都设有相应的分支机构,由本地化的团队专门服务于中国市场。2022年,Rambus的经营现金流达到2.3亿美元。

“ChatGPT等AIGC应用与我们公司的产品组合是非常契合的。”Rambus大中华区总经理苏雷说,Rambus China立足于中国市场,愿意更多、更紧密地支持中国公司在ChatGPT产业的发展,为他们保驾护航,“Rambus面对中国客户的需求,有最好的技术、最快的响应和最好的技术支持来服务中国市场。”

据Rambus IP核产品营销高级总监Frank Ferro分享,AI推理应用对带宽的需求通常在200到500Gb/s的范围之间波动,每一个GDDR6设备的带宽都可以达到96Gb/s,因此通过将4-5个GDDR6设备组合在一起,就能轻松满足500Gb/s及以下的带宽需求。

他谈道,如果用到一个HBM3设备,基本上会把这个带宽需求的数字翻倍,能够达到接近800Gb/s的带宽,而这超过了AI推理本身所需要的400到500Gb/s带宽,会使成本增加3~4倍。在这种条件下,HBM并非一个经济高效的选择,GDDR6则是一个更好的替代。

他建议按需选择HBM或是GDDR6内存,对于对高带宽和低延迟有很高要求的AI训练场景,HBM可能是更好的选择;对于需要更大容量、更高带宽的AI推理场景,GDDR6会是更合适的选择。

一、高性能内存和互连方案,支持下一代数据中心发展

Rambus大中华区总经理苏雷谈道,Rambus主要业务包含基础专利授权、芯片IP授权和内存接口芯片。其中芯片IP又主要分为接口IP和安全IP。其技术和产品面向数据密集型市场,包括数据中心、5G、物联网IoT、汽车等细分市场,后续还将推出CXL家族各产品组合芯片。

面向数据中心,Rambus非常注重产品和方案的易用性,通过一站式的解决方案以及完善的服务机制,使产品方案变得更易在客户端集成使用。Rambus陆续推出了各内存子系统、接口子系统,提供业界领先、可靠的数据传输。其GDDR6接口子系统率先实现高达24Gb/s的内存接口数据速率,并能为每个GDDR6内存设备提供最高达到96Gb/s的带宽。

Rambus的内存接口芯片产品不断提高数据中心内存模块的速度和容量,同时它拥有非常丰富而全面的安全IP产品线,对用于静态数据以及动态数据安全保护都有着专门安全的产品方案。

总体来说,Rambus通过领先的高性能内存和互联解决方案以及硬件级安全,支持下一代数据中心的发展。其产品应用领域聚焦于服务器主内存、人工智能和网络加速器、智能网卡、网络存储、网络交换机以及内存扩展和池化等。

二、内存是未来AI性能的关键

Rambus IP核产品营销高级总监Frank Ferro着重分享了迄今市场推动高性能需求的主要驱动力,以及未来如何更好满足AI性能需求。

数据需求依旧呈现上涨趋势。ChatGPT等AI相关应用快速发展,对内存带宽需求旺盛,因此市面上越来越多公司开始专注于开发自己个性化、定制化的处理器产品,以更好地满足神经网络以及专属应用的需求。

Frank Ferro强调说,尽管算力增长非常显著,但带宽的进步与之并不匹配,即现有高算力的基础之上,很多的GPU资源其实并没有得到充分的占用和利用,这造成了现在的困境。

AI训练环节需要录入大量数据进行分析,需要消耗大量算力。AI推理环节对算力的需求会大幅下降,但对成本和功耗更加敏感。Frank Ferro谈道,一个重要趋势是AI推理越来越多地向边缘设备上进行集成和转移。在这个变化过程中,拥有更高带宽、更低时延特性的GDDR6方案,能够帮助边缘端更好地处理数据。

对带宽需求进一步的增加,驱动了像Rambus这样的公司不断地在去打造更加新一代的产品,不断地提高内存带宽以及接口带宽的相关速度。

三、GDDR6能够提供AI推理所需的内存性能

Rambus有着丰富的接口IP产品组合,同时也提供像DDR、LPDDR以及HBM等产品,并非常关注SerDes产品的开发,主要聚焦于PCIe和CXL接口,会开发配套的PHY及控制器。Rambus的HBM产品拥有领先的市占率,同时其HBM3产品已经能够提供高达8.4Gbps/s的数据传输速率。

其全新GDDR6 PHY及控制器的配套产品已达到业界领先的24Gb/s的数据传输速率,可为AI推理等应用场景带来巨大性能优势和收益。此外,该产品在功耗管理方面优势明显,并实现了PHY以及控制器的完整集成,即客户收到产品后,可以直接对其子系统进行定制化应用。

如图是GDDR6内存接口系统,Rambus提供的是中间标蓝的两个重要环节,也就是完整的子系统。Rambus会根据客户具体应用场景和实际的诉求对子系统来进行优化,并将其作为完整的子系统来交付给客户。

clamshell模式指每个信道可支持两个GDDR6的设备。换句话说,在clamshell模式之下,整个容量是直接翻倍乘以2的。值得一提的是,GDDR6现已支持先进的FinFET工艺节点环境。

此外,Rambus也会针对PCB以及封装提供相关的参考设计,同时内部有信号完整度和边缘完整性方面的专家,来帮助客户完成整个设计工作。

市面上很多GPU加速器都已经用到GDDR6。由于在成本和性能之间达到不错的平衡,GDDR6成为在AI应用场景下比较合理的产品和选择。而Rambus拥有领先的SI/PI专业知识,可以进行早期的协同设计和开发,确保GDDR6产品的性能表现,也能更好地去缩短产品的上市时间。

结语:在带宽、成本、方案复杂性之间实现平衡

随着AI应用趋于盛行,苏雷谈道,下游厂商首先关注高带宽,并开始关注方案的成本和复杂性,“GDDR技术是在带宽、成本和方案复杂性的各因素之间提供了一个非常完美的折中技术方案。”他预计到2025年或2026年市场上会出现使用GDDR6 IP的芯片。

进入全新的GDDR6时代,相关产品已开始采用16位的双读写通道。双读写通道加起来是32位的数据宽度,而GDDR6内存有8个双读写通道,总共可实现256位的数据传输宽度,所以能够显著提高数据传输的速度和效率,系统层效率和功耗管理也能得到进一步的优化。

除了适用于AI推理场景外,Frank Ferro说,GDDR6也会在图形领域和一些网络应用场景中起到重要作用,能够大幅降低网络边缘设备对DDR数量的需求。

相关内容

扎实推动高质量发展在湖南农信系统落地生根

洪 樱 成依潇 刘雯娟 黄利飞 新型农业经营主体贷款余额177.2亿元,累计涉农贷款余额达6264.5亿元; 普惠型小微企业贷款余额达2182亿元,支持普惠型小微企业户数50.8万户; 新版手机银行客户数1244万户,收单商户数79万户,线···

全国港口前三季度吞吐量出炉

1-9月,全国港口集装箱吞吐量前10名分别是:上海港(第1)、宁波舟山港(第2)、深圳港(第3)、青岛港(第4)、广州港(第5)、天津港(第6)、厦门港(第7)、苏州港(第8)、北部湾港(第9)、日照港(第10)。图片来源于港口圈1-9月,···

定安打出组合拳推动知名企业纷纷落地

海南日报记者 李豌 特约记者 孙国富蜜雪冰城全球供应链总部基地和全国冷链物流总部基地项目、煌上煌集团……近年来,大企名企纷纷落地定安。国际投资单一窗口综合管理系统数据显示,2020年5月至今年9月,定安县在库项目36个,签约金额达158.9···

45年·45人·45个典型改革案例丨熊维政:一定要把信阳茶油做上市

□本报记者 胡巨成 刘宏冰潜心医药行业40余年,将一家作坊式医药小厂,做成大别山革命老区和全国贴膏剂药业首家上市企业,打造出“百亿级贴膏剂生产基地”的羚锐制药前“掌门人”熊维政,在他60岁时急流勇退,放手交棒,转身创办了信阳信锐油茶股份有限···

山东区划设想,二分滨州,组建渤海市,利津改区,邹平与高青互换

近年来,随着我国产业结构的不断调整,经济增长方式也在持续优化,特别是随着交通等基础设施的完善,区域经济开始朝着一体化发展方向迈进。如果用《射雕英雄传》中的一句话来形容,江苏是“东邪”、广东是“南帝”、四川是“西毒”,那么山东则是“北丐”,此···

为什么河南经济是最没有希望的?上车,带你深度了解河南的问题

“河南小孩出生就是为了离开河南”,这是我最近一个关于河南经济评论文章下点赞最高的评论。这句话我深深刺痛着自己,因为我自己就是河南人,深知这里面包含了多少无奈和心酸。当人们在聊地域之争的话题时,大家都会为自己的省份争辩几句,然而只有河南人,会···

关注双11丨“88VIP”淘宝天猫全网商品都能用花呗分期免息

2023天猫“双11”活动今晚8点正式开始。今年“88VIP”大额券总规模达到200亿,用户可领券额度最高可达860元。支付宝针对“88VIP”淘宝天猫用户还推出花呗分期免息服务,消费者购买大件商品又多了一重实惠。“88VIP”用户购买单价···

每日新闻,60秒知晓世界热点

2023年10月31日,星期二,农历九月十七1、31省份前三季度人均可支配收入公布:上海北京首超6万元位居全国前列,浙江天津江苏同属4万+梯队紧随其后;长三角万亿城市经济三季报:合肥增速第一,宁波增速超上半年;2、工行、农行、中行、建行、邮···

2024年城乡居民参保调整,一次性补缴5.9万,每月能领2300元吗?

随着时间的推移,社会保障制度也在不断地完善和调整。2024年城乡居民参保也将迎来新的一轮调整。据相关政策规定,未来居民参保需要一次性补缴5.9万,每月能领2300元。这个政策引起了很多人的关注和讨论。对于这个政策,有些人认为一次性补缴5.9···

老百姓:第三季度净利润同比增长32.78% “聚焦发展”战略优势凸显

中证网讯(记者 段芳媛)老百姓10月30日晚间披露2023年第三季度报告。公司前三季度实现营业收入160.42亿元,同比增长16.44%;实现归属于上市公司股东的净利润7.17亿元,同比增长17.54%。其中,第三季度实现营业收入52.31···

紧抓机遇开展差异化竞争 骆驼股份积极开拓国际市场

骆驼股份 黄剑波/供图 彭春霞/制图证券时报记者 韩忠楠越来越“卷”的新能源汽车赛道,既充满挑战,也酝酿着新的机遇。近期,受益于华为与赛力斯联合打造的全新问界M7的热销,与之相关的汽车产业链在A股市场的热度也随之升温。这当中,为问界M5/M···

宝山罗店:罗南二村 半年跌幅近乎恐怖 郊区老破小太可怕

前几天,我们写了几个宝山区二手房系列,美兰湖板块的万科琥珀郡园以半年跌幅近五分之一位列榜首,我以为就是跌幅极限。然后,今天现场去看了位于美兰湖南侧的罗南新村,在那周围详细地看了看,然后比较了一下罗南二村最近成交与4月份左右的成交记录,愕然发···

压倒许家印并不是造车,而是恒大童世界,砸几千亿搞了十几个鬼城

恒大集团以其高调的投资和建设项目而闻名,最近引起了人们的广泛关注。与传统地产业务不同,恒大集团的新尝试是在娱乐旅游领域建设恒大童世界。这一巨大的投资计划引发了广泛的争议和讨论。恒大童世界的建设规模之大令人瞩目。据报道,恒大集团计划投资数千亿···

《人民日报》警告奏效?98款,突破1亿台!华为正式宣布

导语:在科技的浪潮中,华为从遭遇“极限施压”,到芯片突破和鸿蒙生态的自研,始终展现出卓越的技术实力和坚韧不拔的创新决心。华为面对挑战:技术封锁与自主创新在2019年,《人民日报》发送《人民日报评华为遭"极限施压":科技自立,时不我待》一文,···

中国钢铁大王戴国芳,入狱5年东山再起,再造500强民企狂赚1957亿

他从一个收废品的穷小子,摇身一变,登上了中国400富豪榜。他的钢铁厂年销售额已超过1个亿,手下员工超过1千人,他就是钢铁大王戴国芳但是这个钢铁界的王者,却因为一时错误,被捕入狱,还坐了5年牢。出狱后,他不忘初心重操旧业,不仅再次创办炼钢厂,···

油价暴跌倒计时,专家透露:11月国内高油价将消失!

随着外资油站的进入,国内加油站市场的竞争格局正在发生重大变化。近日,多位专家在接受记者采访时表示,预计11月国内高油价将不复存在。这一预测的背后,是外资油站的入驻带来的市场冲击和国内油价的持续波动。外资油站的进入,打破了国内加油站的垄断格局···

共话中国经济新机遇丨专访:中国经济展现出发展韧性

新华社日内瓦10月30日电 专访:中国经济展现出发展韧性——访联合国贸发会议资深经济学家梁国勇新华社记者陈斌杰联合国贸发会议资深经济学家梁国勇日前接受新华社记者书面专访时表示,中国经济今年前三个季度的增长态势展现出了发展韧性和潜力。中国国家···

润达医疗:目前在上海、北京等地区部分医疗机构已开展LDT相关业务的试行

润达医疗近期接受投资者调研时称,目前在上海、北京等地区部分医疗机构已开展LDT相关业务的试行,公司在上海等地区积极和相关部分医疗机构展开合作,共同推进LDT相关业务在医疗机构的开展。未来随着相关政策法规进一步完善,LDT相关业务将给公司带来···

国航率先公布第三季度财报,疫情后首度扭亏

在阅读此文之前,希望用您发财的小手点一下“关注”,文章内容来源于网络但是最后会有小编的个人感悟,如有不足之处可以评论指出,谢谢您的支持。民航行业近期公布的积极消息显示了行业的积极向上趋势。多家航空公司在财报中宣布扭亏为盈,旅客运输量也逐步恢···

竹塑革命!中国发改委推动“以竹代塑”三年行动计划。

近日,中国国家发展和改革委员会发布了一份重要通知,名为《加快“以竹代塑”发展三年行动计划》,这一举措旨在推动“以竹代塑”产业体系的快速建立。这个消息将给与竹制品、造纸等行业密切相关的产业带来利好消息。竹子作为中国特色植物,广泛应用于造纸、包···