集微网报道 (文/陈兴华)随着芯片向高密度、高集成和高算力迭代,其功率及功率密度正不断飙升,同时“高热密度”成为高功率半导体技术发展的重大瓶颈。鉴于芯片功耗持续增加,液冷散热技术愈发受到重视。但由于成本较高以及方案复杂,目前水冷板技术距离业界理想的散热方案还有一定距离。此外,业内采用被称为“茅台”的氟化液浸沒式液冷技术方案的成本也居高不下。
理论而言,芯片的温度越低寿命就会越长,同时性能越稳定。但若要实现更低的芯片温度,产业界所需要付出的散热代价太高,目前还没有达到提升性能同时兼顾成本的平衡点。对此,针对各种散热材料、散热技术以及应用场景,业界可以采用不同的技术组合或合作开发相关产品,从而在现阶段成本可接受的条件下探索出最优化的解决方案。
无论如何,随着散热痛点和热管理需求愈发明显,业界资本、产业企业正不断加大对相关技术方案的投入,推动针对超高密度的芯片及模组演进出更完善的技术方案。目前来看,国内部分企业已经在高功率密度芯片散热和先进封装散热技术等方面已有建树。但为了避免被“卡脖子”,还需要业界在材料、散热结构、设计和成本等各产业链环节携力布局。
破局瓶颈 尚欠火候
既然散热已经成为芯片等电子信息产品的重大痛点,这一产业便还有很长的路要走。
中科创星董事总经理卢小保对集微网表示,虽然电子信息领域对散热新技术和更强的散热能力有非常迫切的需求,但是供应端提供的技术能力还远远不够。“在散热技术发展演进上,早期PC机可能只有几瓦(W)到十几瓦时,给芯片上贴一个散热片就能把大面积的热量带走。后来随着功耗瓦数增加,就需要在散热片上面加一个风扇去吹,这种技术方案叫做风冷散热,而且大多数情况可能都会用经济性和实用性比较好的铜材或铝材去做。”
“当功耗达到几十瓦上百瓦时,就需要采用热管将热量从芯片上导出,待热量扩散到更大的散热翅片上后再用风扇去吹,这其中涉及了相变吸热、热传导和热对流组合技术方案。迄今为止,PC和服务器中绝大部分都是采用这种方案组合,即热管加鳍片及风扇。但当CPU的功耗逐步达到300瓦、500瓦甚至800瓦时,就打破了热管加风扇的散热能力极限值。由于采用多年的热管加风扇方案已经无法适应行业发展,这时就不得不采用水冷板等液冷散热技术。”卢小保说。
他进一步表示,由于芯片功耗持续增加,水冷板等新兴的散热技术方式正愈发受到重视。相比热管加鳍片及风扇的风对流,水冷板采用水的对流方式,通过水流做热交换带走热量的速度更快、效率更高。但鉴于成本比较高以及解决方案较复杂,水冷板技术目前还没实现规模数量级的增长。不过,其在一些高功耗的应用场景也成为必选项,因为业界还没有更理想的解决方案。
至于另一种采用氟化液的㓎没式液冷技术方案,就是把整个服务器泡在氟化液里面。虽然这种方案会进一步加强散热能力,但氟化液号称“茅台”,从而使得氟化液的成本比服务器都高。因此,当数据中心围绕氟化液去做开发建设时,散热这个配角反而变成了开发投资的“主角”。
此外,国内散热技术厂商广州力及热管理科技(NeoGene Tech)创始人陈振贤亦认为,在后摩尔时代,随着芯片功率越来越高,散热器设计结构的热阻值已渐渐无法适应行业的发展需求。“通常一颗芯片会定义其温度限值,比如英特尔、AMD等定义其芯片的外壳温度不能超过85度,其实半导体芯片的节温(Tj)已超过此温度,而且通常需控制不超过105度,这是因为半导体芯片的封装中存在各种材料的层层热阻。”
“假设环境温度是25度以及芯片功耗为600瓦,如果散热器热阻值(包含介面材料)为0.1,芯片与环境温度的温差是60度,芯片外売温度刚好是85度。而一旦芯片功耗超过600瓦达到1000瓦时,同样使用热阻值0.1的散热器,芯片与环境温度之间面临的温差就变成100度,芯片外売的温度将高达125度,芯片的节温(Tj)更高于此。”
陈振贤补充道,芯片功耗瓦数越来越高会使温差越来越大,进而超过芯片外壳定义的温度,这就当前的散热瓶颈所在,因而需要设计并制作出热阻值更低的散热器。“当高算力芯片跟功率挂钩时,以现有的微流道水冷板技术大概在500瓦是一个分界点,浸没式会在600瓦左右面临瓶颈。但问题是如今AI芯片的算力和功耗越来越大,正在突破这一极值。另外,AI芯片的热设计功率超过千瓦级的产品即将发生。”
对此,卢小保进一步表示,CPU所在的服务器空间长期高于室温度,其稳定性和寿命可能都会受到影响。理论上来讲,常温条件下CPU的温度越低寿命就会越久,同时性能越稳定。但如果要实现更低的CPU温度,产业界所需要付出的散热代价太高,还没有达到提升性能同时兼顾成本的平衡点。目前,数据中心维持在二三十度,还可以容忍对相关散热技术付出的成本。如果将来有更好的技术,而且成本并不是很高,应用者的采购意愿应该比较强。
升级长板 兼攻短板
从发热的芯片到器件到最终产品,可谓每一个层级和环节都存在散热需求,因而其中涉及不同的支撑材料、界面材料、底层材料。同时,应用不同的散热技术或应用场景不同,相关技术路线和解决方案也不同。而这其中势必潜在各种发展机遇与不同技术挑战。
在卢小保看来,散热技术的核心要素包括芯片本身产生多大瓦数的热、单位面积上的热流强度大小,以及热量可以在多少的距离内扩散到多大的体积上。由于PC、手机和服务器等不同应用终端对于热的痛点或散热需求不同,采用的技术方案差别也非常大。其中,PC、服务器的体积更大、产生功耗瓦数更高,需要采取更复杂的散热技术。而手机由于集成度更高,某种程度在体积上就限制了芯片瓦数不能太高。
通常情况下,散热是把一个热能非常高的出热或产热点的热量扩散到更大空间,这个热传递过程是串行的,而且当中任何一个环节都可能会成为热瓶颈。对此,卢小保阐述称,“散热是一个逐级传递的体系,比如从产热点A到B到C到D到E再到F,如果AB之间、BC之间、CD之间的传递效率低了,可能最终结果就是A到F的散热效率不够高。所以各个环节都需要不断提升散热的能力,使之避免成为整个通路上的瓶颈点。”
随着芯片向高密度、高集成和高算力迭代,无论是芯片还是整个模组,其功率及功率密度将不停飙升。陈振贤表示,“为了达到终极集成度,芯片势必朝SoC发展,模组则朝MCM发展。IC及模组功能越来越强大、功率越来越高,‘高热密度’的解热及散热显然已成为高算力芯片技术发展的瓶颈。针对超高密度的芯片及芯片模组(MCM),势必也将发展出一套可持续性发展之终极的解热及散热技术方案。”
与此同时,作为芯片的重要散热环节,先进封装也正面临愈发严峻的挑战。
芯瑞微创始人、董事长兼CEO郭茹对集微网表示,“在整个与电相关的电子系统方面,无论是3D集成的先进封装还是电子信息设备,它们的集成度越高产生的热源就越多,同时热源与热源之间会因为温差产生热流,以及内置的风扇也会带给其它部件额外的热。由于传统设计集成度不高,工程师在设计和仿真中并没有考虑复杂场景下的热分布,从而无法准确计算这些热量对整个系统的不同程度影响。因此,对后摩尔时代采用先进封装堆叠的芯片以及高集成高密度设计的系统而言,散热技术都已变得越来越至关重要。”
作为电子信息产品领域的重大痛点,散热技术的系统提升显然需要找准对策。卢小宝指出,“解决散热问题的思路就在于克服瓶颈,即在ABCDEF中任何一个环节开始出现瓶颈,就想尽一切办法把它解决掉。但可能某个环节不是瓶颈,而且有很好的技术可以把它的能力大幅提升,那么这部分就可以做成长板。总体上,任何环节都可以开发出很多东西提升散热能力和效率,但其中既要做长板也要补短板,进而打破产业瓶颈。”
同时,针对各类不同应用场景,业界可以采用不同的基底材料、界面材料、散热器件等各种技术组合去开发散热方案,最终在现阶段成本可接受的条件下找出最优化的解决方案。
为此,中科创星已经对散热领域进行诸多布局,其中涉及产业链的多个环节,包括圣荣元(环路热管)、力及热管理(两相流极致散热技术方案)、江西国化(氟化液散热)、中科原子(微通道)、钜瓷科技(ALN陶瓷粉体和陶瓷结构件)、中科皓烨(氮氧化铝)、彗晶新材料(界面材料)、芯瑞微(多物理场仿真-热仿真)和墨光新能(辐射制冷)等。卢小保表示,在布局战略方面,中科创星主要专注的是技术创新型企业。未来,由于散热痛点势必会持续存在很多年,中科创星将不断加大对相关创新技术的布局。
迎热而上 砥砺建树
在推动国内散热产业发展方面,资本显然与技术、人才等元素作为核心支撑之一。目前,通过精准布局,中科创星投资的上述国内企业均展现出不俗实力、影响力以及有力发展势头。
其中,力及热管理(NeoGene Tech)开发的牛劲冷泵(NeoGene Cooling Engine)技术是一种崭新的高功率密度芯片解热技术。陈振贤表示,牛劲冷泵为实现适用各种场景,其元件尺寸可大可小、可高可低、可胖可瘦,将以三种不同的应用方式呈现在液冷散热的产品线上,包括冷板式液冷散热器、算力芯片的IC封装模组和浸没式液冷的热消散器。在功耗上,单颗算力芯片的TDP300W~1500W都是目前牛劲冷泵技术的解热及散热服务范围,同时单芯片1500W~2000W的应用的技术也已在开发路线图中。
另一方面,Al算力芯片及AI服务器散热需要的不只是一时的解决方案,整个产业寻求的将是一个具有随着功率飚升而仍可持续性发展的崭新解热及散热技术平台。
陈振贤进一步表示,NeoGene Tech迄今已建构完成专为高功率芯片及电子电路系统的解热与散热,提供一种基于结合三维两相流循环及液冷循环的高效热管理技术平台。“牛劲冷泵液冷散热技术加上具有三重液冷循环之服务器设计,对于2000W以上的芯片解热及散热技术平台已准备就绪,实已领先美国能源部与英特尔的合作开发计划。”
他还称,NeoGene Tech创立三年多来,已开发的创新硬核技术包括,全世界最薄的两相流循环蒸气腔技术(PWS/MagicWick-lnside VC)、具不同工质两相流循环的四季均温板技术(FSVC),以及全世界解热功率最高的三维两相流循环蒸气腔崁入式液冷散热技术(牛劲冷泵液冷散热器)。NeoGene Tech已为这三项创新技术累积申请了超过130篇的发明专利。目前,这些硬科技可广泛应用于智能手机、平板电脑、AR/VR、电动车、机器人、通讯交换机、数据中心服务器和高算力芯片冷却封装等众多场景以及极端解热和散热应用。
在先进封装领域,芯瑞微则看准芯片系统高集成、高功耗密度和小型化下的风口以及实验室数据愈发捉襟见肘,探索开发出了散热仿真工具——Turbo T。据悉,其可以深入到芯片内部,从而促进细微的跨尺度结构做更多计算。此外,Turbo T仿真场景涵盖了芯片级、PCB级到电子设备级所有的场景,在物理场方面可实现对流换热、辐射换热和导热等。
对于产品开发路径和策略,郭茹表示,Turbo T是基于芯瑞微的行业积累和客户一些最先进的诉求应运而生。针对多源异构封装热源分布多且分布不均匀等问题以及不同的应用场景,芯瑞微采用了新的工艺和结构布局,创新型的将“热、流、固”算法耦合起来,包括做了涉及多个学科的温度分析、热应力分析解决方案,以及解决了很多跨尺度、多场景耦合等问题,进而使Turbo T产品在新型散热领域中与客户的应用场景需求保持一致性。
在保持行业竞争力方面,芯瑞微主要从两个方向入手。郭茹阐述道,“第一,公司在预判技术发展趋势和开拓新兴研发方式方面落地比较早,比如在2020年年初时就做了热产品的研发规划,从而形成了更好的行业技术积累。第二,通过与各类客户深度融合在一起,公司能够了解到最关键的诉求和痛点是什么,然后根据它们的应用场景不断做产品升级迭代。”
简而言之,将整个产业技术的发展创新趋势与公司产品发展方向相结合,是芯瑞微能够实现领先的非常重要原因。郭茹还称,“未来,芯瑞微会持续加大在散热领域的布局。除了Turbo T散热仿真工具之外,我们也在进一步研究基于数据和模型双驱动的散热算法,开发适配高复杂度模型的一些软件等,以实现从集成电路进入到智能制造、新能源等更多行业,最终形成从芯片级、PCB板级到设备级的全尺寸解决方案。”