桑迪亚国家实验室测试NextSilicon芯片,该芯片已通过政府超级计算领域的关键技术里程碑
NextSilicon芯片采用与主流产品不同的设计方案,能效更高
桑迪亚国家实验室致力于供应商多元化,确保在行业优先级转变之际仍能获得任务关键型芯片
桑迪亚国家实验室此前通过合作推动了液冷等创新技术的行业应用
Stephen Nellis
路透新墨西哥州阿尔伯克基5月18日 - 在新墨西哥州高海拔沙漠地带的柯特兰空军基地一栋不起眼的建筑内,液冷超级计算机正咕噜作响、嗡嗡作响地运转,致力于解决美国政府亟待攻克的复杂数学难题:模拟高超音速核武器如何穿透地球大气层,或是当一个核弹头在另一个附近引爆时会发生什么。
十多年来,承担这项机密且高要求工作的芯片一直来自英伟达(Nvidia, NVDA.O)或超微半导体(AMD, AMD.O)等主流半导体公司。
但随着这些公司日益将芯片设计重心转向人工智能领域,且面临供应短缺,桑迪亚国家实验室(Sandia National Laboratories)的系统负责人们越来越不确定如何为像他们这样的高精度科学工作找到计算能力。该实验室负责运营柯特兰基地的机器,也是美国负责开发和维护国家核武库的三个实验室之一。
“我们目前面临的压力既来自计算领域,也来自供应链,”桑迪亚高性能计算团队负责人史蒂夫·蒙克(Steve Monk)在解释获取符合其需求的芯片所面临的挑战时表示。“展望未来,就我们能否完成任务而言,这确实令人有些压力。”
芯片市场的新晋者
该实验室的困境表明,对更优质AI芯片的竞逐正产生意想不到的后果:曾经由大型企业主导的市场正向NextSilicon等小型企业敞开大门。NextSilicon是一家以色列初创公司,其芯片目前正通过桑迪亚实验室的一个项目进行测试。 这也凸显了桑迪亚在培育和塑造新型计算技术方面所发挥的作用——该实验室曾与英伟达开展广泛合作,助力其崛起为超级计算领域的领军企业,目前仍在与英伟达共同研发新型内存技术。
桑迪亚官员的一大关注点是所谓的双精度浮点运算——这一技术术语指的是能够计算极大数和极小数,且不会因舍入误差而损失精度。多年来,英伟达和AMD一直致力于在加速此类计算方面保持领先地位,并因此获得了与大学及政府实验室的超级计算合同。
但与物理问题模拟不同,人工智能工作无法从双精度计算中获得同等效益。芯片咨询公司More Than Moore的首席分析师伊恩·卡特雷斯(Ian Cutress)指出,尽管AMD正在推出面向科学计算的芯片版本,但根据某些指标,英伟达即将推出的Rubin芯片在双精度性能方面有所下降,这令高性能计算行业的许多科学家感到担忧。
英伟达超级计算产品高级总监丹尼尔·恩斯特表示,公司仍致力于科学计算,旨在打造一款既能运行实际科学应用又能处理AI任务的平衡型芯片。
但芯片市场的变化促使桑迪亚国家实验室的官员开始测试NextSilicon等新晋厂商的产品,其芯片采用的计算方法与英伟达和AMD的图形处理单元(GPUs)或中央处理单元(CPUs)截然不同。
核安全工作
周一,桑迪亚、NextSilicon以及协助将NextSilicon芯片集成到超级计算机中的Penguin Solutions公司表示,该系统已通过一系列通用超级计算测试,达成关键技术里程碑,这使得这些芯片有望应用于政府系统。
这为NextSilicon的芯片铺平了道路,今年秋季将决定是否开始用更严苛的计算问题对芯片进行测试,这些计算问题与它们最终需要处理的核安全工作非常相似。
NextSilicon的芯片能够进行双精度计算,并且设计上支持实时 重编程以 提升运行效率。该芯片采用所谓的数据流架构,通过减少数据在计算系统内存之间来回传输的时间和能耗,从而实现节能。
桑迪亚与芯片公司的合作往往有助于推动技术普及。十多年前,当桑迪亚开始敦促英特尔、AMD和英伟达研发芯片液冷系统时,这还是一种新奇的想法,而如今该技术已十分普遍。
桑迪亚国家实验室负责监督新计算架构测试项目的资深科学家詹姆斯·拉罗斯表示,与NextSilicon等小型企业合作,旨在确保即使大型芯片公司调整业务重心,桑迪亚也能始终采购到所需的芯片。
“我们必须保留可行的选择来完成我们的使命,因为这项使命是不可或缺的,”拉罗斯说道。
(为便利非英文母语者,路透将其报导自动化翻译为数种其他语言。由于自动化翻译可能有误,或未能包含所需语境,路透不保证自动化翻译文本的准确性,仅是为了便利读者而提供自动化翻译。对于因为使用自动化翻译功能而造成的任何损害或损失,路透不承担任何责任。)