欧易数字货币交易所 更快、更好、更强

欧易是世界领先的数字货币交易平台,你可以放心购买比特币、以太币、莱特币、狗狗币等数字货币,也可以探索Web3、投资DeFi 和NFT。欧易是您数字货币之旅的得力助手,下载欧易APP客户端安装包将助您轻松赚币.

hero thumb

中国智算:万卡时代的三重挑战

近日,一段令人震撼的视频在网络上流传开来,科学家们在NASA戈达德空间飞行中心的天体物理学家的指导下,利用Discover超级计算机模拟了跳入黑洞的过程。

视频呈现出的画面视觉效果十分震撼,但更为惊人的是其中的数据:这段视频生成了10TB的数据,仅用了5天的时间,耗费了总算力的0.3%。如果用一台普通的笔记本电脑来模拟这一场景,需要花费整整10年的时间。

"时间就是金钱,效率就是生命",这句改编自时代的口号,在大模型驱动的智算时代仍然深具意义。

算力作为生产力,其节约的不仅仅是金钱,更是时间。

目前,算力集群已经从千卡迈入了万卡、五万卡的时代。甚至有预测称,未来GPT6的部署将需要70万-80万张卡才能支撑。

然而,伴随着万卡时代的到来,一个问题摆在了我们面前:如何应对更大规模的提升?

近几个月,我们团队与众多ICT厂商进行了交流,发现业内普遍认为迈入万卡时代必须"过三关"。

万卡时代,AI开发是否等同于"中彩票"?

首先,我们需要澄清一点:为什么智能计算仍然在"堆卡"?从千卡、万卡到十万卡、百万卡,这种趋势是否可持续?

随着模型规模和数据参数的不断增大,基础设施层面的"堆卡"竞赛仍将持续下去。

目前,国际科技巨头如谷歌、微软、苹果等不断投入算力集群建设,其中AI算力占总算力支出的比例预计将在2025年达到25%。国内方面,万卡及以上的组网也成为下一代智算中心的建设重点。

然而,算力集群卡的数量非线性增加,会带来更大的不稳定性和协作难度。因此,在万卡时代,一张卡、一台机器或一个链路的故障,都可能导致中断,拖慢进程。万卡时代,一张卡、一台机器或一个链路的故障,都可能导致中断,拖慢进程。

如何让多卡集群高效稳定地协作,成为了一个亟待解决的问题。

其次,网络通信的联接能力是一个关键因素。如果网络通信不畅,大量算力资源在传输过程中会损失,这对智算中心和AI模型开发者来说都是一个巨大的挑战。

最后,软件生态也是一个至关重要的方面。当前国内虽然有不少公司推出了国产AI芯片,但用户并不十分青睐,主要原因在于软件生态不够完善。因此,如何建立完善的软件生态,成为了发展智算产业的一个重要课题。

万卡时代,我们需要克服这三个关键挑战,才能够实现智算产业的可持续发展。

标签