欢迎来到芯果!

科技创业者的媒体合伙人
老黄揭秘三代GPU革新,颠覆摩尔定律构建AI新纪元!
主编:原创

图片

 

不久之前,老黄向世界展示了Blackwell芯片,这是目前全球最大的芯片,被誉为全球最复杂、性能最高的计算机核心。英伟达的产品迭代速度已经超越了摩尔定律,正如网友所言,老黄创造了属于他自己的定律。他凭借顶尖的硬件和CUDA技术,自信地预测未来所有计算密集型应用和数据中心都将获得巨大加速。同时,老黄再次强调了“买得越多,省得越多”的商业策略,彰显出英伟达在计算领域的雄心壮志。

 

全新计算纪元揭幕

 

老黄在演讲中首先引领观众进入了一个Omniverse模拟世界的奇妙旅程,他强调:“英伟达正站在图形模拟与AI的交汇点,这是我们的核心。”加速计算和人工智能这两项关键技术,正引领着计算产业的变革,标志着全新计算时代的来临。
回顾过去60年,计算机行业经历了数次技术飞跃,从IBM的System 360引入CPU,到PC革命和iPhone的云端连接,每次技术革新都极大地推动了计算行业的发展。然而,如今我们站在了另一个历史性的节点上。
处理器性能扩展的瓶颈与计算需求的爆炸式增长,正引发一场“计算通货膨胀”。面对这一挑战,英伟达凭借GPU和CUDA技术,开创了异构计算的新纪元。CUDA不仅加速了CPU负载,更推动了整个计算效率的飞跃,实现了高达100倍的速率提升,而功耗和成本的增长却相对有限。
英伟达还通过CUDA软件,为不同领域提供了专用的加速工具,从深度学习到物理模拟,再到基因序列分析,CUDA已成为各领域不可或缺的加速引擎。全球数百万开发者和用户已经加入CUDA生态,共同推动着计算技术的进步。

老黄表示,CUDA的成功并非一蹴而就,它克服了“蛋和鸡”的困境,通过开发者与用户之间的良性循环,不断优化和迭代。如今,CUDA已经遍布全球,成为计算领域的基石。随着全新计算时代的开启,我们有理由相信,在英伟达等科技巨头的引领下,计算技术将继续创造更多奇迹。

 

AI工厂:全栈变革的引擎

 

自2012年AlexNet的崛起,英伟达与AI的缘分正式开启。Hinton和他的团队在两颗英伟达GPU上完成了这一里程碑式的训练,深度学习的大门就此敞开。然而,随着神经网络架构的日益复杂,对数据和计算力的需求也呈指数级增长,英伟达不得不重新构想一切。

 

英伟达通过一系列创新技术——从Tensor Core到NvLink,再到TensorRT和Triton推理服务器,以及DGX超级计算机——不断推动AI的发展。在许多人还持怀疑态度时,英伟达已经将首个DGX超算赠予了OpenAI,这一前瞻性的决定开启了全新的篇章。

 

随着Transformer架构的兴起和LLM训练的需求激增,英伟达建造了更大规模的超算。直到ChatGPT的出现,这一基于英伟达数万GPU训练的模型,能够像人类一样进行交互,标志着生成式AI的崛起。现在,我们可以生成图像、语音、文字、视频等一切可想象的token,这是全新的生成式AI时代。

 

英伟达打造的“AI工厂”正在创造巨大的价值。正如尼古拉·特斯拉的AC Generator引领了电力革命,英伟达正在用其AI Generator引领新一轮的产业革命。IT产业正以前所未有的速度发展,直接服务于庞大的100万亿美元产业。从传统的软件工厂到如今的AI工厂,从CPU到GPU,从检索到生成,从指令到大模型,从工具到技能,全栈的重塑正在发生,引领我们走向更加智能的未来。

 

--从Blackwell GPU到超级AI工厂:算力革命

 

英伟达如何将Blackwell GPU转化为超级AI工厂?答案在于其强大的计算能力和创新技术。Blackwell GPU不仅代表了地表最强的芯片技术,更是推动AI向前迈进的关键力量。

 

回顾过去八年,英伟达GPU的Flops增长高达1000倍,远超摩尔定律的预测。这种惊人的算力提升直接降低了成本,使得训练庞大模型如GPT-4的能耗降至原来的1/350。想象一下,过去需要1000吉瓦时和一个月时间才能完成的训练,现在只需3吉瓦时和极短时间即可完成。

 

Blackwell GPU正是为此而生。其设计的核心在于提高推理和生成token的效率。每个token的能量消耗降低了惊人的45000倍,让我们能够以前所未有的速度生成内容。这种革命性的变化,源于运算模型规模的指数级增长和英伟达对技术的不断追求。

 

Blackwell GPU的技术创新包括其巨大的芯片尺寸、高速的NVLink连接、以及与Grace CPU的紧密集成。这些特性使得Blackwell GPU在训练、推理和生成方面都具有极高的效率和可靠性。此外,英伟达还通过增加数据压缩和解压缩引擎,大幅提高了数据处理速度,进一步提升了AI工厂的性能。

 

总之,从Blackwell GPU到超级AI工厂的转变,不仅代表了技术的飞跃,更预示着新一轮产业革命的到来。英伟达通过不断创新和突破,正引领着AI时代向前发展。

 

 

--英伟达:从风冷DGX到液冷MGX,引领AI计算新纪元

 

英伟达不满足于Blackwell GPU的卓越性能,他们更追求将最尖端的芯片技术融入服务器之中。搭载Blackwell的DGX超算,在性能上实现了质的飞跃,能耗仅提升10倍,而FLOPS量级却飙升了45倍。风冷DGX Blackwell,凭借8个GPU和惊人的15kW散热器,展示了强大的散热能力。而追求液冷技术的用户,英伟达则推出了MGX,集成了72个Blackwell GPU,并通过第五代NVLink实现每秒130TB的传输速度。

 

NVLink,这一英伟达引以为傲的GPU互连技术,将独立的GPU紧密连接,让拥有十万亿参数的LLM得以流畅运行。其内部数学功能对于深度学习至关重要,而5000根电缆的庞大架构支撑起了整个MGX的超强算力。这一电气机械奇迹,不仅仅是简单的芯片连接,更是AI计算新纪元的开启。

 

然而,英伟达并未止步于此。他们意识到,连接超算中心内不同主机的技术同样关键。为此,英伟达研发了一系列适配AI超算的以太交换机,通过顶尖的网络级RDMA、阻塞控制、适应性路由和噪声隔离技术,将传统以太网改造为适合GPU间点对点通信的高效网络。这不仅意味着技术上的巨大飞跃,也预示着数百万GPU数据中心时代的到来,英伟达正引领AI计算迈向新的高度。

 

英伟达NIM助力全球开发者,及时部署LLM

 

英伟达推出了创新软件NIM,为AI工厂注入了新的活力。这款软件通过容器化方式,集成了Triton推理服务器、优化的AI模型以及云原生堆栈等,极大地简化了生成式AI的部署和应用。现在,全球2800万开发者可以迅速将NIM集成到他们的数据中心中,享受快速构建和部署生成式AI应用程序的便利。

 

NIM不仅提高了开发者的生产力,还加速了生成式AI应用的创新。它支持Meta Llama 3-8B模型,使得企业能够在相同的计算资源下,生成更多的响应,从而推动数字人、智能体、数字孪生等应用的蓬勃发展。英伟达CEO老黄表示,NVIDIA NIM的广泛集成和易用性,正在让生成式AI技术触手可及。

 

展望未来,智能体将成为最重要的应用之一。老黄认为,智能体市场潜力巨大,几乎每个行业都需要客服智能体等解决方案。在NIM的支撑下,未来的智能体将组成高效协作的团队,通过连接和协同完成各种复杂的任务。这将为企业带来前所未有的效率和机遇,推动整个技术行业的革新和进步。

 

英伟达(老黄团队)正致力于实现数字人的愿景,这一想法与Sam Altman不谋而合。他们认识到,尽管文字或语音prompt为AI提供了指令方式,但更自然、类人的交互方式仍是许多应用所需。GPT-4o虽展现了出色的类人交互能力,但缺乏一个“实体”或“躯壳”。

 

老黄提出,品牌大使甚至无需是真人,AI数字人完全能胜任这一角色。从客户服务到广告、游戏等行业,数字人都有着巨大的潜力。通过连接Gen AI的CG技术,能够实时渲染出高度逼真的人类面部,实现低延迟的数字人处理,覆盖全球100多个地区。

 

英伟达计划通过其ACE平台,在1亿台RTX AI个人电脑和笔记本电脑上部署相关微服务,其中包括专为设备设计的Nemotron-3 4.5B小语言模型,以及即将推出的NVIDIA Audio2Gesture技术,能够根据音轨生成身体手势。

 

老黄坚信,数字人类将彻底改变各个行业,而英伟达ACE提供的多模态LLM和神经图形学的突破,正推动我们走向一个意图驱动计算的未来,届时与计算机的交互将如同与人类的交互一样自然。

 

英伟达即将推出的新一代芯片Rubin和Blackwell系列,再次证明了该公司在AI超算技术栈的搭建上的全面布局。其技术栈涵盖了CPU、GPU芯片,高效的NVLink GPU通信技术,以及由NIC和交换机组成的先进服务器网络。这意味着,客户完全可以选择使用英伟达的全套技术来搭建整个数据中心。

 

如此完整且全面的技术栈足以展示英伟达的实力与野心。然而,老黄却强调,为了跟上GenAI技术的飞速发展,英伟达的迭代速度还需进一步加快。不久前,英伟达已经宣布将GPU的迭代周期从两年缩短至一年,以加速推动技术边界的拓展。

 

在今天的演讲中,老黄再次确认了GPU的年度更新计划,并坦言自己可能会因此感到后悔。但无论如何,这一决策已经明确,我们即将迎来Blackwell Ultra的发布,并在明年迎来新一代的Rubin系列芯片。英伟达正以其不懈的努力和前瞻的视野,推动着AI技术的持续进步。

 

从模拟地球到具身AI机器人的崛起

 

英伟达正引领一场前所未有的技术革命,不仅发布了尖端芯片和超算服务器,还推出了震撼人心的数字孪生地球项目——“Earth-2”。这一项目不仅是对地球的全面模拟,更是对未来气候变化和极端天气预测的雄心壮志。Earth-2结合先进的AI模型和数值模拟技术,能以前所未有的精度和速度预测天气变化,助力我们更好地应对气候变化。

 

但英伟达的步伐并未止步于此。他们大胆预测,下一个AI浪潮将是物理AI或具身AI的崛起。这类机器人不仅具备高度的认知能力,理解人类和物理世界,更拥有强大的行动力,能够执行各种现实任务。想象一下,未来的世界充满了能够自主交流、协作的机器人,它们将无处不在,完成各种复杂任务。

 

为了实现这一愿景,英伟达推出了Omniverse平台,为机器人提供一个“健身房”,在遵循物理规律的数字孪生世界中不断试错、学习。这一平台集成了AI模型、物理模拟和实时渲染技术,为机器人的训练提供了理想的环境。同时,英伟达还提供从操作系统到芯片的全栈产品,确保AI机器人时代的顺利到来。

 

在演示的最后,九个与英伟达创始人黄仁勋身高相同的机器人亮相,生动展现了AI机器人时代的可能性。正如黄仁勋所言:“这不是未来,这一切都正在发生。”英伟达正以其创新的技术和全面的产品布局,引领我们迈向一个充满智能机器人的新时代。

 

back top