英伟达深夜炸场世界最强AI芯片H200震撼发布性能飙升90%

TAG标签| 网站地图| 收藏本站

返回首页

最后编辑时间：2023-11-14 20:32:17 来源：未知作者：未知阅读量：未知

　　不仅如此，这两款芯片还是互相兼容的。这意味着，使用H100训练/推理模型的企业，可以无缝更换成最新的H200。

　　全世界的AI公司都陷入算力荒，英伟达的GPU已经千金难求。英伟达此前也表示，两年一发布的架构节奏将转变为一年一发布。

　　同在明年，英伟达还会发布基于Blackwell架构的B100，并计划在2024年将H100的产量增加两倍，目标是生产200多万块H100。

　　而在发布会上，英伟达甚至全程没有提任何竞争对手，只是不断强调「英伟达的AI超级计算平台，能够更快地解决世界上一些最重要的挑战。」

　　随着生成式AI的大爆炸，需求只会更大，而且，这还没算上H200呢。赢麻了，老黄线GB超大显存，性能直接翻倍！

　　它基于Hopper架构，配备英伟达H200 Tensor Core GPU和先进的显存，因此可以为生成式AI和高性能计算工作负载处理海量数据。

　　要利用生成式人工智能和高性能计算应用创造智能，必须使用大型、快速的GPU显存，来高速高效地处理海量数据。借助H200，业界领先的端到端人工智能超算平台的速度会变得更快，一些世界上最重要的挑战，都可以被解决。

　　跟前代架构相比，Hopper架构已经实现了前所未有的性能飞跃，而H100持续的升级，和TensorRT-LLM强大的开源库，都在不断提高性能标准。

　　H200的发布，让性能飞跃又升了一级，直接让Llama2 70B模型的推理速度比H100提高近一倍！

　　H200基于与H100相同的Hopper架构。这就意味着，除了新的显存功能外，H200还具有与H100相同的功能，例如Transformer Engine，它可以加速基于Transformer架构的LLM和其他深度学习模型。

　　当用H200代替H100，与英伟达Grace CPU搭配使用时，就组成了性能更加强劲的GH200 Grace Hopper超级芯片——专为大型HPC和AI应用而设计的计算模块。

　　对于模拟、科学研究和人工智能等显存密集型HPC应用，H200更高的显存带宽可确保高效地访问和操作数据，与CPU相比，获得结果的时间最多可加快110倍。

　　这次，英伟达更是在官方公告中宣布了全新的H200和B100，将过去数据中心芯片两年一更新的速率直接翻倍。

　　以推理1750亿参数的GPT-3为例，今年刚发布的H100是前代A100性能的11倍，明年即将上市的H200相对于H100则有超过60%的提升，而再之后的B100，性能更是望不到头。

　　云服务方面，除了英伟达自己投资的CoreWeave、Lambda和Vultr之外，亚马逊云科技、谷歌云、微软Azure和甲骨文云基础设施，都将成为首批部署基于H200实例的供应商。

　　这台超级计算机将成为欧洲第一台超大规模超级计算机，是欧洲高性能计算联合项目（EuroHPC Joint Undertaking）的一部分。

　　它能提供93 Exaflops的低精度AI算力和1 Exaflop的高精度（FP64）算力。这台超级计算机预计将于2024年安装完毕。

　　作为世界最大超算中心之一的德克萨斯高级计算中心，也将采用英伟达的GH200构建超级计算机Vista。

　　此外，布里斯托大学将在英国政府的资助下，负责建造英国最强大的超级计算机Isambard-AI——将配备5000多颗英伟达GH200超级芯片，提供21 Exaflops的AI计算能力。

　　而英特尔也摩拳擦掌，计划提升Gaudi AI芯片的HBM容量，并表示明年推出的第三代Gaudi AI芯片将从上一代的 96GB HBM2e增加到144GB。

　　要知道，一块H100的售价，在25000美元到40000美元之间。训练AI模型，至少需要数千块。

　　Sam Altman否认了在训练GPT-5，但却提过「OpenAI的GPU严重短缺，使用我们产品的人越少越好」。

(责任编辑：管理)

随机内容