Nvidia公布Blackwell平台AI推论Llama 2运行性能,为前代GPU 4倍
支付動態 · 2024-08-29

Nvidia公布下一代GPU架构Blackwell的运行性能,宣称运行Llama 2模型的性能是前代产品的4倍

Nvidia

Nvidia昨(28)日公布财报,并公布下一代GPU架构Blackwell的运行性能,宣称运行Llama 2的性能是前代产品的4倍。

Nvidia希望趁财报,为其预计第4季上市的Blackwell平台芯片包括B100、B200暖场,但报导指出,新芯片因设瑕疵,推出时程可能会延迟到2025年第2季。

Nvidia宣称,在最新的MLPerf Inference 4.1标竿测试中,Nvidia平台做过所有数据中心的测试,其中Blackwell平台产品运行MLPerf最大的LLM工作负载Llama 2 70B的测试性能,比前一代Nvidia H100 Tensor Core GPU快高达4倍,这要拜第二代Transformer人工智能引擎和FP4精度的Tensor Core内核所赐。

最新的MLPerf标竿测试加入新的测试项目。其中包含专家混合(Mixture of Experts,MoE)模型,特别是Mixtral 8x7B模型。MoE模型之所以大行其道,是因为可支持多种任务、回答多种问题的企业开发需求,而且由于每次推论只需启动几个专家(而非整个模型),性能也更高。另一方面,LLM的推论应用持续增长,也推升对运算的需求,使多GPU(multi-GPU)运算成为必要。

有鉴于此,Nvidia指出,前代Hopper架构为基础的Nvidia NVLink互连技术和NV Switch芯片已经支持大型模型的即时推论。而新一代的Blackwell平台将进一步以72颗GPU及更大的NVLink网域扩展NV Switch芯片的能力。

除了新Blackwell架构,Nvidia并宣称其H200 GPU搭载推论软件Triton Inference Server在最近一次MLPerf测试表现,比前一次提升27%。而在边缘运算平台上,NVIDIA Jetson AGX Orin SOM(system-on-modules)在运行GPT-J LLM模型的测试中,传输量提升6.2倍,而延迟性则改善2.4倍。Nvidia表示,这性能表现让Jetson平台很适合于本地运行LLM、视觉transformer模型及Stable Diffusion模型等任务。

热门文章
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
BETFAIR 网络攻击80万用户资料泄露
游戏风向
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
首页
游戏
合作
发现
我的