你的位置:开云官网切尔西赞助商(2025已更新(最新/官方/入口) > 新闻动态 >
发布日期:2025-10-17 09:08 点击次数:98
快科技8月29日音问,NVIDIA日前发布了2季度财报,事迹依然暴涨,新一代AI显卡Blackwell系列中的最英雄GB300本年4季度也会崇拜上市,下下代的Rubin有6款产物正在鼓动。
GB300的详备规格不错参考之前的著作,这里要来看一个可能影响中好意思AI手艺的变化,那即是在算法选拔上,国产的AI跟NVIDIA还是有了差异,前者选拔的是UE8M0 FP8,而在Blackwell上NVIDIA强化的是NVFP4模范。
UE8M0 FP8这几天引爆了国产算力行业,这是Deepseek 3.1崇拜问世时DS官方公布的音问,称UE8M0 FP8还是全面适配行将发布的新一代国产AI芯片。
天然莫得专指哪家厂商,可是华为昇腾、摩尔线程、砺算科技、芯原科技、海光科技等厂商的新一代算力芯片险些王人会因循这个模范。
比较之前国产AI算力芯片主次第受FP16+INT8的算法模范,UE8M0 FP8带来的刚正好多,性能是之前的2-3倍,况兼大幅裁汰显存压力,还能裁汰功耗,具体就要看各大厂商的达成了。
那手脚AI一哥的NVIDIA呢?比较国内AI范围率先有DS这种模子厂商来协同算法模范的情况,NVIDIA这几年一直以算力芯片上游厂商的身份来推动模范,FP64、FP32、FP16、INT8、FP8等模范王人是因循的,而在Blackwell架构上,NVIDIA也因循FP4、MXFP4这两种模范,但重心推的是NVFP4,它跟E2M1 FP4结构差未几,但精度险些莫得若干圆寂。
NVFP4模范的优点有哪些?领先来看性能上的,GB300的纷乱性能大幅培植了50%而来到15PFlops,要知说念它跟GB200基本架构可没什么变化。
50%的性能培植大略不够惊东说念主,那再来望望精度变化。
与FP8的基准比较,NVFP4在DS 0528的模子精度上险些合手平,大部分过时不到1个百分点,AIME 2024中致使还跨越了2个百分点。
在内存使用上,NVFP4与FP16比较占用减少了3.5倍,比较FP8也减少了1.8倍,而GB300显卡HBM容量也从GB200的186GB培植到了288GB,一样的NVL72机柜中,系统的总内存容量可达40TB,能因循3000亿参数的大模子。
第三个上风则是在能效上,GB300在NVFP4的因循下,每Token的能量耗尽惟有0.2J,GB200则是0.4J,H100架构的H100是10J,比较之下培植了50倍的能效。
随意来说,NVIDIA此次主导的NVFP4算法模范性能培植了50%,精度比FP8险些莫得圆寂,内存占用大幅减少2-3倍,能效则是50倍培植。
有计划到NVIDIA的影响力,NVFP4澄澈会成为前沿大模子凡俗使用的算法模范,国内大厂应该也会大范畴使用。
但在国产AI芯片上,UE8M0 FP8也还是成为新一代AI芯片的模范,尽管它还不成高出NVIDIA的CUDA生态,可是这澄澈亦然国产AI软件及硬件范围的一次紧要协同,一样有契机杀出重围,大略也能打造出我方的上风范围呢,一切王人有可能。
【本文截止】如需转载请务必注明出处:快科技
包袱剪辑:宪瑞开yun体育网
著作实质举报 ]article_adlist--> 声明:新浪网独家稿件,未经授权辞谢转载。 -->