编辑
2025-02-05
momen炼丹日记
0

注意

本篇文章仅为估算所需部署模型需要的显存,实际结果可能不一致。

一个INT8参数需要1个字节

1B(十亿)参数需要多少?

看到以上问题,你可能大致明白怎么算了。

1G显存=1024MB=1024²KB=1024³Byte=1,073,741,824Byte 1B参数需要字节数=10亿参数*每参数1Byte=10亿byte 那么1B参数所需显存=1B参数需要字节数/1G显存=10亿byte➗1,073,741,824=0.9313225G

结论:所以1B参数大概需要1G显存。

但是1B参数可以有很多精度。

float32(fp32)需要4字节

fp16/bf16需要2字节

int8需要1个字节

int4需要0.5个字节

结论得出1B模型所需显存大小(预测):

精度所需存大小
float32(fp32)4G
fp16/bf162G
int81G
int40.5G

突🐔检查:

8B int4模型所需大小:8G*0.5G=4G

本文作者:墨洺的文档

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!