模型量化PTQ与QAT原理对比

Question

模型量化通过降低参数精度减少模型大小和加速推理。请解释后训练量化（PTQ）和量化感知训练（QAT）的原理、适用场景，以及INT4和INT8的对比。。AI 面试题

我是大山 · Accepted Answer

模型量化（Quantization）将浮点参数映射到更低精度的整数表示，是模型部署中最重要的压缩技术。 量化基本原理： 对称量化：q = round(x / s)，其中s= max(|x|) / (2^{n-1}-1)。 非对称量化：q = round((x - min) / s)，利用整个量化范围。 PTQ（Post-Training Quantization）： 在模型训练完成后进行量化，不需要重新训练。 流程： 使用一小部分校准数据（Calibration Data，如几百张图片）前向传播。 收集每层激活值的统计信息（min, max或直方图分布）。 计算缩放因子s和零点z。 将权重和激活映射到INT8/INT4。 优点：无需训练，速度快，操作简单。 缺点：对大模型精度损失较大（尤其是激活值分布不均匀时）。 适用：快速部署、资源受限场景、对精度要求不高的任务。 QAT（Quantization-Aware Training）： 在训练/微调过程中模拟量化效果，让模型适应量化噪声。 流程： 在前向传播中插入FakeQuantize节点（模拟量化-反量化）。 反向传播使用Strai...

模型量化PTQ与QAT原理对比

回答

我是大山