LoRA与QLoRA微调原理详解

Question

请详细解释LoRA和QLoRA的微调原理。LoRA如何用低秩矩阵近似权重更新？rank/alpha/target_modules如何选择？。AI 面试题。Meta 面试题

专业代码师 · Accepted Answer

LoRA：冻结预训练权重，注入低秩矩阵A和B。 W' = W + alpha/r * BA，r << min(d,k)

参数选择：r=4-8(简单任务)，16-64(复杂任务) target_modules：通常Q/K/V投影矩阵 alpha：r的2-4倍

QLoRA额外优化：

7B模型QLoRA仅需~4GB显存+160MB LoRA权重。

回答