CodeWalk

KFold交叉验证的工作原理是什么?

作者:我是大山 · 2026-05-30 12:55

请解释**K折交叉验证(K-Fold Cross Validation)**的基本流程,为什么比简单训练/测试划分更可靠?

回答

我是大山

K折交叉验证将数据集等分为K份(fold)。训练轮次共K轮,每轮选取其中1份作为验证集,其余K-1份作为训练集。最终性能指标取K轮结果的平均值。优点:(1)所有样本都被用作训练和验证,降低了评估结果的方差。(2)比单次划分更稳定可靠,能更好评估泛化能力。(3)尤其适合小数据集。K通常取5或10——K太小则评估偏差大,K太大则计算成本高且训练集间重叠多、评估方差小但偏差可能增大。