0%

独立测试与交叉测试

独立测试与交叉测试的区别在于数据的划分,不在于是否寻优。

算法:比如随机森林

模型:比如使用随机森林,进行参数寻优,在一组特定数据中训练得到最优参数的算法(模型只接触过训练集)

评价模型:使用测试集评价,有独立测试、交叉测试。

  • 独立测试:将数据集单次划分为训练集和测试集,训练集用于训练,测试集用于测试最后模型好坏结果。一般,训练集0.75,测试集0.25。

  • 交叉测试(Cross-Validation):也就是交叉验证,比如常见的 k 折交叉验证,将数据集先划分为 K 份,比较常见的为 5 或 10 份,一份数据作为测试集,另外几份作为训练集,循环五次,即每一份数据都作为过测试集,也就是会得到五个模型精度,取均值作为该算法的评价。五折交叉中训练集比例为 4/5,即 0.8,交叉测试训练集比例高于独立测试,所以交叉测试结果会比独立测试结果好。

参考文章

+