独立测试与交叉测试的区别在于数据的划分,不在于是否寻优。
算法:比如随机森林
模型:比如使用随机森林,进行参数寻优,在一组特定数据中训练得到最优参数的算法(模型只接触过训练集)
评价模型:使用测试集评价,有独立测试、交叉测试。
独立测试:将数据集单次划分为训练集和测试集,训练集用于训练,测试集用于测试最后模型好坏结果。一般,训练集0.75,测试集0.25。
交叉测试(Cross-Validation):也就是交叉验证,比如常见的 k 折交叉验证,将数据集先划分为 K 份,比较常见的为 5 或 10 份,一份数据作为测试集,另外几份作为训练集,循环五次,即每一份数据都作为过测试集,也就是会得到五个模型精度,取均值作为该算法的评价。五折交叉中训练集比例为 4/5,即 0.8,交叉测试训练集比例高于独立测试,所以交叉测试结果会比独立测试结果好。


参考文章
无