保存训练好的机器学习模型
当我们训练好一个model后,下次如果还想用这个model,我们就需要把这个model保存下来,下次直接导入就好了,不然每次都跑一遍,训练时间短还好,要是一次跑好几天的那怕是要天荒地老了。
sklearn官网提供了两种保存model的方法:
1.使用python自带的pickle
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| from sklearn.ensemble import RandomForestClassifier from sklearn import datasets import pickle
(X,y) = datasets.load_iris(return_X_y=True) rfc = RandomForestClassifier(n_estimators=100,max_depth=100) rfc.fit(X,y) print(rfc.predict(X[0:1,:]))
f = open('saved_model/rfc.pickle','wb') pickle.dump(rfc,f) f.close()
f = open('saved_model/rfc.pickle','rb') rfc1 = pickle.load(f) f.close() print(rfc1.predict(X[0:1,:]))
|
2.使用sklearn中的模块joblib
使用joblib模块更加的简单了,内核代码就两行
1 2 3 4 5 6 7 8 9 10 11 12 13
| from sklearn.ensemble import RandomForestClassifier from sklearn import datasets from sklearn.externals import joblib
(X,y) = datasets.load_iris(return_X_y=True) rfc = RandomForestClassifier(n_estimators=100,max_depth=100) rfc.fit(X,y) print(rfc.predict(X[0:1,:]))
joblib.dump(rfc, 'saved_model/rfc.pkl')
rfc2 = joblib.load('saved_model/rfc.pkl') print(rfc2.predict(X[0:1,:]))
|
参考文章
无