zoukankan      html  css  js  c++  java
  • 保存训练好的机器学习模型

    保存训练好的机器学习模型

            当我们训练好一个model后,下次如果还想用这个model,我们就需要把这个model保存下来,下次直接导入就好了,不然每次都跑一遍,训练时间短还好,要是一次跑好几天的那怕是要天荒地老了。。sklearn官网提供了两种保存model的方法:官网地址

      1.使用python自带的pickle

    from sklearn.ensemble import RandomForestClassifier
    from sklearn import datasets
    import pickle
    
    #方法一:python自带的pickle
    (X,y) = datasets.load_iris(return_X_y=True)
    rfc = RandomForestClassifier(n_estimators=100,max_depth=100)
    rfc.fit(X,y)
    print(rfc.predict(X[0:1,:]))
    #save model
    f = open('saved_model/rfc.pickle','wb')
    pickle.dump(rfc,f)
    f.close()
    #load model
    f = open('saved_model/rfc.pickle','rb')
    rfc1 = pickle.load(f)
    f.close()
    print(rfc1.predict(X[0:1,:]))

    2.使用sklearn中的模块joblib 
    使用joblib模块更加的简单了,核心代码就两行

    from sklearn.ensemble import RandomForestClassifier
    from sklearn import datasets
    from sklearn.externals import joblib
    #方法二:使用sklearn中的模块joblib
    (X,y) = datasets.load_iris(return_X_y=True)
    rfc = RandomForestClassifier(n_estimators=100,max_depth=100)
    rfc.fit(X,y)
    print(rfc.predict(X[0:1,:]))
    #save model
    joblib.dump(rfc, 'saved_model/rfc.pkl')
    #load model
    rfc2 = joblib.load('saved_model/rfc.pkl')
    print(rfc2.predict(X[0:1,:]))

    这两个方法都可以,但是更推荐用第二种,即joblib,因为根据官网介绍,速度更快。 

  • 相关阅读:
    light oj 1007
    51nod 1298 圆与三角形
    codeforces 899C Dividing the numbers
    zznu 1996 : 正三角形和圆的爱情
    zznu 2081 : 舰队管理
    zzun 2076 : 三花聚顶神功
    zznu 2054 : 油田
    机械设备--第九届省赛--深搜
    设计模式-单例模式、工厂模式
    Spring Boot 遇到空指针
  • 原文地址:https://www.cnblogs.com/caiyishuai/p/13270935.html
Copyright © 2011-2022 走看看