zoukankan      html  css  js  c++  java
  • 机器学习

    结构=特征值+目标值

    数据降维:

    import pandas as pd
    from sklearn.decomposition import PCA
    
    #读取表格数据
    prior=pd.read_csv('./data/order_products__prior.csv')
    
    products=pd.read_csv('./data/products.csv')
    
    orders=pd.read_csv('./data/orders.csv')
    
    aisles=pd.read_csv('./data/aisles.csv')
    
    _mg=pd.merge(prior,products,on=['product_id','product_id'])
    
    _mg=pd.merge(_mg,orders,on=['order_id','order_id'])
    
    mt=pd.merge(_mg,aisles,on=['aisle_id','aisle_id'])
    
    mt.head(5)
    #四张表拼接成一张表
    
    #处理分段数据  所有用户 购买的全部商品一览表
    cross=pd.crosstab(mt['user_id'],mt['aisle'])
    
    cross.head(5)
    
    pca=PCA(n_components=0.9)
    #数据降维 保存百分之90的有用数据
    
    data=pca.fit_transform(cross)
    
    data.shape
  • 相关阅读:
    CSP2018-09
    CSP2018-03
    CSP2017-12
    CSP2017-09
    CSP2017-03
    CSP2016-12
    [算法设计与分析] 奶酪 (并查集)
    5555
    阿超
    结对作业
  • 原文地址:https://www.cnblogs.com/wen-kang/p/11022648.html
Copyright © 2011-2022 走看看