zoukankan      html  css  js  c++  java
  • python小随笔

    关于pip安装

     .pip.exe install --ignore-installed --upgrade tensorflow-gpu   

     python可视化库

    • Seaborn:是一个基于matplotlib的高级可视化效果库,针对的点主要是数据挖掘和机器学习中的变量特征选取,seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果图。(用来对Titanic数据集来进行分析)

    pandas

    user[user['user_id']==10001082]  #特定查询  

    train.Survived.value_counts()  #pandas 可以直接 .列名

    Survived_0 = data_train.Pclass[data_train.Survived == 0].value_counts()  #进阶

     https://www.cnblogs.com/chaosimple/p/4153083.html   pandas十分钟

    train.Survived.value_counts().plot(kind='bar')   #可以直接在matplotlib里画图

     get_dummies获取某一列的one-hot向量

    boolean索引

    pandas 10 十分钟入门系列 

    https://www.cnblogs.com/chaosimple/p/4153083.html

    创建

     dataframe对象创建:传入numpy , 字典对象也可以

    参看数据
    选择  有标签方法,位置方法,布尔方法

    http://blog.csdn.net/xw_classmate/article/details/51333646

     缺失值处理

     . Apply对数据应用函数

    .str 使用字符串函数

    合并 

     Concat基本的合并     Join 类似于SQL类型的合并(按照主键)    Append 将一行连接到一个DataFrame上,

    分组

    对于”group by”操作,我们通常是指以下一个或多个操作步骤:

    l  (Splitting)按照一些规则将数据分为不同的组;

    l  (Applying)对于每组数据分别执行一个函数;

    l  (Combining)将结果组合到一个数据结构中;

    Categorical  

    高级操作:

    统计两个key关于第三个key的值

    层次化索引(hierarchical index)是pandas的重要功能,这能使在一个轴上拥有两个以上的索引级别。抽象点说,它能使你以低维度形式处理高维度。

    https://www.cnblogs.com/batteryhp/p/5006274.html

    matplotlib

    import matplotlib.pyplot as plt
    fig = plt.figure()
    fig.set(alpha=0.2)  # 设定图表颜色alpha参数
    
    plt.subplot2grid((2,3),(0,0))             # 在一张大图里分列几个小图
    data_train.Survived.value_counts().plot(kind='bar')# 柱状图 
    plt.title(u"获救情况 (1为获救)") # 标题
    plt.ylabel(u"人数")  
    
    plt.subplot2grid((2,3),(0,1))
    data_train.Pclass.value_counts().plot(kind="bar")
    plt.ylabel(u"人数")
    plt.title(u"乘客等级分布")
    
    plt.subplot2grid((2,3),(0,2))
    plt.scatter(data_train.Survived, data_train.Age)
    plt.ylabel(u"年龄")                         # 设定纵坐标名称
    plt.grid(b=True, which='major', axis='y') 
    plt.title(u"按年龄看获救分布 (1为获救)")
    
    
    plt.subplot2grid((2,3),(1,0), colspan=2)
    data_train.Age[data_train.Pclass == 1].plot(kind='kde')   
    data_train.Age[data_train.Pclass == 2].plot(kind='kde')
    data_train.Age[data_train.Pclass == 3].plot(kind='kde')
    plt.xlabel(u"年龄")# plots an axis lable
    plt.ylabel(u"密度") 
    plt.title(u"各等级的乘客年龄分布")
    plt.legend((u'头等舱', u'2等舱',u'3等舱'),loc='best') # sets our legend for our graph.
    
    
    plt.subplot2grid((2,3),(1,2))
    data_train.Embarked.value_counts().plot(kind='bar')
    plt.title(u"各登船口岸上船人数")
    plt.ylabel(u"人数")  
    plt.show()

     matplotlib  user guide

    Line Plot  plot().

     多个子图

    time  datatime 等时间包的使用

    datatime https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431937554888869fb52b812243dda6103214cd61d0c2000

    https://www.cnblogs.com/snow-backup/p/5063665.html

  • 相关阅读:
    poj 1789 每个字符串不同的字母数代表两个结点间的权值 (MST)
    poj 1251 poj 1258 hdu 1863 poj 1287 poj 2421 hdu 1233 最小生成树模板题
    poj 1631 最多能有多少条不交叉的线 最大非降子序列 (LIS)
    hdu 5256 最少修改多少个数 能使原数列严格递增 (LIS)
    hdu 1025 上面n个点与下面n个点对应连线 求最多能连有多少条不相交的线 (LIS)
    Gym 100512F Funny Game (博弈+数论)
    UVa 12714 Two Points Revisited (水题,计算几何)
    UVa 12717 Fiasco (BFS模拟)
    UVa 12718 Dromicpalin Substrings (暴力)
    UVa 12716 && UVaLive 6657 GCD XOR (数论)
  • 原文地址:https://www.cnblogs.com/bigjelly/p/7617244.html
Copyright © 2011-2022 走看看