zoukankan      html  css  js  c++  java
  • python小随笔

    关于pip安装

     .pip.exe install --ignore-installed --upgrade tensorflow-gpu   

     python可视化库

    • Seaborn:是一个基于matplotlib的高级可视化效果库,针对的点主要是数据挖掘和机器学习中的变量特征选取,seaborn可以用短小的代码去绘制描述更多维度数据的可视化效果图。(用来对Titanic数据集来进行分析)

    pandas

    user[user['user_id']==10001082]  #特定查询  

    train.Survived.value_counts()  #pandas 可以直接 .列名

    Survived_0 = data_train.Pclass[data_train.Survived == 0].value_counts()  #进阶

     https://www.cnblogs.com/chaosimple/p/4153083.html   pandas十分钟

    train.Survived.value_counts().plot(kind='bar')   #可以直接在matplotlib里画图

     get_dummies获取某一列的one-hot向量

    boolean索引

    pandas 10 十分钟入门系列 

    https://www.cnblogs.com/chaosimple/p/4153083.html

    创建

     dataframe对象创建:传入numpy , 字典对象也可以

    参看数据
    选择  有标签方法,位置方法,布尔方法

    http://blog.csdn.net/xw_classmate/article/details/51333646

     缺失值处理

     . Apply对数据应用函数

    .str 使用字符串函数

    合并 

     Concat基本的合并     Join 类似于SQL类型的合并(按照主键)    Append 将一行连接到一个DataFrame上,

    分组

    对于”group by”操作,我们通常是指以下一个或多个操作步骤:

    l  (Splitting)按照一些规则将数据分为不同的组;

    l  (Applying)对于每组数据分别执行一个函数;

    l  (Combining)将结果组合到一个数据结构中;

    Categorical  

    高级操作:

    统计两个key关于第三个key的值

    层次化索引(hierarchical index)是pandas的重要功能,这能使在一个轴上拥有两个以上的索引级别。抽象点说,它能使你以低维度形式处理高维度。

    https://www.cnblogs.com/batteryhp/p/5006274.html

    matplotlib

    import matplotlib.pyplot as plt
    fig = plt.figure()
    fig.set(alpha=0.2)  # 设定图表颜色alpha参数
    
    plt.subplot2grid((2,3),(0,0))             # 在一张大图里分列几个小图
    data_train.Survived.value_counts().plot(kind='bar')# 柱状图 
    plt.title(u"获救情况 (1为获救)") # 标题
    plt.ylabel(u"人数")  
    
    plt.subplot2grid((2,3),(0,1))
    data_train.Pclass.value_counts().plot(kind="bar")
    plt.ylabel(u"人数")
    plt.title(u"乘客等级分布")
    
    plt.subplot2grid((2,3),(0,2))
    plt.scatter(data_train.Survived, data_train.Age)
    plt.ylabel(u"年龄")                         # 设定纵坐标名称
    plt.grid(b=True, which='major', axis='y') 
    plt.title(u"按年龄看获救分布 (1为获救)")
    
    
    plt.subplot2grid((2,3),(1,0), colspan=2)
    data_train.Age[data_train.Pclass == 1].plot(kind='kde')   
    data_train.Age[data_train.Pclass == 2].plot(kind='kde')
    data_train.Age[data_train.Pclass == 3].plot(kind='kde')
    plt.xlabel(u"年龄")# plots an axis lable
    plt.ylabel(u"密度") 
    plt.title(u"各等级的乘客年龄分布")
    plt.legend((u'头等舱', u'2等舱',u'3等舱'),loc='best') # sets our legend for our graph.
    
    
    plt.subplot2grid((2,3),(1,2))
    data_train.Embarked.value_counts().plot(kind='bar')
    plt.title(u"各登船口岸上船人数")
    plt.ylabel(u"人数")  
    plt.show()

     matplotlib  user guide

    Line Plot  plot().

     多个子图

    time  datatime 等时间包的使用

    datatime https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431937554888869fb52b812243dda6103214cd61d0c2000

    https://www.cnblogs.com/snow-backup/p/5063665.html

  • 相关阅读:
    cubestore driver 添加auth认证
    cubestore 添加auth 认证
    基于s3 扩展cubestore
    cube.js 预聚合检查
    cube.js 集成cubestore 时间格式问题的一些说明
    cube.js 集成cubestore 时间格式问题
    Building a GraphQL to SQL Compiler on Postgres, MS SQL and MySQL
    支持minio cubestore docker 镜像
    数据治理怎么做
    使用project制定项目计划可以分为六个步骤
  • 原文地址:https://www.cnblogs.com/bigjelly/p/7617244.html
Copyright © 2011-2022 走看看