zoukankan      html  css  js  c++  java
  • 4月份大数据学习

    四月份大数据学习

    Import numpy as np

    三维数组:几个二维数组(3个2行5列)

    Pandas:

    series一维的数据结构

    data:传入的数据

    Index:索引

    Ser = pd.series([1,2,3,4,5])

    指定索引:Ser = pd.series([1,2,3,4,5],

    Index=[‘a’,’b’,’c’,’d’,’e’])

    Ser.index获取索引

    Ser.values获取值

    运算:ser*2(只会改变值)

    Dataframe二维的数据结构(若干个series组成)

    Index表示行标签

    Columns表示列标签

    Type(arr) 查看返回结果类型

    #创建数组

    demo_arr=np.array([['a', 'b', 'c'],['d', 'e', 'f']])

    #基于数组创建DataFrame对象

    df_obj = pd.DataFrame(demo_arr)

    df_obj [‘No4’]=(‘g’,’h’) 增加No4列的数据

    Del df_obj [‘No3’] 删除No3列

    重置索引reindex():

    method参数:

    Ser_obj2 = ser_obbj.reindex([‘a’,’b’,’c’,’d’,’e’,’f’])

    Ser_obj2

    Out[]:

    a 3.0

    B 4.0

    C 1.0

    D 2.0

    E 5.0

    F NaN

    ser_obj.reindex(['a', 'b', 'c', 'd', 'e', 'f'],fill value=6)

    向前向后填充:

    ser_obj = pd.Series([1,3,5,7],index=[0,2,4,6])

    ser_obj.reindex(range(6),method='ffill') 向前填充

    ser_obj.reindex(range(6),method='bfill') 向后填充

    MultiIndex.from_tuples():将元组列表转换为MultiIndex

    MultiIndex.from_arrays():将数组列表转换为MultiIndex

    MultiIndex.from_product():从多个集合的笛卡尔乘积中创建一个MultiIndex

    Matplotlib基本库——>2D

    数据可视化:

    常见的图表形式(直方图、折线图、条形图、柱形图、饼图、散点图、箱型图)

    pyplot模块

    Figure()对象

  • 相关阅读:
    ReentrantLock-公平锁、非公平锁、互斥锁、自旋锁
    行动的阻碍
    AQS-等待队列
    AQS-volatile、CAS
    UML类图符号
    最小堆
    红黑树
    Java面试题-Collection框架
    Java面试题-Java特性
    Qt QString中文 char* UTF-8 QByteArray QTextCodec unicode gb2312 GBK 乱码和转码问题
  • 原文地址:https://www.cnblogs.com/PITENG/p/14721914.html
Copyright © 2011-2022 走看看