zoukankan      html  css  js  c++  java
  • 数据分析中常用数据类型转换总结

    数据结构是计算机存储和组织数据的方式。Python中有三类四种内建的数据结构,分别是序列(List、Tuple)、映射(Dictionary)以及集合(Set)。

    此外,数据分析库Numpy和Pandas还提供了ndarry、Series、DataFrame等数据类型,不同的数据类型在程序中会常常遇到相互转换的情况,以便参数类型之需。

    import pandas as pd
    import numpy as np
    from pandas import Series,DataFrame
    
    
    arr = np.arange(8)
    s = Series(np.arange(8),index = list('abcdefgh'))
    df = DataFrame(np.arange(40).reshape(8,5),columns = list('abcde') ,index = range(8))
    lst = [['apple','3.5',2],['oringe','9.9','1'],['banana','4.9','1.5'],['grape','12','2']]
    #lst1 = [('apple','3.5',2),('oringe','9.9','1'),('banana','4.9','1.5'),('grape','12','2')] 
    #list转ndarry、series、dataframe类型 list_to_arr = np.array(lst) list_to_series = Series(lst,index=list('abcd')) list_to_df = DataFrame(lst,columns = ['name','price','number'],index = range(len(lst))) #ndarry转list、series、dataframe类型 arr_to_list = arr.tolist() arr_to_series = Series(arr,index = range(len(arr))) arr_to_df = DataFrame(arr,columns = ['a'],index = range(len(arr))) #series转ndarry、list、dataframe类型 series_to_arr = Series.as_matrix(s) #等价于series_to_arr = series.as_matrix() series_to_list = Series.as_matrix(s).tolist() series_to_df1= pd.DataFrame([s,s]) series_to_df2 = s.to_frame() series_to_df3 = pd.concat([s,s], axis=1) #axis=0 type为series #df转ndarry、list、series类型 df_to_arr1 = DataFrame.as_matrix(df) #df_to_arr1[:,1] #df_to_arr1[1,:] df_to_arr2 = df.values df_to_arr3 = np.array(df) df_to_list1 = np.array(df).tolist() df_to_list2 = [i[0] for i in df.values] df_to_series = df['a']
  • 相关阅读:
    [置顶] 也论百度轻应用--一个开发者的吐槽
    HDU 1506 Largest Rectangle in a Histogram
    [置顶] 搭建apache+tomcat+memcached集群环境
    (step8.2.6)hdu 1848(Fibonacci again and again——组合博弈)
    SQL2005、2008、2000 清空删除日志
    网络获取北京时间和系统时间
    C++界面库
    Cocos2d-X游戏开发之Windows7+VS2010环境搭建(亲测)
    华为面试题——一道关于指针方面的编程题(C/C++)
    java之Math
  • 原文地址:https://www.cnblogs.com/Ryana/p/7458384.html
Copyright © 2011-2022 走看看