zoukankan      html  css  js  c++  java
  • 利用Python进行数据分析学习记录(一)

    1、Python的科学计算邮件列表

      pydata:这是一个Google Group邮件列表,其中的问题都是Python数据分析和pandas方面的。

      pystatsmodels:针对Numpy相关的问题

      numpy-discussion:针对Numpy相关的问题

      scipy-user:针对与scipy和Python科学计算相关的问题

           探讨会:PyCon和EuroPython

    2、引入惯例

    import numpy as np
    import pandas as pd 
    import matplotlib.pyplot as plt

    在Python软件开发过程中,不建议直接引入Numpy这种大型库的全部内容

    3、编程和数据科学方面的常用术语

      数据规整(Munge/Munging/Wrangling):

      指的是将非结构化和(或)散乱数据处理为结构化或整洁形式的整个过程。

      伪代码(Pseudocode):

      算法或过程的代码式描述,而这些代码本身并不是实际有效的源代码。

      语法糖(syntactic  sugar):

      一种编程语法,它并不会带来新的特性,但却能让代码易读,更易写。

    4.读者各自工作的最终目的千差万别,但基本都需要完成以下几个大类的任务:

      与外界进行交互:读写各种各样的文件格式和数据库

      准备:对数据进行清理、修整、整合、规范化、重塑、切片切块、变形等处理以便进行分析。

      转换:对数据集做一些数学和统计运算以产生新的数据集。比如说,根据分组变量对一个大表进行聚合。

      建模和计算:将数据跟统计模型、机器学习算法或其他计算工具联系起来。

      展示:创建交互式的或静态的图片或文字摘要。

    第一章的例子只看了bit.ly的1.usa.gov例子,其余的都看不懂,先不看了

  • 相关阅读:
    第14章 位图和位块传输_14.1-14.3 位图基础
    第13章 使用打印机_13.2 打印图形和文字
    第13章 使用打印机_13.1 打印基础
    第12章 剪贴板_12.3 实现一个剪贴板查看器
    第12章 剪贴板_12.2 剪贴板的高级用法
    第12章 剪贴板_12.1 剪贴板的简单用法
    第11章 对话框_11.3 通用对话框
    第11章 对话框_11.2 非模态对话框
    第11章 对话框_11.1 模态对话框
    第5章 作业和进程池(2)
  • 原文地址:https://www.cnblogs.com/sggggr/p/11870131.html
Copyright © 2011-2022 走看看