zoukankan      html  css  js  c++  java
  • 「数据挖掘入门系列」Python快速入门

    Python环境搭建

    本次入门系列将使用Python作为开发语言。要使用Python语言,我们先来搭建Python开发平台。我们将基于Python 2.7版本、以及Python的开发发行版本Anaconda版本来开发。

    Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。

    下载地址:

    https://www.anaconda.com/distribution/,注意要下载2.7版本

    image

    下载好Anaconda安装包后,即可安装,安装好后,我们可以来测试下Python环境是否已经搭建好。

    image

    Python语言入门

    本小节将简单介绍Python语言,此处不会涉及过多的Python语言细节。例如:面向对象之类。此处主要介绍后续学习数据挖掘过程中会使用到的语法。

    Hello Python

    此案例将在控制台上打印 Hello, Python。

    1、创建一个文本文件,并命名为hello_python.py

    2、编写以下内容

    # 打印字符串
    print 'hello, python'

    3、在命令行中执行命令 python hello_python.py

    多重赋值

    Python中支持多重赋值

    # -*- coding: utf-8 -*
    # 多重赋值
    zhangsan, lisi, wangwu = u'张三', u'李四', u'王五'
    print zhangsan, lisi, wangwu

    注意:

    • 在python中要使用中文,需要在文件头上加入 # -*- coding: utf-8 –*
    • 字符串应该使用 u开头

    条件判断

    python条件判断可以使用 if …. elif … else,但逻辑条件使用 and、or。Python一般不使用花括号,而使用缩进对齐来作为区分。参考以下代码:

    '''
    案例三:
    定义变量 username 和 password
    1. 如果 username 为 abc,且password为 123, 打印 正确
    2. 如果 username 不为 abc,打印用户名错误
    3. 如果 password 不为 123,打印密码错误
    '''
    username = 'abc'
    password = '123'
    
    if username == 'abc' and password == '123':
        print u'正确'
    else:
        if username != 'abc':
            print u'用户名错误'
        else:
            print u'密码错误'

    for循环

    # 打印 1-10之间的数字
    for i in range(1, 11):
        print i

    函数

    在Python可以使用def或者lambda表达式来定义函数:

    # 定义一个函数计算两个数字的和
    def add(a, b):
        return a + b
        
    # 调用函数
    print add(1, 1)
    
    print '==' * 10
    
    # 使用 lambda表达式定义函数
    add_lambda = lambda x,y: x + y
    print add_lambda(1, 1)

    集合

    以下代码演示列表、元组、字典的使用

    # 定义列表
    list1 = [1,2,3,4,5]
    # 定义元组
    tuple1 = (1,2,3,4)
    # 定义字典
    dict1 = {'zhangsan':20, 'lisi': 30}
    
    print list1
    print tuple1
    print dict1

    注意:元组的元素是不可以被修改的。

    可以使用 []来访问集合的元素

    函数式编程

    Python支持函数式编程,编写起来也很方便

    # 函数式编程
    # 1. 初始化一个集合,包含数字从1-10
    list2 = range(1, 11)
    # 2. 对每一个数字 +1
    list3 = map(lambda n:n+1, list2)
    print list3
    # 3. 过滤集合中所有能够整除2的数字
    list4 = filter(lambda n: n%2==0, list2)
    print list4

    使用库函数

    Python中需要使用到外部的函数,可以使用import关键字来导入库函数

    # 导入库
    import math
    
    print math.pi
    print math.sin(1)
    
    # 给math库取一个别名
    import math as m
    
    print m.pi

    添加第三方库

    要使用Python进行数据挖掘开发,需要提前安装第三方库。Python中有非常丰富的第三方库。使用以下方式可以非常简便地安装第三方库。

    使用pip安装。以下将演示使用pip来安装各类数据分析工具。

    Numpy

    Numpy实现了真正的数组功能。很多高级的库都依赖该库。我们可以使用pip来安装它。

    pip install numpy

  • 相关阅读:
    基数排序
    计数排序和桶排序
    部署Java Web项目到云服务器的步骤全解析
    IP地址0.0.0.0/0是什么意思
    Tomcat在阿里云Centos7上正常启动,但浏览器无法访问的解决方法
    eclipse光标怎么返回上一次浏览的位置
    IDEA设置方法自动显示参数提示
    socket通信模型、socket中的accept()阻塞与read()阻塞
    Ubuntu18.04 下修改 root密码
    Ubuntu18.04 安装 VMwareTools
  • 原文地址:https://www.cnblogs.com/ilovezihan/p/12240711.html
Copyright © 2011-2022 走看看