zoukankan      html  css  js  c++  java
  • Python 基础(四)

    原文链接:http://www.one2know.cn/python4/

    • open函数
      open(name[,mode[,buffering[,encoding]]])
      mode(访问模式):
      -1 : r(只读) w(只写,若文件存在则覆盖) a(追加) rb(二进制只读) wb(二进制只写)
      -2 : ab(二进制追加) r+,w+,a+(都是读写) rb+,wb+,ab+(都是二进制读写)
      r+,w+,a+区别
      r+ :文件的指针调到文件头部
      w+:如果文件不存在直接创建,存在覆盖源文件
      a+ :文件的指针调到文件末尾
    • 打开关闭文件
      open
    #打开文件
    file1 = open('python.txt','r')
    print(file1)
    
    #读写操作
    
    #关闭文件
    file1.close() 
    

    with open完成后自己自动关闭

    with open('python.txt','r',encoding = 'utf-8') as file1:
        content = file1.read()
        print(content)
    
    • 读文件
      read(num):读取文件内容,num表示指定长度,如果没有则读取所有数据
    file1 = open('python.txt','r',encoding = 'utf-8')
    content = file1.read() #读取数据保存在content变量当中
    print(content)
    

    readlines()按行读取,返回一个列表,每一行的数据为一个元素,换行也会转换成str格式即' '

    file1 = open('python.txt','r',encoding = 'utf-8')
    content = file1.readlines() #逐行读取内容
    print(content)
    file1.close()
    
    • 逐行读取
    1. open结合for循环
    file1 = open('python.txt','r',encoding = 'utf-8')
    i = 1
    for line in file1:
        #没有使用read,像迭代器一样节省空间
        print('这是第%d行:%s'%(i,line))
    file1.close()
    
    1. with结合for循环
    with open('python.txt','r',encoding = 'utf-8') as file1:
        i = 1
        for line in file1:
        #没有使用read,像迭代器一样节省空间
            print('这是第%d行:%s'%(i,line))
            i += 1
    
    • 写入文件write
    #以写的方式打开一个文件
    file1 = open('python.txt','w',encoding = 'utf-8') #覆盖源文件
    #file1 = open('python.txt','a',encoding = 'utf-8') #追加
    content = 'hello'
    file1.write(content)
    file.close()
    
    with open('python.txt','w',encoding = 'utf-8') as file1:
    #with open('python.txt','a',encoding = 'utf-8') as file1:
        content = 'hello'
        file1.write(content)
    
    • 常用函数
      flush 把缓冲区内容写入硬盘
      tell() 查看文件指针
    file1 = open('python.txt','r',encoding = 'utf-8')
    str = file1.read(5) #读取数据保存在content变量当中
    print('当前读取的数据是:'+str)
    
    #查看当前指针位置
    position = files.tell()
    print('当前位置是:',position)
    
    file1.close()
    

    seek(offset[,whence])设置指针位置
    offset是偏移量,whence有三个变量:0,1,2
    0:从头开始算
    1:从当前位置开始算
    2:从末尾开始算

    • 文件夹的操作,要import os模块
    import os
    #获取当前路径
    print(os.getcwd())
    
    #列出当前(默认的)或指定目录的文件和文件夹
    print(os.listdir('F:python3.7\))
    
    #判断是否是一个文件
    print(os.path.isfile('1.txt'))
    
    #判断文件是否存在
    print(os.path.exists('1.txt'))
    
    #重命名文件
    os.rename('1.txt','2.txt')
    
    #删除文件
    os.remove('2.txt')
    
    #将目录和文件分割成2个元素,作为列表输出
    os.path.split(F:python3.71.txt)
    
    #创建目录
    os.mkdir('py')
    
    #删除目录
    os.rmdir('py')
    
    • 异常处理try except else finally
    • 简单异常处理
    try:
        print(a) #如果有错,就会捕获到异常
    except ValueError:
        print('变量未定义') #ValueError对异常的处理
    except NameError:
        print('变量未定义') #NameError对异常的处理
        
    #捕获异常的具体信息
    try:
        print(a)
        file = open('a.txt','r')
    except (NameError,FileNotFoundError) as e: #异常元组,若不知道什么异常可以用基类Exception
        print(e) #打印异常的具体信息,捕捉第一个异常就输出了
    
    • else没有异常时执行的语句
    • finally不管有没有异常都执行
    • 常用模块—time模块
    import time
    
    print(time.altzone) #返回格林威治西部的夏令时地区的偏移秒数
    
    print(time.asctime()) #默认返回可读形式的当前时间
    print(time.asctime((2017,12,12,12,12,12,3,340,1))) #返回可读形式的时间,感觉没啥用啊
    
    print(time.gmtime()) #返回时间元组,格林威治时间的元组
    print(time.localtime()) #返回本地时间元组
    
    print(time.clock()) #返回进程时间,以秒为单位记时间戳
    
    print(time.ctime()) #获取当前时间
    print(time.time()) #返回当前时间的时间戳,从今年1月1日0点到现在的秒数
    
    for i in range(3):
        print(1)
        time.sleep(2) #睡眠两秒
    

    格式化时间:时间戳->时间元组->时间字符串

    import time
    times = time.time() #获取当前时间戳
    formatTime = time.localtime(times)
    print(time.strftime('%Y-%m-%d %H:%M:%S'.formatTime))
    
    #time.strptime将时间字符串转换为时间元组
    times = '2017-12-12 12:12:12'
    formatTime = time.strptime(times,'%Y-%m-%d %H:%M:%S')
    print(formatTime)
    
    #mktime将时间元组转换为时间戳
    print(time.mktime(formatTime))
    
    • 三天前的时间
      print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()-3*24*60*60)))
    • 进程与线程
    import time
    import threading
    
    #单线程
    def music(name,loop):
        for i in range(loop):
            print('listen music %s %s'%(name,time.ctime()))
            time.sleep(1)
    def movie(name,loop):
        for i in range(loop):
            print('watch movie %s %s'%(name,time.ctime()))
            time.sleep(1)  
    
    if __name__ = '__main__':
        music('music1',3)
        movie('movie2',2)
        print('end time %s'%time.ctime())
    
    #创建多线程:假多线程,不建议使用
    t1 = threading.Thread(target = music,args = ('music1',3))
    t2 = threading.Thread(target = movie,args = ('movie2',2))     
    
    if __name__ = '__main__':
        #守护主线程,主线程结束杀死子线程
        t1.setDaemon(True)
        t2.setDaemon(True)
        
        #启动线程
        t1.start()
        t2.start()
        
        #对主线程进行阻塞,等所有的子线程运行结束,再运行主线程
        t1.join()
        t2.join()
        
        print('end time %s'%time.ctime())
    
    • 全局解释锁GIL
    #加锁
    balance = 0
    def change(n):
        global balance
        balance += n
        balance -= n
        
    lock = threading.Lock() #获取线程锁
    def run_thread(n):
        for i in range(100000):
            #获取锁
            lock.acquire()
            try:
                change(n)
            finally:
                #释放锁
                lock.release()
            
    t1 = threading.Thread(target = run_thread,args = (4,))
    t2 = threading.Thread(target = run_thread,args = (8,))
    
    t1.start()
    t2.start()
    
    t1.join()
    t2.join()
    
    print(balance)
    
    • 多进程:用multiprocessing代替Thread
      单进程
    import time
    
    def work1(f,n):
        print('work1 start')
        for i in range(n):
            with open(f,'a') as fs:
                fs.write('hello
    ')
                time.sleep(1)
        print('work1 end')
        
    def work2(f,n):
        print('work2 start')
        for i in range(n):
            with open(f,'a') as fs:
                fs.write('world
    ')
                time.sleep(1)
        print('work2 end')
        
    if __name__ = '__main__':
        work1('1.txt',3)
        work2('1.txt',3)
    

    多进程加锁

    import time
    import multiprocessing
    
    def work1(f,n,lock):
        print('work1 start')
        lock.acquire()
        for i in range(n):
            with open(f,'a') as fs:
                fs.write('hello
    ')
                time.sleep(1)
        print('work1 end')
        lock.release()
        
    def work2(f,n,lock):
        print('work2 start')
        lock.acquire()
        for i in range(n):
            with open(f,'a') as fs:
                fs.write('world
    ')
                time.sleep(1)
        print('work2 end')
        lock.release()
        
    if __name__ = '__main__':
        lock = multiprocessing.Lock()
        p1 = multiprocessing.Process(target=work1,args=('1.txt',3,lock))
        p2 = multiprocessing.Process(target=work2,args=('1.txt',3,lock))
        p1.start()
        p1.start()
    
    • 进程池pool
    import os
    import multiprocessing
    import time
    
    def work(n):
        print('run work(%s),work id %s'%(n,os.getpid()))
        time.sleep(5)
        print('work(%s) stop,work id %s'%(n,os.getpid()))
    
    if __name__ = '__main__':
        print('parent process %s.'% os.getpid())
        #创建进程池
        p = multiprocessing.Pool(3)
        for i in range(5):
            #创建5个进程
            p.apply_async(work,args=(i,))
            p.close()
            p.join()
    
    • pandas数据分析包
      引入约定:
      drom pandas import Series,DataFrame 系列,帧
      import pandas as pd
      Series:类似一维数组的对象,索引值是可以重复的
      DataFrame :表格型,没列可以是不同的数据类型,既有行索引也有列索引
    • 通过一维数组创建Series
    import pandas as pd
    
    #通过一维数组创建Series
    ser01 = pd.Series([1,2,3,4])
    ser01
    print(ser01.dtype) #获取类型,输出: int32
    print(ser01.values) #获取值,输出: [1 2 3 4]
    print(ser01.index) #获取索引,输出: RangeIndex(start=0,stop=4,step=1)
    
    #设置索引 通过 index 属性
    ser01.index = ['a','b','c','d']
    ser01
    
    #也可以在创建时设置属性
    ser02 = pd.Series(np.Series(np.array([1,2,3,4]),dtype = np.float64,index = ['a','b','c','d'])
    
    #通过字典的方式创建
    ser02 = pd.Series({'a':10,'b':20,'c':30})
    ser02
    
    #获取Series
    print(ser02['a']) #通过key,输出:10
    print(ser02[0]) #通过坐标,输出:10
    print(ser02[0:2]) #类似切片,含左不含右,输出2对数据
    print(ser02['a':'c']) #类似切片,但输出3对数据
    
    • Numpy的运算Series基本都可以用
    import pandas as pd
    ser01 = pd.Series([1,2,3,4])
    ser01+1 #每个数都+1,很简单
    
    • Series缺失值处理
    ser01 = pd.Series([1,2,3])
    ser02 = pd.Series(ser01,index=['a','b','c','d'])
    ser02 #缺失的数据用NaN来代替
    ser02[pd.isnull(ser02)]
    ser02[pd.notnull(ser02)] #过滤掉缺失值
    
    • Series自动对齐:有的自动对齐,没有的自动NaN
    ser01 = pd.Series([1,2,3,4],index = ['a','b','c','d'])
    ser02 = pd.Series([10,20,30,40],index = ['e','a','b','f'])
    print(ser01+ser02)
    '''
        输出:
        a   21.0
        b   32.0
        c   NaN
        d   NaN
        e   NaN
        f   NaN
    '''
    
    • Seriesname属性
      ser01.name 总名字
      ser01.index.name 第一列索引名
    • DataFrame创建
      df01 = pd.DataFrame(['joe','susan','anne'],[70,80,90],index = ['one','two','three'],columns = ['name','score'])
      通过字典方式创建
    df01 = pd.DataFrame({
            'name':['joe','susan','anne'],  #key 变成列索引
            'age':[18,19,20],
            'class':3
    },index = ['one','two','three'])
    print(df01) #输出一个表
    
    • DataFrame 数据处理
      df01['name'] 通过列索引获取数据
      df01['address'] = ['shanghai','beijing','hangzhou'] 添加列数据
      df01.pop('address') 列删除
      df01.ix['one']行获取,古老的方法
      df01.loc['two']行获取
      df01.ix['four'] = ['batman',25,4]行修改,没这行就添加,有这行就修改
      df02 = df01.drop('four')行删除
    • pandas基本操作
    import pandas as pd
    
    #读取文件
    df01 = pd.read_csv('data1.csv') #读取csv
    print(df01)
    
    df02 = pd.read_excel('data1.xlsx') #读取excel
    print(df02)
    
    df03 = pd.read_csv('data1.txt',sep = ';',header = None) 
    #读取txt,sep表示用什么分割,header=None表示不用第一排作为列索引
    print(df03)
    
  • 相关阅读:
    概率密度函数 通俗理解
    宋浩《概率论与数理统计》笔记---2.2.2、连续型随机变量及其概率密度函数
    宋浩《概率论与数理统计》笔记---2.2.1、离散型随机变量及其概率分布
    宋浩《概率论与数理统计》笔记---2.1、随机变量的概念
    宋浩《概率论与数理统计》笔记---1.5.2、伯努利模型
    宋浩《概率论与数理统计》笔记---1.5.1、事件的独立性
    贝叶斯公式-汽车实例
    贝叶斯公式的理解
    宋浩《概率论与数理统计》笔记---1.4.2、贝叶斯公式
    nodemon通过配置文件监视
  • 原文地址:https://www.cnblogs.com/peng8098/p/python_basis_4.html
Copyright © 2011-2022 走看看