一、编码问题
ASCII是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,最多只能用8位来表示一个字节,做多只能表示28=256个符号显然不能满足各国的符号和文字的需要。
Unicode,又称为统一码、万国码、单一码,是一种在计算机上使用的字符编码。为解决传统字符编码的局限而产生的。它为每种语言设计了统一并且唯一的二进制编码,规定有的字符最少有16位来表示(2个字节),即216=65536。
UTF-8是对Unicode的压缩和优化,它不再使用最少两个字节。而是将所有的符号和编码进行分类。它的一个最大的特点,就是它是一种变长的编码方式。它可以使用1-4个字节表示一个符号,根据不同的符号变化字节长度,当符号在ASCII码范围的时,就用一个字节表示,保留了ASCII字符一个字节的编码作为它的一部分,注意的是Unicode一个中文字符占2个字节,而UTF-8一个中文字符占3个字节。从Unicode到UTF-8并不是直接的对应,需要通过一些算法和规则来转换。
二、运算符号
- +
- -
- *
- /
- % 取模,取余
- // 取整除,返回商的整数部分
三,基本数据类型
-
数字
-
布尔型 1或0(真或假)
-
字符型
常用的功能:移除空白、分割、索引、切片、长度
-
列表
常用的功能:索引、切片、追加、删除、循环、长度、包含
-
元组
常用的功能:索引、切片、循环、长度、包含
-
字典
常用的功能:索引、新增、删除、长度、循环、键、值、键值对
-
集合
常用的功能:交集、并集、差集、补集、包含
四,初识常用模块
- os.system('cmd') #可以返回执行任何命令,但是只会返回执行结果的返回值,如执行正确返回0
- os.popen('cmd').read() #返回执行命令的结果
- getpass #用户可以密文输入密码

1 >>> os.system('df') 2 Filesystem 1K-blocks Used Available Use% Mounted on 3 /dev/mapper/VolGroup-lv_root 18650424 8162324 9540696 47% / 4 tmpfs 375228 72 375156 1% /dev/shm 5 /dev/sda1 495844 34878 435366 8% /boot 6 0 7 >>> cmd_re = os.popen('df').read() 8 >>> print (cmd_re) 9 Filesystem 1K-blocks Used Available Use% Mounted on 10 /dev/mapper/VolGroup-lv_root 18650424 8162324 9540696 47% / 11 tmpfs 375228 72 375156 1% /dev/shm 12 /dev/sda1 495844 34878 435366 8% /boot 13 14 >>> 15 >>> passwd = getpass.getpass('please input your password:') 16 please input your password: 17 >>> print (passwd) 18 dsflsdgh
补充:
break和continue的区别
break:跳出当前整个循环
continue:跳出此次循环

1 #_*_ coding:utf-8 _*_ 2 a = 10 3 while a > 0: 4 a = a - 1 5 if a < 5: #当小于5时,只会打印一次便会跳出整个循环,不往下走。 6 print(a, ':小于5') 7 break 8 elif a < 8: #当小于8时,会跳出当次循环,但是还会继续往下走。 9 continue 10 print(a, ':小于8') 11 else: 12 print(a,':大于8') 13 14 15 #结果如下: 16 9 :大于8 17 8 :大于8 18 4 :小于5