0%

int整型

作用

用来记录人的年龄,出生年份,学生人数等整数相关的状态

定义

1
2
3
4
5
age=18

birthday=1990

student_count=48

float浮点型

作用

用来记录人的身高,体重,薪资等小数相关的状态

定义

1
2
3
4
5
height=172.3

weight=103.5

salary=15000.89

数字类型的使用

1 、数学运算

1
2
3
4
5
>>> a = 1
>>> b = 3
>>> c = a + b
>>> c
4

2、比较大小

1
2
3
4
>>> x = 10
>>> y = 11
>>> x > y
False

字符串类型str

作用

用来记录人的名字,家庭住址,性别等描述性质的状态

定义

1
2
3
4
5
name = 'Tony'

address = '上海市浦东新区'

sex = '男'

用单引号、双引号、多引号,都可以定义字符串,本质上是没有区别的,但是

1
2
3
4
5
6
7
8
#1、需要考虑引号嵌套的配对问题
msg = "My name is Tony , I'm 18 years old!" #内层有单引号,外层就需要用双引号
#2、多引号可以写多行字符串
msg = '''
天下只有两种人。比如一串葡萄到手,一种人挑最好的先吃,另一种人把最好的留到最后吃。
照例第一种人应该乐观,因为他每吃一颗都是吃剩的葡萄里最好的;第二种人应该悲观,因为他每吃一颗都是吃剩的葡萄里最坏的。
不过事实却适得其反,缘故是第二种人还有希望,第一种人只有回忆。
'''

使用

1
2
3
4
5
6
7
数字可以进行加减乘除等运算,字符串呢?也可以,但只能进行"相加""相乘"运算。
>>> name = 'tony'
>>> age = '18'
>>> name + age #相加其实就是简单的字符串拼接
'tony18'
>>> name * 5 #相乘就相当于将字符串相加了5次
'tonytonytonytonytony'

列表list

作用

如果我们需要用一个变量记录多个学生的姓名,用数字类型是无法实现,字符串类型确实可以记录下来,比如

stu_names=’张三 李四 王五’,但存的目的是为了取,此时若想取出第二个学生的姓名实现起来相当麻烦,而列表类型就是专门用来记录多个同种属性的值(比如同一个班级多个学生的姓名、同一个人的多个爱好等),并且存取都十分方便

定义

1
>>> stu_names=['张三','李四','王五']

使用

1
2
3
4
5
6
7
8
9
10
11
12
# 1、列表类型是用索引来对应值,索引代表的是数据的位置,从0开始计数
>>> stu_names=['张三','李四','王五']
>>> stu_names[0]
'张三'
>>> stu_names[1]
'李四'
>>> stu_names[2]
'王五'
# 2、列表可以嵌套,嵌套取值如下
>>> students_info=[['tony',18,['jack',]],['jason',18,['play','sleep']]]
>>> students_info[0][2][0] #取出第一个学生的第一个爱好
'play'

字典dict

作用

如果我们需要用一个变量记录多个值,但多个值是不同属性的,比如人的姓名、年龄、身高,用列表可以存,但列表是用索引对应值的,而索引不能明确地表示值的含义,这就用到字典类型,字典类型是用key:value形式来存储数据,其中key可以对value有描述性的功能

定义

1
>>> person_info={'name':'tony','age':18,'height':185.3}

使用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# 1、字典类型是用key来对应值,key可以对值有描述性的功能,通常为字符串类型
>>> person_info={'name':'tony','age':18,'height':185.3}
>>> person_info['name']
'tony'
>>> person_info['age']
18
>>> person_info['height']
185.3
# 2、字典可以嵌套,嵌套取值如下
>>> students=[
... {'name':'tony','age':38,'hobbies':['play','sleep']},
... {'name':'jack','age':18,'hobbies':['read','sleep']},
... {'name':'rose','age':58,'hobbies':['music','read','sleep']},
... ]
>>> students[1]['hobbies'][1] #取第二个学生的第二个爱好
'sleep'

布尔bool

作用

用来记录真假这两种状态

定义

1
2
>>> is_ok = True
>>> is_ok = False

使用

1
# 通常用来当作判断的条件,我们将在if判断中用到它

目录:

  • 引子
  • 数字类型int与float
    • 定义
    • 类型转换
    • 使用
  • 字符串
    • 定义
    • 类型转换
    • 使用
      • 优先掌握的操作
      • 需要掌握的操作
      • 了解操作
  • 列表
    • 定义
    • 类型转换
    • 使用
      • 优先掌握的操作
      • 了解操作
  • 元组
    • 作用
    • 定义方法
    • 类型转换
    • 使用
  • 字典
    • 定义
    • 类型转换
    • 使用
      • 优先掌握的操作
      • 需要掌握的操作
  • 集合
    • 作用
    • 定义
    • 类型转换
    • 使用
      • 关系运算
      • 去重
      • 其他操作
    • 练习
  • 可变类型和不可变类型
  • 数据类型总结

引子

数据类型是用来记录事物状态的,而事物的状态是不断变化的(如:一个人年龄的增长(操作int类型) ,单个人名的修改(操作str类型),学生列表中增加学生(操作list类型)等),这意味着我们在开发程序时需要频繁对数据进行操作,为了提升我们的开发效率, python针对这些常用的操作,为每一种数据类型内置了一系列方法。本章的主题就是带大家详细了解下它们,以及每种数据类型的详细定义、类型转换。

数字类型int与float

定义

1
2
3
4
5
6
7
8
9
10
11
# 1、定义:
# 1.1 整型int的定义
age=10 # 本质age = int(10)

# 1.2 浮点型float的定义
salary=3000.3 # 本质salary=float(3000.3)

# 注意:名字+括号的意思就是调用某个功能,比如
# print(...)调用打印功能
# int(...)调用创建整型数据的功能
# float(...)调用创建浮点型数据的功能

类型转换

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
# 1、数据类型转换
# 1.1 int可以将由纯整数构成的字符串直接转换成整型,若包含其他任意非整数符号,则会报错
>>> s = '123'
>>> res = int(s)
>>> res,type(res)
(123, <class 'int'>)

>>> int('12.3') # 错误演示:字符串内包含了非整数符号.
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: invalid literal for int() with base 10: '12.3'

# 1.2 进制转换
# 十进制转其他进制
>>> bin(3)
'0b11'
>>> oct(9)
'0o11'
>>> hex(17)
'0x11'
# 其他进制转十进制
>>> int('0b11',2)
3
>>> int('0o11',8)
9
>>> int('0x11',16)
17

# 1.3 float同样可以用来做数据类型的转换
>>> s = '12.3'
>>> res=float(s)
>>> res,type(res)
(12.3, <class 'float'>)

使用

数字类型主要就是用来做数学运算与比较运算,因此数字类型除了与运算符结合使用之外,并无需要掌握的内置方法

字符串

定义:

1
2
3
4
# 定义:在单引号\双引号\三引号内包含一串字符
name1 = 'jason' # 本质:name = str('任意形式内容')
name2 = "lili" # 本质:name = str("任意形式内容")
name3 = """ricky""" # 本质:name = str("""任意形式内容""")

类型转换

1
2
3
4
5
6
7
8
9
10

# 数据类型转换:str()可以将任意数据类型转换成字符串类型,例如
>>> type(str([1,2,3])) # list->str
<class 'str'>
>>> type(str({"name":"jason","age":18})) # dict->str
<class 'str'>
>>> type(str((1,2,3))) # tuple->str
<class 'str'>
>>> type(str({1,2,3,4})) # set->str
<class 'str'>

使用

优先掌握的操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72

>>> str1 = 'hello python!'


# 1.按索引取值(正向取,反向取):
# 1.1 正向取(从左往右)
>>> str1[6]
p
# 1.2 反向取(负号表示从右往左)
>>> str1[-4]
h
# 1.3 对于str来说,只能按照索引取值,不能改
>>> str1[0]='H' # 报错TypeError


# 2.切片(顾头不顾尾,步长)
# 2.1 顾头不顾尾:取出索引为0到8的所有字符
>>> str1[0:9]
hello pyt
# 2.2 步长:0:9:2,第三个参数2代表步长,会从0开始,每次累加一个2即可,所以会取出索引0、2、4、6、8的字符
>>> str1[0:9:2]
hlopt
# 2.3 反向切片
>>> str1[::-1] # -1表示从右往左依次取值
!nohtyp olleh

# 3.长度len
# 3.1 获取字符串的长度,即字符的个数,但凡存在于引号内的都算作字符)
>>> len(str1) # 空格也算字符
13

# 4.成员运算 in 和 not in
# 4.1 int:判断hello 是否在 str1里面
>>> 'hello' in str1
True
# 4.2 not in:判断tony 是否不在 str1里面
>>> 'tony' not in str1
True

# 5.strip移除字符串首尾指定的字符(默认移除空格)
# 5.1 括号内不指定字符,默认移除首尾空白字符(空格、\n、\t)
>>> str1 = ' life is short! '
>>> str1.strip()
life is short!

# 5.2 括号内指定字符,移除首尾指定的字符
>>> str2 = '**tony**'
>>> str2.strip('*')
tony

# 6.切分split
# 6.1 括号内不指定字符,默认以空格作为切分符号
>>> str3='hello world'
>>> str3.split()
['hello', 'world']
# 6.2 括号内指定分隔字符,则按照括号内指定的字符切割字符串
>>> str4 = '127.0.0.1'
>>> str4.split('.')
['127', '0', '0', '1'] # 注意:split切割得到的结果是列表数据类型


# 7.循环
>>> str5 = '今天你好吗?'
>>> for line in str5: # 依次取出字符串中每一个字符
... print(line)
...






需要掌握的操作

1.strip, lstrip, rstrip

1
2
3
4
5
6
7
8
9

>>> str1 = '**tony***'

>>> str1.strip('*') # 移除左右两边的指定字符
'tony'
>>> str1.lstrip('*') # 只移除左边的指定字符
tony***
>>> str1.rstrip('*') # 只移除右边的指定字符
**tony

2.lower(),upper()

1
2
3
4
5
6
7

>>> str2 = 'My nAme is tonY!'

>>> str2.lower() # 将英文字符串全部变小写
my name is tony!
>>> str2.upper() # 将英文字符串全部变大写
MY NAME IS TONY!

3.startswith,endswith

1
2
3
4
5
6
7
8
9
10
11
12
13

>>> str3 = 'tony jam'

# startswith()判断字符串是否以括号内指定的字符开头,结果为布尔值True或False
>>> str3.startswith('t')
True
>>> str3.startswith('j')
False
# endswith()判断字符串是否以括号内指定的字符结尾,结果为布尔值True或False
>>> str3.endswith('jam')
True
>>> str3.endswith('tony')
False

4.格式化输出之format

之前我们使用%s来做字符串的格式化输出操作,在传值时,必须严格按照位置与%s一一对应,而字符串的内置方法format则提供了一种不依赖位置的传值方式

案例:

1
2
3
4
5
6
7
8
9

# format括号内在传参数时完全可以打乱顺序,但仍然能指名道姓地为指定的参数传值,name=‘tony’就是传给{name}
>>> str4 = 'my name is {name}, my age is {age}!'.format(age=18,name='tony')
>>> str4
'my name is tony, my age is 18!'

>>> str4 = 'my name is {name}{name}{name}, my age is {name}!'.format(name='tony', age=18)
>>> str4
'my name is tonytonytony, my age is tony!'

format的其他使用方式(了解)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

# 类似于%s的用法,传入的值会按照位置与{}一一对应
>>> str4 = 'my name is {}, my age is {}!'.format('tony', 18)
>>> str4
my name is tony, my age is 18!
# 把format传入的多个值当作一个列表,然后用{索引}取值
>>> str4 = 'my name is {0}, my age is {1}!'.format('tony', 18)
>>> str4
my name is tony, my age is 18!

>>> str4 = 'my name is {1}, my age is {0}!'.format('tony', 18)
>>> str4
my name is 18, my age is tony!

>>> str4 = 'my name is {1}, my age is {1}!'.format('tony', 18)
>>> str4
my name is 18, my age is 18!

5.split,rsplit

1
2
3
4
5
6
7
8
9
10

# split会按照从左到右的顺序对字符串进行切分,可以指定切割次数
>>> str5='C:/a/b/c/d.txt'
>>> str5.split('/',1)
['C:', 'a/b/c/d.txt']

# rsplit刚好与split相反,从右往左切割,可以指定切割次数
>>> str5='a|b|c'
>>> str5.rsplit('|',1)
['a|b', 'c']

6.join

1
2
3
4
5
6

# 从可迭代对象中取出多个字符串,然后按照指定的分隔符进行拼接,拼接的结果为字符串
>>> '%'.join('hello') # 从字符串'hello'中取出多个字符串,然后按照%作为分隔符号进行拼接
'h%e%l%l%o'
>>> '|'.join(['tony','18','read']) # 从列表中取出多个字符串,然后按照*作为分隔符号进行拼接
'tony|18|read'

7.replace

1
2
3
4
5
6
7
8
9
10
11
12

# 用新的字符替换字符串中旧的字符
>>> str7 = 'my name is tony, my age is 18!' # 将tony的年龄由18岁改成73岁
>>> str7 = str7.replace('18', '73') # 语法:replace('旧内容', '新内容')
>>> str7
my name is tony, my age is 73!

# 可以指定修改的个数
>>> str7 = 'my name is tony, my age is 18!'
>>> str7 = str7.replace('my', 'MY',1) # 只把一个my改为MY
>>> str7
'MY name is tony, my age is 18!'

8.isdigit

1
2
3
4
5
6
7
8
9

# 判断字符串是否是纯数字组成,返回结果为True或False
>>> str8 = '5201314'
>>> str8.isdigit()
True

>>> str8 = '123g123'
>>> str8.isdigit()
False

了解操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112

# 1.find,rfind,index,rindex,count
# 1.1 find:从指定范围内查找子字符串的起始索引,找得到则返回数字1,找不到则返回-1
>>> msg='tony say hello'
>>> msg.find('o',1,3) # 在索引为1和2(顾头不顾尾)的字符中查找字符o的索引
1
# 1.2 index:同find,但在找不到时会报错
>>> msg.index('e',2,4) # 报错ValueError
# 1.3 rfind与rindex:略
# 1.4 count:统计字符串在大字符串中出现的次数
>>> msg = "hello everyone"
>>> msg.count('e') # 统计字符串e出现的次数
4
>>> msg.count('e',1,6) # 字符串e在索引1~5范围内出现的次数
1

# 2.center,ljust,rjust,zfill
>>> name='tony'
>>> name.center(30,'-') # 总宽度为30,字符串居中显示,不够用-填充
-------------tony-------------
>>> name.ljust(30,'*') # 总宽度为30,字符串左对齐显示,不够用*填充
tony**************************
>>> name.rjust(30,'*') # 总宽度为30,字符串右对齐显示,不够用*填充
**************************tony
>>> name.zfill(50) # 总宽度为50,字符串右对齐显示,不够用0填充
0000000000000000000000000000000000000000000000tony

# 3.expandtabs
>>> name = 'tony\thello' # \t表示制表符(tab键)
>>> name
tony hello
>>> name.expandtabs(1) # 修改\t制表符代表的空格数
tony hello

# 4.captalize,swapcase,title
# 4.1 captalize:首字母大写
>>> message = 'hello everyone nice to meet you!'
>>> message.capitalize()
Hello everyone nice to meet you!
# 4.2 swapcase:大小写翻转
>>> message1 = 'Hi girl, I want make friends with you!'
>>> message1.swapcase()
hI GIRL, i WANT MAKE FRIENDS WITH YOU!
#4.3 title:每个单词的首字母大写
>>> msg = 'dear my friend i miss you very much'
>>> msg.title()
Dear My Friend I Miss You Very Much

# 5.is数字系列
#在python3中
num1 = b'4' #bytes
num2 = u'4' #unicode,python3中无需加u就是unicode
num3 = '四' #中文数字
num4 = 'Ⅳ' #罗马数字

#isdigt:bytes,unicode
>>> num1.isdigit()
True
>>> num2.isdigit()
True
>>> num3.isdigit()
False
>>> num4.isdigit()
False

#isdecimal:uncicode(bytes类型无isdecimal方法)
>>> num2.isdecimal()
True
>>> num3.isdecimal()
False
>>> num4.isdecimal()
False

#isnumberic:unicode,中文数字,罗马数字(bytes类型无isnumberic方法)
>>> num2.isnumeric()
True
>>> num3.isnumeric()
True
>>> num4.isnumeric()
True

# 三者不能判断浮点数
>>> num5 = '4.3'
>>> num5.isdigit()
False
>>> num5.isdecimal()
False
>>> num5.isnumeric()
False

'''
总结:
最常用的是isdigit,可以判断bytes和unicode类型,这也是最常见的数字应用场景
如果要判断中文数字或罗马数字,则需要用到isnumeric。
'''

# 6.is其他
>>> name = 'tony123'
>>> name.isalnum() #字符串中既可以包含数字也可以包含字母
True
>>> name.isalpha() #字符串中只包含字母
False
>>> name.isidentifier()
True
>>> name.islower() # 字符串是否是纯小写
True
>>> name.isupper() # 字符串是否是纯大写
False
>>> name.isspace() # 字符串是否全是空格
False
>>> name.istitle() # 字符串中的单词首字母是否都是大写
False

列表

定义

1
2
3

# 定义:在[]内,用逗号分隔开多个任意数据类型的值
l1 = [1,'a',[1,2]] # 本质:l1 = list([1,'a',[1,2]])

类型转换

1
2
3
4
5
6
7

# 但凡能被for循环遍历的数据类型都可以传给list()转换成列表类型,list()会跟for循环一样遍历出数据类型中包含的每一个元素然后放到列表中
>>> list('wdad') # 结果:['w', 'd', 'a', 'd']
>>> list([1,2,3]) # 结果:[1, 2, 3]
>>> list({"name":"jason","age":18}) #结果:['name', 'age']
>>> list((1,2,3)) # 结果:[1, 2, 3]
>>> list({1,2,3,4}) # 结果:[1, 2, 3, 4]

使用

优先掌握的操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115

# 1.按索引存取值(正向存取+反向存取):即可存也可以取
# 1.1 正向取(从左往右)
>>> my_friends=['tony','jason','tom',4,5]
>>> my_friends[0]
tony
# 1.2 反向取(负号表示从右往左)
>>> my_friends[-1]
5
# 1.3 对于list来说,既可以按照索引取值,又可以按照索引修改指定位置的值,但如果索引不存在则报错
>>> my_friends = ['tony','jack','jason',4,5]
>>> my_friends[1] = 'martthow'
>>> my_friends
['tony', 'martthow', 'jason', 4, 5]


# 2.切片(顾头不顾尾,步长)
# 2.1 顾头不顾尾:取出索引为0到3的元素
>>> my_friends[0:4]
['tony', 'jason', 'tom', 4]
# 2.2 步长:0:4:2,第三个参数2代表步长,会从0开始,每次累加一个2即可,所以会取出索引0、2的元素
>>> my_friends[0:4:2]
['tony', 'tom']

# 3.长度
>>> len(my_friends)
5

# 4.成员运算in和not in
>>> 'tony' in my_friends
True
>>> 'xxx' not in my_friends
True

# 5.添加
# 5.1 append()列表尾部追加元素
>>> l1 = ['a','b','c']
>>> l1.append('d')
>>> l1
['a', 'b', 'c', 'd']

# 5.2 extend()一次性在列表尾部添加多个元素
>>> l1.extend(['a','b','c'])
>>> l1
['a', 'b', 'c', 'd', 'a', 'b', 'c']

# 5.3 insert()在指定位置插入元素
>>> l1.insert(0,"first") # 0表示按索引位置插值
>>> l1
['first', 'a', 'b', 'c', 'alisa', 'a', 'b', 'c']

# 6.删除
# 6.1 del
>>> l = [11,22,33,44]
>>> del l[2] # 删除索引为2的元素
>>> l
[11,22,44]

# 6.2 pop()默认删除列表最后一个元素,并将删除的值返回,括号内可以通过加索引值来指定删除元素
>>> l = [11,22,33,22,44]
>>> res=l.pop()
>>> res
44
>>> res=l.pop(1)
>>> res
22

# 6.3 remove()括号内指名道姓表示要删除哪个元素,没有返回值
>>> l = [11,22,33,22,44]
>>> res=l.remove(22) # 从左往右查找第一个括号内需要删除的元素
>>> print(res)
None

# 7.reverse()颠倒列表内元素顺序
>>> l = [11,22,33,44]
>>> l.reverse()
>>> l
[44,33,22,11]

# 8.sort()给列表内所有元素排序
# 8.1 排序时列表元素之间必须是相同数据类型,不可混搭,否则报错
>>> l = [11,22,3,42,7,55]
>>> l.sort()
>>> l
[3, 7, 11, 22, 42, 55] # 默认从小到大排序
>>> l = [11,22,3,42,7,55]
>>> l.sort(reverse=True) # reverse用来指定是否跌倒排序,默认为False
>>> l
[55, 42, 22, 11, 7, 3]
# 8.2 了解知识:
# 我们常用的数字类型直接比较大小,但其实,字符串、列表等都可以比较大小,原理相同:都是依次比较对应位置的元素的大小,如果分出大小,则无需比较下一个元素,比如
>>> l1=[1,2,3]
>>> l2=[2,]
>>> l2 > l1
True
# 字符之间的大小取决于它们在ASCII表中的先后顺序,越往后越大
>>> s1='abc'
>>> s2='az'
>>> s2 > s1 # s1与s2的第一个字符没有分出胜负,但第二个字符'z'>'b',所以s2>s1成立
True
# 所以我们也可以对下面这个列表排序
>>> l = ['A','z','adjk','hello','hea']
>>> l.sort()
>>> l
['A', 'adjk', 'hea', 'hello','z']

# 9.循环
# 循环遍历my_friends列表里面的值
for line in my_friends:
print(line)
'tony'
'jack'
'jason'
4
5

了解操作

1
2
3
4
5
6
7
8
9
10

>>> l=[1,2,3,4,5,6]
>>> l[0:3:1]
[1, 2, 3] # 正向步长
>>> l[2::-1]
[3, 2, 1] # 反向步长

# 通过索引取值实现列表翻转
>>> l[::-1]
[6, 5, 4, 3, 2, 1]

元组

作用

元组与列表类似,也是可以存多个任意类型的元素,不同之处在于元组的元素不能修改,即元组相当于不可变的列表,用于记录多个固定不允许修改的值,单纯用于取

定义方式

1
2
3
4
5

# 在()内用逗号分隔开多个任意类型的值
>>> countries = ("中国""美国""英国") # 本质:countries = tuple("中国","美国","英国")
# 强调:如果元组内只有一个值,则必须加一个逗号,否则()就只是包含的意思而非定义元组
>>> countries = ("中国",) # 本质:countries = tuple("中国")

类型转换

1
2
3
4
5
6
7
8

# 但凡能被for循环的遍历的数据类型都可以传给tuple()转换成元组类型
>>> tuple('wdad') # 结果:('w', 'd', 'a', 'd')
>>> tuple([1,2,3]) # 结果:(1, 2, 3)
>>> tuple({"name":"jason","age":18}) # 结果:('name', 'age')
>>> tuple((1,2,3)) # 结果:(1, 2, 3)
>>> tuple({1,2,3,4}) # 结果:(1, 2, 3, 4)
# tuple()会跟for循环一样遍历出数据类型中包含的每一个元素然后放到元组中

使用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32

>>> tuple1 = (1, 'hhaha', 15000.00, 11, 22, 33)
# 1、按索引取值(正向取+反向取):只能取,不能改否则报错!
>>> tuple1[0]
1
>>> tuple1[-2]
22
>>> tuple1[0] = 'hehe' # 报错:TypeError:

# 2、切片(顾头不顾尾,步长)
>>> tuple1[0:6:2]
(1, 15000.0, 22)

# 3、长度
>>> len(tuple1)
6

# 4、成员运算 in 和 not in
>>> 'hhaha' in tuple1
True
>>> 'hhaha' not in tuple1
False

# 5、循环
>>> for line in tuple1:
... print(line)
1
hhaha
15000.0
11
22
33

字典

定义方式

1
2
3
4
5

# 定义:在{}内用逗号分隔开多元素,每一个元素都是key:value的形式,其中value可以是任意类型,而key则必须是不可变类型,详见第八小节,通常key应该是str类型,因为str类型会对value有描述性的功能
info={'name':'tony','age':18,'sex':'male'} #本质info=dict({....})
# 也可以这么定义字典
info=dict(name='tony',age=18,sex='male') # info={'age': 18, 'sex': 'male', 'name': 'tony'}

类型转换

1
2
3
4
5
6
7
8
9

# 转换1:
>>> info=dict([['name','tony'],('age',18)])
>>> info
{'age': 18, 'name': 'tony'}

# 转换2:fromkeys会从元组中取出每个值当做key,然后与None组成key:value放到字典中
>>> {}.fromkeys(('name','age','sex'),None)
{'age': None, 'sex': None, 'name': None}

使用

优先掌握的操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

# 1、按key存取值:可存可取
# 1.1 取
>>> dic = {
... 'name': 'xxx',
... 'age': 18,
... 'hobbies': ['play game', 'basketball']
... }
>>> dic['name']
'xxx'
>>> dic['hobbies'][1]
'basketball'
# 1.2 对于赋值操作,如果key原先不存在于字典,则会新增key:value
>>> dic['gender'] = 'male'
>>> dic
{'name': 'tony', 'age': 18, 'hobbies': ['play game', 'basketball'],'gender':'male'}
# 1.3 对于赋值操作,如果key原先存在于字典,则会修改对应value的值
>>> dic['name'] = 'tony'
>>> dic
{'name': 'tony', 'age': 18, 'hobbies': ['play game', 'basketball']}


# 2、长度len
>>> len(dic)
3


# 3、成员运算in和not in
>>> 'name' in dic # 判断某个值是否是字典的key
True


# 4、删除
>>> dic.pop('name') # 通过指定字典的key来删除字典的键值对
>>> dic
{'age': 18, 'hobbies': ['play game', 'basketball']}


# 5、键keys(),值values(),键值对items()
>>> dic = {'age': 18, 'hobbies': ['play game', 'basketball'], 'name': 'xxx'}
# 获取字典所有的key
>>> dic.keys()
dict_keys(['name', 'age', 'hobbies'])
# 获取字典所有的value
>>> dic.values()
dict_values(['xxx', 18, ['play game', 'basketball']])
# 获取字典所有的键值对
>>> dic.items()
dict_items([('name', 'xxx'), ('age', 18), ('hobbies', ['play game', 'basketball'])])


# 6、循环
# 6.1 默认遍历的是字典的key
>>> for key in dic:
... print(key)
...
age
hobbies
name
# 6.2 只遍历key
>>> for key in dic.keys():
... print(key)
...
age
hobbies
name
# 6.3 只遍历value
>>> for key in dic.values():
... print(key)
...
18
['play game', 'basketball']
xxx
# 6.4 遍历key与value
>>> for key in dic.items():
... print(key)
...
('age', 18)
('hobbies', ['play game', 'basketball'])
('name', 'xxx')

需要掌握的操作

1.get()

1
2
3
4
5
6
7
8
9
10
11

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> dic.get('k1')
'jason' # key存在,则获取key对应的value值
>>> res=dic.get('xxx') # key不存在,不会报错而是默认返回None
>>> print(res)
None
>>> res=dic.get('xxx',666) # key不存在时,可以设置默认返回的值
>>> print(res)
666
# ps:字典取值建议使用get方法

2.pop()

1
2
3
4
5
6
7

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> v = dic.pop('k2') # 删除指定的key对应的键值对,并返回值
>>> dic
{'k1': 'jason', 'kk2': 'JY'}
>>> v
'Tony'

3.popitem()

1
2
3
4
5
6
7

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> item = dic.popitem() # 随机删除一组键值对,并将删除的键值放到元组内返回
>>> dic
{'k3': 'JY', 'k2': 'Tony'}
>>> item
('k1', 'jason')

4.update()

1
2
3
4
5
6

# 用新字典更新旧字典,有则修改,无则添加
>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}
>>> dic.update({'k1':'JN','k4':'xxx'})
>>> dic
{'k1': 'JN', 'k3': 'JY', 'k2': 'Tony', 'k4': 'xxx'}

5.fromkeys()

1
2
3
4

>>> dic = dict.fromkeys(['k1','k2','k3'],[])
>>> dic
{'k1': [], 'k2': [], 'k3': []}

6.setdefault()

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

# key不存在则新增键值对,并将新增的value返回
>>> dic={'k1':111,'k2':222}
>>> res=dic.setdefault('k3',333)
>>> res
333
>>> dic # 字典中新增了键值对
{'k1': 111, 'k3': 333, 'k2': 222}

# key存在则不做任何修改,并返回已存在key对应的value值
>>> dic={'k1':111,'k2':222}
>>> res=dic.setdefault('k1',666)
>>> res
111
>>> dic # 字典不变
{'k1': 111, 'k2': 222}

集合

作用

集合、list、tuple、dict一样都可以存放多个值,但是集合主要用于:去重、关系运算

定义

1
2
3
4
5
6
7
8
9
10
11
12
13
14

"""
定义:在{}内用逗号分隔开多个元素,集合具备以下三个特点:
1:每个元素必须是不可变类型
2:集合内没有重复的元素
3:集合内元素无序
"""
s = {1,2,3,4} # 本质 s = set({1,2,3,4})

# 注意1:列表类型是索引对应值,字典是key对应值,均可以取得单个指定的值,而集合类型既没有索引也没有key与值对应,所以无法取得单个的值,而且对于集合来说,主要用于去重与关系元素,根本没有取出单个指定值这种需求。

# 注意2:{}既可以用于定义dict,也可以用于定义集合,但是字典内的元素必须是key:value的格式,现在我们想定义一个空字典和空集合,该如何准确去定义两者?
d = {} # 默认是空字典
s = set() # 这才是定义空集合

类型转换

1
2
3
4
5
6
7
8

# 但凡能被for循环的遍历的数据类型(强调:遍历出的每一个值都必须为不可变类型)都可以传给set()转换成集合类型
>>> s = set([1,2,3,4])
>>> s1 = set((1,2,3,4))
>>> s2 = set({'name':'jason',})
>>> s3 = set('egon')
>>> s,s1,s2,s3
{1, 2, 3, 4} {1, 2, 3, 4} {'name'} {'e', 'o', 'g', 'n'}

使用

关系运算

我们定义两个集合friends与friends2来分别存放两个人的好友名字,然后以这两个集合为例讲解集合的关系运算

1
2
3

>>> friends1 = {"zero","kevin","jason","egon"} # 用户1的好友们
>>> friends2 = {"Jy","ricky","jason","egon"} # 用户2的好友们

两个集合的关系如下图所示

img

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

# 1.合集/并集(|):求两个用户所有的好友(重复好友只留一个)
>>> friends1 | friends2
{'kevin', 'ricky', 'zero', 'jason', 'Jy', 'egon'}

# 2.交集(&):求两个用户的共同好友
>>> friends1 & friends2
{'jason', 'egon'}

# 3.差集(-):
>>> friends1 - friends2 # 求用户1独有的好友
{'kevin', 'zero'}
>>> friends2 - friends1 # 求用户2独有的好友
{'ricky', 'Jy'}

# 4.对称差集(^) # 求两个用户独有的好友们(即去掉共有的好友)
>>> friends1 ^ friends2
{'kevin', 'zero', 'ricky', 'Jy'}

# 5.值是否相等(==)
>>> friends1 == friends2
False

# 6.父集:一个集合是否包含另外一个集合
# 6.1 包含则返回True
>>> {1,2,3} > {1,2}
True
>>> {1,2,3} >= {1,2}
True
# 6.2 不存在包含关系,则返回False
>>> {1,2,3} > {1,3,4,5}
False
>>> {1,2,3} >= {1,3,4,5}
False


# 7.子集
>>> {1,2} < {1,2,3}
True
>>> {1,2} <= {1,2,3}
True

去重

集合去重复有局限性

1
2
3

# 1. 只能针对不可变类型
# 2. 集合本身是无序的,去重之后无法保留原来的顺序

示例如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

>>> l=['a','b',1,'a','a']
>>> s=set(l)
>>> s # 将列表转成了集合
{'b', 'a', 1}
>>> l_new=list(s) # 再将集合转回列表
>>> l_new
['b', 'a', 1] # 去除了重复,但是打乱了顺序

# 针对不可变类型,并且保证顺序则需要我们自己写代码实现,例如
l=[
{'name':'lili','age':18,'sex':'male'},
{'name':'jack','age':73,'sex':'male'},
{'name':'tom','age':20,'sex':'female'},
{'name':'lili','age':18,'sex':'male'},
{'name':'lili','age':18,'sex':'male'},
]

new_l=[]

for dic in l:
if dic not in new_l:
new_l.append(dic)

print(new_l)
# 结果:既去除了重复,又保证了顺序,而且是针对不可变类型的去重
[
{'age': 18, 'sex': 'male', 'name': 'lili'},
{'age': 73, 'sex': 'male', 'name': 'jack'},
{'age': 20, 'sex': 'female', 'name': 'tom'}
]

其他操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

# 1.长度
>>> s={'a','b','c'}
>>> len(s)
3

# 2.成员运算
>>> 'c' in s
True

# 3.循环
>>> for item in s:
... print(item)
...
c
a
b

练习

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
"""
一.关系运算
  有如下两个集合,pythons是报名python课程的学员名字集合,linuxs是报名linux课程的学员名字集合
  pythons={'jason','egon','kevin','ricky','gangdan','biubiu'}
  linuxs={'kermit','tony','gangdan'}
  1. 求出即报名python又报名linux课程的学员名字集合
  2. 求出所有报名的学生名字集合
  3. 求出只报名python课程的学员名字
  4. 求出没有同时这两门课程的学员名字集合
"""
# 求出即报名python又报名linux课程的学员名字集合
>>> pythons & linuxs
# 求出所有报名的学生名字集合
>>> pythons | linuxs
# 求出只报名python课程的学员名字
>>> pythons - linuxs
# 求出没有同时这两门课程的学员名字集合
>>> pythons ^ linuxs

可变类型与不可变类型

可变数据类型:值发生改变时,内存地址不变,即id不变,证明在改变原值

不可变类型:值发生改变时,内存地址也发生改变,即id也变,证明是没有在改变原值,是产生了新的值

数字类型:

1
2
3
4
5
6
7
8

>>> x = 10
>>> id(x)
1830448896
>>> x = 20
>>> id(x)
1830448928
# 内存地址改变了,说明整型是不可变数据类型,浮点型也一样

img

字符串

1
2
3
4
5
6
7
8

>>> x = "Jy"
>>> id(x)
938809263920
>>> x = "Ricky"
>>> id(x)
938809264088
# 内存地址改变了,说明字符串是不可变数据类型

img

列表

1
2
3
4
5
6
7
8
9
10
11

>>> list1 = ['tom','jack','egon']
>>> id(list1)
486316639176
>>> list1[2] = 'kevin'
>>> id(list1)
486316639176
>>> list1.append('lili')
>>> id(list1)
486316639176
# 对列表的值进行操作时,值改变但内存地址不变,所以列表是可变数据类型

img

元组

1
2
3
4
5
6
7
8
9
10
11
12
13

>>> t1 = ("tom","jack",[1,2])
>>> t1[0]='TOM' # 报错:TypeError
>>> t1.append('lili') # 报错:TypeError
# 元组内的元素无法修改,指的是元组内索引指向的内存地址不能被修改
>>> t1 = ("tom","jack",[1,2])
>>> id(t1[0]),id(t1[1]),id(t1[2])
(4327403152, 4327403072, 4327422472)
>>> t1[2][0]=111 # 如果元组中存在可变类型,是可以修改,但是修改后的内存地址不变
>>> t1
('tom', 'jack', [111, 2])
>>> id(t1[0]),id(t1[1]),id(t1[2]) # 查看id仍然不变
(4327403152, 4327403072, 4327422472)

img

字典

1
2
3
4
5
6
7
8
9
10
11

>>> dic = {'name':'egon','sex':'male','age':18}
>>>
>>> id(dic)
4327423112
>>> dic['age']=19
>>> dic
{'age': 19, 'sex': 'male', 'name': 'egon'}
>>> id(dic)
4327423112
# 对字典进行操作时,值改变的情况下,字典的id也是不变,即字典也是可变数据类型

img

数据类型总结

img

内容概要

  • 多态与多态性
  • 鸭子类型

内容详细

多态与多态性

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
多态指的是一类事务有多种形态,比如动物有多种形态:猫、狗、猪

class Animal: #同一类事物:动物
def talk(self):
pass
class Cat(Animal): #动物的形态之一:猫
def talk(self):
print('喵喵喵')
class Dog(Animal): #动物的形态之二:狗
def talk(self):
print('汪汪汪')
class Pig(Animal): #动物的形态之三:猪
def talk(self):
print('哼哼哼')

#实例化得到三个对象
>>> cat=Cat()
>>> dog=Dog()
>>> pig=Pig()

# 多态性指的是:可以在不用考虑对象具体类型的情况下而直接使用对象,这就需要在设计时,把对象的使用方法统一成一种
1
2
3
4
5
6
7
8
9
10
11

例如:
cat、dog、pig都是动物,但凡是动物肯定有talk方法, 于是我们可以不用考虑它们三者具体是什么类型的动物,而直接使用talk方法

>>> cat.talk()
喵喵喵
>>> dog.talk()
汪汪汪
>>> pig.talk()
哼哼哼

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

更进一步,我们可以定义一个统一的接口来使用

>>> def Talk(animal):
... animal.talk()
...
>>> Talk(cat)
喵喵喵
>>> Talk(dog)
汪汪汪
>>> Talk(pig)
哼哼哼

python中一切皆对象,本身就支持多态性

# 我们可以在不考虑三者类型的情况下直接使用统计三个对象的长度
s.__len__()
l.__len__()
t.__len__()

# Python内置了一个统一的接口
len(s)
len(l)
len(t)
1
2
3
4
5
6
7
8
9
10
11
12
13

多态性的好处在于增强了程序的灵活性和可扩展性

例如:
通过继承Animal类创建了一个新的类,实例化得到的对象obj,可以使用相同的方式去使用obj.talk()

>>> class Wolf(Animal): #动物的另外一种形态:狼
... def talk(self):
... print('嗷...')
...
>>> wolf=Wolf() # 实例出一匹狼
>>> wolf.talk() # 使用者根本无需关心wolf是什么类型而调用talk
嗷...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

综上所述,可知:
'多态性的本质在于不同的类中定义有相同的方法名,这样我们就可以不考虑类,而统一用一种方法去使用对象,可以通过在父类中引入抽象类的概念来硬性限制子类必须有某些方法名'

import abc

# 指定metaclass属性将类设置为抽象类,抽象类本身只是用来约束子类的,不能被实例化
class Animal(metaclass=abc.ABCMeta):
@abc.abstractmethod # 该装饰器限制子类必须定义有一个名为talk的方法
def talk(self): # 抽象方法中无需实现具体的功能
pass

class Cat(Animal): # 但凡继承Animal的子类都必须遵循Animal规定的标准
def talk(self):
pass

cat=Cat() # 若子类中没有一个名为talk的方法则会抛出异常TypeError,无法实例化

鸭子类型

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
    其实我们完全可以不依赖继承,只需要制造出外观和行为相同的对象,同样可以实现不考虑对象类型而使用对象,这正是python崇尚的'鸭子类型'
鸭子类型:如果看起来像、叫声像且走起路来也像鸭子,那么它就是鸭子

'比起继承的方式,鸭子类型在某种程度上实现了程序的松耦合度'

例如:

#二者看起来都像文件,因而就可以当文件一样去用,然而它们并没有直接的关系
class Txt: #Txt类有两个与文件类型同名的方法,即read和write
def read(self):
pass
def write(self):
pass

class Disk: #Disk类也有两个与文件类型同名的方法:read和write
def read(self):
pass
def write(self):
pass

引入

字符串类型、本文类型的内容都是由字符组成的,但凡涉及到字符的存取,都需要考虑字符编码的问题
字符编码这个知识点的典型特征就是理论多,结论少,但对于开发而言只需要记住结论即可

知识储备

三大核心硬件

1
2
3
4
5
6
    所有软件都是运行在硬件之上的,与运行软件相关的三大核心硬件为cpu、内存、硬盘,我们需要明白三点
# 1 软件运行前,软件的代码及其相关数据都是存放在硬盘中的

# 2 任何软件的启动都是将数据从硬盘读入内存,然后cpu从内存中取出指令并执行

# 3 软件运行过程中产生的数据最先都是存放于内存中的,若想永久保存软件产生的数据,则需要将数据由内存写入硬盘

img

文本编辑器读取文件内容的流程

1
2
3
4
5
6

# 阶段1 启动一个文本编辑器(文本编辑器如nodepad++, pycharm, word...)

# 阶段2 文件编辑器会将文件内容从硬盘读入内存

# 阶段3 文本编辑器会将刚刚读入内存的内容显示到屏幕上

python解释器执行文件流程

1
2
3
4
5
6
7
    以python test.py为例,执行流程如下↓↓↓

# 阶段1 启动python解释器,此时就相当于启动了一个文本编辑器

# 阶段2 python解释器相当于文本编辑器,从硬盘上将test.py的内容读入到内存中

# 阶段3 python解释器解释执行刚刚读入的内存的内容,开始识别python语法

总结

1
2
3
4
5
6
7
    python解释器与文本编辑器的异同如下:

# 1 相同点:前两个阶段二者完全一致,都是将硬盘中文件的内容读入内存
(python解释器是解释执行文件内容的,因而python解释器具备读py文件的功能,这一点与文本编辑器一样)

# 2 不同点:在阶段3时,针对内存中读入的内容处理方式不同
(文本编辑器将文件内容读入内存后,是为了显示或者编辑,根本不会去理会python语法,而python解释器将文件内容读入内存后,可不是为了给你瞅一眼python代码写的是啥,而是为了执行python代码,会识别python语法)

字符编码介绍

什么是字符编码?

1
2
3
4
5
6
7
8
9
10
11
12
13
人类再与计算机交互时,用的都是人类能读懂的字符,如中文字符、英文字符、日文字符...

而计算机只能识别二进制数

# 二进制数即由0和1组成的数字,如010101010101001,计算机是基于电工作的,电的特性即高低电频人类从逻辑层面将髙电频对应为数字1,低电频对应为数字0,这直接决定了计算机可是识别的是由0和1组成的数字

由人类的字符到计算机中的数字,必须经历一个过程↓↓↓
字符 ---> 翻译 ---> 数字

翻译的过程必须参照一个特定的标准,该标准称之为字符编码表,该表上存放的就是字符与数字一一对应的关系

字符编码中的编码指的是翻译或者转换的意思是,即将人能理解的字符翻译成计算机能识别的数字

字符编码表的发展史(了解)

阶段一:一家独大

1
2
3
4
5
现代计算机起源于美国,所以最先考虑的仅仅是让计算机识别英文字符,于是诞生了ASCII表

# ASCII表的特点
1 只有英文字符与数字的一一对应关系
2 一个英文字符对应1bytes,1bytes=8bit, 8bit最多包含256个数字,可以对应256个字符,足够表示所有的英文字符

阶段二:诸侯割据,天下大乱

1
2
3
4
5
6
7
8
为了让计算机能够识别中文和英文,中国人制定了gbk

# gbk表的特点
1 只有中文字符、英文字符与数字的一一对应关系
2 一个英文字符对应1bytes
一个中文字符对应2bytes
补充说明:1bytes = 8bit,8bit最多包含256个数字,可以对应256个字符,足够表示所有英文字符
2bytes = 16bit,16bit最多包含65536个字符,足够表示所有中文字符
1
2
3
4
5
6
7
每个国家都有各自的字符(语言),为了让计算能够识别自己国家的字符外加英文字符, 各个国家都制定了自己的字符编码表

# shift_JIS表的特点
1 只有日文字符、英文字符与数字的一一对应关系

# Euc_kr表的特点
1 只有韩文字符、英文字符与数字的一一对应关系

img

1
2
3
4
5
6
7
8
9
10
11
12
1中,文本编辑存取文件的原理如下
文本文件内容全都为字符,无论存取都是涉及到字符编码的问题

# 1 存(写)文本文件
人类通过文本编辑器输入的字符会被转换成ASCII格式的二进制存放于内存中,如果需要永久保存,则直接将内存中的ASCII格式的二进制写入硬盘

# 2 取(读)文本文件
直接将硬盘中的ASCII格式的二进制读入内存,然后通过ASCII表反解成英文字符

23也都是相同的过程,此时无论是存还是取,由于采用的字符编码表一样,所以肯定不会出现乱码问题,但问题是在美国人用的计算机里只能输入英文字符,而在中国人用的计算机里只能输入中文和英文字符...

毫无疑问我们希望计算机允许我们输入的万国字符均可识别,不乱码,而现阶段计算机采用的字符编码表ASCII、gbk、shift_jis都无法识别万国字符,所以我们必须制定一个兼容万国字符的编码表

阶段三:分久必合

1
2
3
4
Unicode于1990年开始研发,1994年正式公布,具备两大特点:
# 1 存在所有语言中的所有字符与数字的一一对应关系,即兼容万国字符

# 2 与传统的字符编码的二进制数都有对应关系
1
2
3
很多地方或老的系统、应用软件仍会采用各种各样传统的编码,这是历史遗留问题。此处需要强调:

软件是存放于硬盘的,而运行软件是要将软件加载到内存的,面对硬盘中存放的各种传统编码的软件,想让我们的计算机能够将他们全部正常运行而不出现乱码,内存中必须有一种兼容万国的编码,并且该编码需要与其他编码有相对饮的映射/转换关系,这就是Unicode的第二大特点产生的缘由

img

1
2
3
4
5
6
7
8
9
文本编辑器输入任何字符都是最先存于内存中的,而内存是Unicode编码的,若存放于硬盘中,则可以转换成任意其他编码,只要该编码可以支持相应的字符
# 英文字符可以背ASCII识别
英文字符 ---> Unicode格式的数字 --->ASCII格式的数字

# 中文字符、英文字符可以背gbk识别
中文字符、英文字符 ---> Unicode格式的数字 ---> gbk格式的数字

# 日文字符、英文字符可以被shift_JIS识别
日文字符、英文字符 ---> Unicode格式的数字 ---> shift_JIS格式的数字

编码与解码

由字符转换成内存中的Unicode,以及由Unicode转换成其他编码的过程,都称为编码encode

img

由内存中的Unicode转换成字符,以及由其他编码转换成Unicode的过程,都称为解码decode

img

utf-8的由来

1
2
3
4
5
6
7
8
9
10
11
12
13
注意:
如果保存到硬盘的是gbk格式的二进制,当初用户输入的字符只能是中文或英文,同理,如果保存到硬盘的是shift_JIS格式的二进制,当初用户输入的字符只能是日文或英文,如果我们输入的字符中包含多国字符,那么该如何处理

# 多国字符 ---√---> 内存(Unicode格式的二进制) ---×--->硬盘(gbk格式的二进制)

# 多国字符 ---√---> 内存(Unicode格式的二进制) ---×--->硬盘(shift_JIS格式的二进制)

# 多国字符 ---√---> 内存(Unicode格式的二进制) ---×--->硬盘(???格式的二进制)


理论上是可以将内存中Unicode格式的二进制直接存放于硬盘中的,但由于Unicode固定使用两个字节来存储一个字符,如果多国字符中包含大量的英文字符时,使用Unicode格式存放会额外占用一倍空间(英文字符其实只需要用一个字节存放即可),然而空间占用并不是最致命的问题,最致命的问题是当我们由内存写入硬盘时会额外耗费一倍的时间,所以将内存中的Unicode二进制写入硬盘或者基于网络传输时必须将其转换成一种精简的格式,这种格式就是utf-8

# 多国字符 ---√---> 内存(Unicode格式的二进制) ---√--->硬盘(utf-8格式的二进制)

img

1
2
3
4
那为何不直接在内存中使用utf-8?↓↓↓

utf-8是针对Unicode的可变长度字符编码:一个英文字符占1bytes,一个中文字符占3bytes,生僻字用更多的bytes存储
Unicode更像是一个过渡版本,我们新开发的软件或文件存入硬盘都采用utf-8格式,等过去几十年,所有老编码的文件都淘汰掉之后,会出现一个令人开心的场景,就是硬盘里放的都是utf-8格式,此时Unicode便可以退出历史舞台,内存里也改用utf-8,天下重新归于统一

字符编码的应用(重要)

1
2
3
4
5
6
7
8
9
我们学习字符编码就是为了存取字符时不发生乱码问题:

# 1 内存中固定使用Unicode,无论输入任何字符都不会发生乱码

# 2 我们能够修改的是存/取硬盘的编码方式,如果编码设置不正确将会出现乱码问题,乱码问题分为两种:存乱了,读乱了

# 2.1 存(写)乱了(致命,文件乱了):如果用户输入的内容中包含中文和日文字符,如果单纯shift_JIS存,日文可以正常写入硬盘,而由于中文字符在shift_jis中没有找到对应关系而导致存乱了

# 2.2 取(读)乱了(不致命,文件还在):如果硬盘中的数据是shift_jis格式存储的,用gbk格式读入内存就读乱了

总结(记):

1
2
3
4

# 1:保证存的时候不乱:在由内存写入硬盘时,必须将编码格式设置为支持所输入字符的编码格式

# 2:保证取的时候不乱:在又硬盘读入内存时,必须采用与写入硬盘时相同的编码格式

python解释器执行文件的前两个阶段

1
2
3
4
5
	执行py文件的前两个阶段就是python解释器读文本文件的过程,与文本编辑读文本文件的前两个阶段没有任何区别,
要保证读不乱码,则必须将python解释器读文件时采用的编码方式设置为文件当初写入硬盘时的编码格式,如果没有设置,python解释器则采用默认的编码方式,在python3中默认为utf-8,在python2中默认ASCII,我们可以通过指定文件头来修改默认的编码方式

--在文件首行写入包含#号在内的以下内容:
# coding:当初文件写入硬盘时采用的编码方式

解释器会先用默认的编码方式读取文件的首行内容,由于首行是纯英文组成,而任何编码方式都可以识别英文字符

python解释器

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
	设置文件头的作用是保证运行python程序的前两个阶段不乱码,经过前两个阶段后py文件的内容都会以Unicode格式存放于内存中

在经历第三个阶段时开始识别python语法,当遇到特定的语法name='上'(代码本身也都全部是Unicode格式存的)时,需要申请内存空间来存储字符串'上',这又涉及到应该以什么编码存储'上'的问题

在python3中,字符串类的值都是使用Unicode格式来存储的

在python2中,由于python2的盛行是早于Unicode的,因此在python2中是按照文件头指定的编码来存储字符串类型的值的(如果文件头中没有指定编码,那么解释器会按照它自己默认的编码方式来存储'上'),所以,这就有可能导致乱码问题
# coding:utf-8

x = '上' # x的值为untf-8格式的二进制
print(x)
# 打印操作是将x的值,即utf-8格式的二进制交给终端,当终端收到后发现并不是unicode(只有unicode才与字符有对应关系),所以终端会执行操作:utf-8二进制---解码-->unicode格式的二进制,解码的过程终端会采用自己默认的编码,而在pycharm的终端默认编码为utf-8、windows下的cmd终端的默认编码为gbk,所以该打印操作在pycharm中显示正常,而在windows下的cmd中则乱码

# 在windows下的cmd中运行效果如下
C:\Users\Administrator>python2 E:\aaa.py

字符串encode编码与decode解码的使用

1
2
3
4
5
6
7
8
9
10
11
# 1 unicode格式 ------ 编码encode ------> 其他编码格式

>>> x = '上' # 在python3中,'上'被存成Unicode
>>> res = x.encode('utf-8')
>>> res, type(res) # Unicode编码成了utf-8格式,而编码的结果为bytes类型,可以直接当做二进制去使用
(b'\xe4\xb8\x8a', <class 'bytes'>)

# 2 其他编码格式 ------ 解码decode ------> Unicode格式

>>> res.decode('utf-8')
'上'

内容概要

  • 引入
  • 隐藏属性
  • 开放接口
  • property

内容详细

引入

1
2
3
4
5
6
7
8
9
10
11
12
13
面对对象编程有三大特性:
1 封装
2 继承
3 多态

其中最重要的一个特性就是封装

封装指的是:
把数据与功能整合到一起 <---"整合"

除此之外,针对封装到对象或者类中的属性,我们还可以严格控制对它们的访问,分两步实现:
1 隐藏属性
2 开放接口

隐藏属性

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
python的Class机制采用双下划线'开头'的方式将属性隐藏起来(设置成私有的),但其实这仅仅是一种变形操作,类中所有的双下划线'开头'的属性都会在定义阶段,检测语法时自动变成'_类名_属性名'的形式:

class Foo:
__N=0 # 变形为_Foo__N

def __init__(self): # 定义函数时,会检测函数语法,所以__开头的属性也会变形
self.__x=10 # 变形为self._Foo__x

def __f1(self): # 变形为_Foo__f1
print('__f1 run')

def f2(self): # 定义函数时,会检测函数语法,所以__开头的属性也会变形
self.__f1() #变形为self._Foo__f1()

print(Foo.__N) # 报错AttributeError:类Foo没有属性__N

obj = Foo()
print(obbj.__x) # 报错AttributeError:对象obj没有属性__x
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18


这种变形需要注意的问题是:

1、在类外部无法直接访问双下滑线开头的属性,但知道了类名和属性名就可以拼出名字:_类名__属性,然后就可以访问了,如Foo._A__N,所以说这种操作并没有严格意义上地限制外部访问,仅仅只是一种语法意义上的变形。

>>> Foo.__dict__
mappingproxy({..., '_Foo__N': 0, ...})

>>> obj.__dict__
{'_Foo__x': 10}

>>> Foo._Foo__N
0
>>> obj._Foo__x
10
>>> obj._Foo__N
0
1
2
3
4
2、在类内部是可以直接访问双下滑线开头的属性的,比如self.__f1(),因为在类定义阶段类内部双下滑线开头的属性统一发生了变形。

>>> obj.f2()
__f1 run
1
2
3
4
5
6
7
8
9
10
11
12
13
3、变形操作只在类定义阶段发生一次,在类定义之后的赋值操作,不会变形。

>>> Foo.__M=100
>>> Foo.__dict__
mappingproxy({..., '__M': 100,...})
>>> Foo.__M
100

>>> obj.__y=20
>>> obj.__dict__
{'__y': 20, '_Foo__x': 10}
>>> obj.__y
20

开放接口

定义属性就是为了使用,所以隐藏并不是目的

隐藏数据属性

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
将数据隐藏起来就限制了类外部对数据的直接操作,然后类内应该提供相应的接口来允许类外部间接地操作数据,接口之上可以附加额外的逻辑来对数据的操作进行严格地控制:

>>> class Teacher:
... def __init__(self,name,age): #将名字和年纪都隐藏起来
... self.__name=name
... self.__age=age
... def tell_info(self): #对外提供访问老师信息的接口
... print('姓名:%s,年龄:%s' %(self.__name,self.__age))
... def set_info(self,name,age): #对外提供设置老师信息的接口,并附加类型检查的逻辑
... if not isinstance(name,str):
... raise TypeError('姓名必须是字符串类型')
... if not isinstance(age,int):
... raise TypeError('年龄必须是整型')
... self.__name=name
... self.__age=age
...
>>>
>>> t=Teacher('lili',18)
>>> t.set_info(‘LiLi','19') # 年龄不为整型,抛出异常
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<stdin>", line 11, in set_info
TypeError: 年龄必须是整型
>>> t.set_info('LiLi',19) # 名字为字符串类型,年龄为整形,可以正常设置
>>> t.tell_info() # 查看老师的信息
姓名:LiLi,年龄:19

隐藏函数属性

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
目的的是为了隔离复杂度,例如ATM程序的取款功能,该功能有很多其他功能组成,比如插卡、身份认证、输入金额、打印小票、取钱等,而对使用者来说,只需要开发取款这个功能接口即可,其余功能我们都可以隐藏起来

>>> class ATM:
... def __card(self): #插卡
... print('插卡')
... def __auth(self): #身份认证
... print('用户认证')
... def __input(self): #输入金额
... print('输入取款金额')
... def __print_bill(self): #打印小票
... print('打印账单')
... def __take_money(self): #取钱
... print('取款')
... def withdraw(self): #取款功能
... self.__card()
... self.__auth()
... self.__input()
... self.__print_bill()
... self.__take_money()
...
>>> obj=ATM()
>>> obj.withdraw()

隐藏属性与开放接口:
本质就是为了明确地区分内外,类内部可以修改封装内的东西而不影响外部调用者的代码;而类外部只需拿到一个接口,只要接口名、参数不变,则无论设计者如何改变内部实现代码,使用者均无需改变代码。这就提供一个良好的合作基础,只要接口这个基础约定不变,则代码的修改不足为虑。

property

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
BMI指数是用来衡量一个人的体重与身高对健康影响的一个指标,计算公式为:
体质指数(BMI)=体重(kg)÷身高^2(m)
EX:70kg÷(1.75×1.75)=22.86

身高或体重是不断变化的,因而每次想查看BMI值都需要通过计算才能得到,但很明显BMI听起来更像是一个特征而非功能,为此Python专门提供了一个装饰器property,可以将类中的函数“伪装成”对象的数据属性,对象在访问该特殊属性时会触发功能的执行,然后将返回值作为本次访问的结果,例如:

>>> class People:
... def __init__(self,name,weight,height):
... self.name=name
... self.weight=weight
... self.height=height
... @property
... def bmi(self):
... return self.weight / (self.height**2)
...
>>> obj=People('lili',75,1.85)
>>> obj.bmi #触发方法bmi的执行,将obj自动传给self,执行后返回值作为本次引用的结果
21.913805697589478
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

使用property有效地保证了属性访问的一致性。另外property还提供设置和删除属性的功能,如下

>>> class Foo:
... def __init__(self,val):
... self.__NAME=val #将属性隐藏起来
... @property
... def name(self):
... return self.__NAME
... @name.setter
... def name(self,value):
... if not isinstance(value,str): #在设定值之前进行类型检查
... raise TypeError('%s must be str' %value)
... self.__NAME=value #通过类型检查后,将值value存放到真实的位置self.__NAME
... @name.deleter
... def name(self):
... raise PermissionError('Can not delete')
...
>>> f=Foo('lili')
>>> f.name
lili
>>> f.name='LiLi' #触发name.setter装饰器对应的函数name(f,’Egon')
>>> f.name=123 #触发name.setter对应的的函数name(f,123),抛出异常TypeError
>>> del f.name #触发name.deleter对应的函数name(f),抛出异常PermissionError

内容概要

  • 定义函数
  • 调用函数与函数返回值

内容详细

定义函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
函数的使用必须遵循'先定义,后调用'的原则

函数的定义就相当于事先将函数体代码保存起来,然后将内存地址赋值给函数名,函数名就是对这段代码的引用,这和变量的定义是相似的,没有事先定义函数而直接调用,就相当于在引用一个不存在的'变量名'

定义函数的语法:
def 函数名(参数1,参数2,...):
'''文档描述'''
函数体
return
'''
1 def:定义函数的关键字
2 函数名:函数名指向函数内存地址,是对函数体代码的引用 函数的命名应该反映出函数的功能
3 括号:括号内定义参数,参数是可有可无的,且无需指定参数的类型
4 冒号:括号后要加冒号,然后在下一行开始缩进编写函数体的代码
5 '''文档描述''':描述函数功能,参数介绍等信息的文档,非必要,但是建议加上,从而增强函数的可读性
6 函数体:由语句和表达式组成
7 return值:定义函数的返回值,return是可有可无的
'''
1
2
3
4
5
6
7
8
9


1 参数是函数的调用者向函数体传值的媒介,若函数体代码逻辑依赖外部传来的参数时则需要定义为'有参函数'
def my_min(x,y):
if x < y:
res = x
else:
res = y
return res
1
2
3
4
5
6

2 否则定义为'无参函数'
def interactive():
user = input('user: ').strip()
pwd = input('password: ').strip()
return (user,pwd)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25


3 函数体为pass代表什么都不做,称之为空函数
定义空函数通常是有用的,因为在程序设计的开始,往往是先想好程序都需要完成什么功能,然后把所有功能都列举出来用pass充当函数体'这里也可以用...代替pass,但是...只能在py3用'充当函数体'占位符',这将使得程序的体系结构立见,清晰且可读性强
例如要编写一个ftp程序,我们可能想到的功能有用户认证、下载、上传、浏览、切换目录等功能,可以先做出如下定义:

def auth_user():
"""user authentication function"""
pass

def download_file():
"""download file function"""
pass

def upload_file():
"""upload file function"""
pass

def ls():
"""list contents function"""
pass

def cd():
"""change directory"""
pass

之后便可以统筹安排编程任务,有选择性的去实现上述功能来替换掉pass,从而提高开发效率

调用函数与函数返回值

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
函数的使用分为定义阶段和调用阶段
1 定义阶段:只检测语法,不执行函数体代码
2 调用阶段:函数名加括号即函数调用,只有调用函数时才会执行函数体代码


# 定义阶段
def foo():
print('in the foo')
bar()

def bar():
print('in the bar')

# 调用阶段
foo()

执行结果:
in the foo
in the bar
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
定义阶段函数foo与bar均无语法错误,而在调用阶段调用foo()时,函数foo与bar都早已经存在于内存中了,所以不会有任何问题



按照在程序出现的形式和位置,可将函数的调用形式分为三种:

# 1 语句形式:
foo()

# 2 表达式形式
m = my_min(1,2) # 将调用函数的返回值赋值给x
n = 10*my_min(1,2) # 将调用函数的返回值乘以10的结果赋值给n

# 3 函数调用作为参数的形式:
# my_min(2,3) 作为函数my_min的第二个参数,实现了取1,2,3中的较小者赋值给m
m = my_min(1,my_min(2,3))
1
2
3
4
5
6
7
8
9
10
11
12
13

若需要将函数体代码执行的结果返回给调用者,则需要用到return
return后无值或直接省略return,则默认返回Nonereturn的返回值无类型限制,且可以将多个返回值放到一个元组内

def test(x,y,z):
return x,y,z # 等同于return(x,y,z)

res = test(1,2,3)
print(res)

>>>(1,2,3)

return是一个函数结束的标志,函数内可以有多个return,但只执行一次函数就结束了,并把return后定义的值作为本次调用的结果返回

内容概要

  • 什么是异常
  • 异常处理
  • 何时使用异常处理

内容详细

什么是异常

异常是程序发生错误的信号

程序一旦出现错误,便会产生一个异常,若程序中没有处理它,就会抛出该异常,程序的运行也随之终止

img

1
2
3
4
5
6
7
8
9
而错误分为两种:

1 是语法上的错误syntaxerror,这种错误应该在程序运行前就修改正确

>>> if
File "<stdin>", line 1
if
^
SyntaxError: invalid syntax
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
2 是逻辑错误,常见的逻辑错误如:

# TypeError:数字类型无法与字符串类型相加
1+’2

# ValueError:当字符串包含有非数字的值时,无法转成int类型
num=input(">>: ") #输入hello
int(num)

# NameError:引用了一个不存在的名字x
x

# IndexError:索引超出列表的限制
l=['egon','aa']
l[3]

# KeyError:引用了一个不存在的key
dic={'name':'egon'}
dic['age']

# AttributeError:引用的属性不存在
class Foo:
pass
Foo.x

# ZeroDivisionError:除数不能为0
1/0

异常处理

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
为了保证程序的容错性与可靠性 ---> 在遇到错误时有相应的处理机制不会任由程序崩溃 ---> 需要对异常进行处理

处理的基本形式为:

try:
被检测的代码块
except 异常类型
检测到异常,就执行这个位置的逻辑

例如:

try:
print('start...')
print(x) # 引用了一个不存在的名字,触发异常NameError
print('end...')
except NameError as e: # as语法将异常类型的值赋值给变量e,这样我们通过打印e便可以知道错误的原因
print('异常值为:%s' %e)
print('run other code...')

#执行结果为
start...
异常值为:name 'x' is not defined
run other code...
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

========================================================================================

本来程序一旦出现异常即整体结束掉了,但有了异常处理以后:
在被检测的代码块出现异常时:
1 被检测的代码块中异常发生位置之后的代码将不会继续执行
2 取而代之的是执行匹配异常的except子代码块,其余代码均正常运行

当被检测的代码块中有可能触发不同类型的异常时,针对不同类型的异常:
如果我们想分别用不同的逻辑处理,则需要用到多分支的except(类似于多分支的elif,从上到下依次匹配,匹配成功依次便不再匹配其他)

try:
被检测的代码块
except NameError:
触发NameError时对应的处理逻辑
except IndexError:
触发IndexError时对应的处理逻辑
except KeyError:
触发KeyError时对应的处理逻辑
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
例如:

def convert_int(obj):
try:
res=int(obj)
except ValueError as e:
print('ValueError: %s' %e)
res=None
except TypeError as e:
print('TypeError: %s' %e)
res=None
return res

convert_int('egon') # ValueError: invalid literal for int() with base 10: 'egon'
convert_int({'n':1}) # TypeError: int() argument must be a string, a bytes-like object or a number, not 'dict'
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

========================================================================================

如果想多种类型的异常统一用一种逻辑处理,可以将多个异常放到一个元组内,用一个except匹配

try:
被检测的代码块
except (NameError,IndexError,TypeError):
触发NameError或IndexError或TypeError时对应的处理逻辑

例如:

def convert_int(obj):
try:
res=int(obj)
except (ValueError,TypeError):
print('argument must be number or numeric string')
res=None
return res

convert_int('egon') # argument must be number or numeric string
convert_int({'n':1}) # argument must be number or numeric string
1
2
3
4
5
6
7
8
9
10
如果我们想捕获所有异常并用一种逻辑处理,Python提供了一个万能异常类型Exception

try:
被检测的代码块
except NameError:
触发NameError时对应的处理逻辑
except IndexError:
触发IndexError时对应的处理逻辑
except Exception:
其他类型的异常统一用此处的逻辑处理
1
2
3
4
5
6
7
8
9
10
11
12
13

========================================================================================
在多分支except之后还可以跟一个else(else必须跟在except之后,不能单独存在),只有在被检测的代码块没有触发任何异常的情况下才会执行else的子代码块

try:
被检测的代码块
except 异常类型1:
pass
except 异常类型2:
pass
......
else:
没有异常发生时执行的代码块
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
此处try还可以与finally连用,从语法上讲finally必须放到else之后,
但可以使用try-except-finally的形式,
也可以直接使用try-finally的形式

无论被检测的代码块是否触发异常,都会执行finally的子代码块
---> 因此通常在finally的子代码块做一些回收资源的操作,比如关闭打开的文件、关闭数据库连接...

try:
被检测的代码块
except 异常类型1:
pass
except 异常类型2:
pass
......
else:
没有异常发生时执行的代码块
finally:
无论有无异常发生都会执行的代码块
1
2
3
4
5
6
7
8
9
10
11
例如:

f=None
try:
f=open(‘db.txt’,'r',encoding='utf-8')
s=f.read().strip()
int(s) # 若字符串s中包含非数字时则会触发异常ValueError
# f.close() # 若上面的代码触发异常,则根本不可能执行到此处的代码,应该将关闭文件的操作放到finally中
finally:
if f: # 文件存在则f的值不为None
f.close()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
在不符合python解释器的语法或逻辑规则时,是由python解释器主动触发的各种类型的异常,而对于违反程序员自定制的各类规则,则需要由程序员自己来明确地触发异常,这就用到了raise语句,raise后必须是一个异常的类或者是异常的实例

class Student:
def __init__(self,name,age):
if not isinstance(name,str):
raise TypeError('name must be str')
if not isinstance(age,int):
raise TypeError('age must be int')

self.name=name
self.age=age

stu1=Student(4573,18) # TypeError: name must be str
stu2=Student('egon','18') # TypeError: age must be int
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

在内置异常不够用的情况下,我们可以通过继承内置的异常类来自定义异常类

class PoolEmptyError(Exception): # 可以通过继承Exception来定义一个全新的异常
def __init__(self,value='The proxy source is exhausted'): # 可以定制初始化方法
super(PoolEmptyError,self).__init__()
self.value=value

def __str__(self): # 可以定义该方法用来定制触发异常时打印异常值的格式
return '< %s >' %self.value


class NetworkIOError(IOError): # 也可以在特定异常的基础上扩展一个相关的异常
pass


raise PoolEmptyError # __main__.PoolEmptyError: < The proxy source is exhausted >
raise NetworkIOError('连接被拒绝') # __main__.NetworkIOError: 连接被拒绝
1
2
3
4
5
6
7
8
9
10
11

最后,python还提供了一种'断言语句'assert expression,断定表达式expression成立,否则触发异常AssertionError,与raise-if-not的语义相同,如下

age='18'

# 若表达式isinstance(age,int)返回值为False则触发异常AssertionError
assert isinstance(age,int)

# 等同于
if not isinstance(age,int):
raise AssertionError

何时使用异常处理

1
2
3
4
5
6
7
8
9
10
11
在了解了异常处理机制后,本着提高程序容错性和可靠性的目的,可能会错误的认为应该尽可能地为程序加上try...except...
这其实是在过度消费程序的可读性,因为try...except本来就是你附加的一种额外的逻辑,与你的主要工作时没有多大关系的


如果错误发生的条件是 '可预知的',我们应该用if来进行'预防',如下

age=input('input your age>>: ').strip()
if age.isdigit(): # 可预知只有满足字符串age是数字的条件,int(age)才不会触发异常,
age=int(age)
else:
print('You must enter the number')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
如果错误发生的条件是'不可预知的',即异常一定会触发,那么我们才应该使用try...except语句来处理

例如编写一个下载网页内容的功能,网络发生延迟之类的异常是很正常的事,而我们根本无法预知在满足什么条件的情况下才会出现延迟,因而只能用异常处理机制了

import requests
from requests.exceptions import ConnectTimeout # 导入requests模块内自定义的异常

def get(url):
try:
response=requests.get(url,timeout=3)#超过3秒未下载成功则触发ConnectTimeout异常
res=response.text
except ConnectTimeout:
print('连接请求超时')
res=None
except Exception:
print('网络出现其他异常')
res=None
return res

get('https://www.python.org')

引入

1
# 应用程序运行过程中产生的数据最先都是存放于内存中的,若想用就保存下来,必须要保存与硬盘中。应用程序若想操作硬件必须通过操作系统,而文件就是操作系统提供给应用程序来操作硬盘的虚拟概念,用户或应用程序对文件的操作,就是向操作系统发起调用,然后由操作系统完成对硬盘的具体操作

文件操作的基本流程

基本流程

1
2
3
4
5
6
7
8
9
10
有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程:

# 1 打开文件,由应用程序向操作系统发起系统调用open(...),操作系统打开改文件,对应一块硬盘空间,并返回一个文件对象赋值给一个变量f
f = open('a.txt','r',encoding='utf-8') # 默认打开模式就为r

# 2 调用文件对象下的读/写方法,会被操作系统转换为读/写硬盘的操作
data = f.read()

# 3 向操作系统发起关闭文件的请求,回收系统资源
f.close()

img

资源回收与with上下文管理

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
打开一个文件包含两部分资源:应用程序的变量f和操作系统打开的文件。

在操作完毕一个文件时,必须把与该文件的这两部分资源全部回收,回收方法为:

1 f.close() # 回收操作系统打开的文件资源
2 def f # 回收应用程序级的变量

其中del f一定要发生在f.close()之后,否则就会导致操作系统打开的文件无法关闭,白白占用资源,而python自动的垃圾回收机制决定了我们无需考虑del f,这就要求我们,在操作完毕文件后,一定要记住f.close(),虽然我们如此强调,但是大多数还是会不由自主的忘记f.close(),考虑到这一点,python提供了with关键字来帮我们管理上下文

# 1 在执行完子代码块后,with 会自动执行f.close()
with open('a.txt','w')as f:
pass

# 2 可用with同时打开多个文件,用逗号分隔开即可
with open('a.txt','r')as read_f,open('b.txt','w')as write_f:
data = read_f.read()
write_f.write(data)

指定操作文本文件的字符编码

1
2
3
f = open(...)是由操作系统打开文件,如果打开的是文本文件,会涉及到字符编码问题,如果没有为open指定编码,那么打开文本文件的默认编码很明显是操作系统说了算,操作系统会用自己的默认编码去打开文件,在windows下是gbk,在Linux下还是utf-8 这就用到了上节课讲的字符编码的知识:若要保证不乱码,文件以什么方式存的,就要以什么方式打开

f = open('a.txt','r',encoding = 'utf-8')

文件的操作模式

控制文件读写操作的模式

1
2
3
r(默认的):只读
w:只写
a:只追加写

案例一:r模式的使用

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# r只读模式:在文件不存在时则报错,文件存在文件内指针直接跳到文件开头

with open('a.txt',mode='r',encoding='utf-8')as f:
res = f.read() # 会将文件的内容由硬盘全部读入内存,赋值给res

# 练习:实现用户认证功能
inp_name = input('请输入名字: ').strip()
inp_pwd = input('请输入密码').strip()
with open(r'db.txt',mode = 'r', encoding = 'utf-8')as f:
for line in f:
# 把用户输入的名字与密码与读出的内容做比对
u, p = line.strip('\n').split(':')
if inp_name == u and inp_pwd == p:
print('登录成功')
break
else:
print('账户名或密码错误')

案例二:w 模式的使用

1
2
3
4
5
6
7
8
w只写模式: 
在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头

with open('b.txt',mode='w',encoding='utf-8') as f:
f.write('你好\n')
f.write('我好\n')
f.write('大家好\n')
f.write('111\n222\n333\n')
1
2
3
强调:
1 在文件不关闭的情况下,连续的写入,后写的内容一定跟在前写内容的后面
2 如果重新以w模式打开文件,则会清空文件内容

案例三:a 模式的使用

1
# a只追加写模式: 在文件不存在时会创建空文档,文件存在会将文件指针直接移动到文件末尾
1
2
3
4
5
6
小练习:实现注册功能:
name=input('username>>>: ').strip()
pwd=input('password>>>: ').strip()
with open('db1.txt',mode='a',encoding='utf-8') as f:
info='%s:%s\n' %(name,pwd)
f.write(info)
1
2
3
4
强调 w 模式与 a 模式的异同:
1 相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后
2 不同点:以 a 模式重新打开文件,不会清空原文件内容,会将文件指针直接移动到文件末尾,新写的内容永远写在最后

案例四:+ 模式的使用(了解)

1
2
r+ w+ a+ :可读可写
在平时工作中,我们只单纯使用r/w/a,要么只读,要么只写,一般不用可读可写的模式

控制文件读写内容的模式

1
2
3
4
5
6
7
8
大前提:tb模式均不能单独使用,必须与r/w/a其中之一结合使用
r(默认的文本模式):
  1 读写文件都是以字符串为单位的
  2 只针对文本文件
  3 必须指定encoding参数
b:二进制模式
    1 读写文件都是以bytes/二进制为单位的    2 可以针对所有文件
  3 一定不能指定encoding参数

案例一:t 模式的使用

1
2
3
4
5
6
7
8
t 模式:如果我们指定的文件打开模式为r/w/a,其实默认就是rt/wt/at
with open('a.txt',mode='rt',encoding='utf-8') as f:
res=f.read()
print(type(res)) # 输出结果为:<class 'str'>

with open('a.txt',mode='wt',encoding='utf-8') as f:
s='abc'
f.write(s) # 写入的也必须是字符串类型
1
# 强调:t模式只能用于操作文本文件,无论读写,都应该以字符串为单位,而存取硬盘本质都是二进制的形式,当指定t模式时,内部帮我们做了编码与解码

案例二: b 模式的使用

1
2
3
4
5
6
7
8
9
b: 读写都是以二进制位单位
with open('1.mp4',mode='rb') as f:
data=f.read()
print(type(data)) # 输出结果为:<class 'bytes'>

with open('a.txt',mode='wb') as f:
msg="你好"
res=msg.encode('utf-8') # res为bytes类型
f.write(res) # 在b模式下写入文件的只能是bytes类型
1
2
3
4
5
强调:b模式对比t模式
1、在操作纯文本文件方面t模式帮我们省去了编码与解码的环节,b模式则需要手动编码与解码,所以此时t模式更为方便
2、针对非文本文件(如图片、视频、音频等)只能使用b模式


1
2
3
4
5
6
7
8
小练习: 编写拷贝工具

src_file=input('源文件路径: ').strip()
dst_file=input('目标文件路径: ').strip()
with open(r'%s' %src_file,mode='rb') as read_f,open(r'%s' %dst_file,mode='wb') as write_f:
for line in read_f:
# print(line)
write_f.write(line)

操作文件的方法

重点

1
2
3
4
5
6
7
8
读操作:
  f.read() # 读取所有内容,执行完该操作后,文件指针会移动到文件末尾
  f.readline() # 读取一行内容,光标移动到第二行首部
  f.readlines() # 读取每一行内容,存放于列表中

强调:
  f.read()与f.readlines()都是将内容一次性读入内容,如果内容过大会导致内存溢出,若还想将内容全部读入内存,则必须分多次读入,有两种实现方式:

1
2
3
4
5
方式一:

with open('a.txt',mode = 'rt', encoding = 'utf-8')as f:
for line in f:
print(line) # 同一时刻只读入一行内容到内存中
1
2
3
4
5
6
7
8
方式二:
  
with open('1.mp4',mode = 'rb')as f:
while True:
data = f.read(1024) # 同一时刻只读入1024个bytes到内存中
if len(data) == 0:
break
print(data)

imgView Code

1
2
3
4
5
写操作: 
    f.write('1111\n222\n') # 针对文本模式的写,需要自己写换行符
    f.write('1111\n222\n'.encode('utf-8')) # 针对b模式的写,需要自己写换行符
    f.writelines(['333\n', '444\n']) # 文件模式
    f.writelines([bytes('333\n',encoding = 'utf-8'),'444\n'.encode('utf-8')]) # b模式

了解

1
2
3
4
5
6
f.readable()  	# 文件是否可读
f.writable() # 文件是否可读
f.closed # 文件是否关闭
f.encoding # 如果文件打开模式为b,则没有该属性
f.flush() # 立刻将文件内容从内存刷到硬盘
f.name

主动控制文件内指针移动

大前提:文件内指针的移动都是bytes为单位的,唯一例外的是t模式下的read(n),n以字符为单位

1
2
3
4
5
with open('a.txt',mode = 'rt',encoding = 'utf-8')as f:
data = f.read(3) # 读取3个字符

with open('a.txt',mode = 'rb')as f:
data = f.read(3) # 读取3个bytes
1
2
3
4
5
6
7
8
9
10
之前文件内指针的移动都是由读/写操作而被动触发的,若想读取文件某一特定位置的数据,则需要用f.seek方法主动控制文件内指针的移动,详细用法如下:

f.seek(指针移动的字节数,模式控制):

# 模式控制:
模式0:默认的模式,该模式代表指针移动的字节数是以文件开头为参照的
模式1:该模式代表指针移动的字节数是以当前所在位置为参照的
模式2:该模式代表指针移动的字节数是以文件末尾的位置为参照的

# 强调:其中模式0可以在t或者b模式使用,而模式1和模式2只能在b模式下使用

案例一: 0模式详解

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# a.txt用utf-8编码,内容如下(abc各占1个字节,中文“你好”各占3个字节)
abc你好

# 0模式的使用

with open('a.txt',mode='rt',encoding='utf-8') as f:
f.seek(3,0) # 参照文件开头移动了3个字节
print(f.tell()) # 查看当前文件指针距离文件开头的位置,输出结果为3
print(f.read()) # 从第3个字节的位置读到文件末尾,输出结果为:你好
# 注意:由于在t模式下,会将读取的内容自动解码,所以必须保证读取的内容是一个完整中文数据,否则解码失败

with open('a.txt',mode='rb') as f:
f.seek(6,0)
print(f.read().decode('utf-8')) #输出结果为: 好

案例二: 1模式详解

1
2
3
4
5
6
# 1模式的使用
with open('a.txt',mode='rb') as f:
f.seek(3,1) # 从当前位置往后移动3个字节,而此时的当前位置就是文件开头
print(f.tell()) # 输出结果为:3
f.seek(4,1) # 从当前位置往后移动4个字节,而此时的当前位置为3
print(f.tell()) # 输出结果为:7

案例三: 2模式详解

1
2
3
4
5
6
7
8
# a.txt用utf-8编码,内容如下(abc各占1个字节,中文“你好”各占3个字节)
abc你好
# 2模式的使用
with open('a.txt',mode='rb') as f:
f.seek(0,2) # 参照文件末尾移动0个字节, 即直接跳到文件末尾
print(f.tell()) # 输出结果为:9
f.seek(-3,2) # 参照文件末尾往前移动了3个字节
print(f.read().decode('utf-8')) # 输出结果为:好
1
2
3
4
5
6
7
8
9
10
11
# 小练习:实现动态查看最新一条日志的效果
import time
with open('access.log',mode='rb') as f:
f.seek(0,2)
while True:
line=f.readline()
if len(line) == 0:
# 没有内容
time.sleep(0.5)
else:
print(line.decode('utf-8'),end='')

文件的修改

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
# 文件a.txt内容如下:

张一蛋 山东 179 49 12344234523
李二蛋 河北 163 57 13913453521
王全蛋 山西 153 62 18651433422

# 执行操作

with open('a.txt',mode = 'r+t',encoding = 'utf-8')as f:
f.seek(9)
f.write('<妇女主任>')

# 文件修改后的内容如下:

张一蛋<妇女主任> 179 49 12344234523
李二蛋 河北 163 57 13913453521
王全蛋 山西 153 62 18651433422

'''
强调:
1 硬盘中是无法修改的,硬盘中数据的更新都是用新内容覆盖旧内容
2 内存中的数据是可以修改的
'''

文件对应的是硬盘,硬盘不能修改 ---> 文件本质也不能修改

那我们看到文件的内容可以修改,是如何实现的呢?
大致思路是将硬盘中文件内容读入内存,然后再内存中修改完毕后,再覆盖回硬盘

具体的实现方式分为两种 ↓↓↓

文件修改方式一:

1
2
3
4
5
6
7
8
9
# 实现思路:将文件内容一次性全部读入内存,然后再内存中修改完毕后再覆盖写回文件

# 优点:在文件修改过程中同一份数据 只有一份
# 缺点:会过多地占用内存
with open('db.txt',mode='rt',encoding='utf-8') as f:
data=f.read()

with open('db.txt',mode='wt',encoding='utf-8') as f:
f.write(data.replace('kevin','SB'))

文件修改方式二:

1
2
3
4
5
6
7
8
9
10
11
12
13
# 实现思路:以读的方式打开源文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完后写入临时文件...,将临时文件重命名原文件名

# 优点:不会占用过多的内存
# 缺点:在文件修改过程中同一份数据存了两份
import os

with open('db.txt',mode='rt',encoding='utf-8') as read_f,\
open('.db.txt.swap',mode='wt',encoding='utf-8') as wrife_f:
for line in read_f:
wrife_f.write(line.replace('SB','kevin'))

os.remove('db.txt')
os.rename('.db.txt.swap','db.txt')

内容概要

  • 模块介绍
  • 模块的使用

内容详细

模块介绍

在Python中,一个py文件就是一个模块,文件名为xxx.py模块名则是xxx,导入模块可以引用模块中已经写好的功能。如果把开发程序比喻成制造一台电脑,编写模块就像是在制造电脑的零部件,准备好零部件后,剩下的工作就是按照逻辑把它们组装到一起。

将程序模块化会使得程序的组织结构清晰,维护起来更加方便。比起直接开发一个完整的程序,单独开发一个小的模块也会更加简单,并且程序中的模块与电脑中的零部件稍微不同的是:程序中的模块可以被重复使用。所以总结下来,使用模块既保证了代码的重用性,又增强了程序的结构性和可维护性。另外除了自定义模块外,我们还可以导入使用内置或第三方模块提供的现成功能,这种“拿来主义”极大地提高了程序员的开发效率。

模块的使用

import语句

1
2
3
4
5
6
7
8
9
10
# 文件名:foo.py
x = 1
def get():
print(x)
def change():
global x
x = 0
class Foo:
def func(self):
print('from the func')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
想要在另一个py文件中引用foo.py中的功能,需要使用import foo,首次导入模块会做三件事:

1 执行源文件代码

2 产生一个新的名称空间用于存放源文件执行过程中产生的名字

3 在当前执行文件所在的名称空间中得到一个名字foo,该名字指向新创建的模块名称空间,若要引用模块名称空间中的名字,需要加上该前缀,如:

import foo # 导入模块foo
a = foo.x # 引用模块foo中变量x的值赋值给当前名称空间中的名字a
foo.get() # 调用模块foo中的get函数
foo.change() # 调用模块foo中的change函数
obj = foo.Foo() # 调用模块foo的类Foo来实例化,进一步可以执行obj.func()

加上foo.作为前缀,就相当于指名道姓地说明要引用foo名称空间中的名字,所以肯定不会与当前执行文件所在名称空间中的名字相冲突,并且若当前执行文件的名称空间中存在x,执行foo.get()或者foo.change()操作的都是源文件中的全局变量x

# 强调:第一次导入模块已经将其加载到内存空间了,之后的重复导入会直接引用内存中已存在的模块,不会重复执行文件,通过import sys,打印sys.modules的值可以看到内存中已经加载的模块名
1
2
3
4
5

提示:

#1、在Python中模块也属于第一类对象,可以进行赋值、以数据形式传递以及作为容器类型的元素等操作。
#2、模块名应该遵循小写形式,标准库从python2过渡到python3做出了很多这类调整,比如ConfigParser、Queue、SocketServer全更新为纯小写形式。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19


import语句导入多个模块,可以写多行import语句

import module1
import module2
...
import moduleN
还可以在一行导入,用逗号分隔开不同的模块

import module1,module2,...,moduleN
但其实第一种形式更为规范,可读性更强,推荐使用,而且我们导入的模块中可能包含有python内置的模块、第三方的模块、自定义的模块,为了便于明显地区分它们,我们通常在文件的开头导入模块,并且分类导入,一类模块的导入与另外一类的导入用空行隔开,不同类别的导入顺序如下:

1. python内置模块
2. 第三方模块
3. 程序员自定义模块
当然,我们也可以在函数内导入模块,对比在文件开头导入模块属于全局作用域,在函数内导入的模块则属于局部的作用域。


from import语句

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
from...import...与import语句基本一致,唯一不同的是:使用import foo导入模块后,引用模块中的名字都需要加上foo.作为前缀,而使用from foo import x,get,change,Foo则可以在当前执行文件中直接引用模块foo中的名字,如下

from foo import x,get,change #将模块foo中的x和get导入到当前名称空间
a=x #直接使用模块foo中的x赋值给a
get() #直接执行foo中的get函数
change() #即便是当前有重名的x,修改的仍然是源文件中的x
无需加前缀的好处是使得我们的代码更加简洁,坏处则是容易与当前名称空间中的名字冲突,如果当前名称空间存在相同的名字,则后定义的名字会覆盖之前定义的名字。

另外from语句支持from foo import 语法,代表将foo中所有的名字都导入到当前位置

from foo import * #把foo中所有的名字都导入到当前执行文件的名称空间中,在当前位置直接可以使用这些名字

a=x
get()
change()
obj=Foo()
如果我们需要引用模块中的名字过多的话,可以采用上述的导入形式来达到节省代码量的效果,但是需要强调的一点是:只能在模块最顶层使用的方式导入,在函数内则非法,并且的方式会带来一种副作用,即我们无法搞清楚究竟从源文件中导入了哪些名字到当前位置,这极有可能与当前位置的名字产生冲突。模块的编写者可以在自己的文件中定义__all__变量用来控制*代表的意思

#foo.py
__all__=['x','get'] #该列表中所有的元素必须是字符串类型,每个元素对应foo.py中的一个名字
x=1
def get():
print(x)
def change():
global x
x=0
class Foo:
def func(self):
print('from the func')
这样我们在另外一个文件中使用*导入时,就只能导入__all__定义的名字了

from foo import * #此时的*只代表x和get

x #可用
get() #可用
change() #不可用
Foo() #不可用

其他导入语法(as)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
我们还可以在当前位置为导入的模块起一个别名

import foo as f #为导入的模块foo在当前位置起别名f,以后再使用时就用这个别名f
f.x
f.get()
还可以为导入的一个名字起别名

from foo import get as get_x
get_x()
通常在被导入的名字过长时采用起别名的方式来精简代码,另外为被导入的名字起别名可以很好地避免与当前名字发生冲突,还有很重要的一点就是:可以保持调用方式的一致性,例如我们有两个模块json和pickle同时实现了load方法,作用是从一个打开的文件中解析出结构化的数据,但解析的格式不同,可以用下述代码有选择性地加载不同的模块

if data_format == 'json':
import json as serialize #如果数据格式是json,那么导入json模块并命名为serialize
elif data_format == 'pickle':
import pickle as serialize #如果数据格式是pickle,那么导入pickle模块并命名为serialize

data=serialize.load(fn) #最终调用的方式是一致的

循环导入问题

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
循环导入问题指的是在一个模块加载/导入的过程中导入另外一个模块,而在另外一个模块中又返回来导入第一个模块中的名字,由于第一个模块尚未加载完毕,所以引用失败、抛出异常,究其根源就是在python中,同一个模块只会在第一次导入时执行其内部代码,再次导入该模块时,即便是该模块尚未完全加载完毕也不会去重复执行内部代码

我们以下述文件为例,来详细分析循环/嵌套导入出现异常的原因以及解决的方案

m1.py

print('正在导入m1')
from m2 import y

x='m1'
m2.py

print('正在导入m2')
from m1 import x

y='m2'
run.py

import m1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
测试一

#1、执行run.py会抛出异常
正在导入m1
正在导入m2
Traceback (most recent call last):
File "/Users/linhaifeng/PycharmProjects/pro01/1 aaaa练习目录/aa.py", line 1, in <module>
import m1
File "/Users/linhaifeng/PycharmProjects/pro01/1 aaaa练习目录/m1.py", line 2, in <module>
from m2 import y
File "/Users/linhaifeng/PycharmProjects/pro01/1 aaaa练习目录/m2.py", line 2, in <module>
from m1 import x
ImportError: cannot import name 'x'

#2、分析
先执行run.py--->执行import m1,开始导入m1并运行其内部代码--->打印内容"正在导入m1"
--->执行from m2 import y 开始导入m2并运行其内部代码--->打印内容“正在导入m2”--->执行from m1 import x,由于m1已经被导入过了,所以不会重新导入,所以直接去m1中拿x,然而x此时并没有存在于m1中,所以报错
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17


测试二

#1、执行文件不等于导入文件,比如执行m1.py不等于导入了m1
直接执行m1.py抛出异常
正在导入m1
正在导入m2
正在导入m1
Traceback (most recent call last):
File "/Users/linhaifeng/PycharmProjects/pro01/1 aaaa练习目录/m1.py", line 2, in <module>
from m2 import y
File "/Users/linhaifeng/PycharmProjects/pro01/1 aaaa练习目录/m2.py", line 2, in <module>
from m1 import x
File "/Users/linhaifeng/PycharmProjects/pro01/1 aaaa练习目录/m1.py", line 2, in <module>
from m2 import y
ImportError: cannot import name 'y'
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

#2、分析
执行m1.py,打印“正在导入m1”,执行from m2 import y ,导入m2进而执行m2.py内部代码--->打印"正在导入m2",执行from m1 import x,此时m1是第一次被导入,执行m1.py并不等于导入了m1,于是开始导入m1并执行其内部代码--->打印"正在导入m1",执行from m1 import y,由于m1已经被导入过了,所以无需继续导入而直接问m2要y,然而y此时并没有存在于m2中所以报错


解决方案

# 方案一:导入语句放到最后,保证在导入时,所有名字都已经加载过
# 文件:m1.py
print('正在导入m1')

x='m1'

from m2 import y

# 文件:m2.py
print('正在导入m2')
y='m2'

from m1 import x

# 文件:run.py内容如下,执行该文件,可以正常使用
import m1
print(m1.x)
print(m1.y)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

# 方案二:导入语句放到函数中,只有在调用函数时才会执行其内部代码
# 文件:m1.py
print('正在导入m1')

def f1():
from m2 import y
print(x,y)

x = 'm1'

# 文件:m2.py
print('正在导入m2')

def f2():
from m1 import x
print(x,y)

y = 'm2'

# 文件:run.py内容如下,执行该文件,可以正常使用
import m1

m1.f1()
注意:循环导入问题大多数情况是因为程序设计失误导致,上述解决方案也只是在烂设计之上的无奈之举,在我们的程序中应该尽量避免出现循环/嵌套导入,如果多个模块确实都需要共享某些数据,可以将共享的数据集中存放到某一个地方,然后进行导入

搜索模块的路径与优先级

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
模块其实分为四个通用类别,分别是:

1、使用纯Python代码编写的py文件

2、包含一系列模块的包

3、使用C编写并链接到Python解释器中的内置模块

4、使用C或C++编译的扩展模块

在导入一个模块时,如果该模块已加载到内存中,则直接引用,否则会优先查找内置模块,然后按照从左到右的顺序依次检索sys.path中定义的路径,直到找模块对应的文件为止,否则抛出异常。sys.path也被称为模块的搜索路径,它是一个列表类型

>>> sys.path
['',
'/Library/Frameworks/Python.framework/Versions/3.5/lib/python35.zip',
'/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5',
...,
'/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/site-packages'
1
2
3
4
5
6
7
8
9
10
列表中的每个元素其实都可以当作一个目录来看:在列表中会发现有.zip或.egg结尾的文件,二者是不同形式的压缩文件,事实上Python确实支持从一个压缩文件中导入模块,我们也只需要把它们都当成目录去看即可。



sys.path中的第一个路径通常为空,代表执行文件所在的路径,所以在被导入模块与执行文件在同一目录下时肯定是可以正常导入的,而针对被导入的模块与执行文件在不同路径下的情况,为了确保模块对应的源文件仍可以被找到,需要将源文件foo.py所在的路径添加到sys.path中,假设foo.py所在的路径为/pythoner/projects/

import sys
sys.path.append(r'/pythoner/projects/') #也可以使用sys.path.insert(……)

import foo #无论foo.py在何处,我们都可以导入它了

区分py文件的两种用途

1
2
3
4
5
6
7
8
9
10
一个Python文件有两种用途,一种被当主程序/脚本执行,另一种被当模块导入,为了区别同一个文件的不同用途,每个py文件都内置了__name__变量,该变量在py文件被当做脚本执行时赋值为“__main__”,在py文件被当做模块导入时赋值为模块名

作为模块foo.py的开发者,可以在文件末尾基于__name__在不同应用场景下值的不同来控制文件执行不同的逻辑

#foo.py
...
if __name__ == '__main__':
foo.py被当做脚本执行时运行的代码
else:
foo.py被当做模块导入时运行的代码

通常我们会在if的子代码块中编写针对模块功能的测试代码,这样foo.py在被当做脚本运行时,就会执行测试代码,而被当做模块导入时则不用执行测试代码。

编写一个规范的模块

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
我们在编写py文件时,需要时刻提醒自己,该文件既是给自己用的,也有可能会被其他人使用,因而代码的可读性与易维护性显得十分重要,为此我们在编写一个模块时最好按照统一的规范去编写,如下:

#!/usr/bin/env python #通常只在类unix环境有效,作用是可以使用脚本名来执行,而无需直接调用解释器。

"The module is used to..." #模块的文档描述

import sys #导入模块

x=1 #定义全局变量,如果非必须,则最好使用局部变量,这样可以提高代码的易维护性,并且可以节省内存提高性能

class Foo: #定义类,并写好类的注释
'Class Foo is used to...'
pass

def test(): #定义函数,并写好函数的注释
'Function test is used to…'
pass

if __name__ == '__main__': #主程序
test() #在被当做脚本执行时,执行此处的代码

分支结构

什么是分支结构

分支结构就是根据条件判断的真假去执行不同分支对应的子代码

为什么要用分支结构

人类某些时候需要根据条件来决定做什么事情,比如:’如果今天下雨,就带伞’

所以程序中必须有相应的机制来控制计算机具备的人的这种判断能力

如何使用分支结构

if语法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
if 条件1:   # 如果条件1的结果为True,就依次执行:代码1、代码2,......
 代码1
代码2
......
elif 条件2: # 如果条件2的结果为True,就依次执行:代码3、代码4,......
 代码3
代码4
......
elif 条件3: # 如果条件3的结果为True,就依次执行:代码5、代码6,......
 代码5
代码6
......
else:   # 其它情况,就依次执行:代码7、代码8,......
代码7
代码8
......

# 注意:
1 python用相同缩进(4个空格表示一个缩进)来标识一组代码块,用一组代码会自上而下依次运行

2 条件可以使任意表达式,但执行结果必须为布尔类型
# 在if判断中所有的数据类型也都会自动转换成布尔类型
2.1 None0, 空(空字符串, 空列表, 空字典等)三种情况下转换成的布尔值为False
2.2 其余均为True

if应用案例

案例1:

1
2
3
4
5
如果:女人的年龄>30岁,那么:叫阿姨

age_of_girl=31
if age_of_girl > 30:
print('阿姨好')

案例2:

1
2
3
4
5
6
7
如果:女人的年龄>30岁,那么:叫阿姨,否则:叫小姐

age_of_girl=18
if age_of_girl > 30:
print('阿姨好')
else:
print('小姐好')

案例3:

1
2
3
4
5
6
7
8
9
10
如果:女人的年龄>=18并且<22岁并且身高>170并且体重<100并且是漂亮的,那么:表白,否则:叫阿姨**

age_of_girl=18
height=171
weight=99
is_pretty=True
if age_of_girl >= 18 and age_of_girl < 22 and height > 170 and weight < 100 and is_pretty == True:
print('表白...')
else:
print('阿姨好')

案例4:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
如果:成绩>=90,那么:优秀

如果成绩>=80且<90,那么:良好

如果成绩>=70且<80,那么:普通

其他情况:很差

score=input('>>: ')
score=int(score)

if score >= 90:
print('优秀')
elif score >= 80:
print('良好')
elif score >= 70:
print('普通')
else:
print('很差')

案例5:if嵌套

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
#在表白的基础上继续:
#如果表白成功,那么:在一起
#否则:打印。。。

age_of_girl=18
height=171
weight=99
is_pretty=True
success=False

if age_of_girl >= 18 and age_of_girl < 22 and height > 170 and weight < 100 and is_pretty == True:
if success:
print('表白成功,在一起')
else:
print('什么爱情不爱情的,爱nmlgb的爱情,爱nmlg啊...')
else:
print('阿姨好')
1
2
3
4
5
6
7
8
练习1: 登陆功能

name=input('请输入用户名字:').strip()
password=input('请输入密码:').strip()
if name == 'tony' and password == '123':
print('tony login success')
else:
print('用户名或密码错误')
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

练习2

#根据用户输入内容打印其权限

'''
egon --> 超级管理员
tom --> 普通管理员
jack,rain --> 业务主管
其他 --> 普通用户
'''
name=input('请输入用户名字:')

if name == 'egon':
print('超级管理员')
elif name == 'tom':
print('普通管理员')
elif name == 'jack' or name == 'rain':
print('业务主管')
else:
print('普通用户')

循环结构

什么是循环结构?

循环结构就是重复执行某段代码块

为什么要用循环结构?

img

人类某些时候需要重复做某些事情 所以程序中必须有相应的机制来控制计算机具备人的这种循环做事的能力

如何使用循环结构?

while循环语法

1
2
3
4
5
6
7
8
9
python中有whilefor两种循环机制,其中while循环称之为条件循环,语法如下
while 条件:
代码1
代码2
代码3
# while的运行步骤
1 如果条件为真,那么依次执行:代码1, 代码2, 代码3...
2 执行完毕后再次判断条件,如果条件为True则代码再次执行:代码1, 代码2, 代码3...
如果条件为False,则循环终止

img

while循环应用案例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
案例一:while循环的基本使用
用户认证程序

# 用户认证程序的基本逻辑就是接收用户输入的用户名密码然后与程序中存放的用户名密码进行判断,判断成功则登陆成功,判断失败则输出账号或密码错误

username = "jason"
password = "123"

inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
else:
print("输入的用户名或密码错误!")
#通常认证失败的情况下,会要求用户重新输入用户名和密码进行验证,如果我们想给用户三次试错机会,本质就是将上述代码重复运行三遍,你总不会想着把代码复制3次吧。。。。
username = "jason"
password = "123"

# 第一次验证
inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
else:
print("输入的用户名或密码错误!")

# 第二次验证
inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
else:
print("输入的用户名或密码错误!")

# 第三次验证
inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
else:
print("输入的用户名或密码错误!")

#即使是小白的你,也觉得的太low了是不是,以后要修改功能还得修改3次,因此记住,写重复的代码是程序员最不耻的行为。
#那么如何做到不用写重复代码又能让程序重复一段代码多次呢? 循环语句就派上用场啦(使用while循环实现)

username = "jason"
password = "123"
# 记录错误验证的次数
count = 0
while count < 3:
inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
else:
print("输入的用户名或密码错误!")
count += 1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
案例二:while+break的使用

使用了while循环后,代码确实精简多了,但问题是用户输入正确的用户名密码以后无法结束循环,那如何结束掉一个循环呢?这就需要用到break了!
username = "jason"
password = "123"
# 记录错误验证的次数
count = 0
while count < 3:
inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
break # 用于结束本层循环
else:
print("输入的用户名或密码错误!")
count += 1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
案例三:while循环嵌套+break

如果while循环嵌套了很多层,要想退出每一层循环则需要在每一层循环都有一个break
username = "jason"
password = "123"
count = 0
while count < 3: # 第一层循环
inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
while True: # 第二层循环
cmd = input('>>: ')
if cmd == 'quit':
break # 用于结束本层循环,即第二层循环
print('run <%s>' % cmd)
break # 用于结束本层循环,即第一层循环
else:
print("输入的用户名或密码错误!")
count += 1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
案例四:while循环嵌套+tag的使用

针对嵌套多层的while循环,如果我们的目的很明确就是要在某一层直接退出所有层的循环,其实有一个窍门,就让所有while循环的条件都用同一个变量,该变量的初始值为True,一旦在某一层将该变量的值改成False,则所有层的循环都结束
username = "jason"
password = "123"
count = 0

tag = True
while tag:
inp_name = input("请输入用户名:")
inp_pwd = input("请输入密码:")
if inp_name == username and inp_pwd == password:
print("登陆成功")
while tag:
cmd = input('>>: ')
if cmd == 'quit':
tag = False # tag变为False, 所有while循环的条件都变为False
break
print('run <%s>' % cmd)
break # 用于结束本层循环,即第一层循环
else:
print("输入的用户名或密码错误!")
count += 1
1
2
3
4
5
6
7
8
9
10
案例五:while+continue的使用

break代表结束本层循环,而continue则用于结束本次循环,直接进入下一次循环
# 打印1到10之间,除7以外的所有数字
number=11
while number>1:
number -= 1
if number==7:
continue # 结束掉本次循环,即本次循环continue之后的代码都不会运行了,而是直接进入下一次循环
print(number)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
案例五:while+else的使用

while循环的后面,我们可以跟else语句,当while 循环正常执行完并且中间没有被break 中止的话,就会执行else后面的语句,所以我们可以用else来验证,循环是否正常结束
count = 0
while count <= 5 :
count += 1
print("Loop",count)
else:
print("循环正常执行完啦")
print("-----out of while loop ------")
输出
Loop 1
Loop 2
Loop 3
Loop 4
Loop 5
Loop 6
循环正常执行完啦 #没有被break打断,所以执行了该行代码
-----out of while loop ------

如果执行过程中被break,就不会执行else的语句

count = 0
while count <= 5 :
count += 1
if count == 3:
break
print("Loop",count)
else:
print("循环正常执行完啦")
print("-----out of while loop ------")
输出
Loop 1
Loop 2
-----out of while loop ------ #由于循环被break打断了,所以不执行else后的输出语句
1
2
3
4
5
6
7
8
9
练习1

寻找1100之间数字7最大的倍数(结果是98
number=100
while number>0:
if number%7==0:
print(number)
break
number-=1
1
2
3
4
5
6
7
8
9
10
11
12
练习2
age=18
count=0
while count<3:
count+=1
guess = int(input(">>:"))
if guess > age :
print("猜的太大了,往小里试试...")
elif guess < age :
print("猜的太小了,往大里试试...")
else:
print("恭喜你,猜对了...")

for循环语法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
循环结构的第二种实现方式是for循环,for循环可以做的事情while循环都可以实现,之所以用for循环,是因为在循环取值(即遍历值)时,for循环比while循环的使用更为简洁

for循环语法如下 ↓↓↓

for 变量名 in 可迭代对象: # 此时只需知道可迭代对象可以是字符串\列表\字典,我们之后会专门讲解可迭代对象
代码一
代码二
...

#例1
for item in ['a','b','c']:
print(item)
# 运行结果
a
b
c

# 参照例1来介绍for循环的运行步骤
# 步骤1:从列表['a','b','c']中读出第一个值赋值给item(item=‘a’),然后执行循环体代码
# 步骤2:从列表['a','b','c']中读出第二个值赋值给item(item=‘b’),然后执行循环体代码
# 步骤3: 重复以上过程直到列表中的值读尽

img

for循环应用案例

1
2
3
4
案例一:打印数字0-5
# 简单版:for循环的实现方式
for count in range(6): # range(6)会产生从0-5这6个数
print(count)
1
2
3
4
5
# 复杂版:while循环的实现方式
count = 0
while count < 6:
print(count)
count += 1
1
2
3
4
案例二:遍历字典
# 简单版:for循环的实现方式
for k in {'name':'jason','age':18,'gender':'male'}: # for 循环默认取的是字典的key赋值给变量名k
print(k)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 复杂版:while循环确实可以遍历字典,后续将会迭代器部分详细介绍

案例三:for循环嵌套
#请用for循环嵌套的方式打印如下图形:
*****
*****
*****

for i in range(3):
for j in range(5):
print("*",end='')
print() # print()表示换行

注意:breakcontinue也可以用于for循环,使用语法同while循环
1
2
3
4
5
6
7
8
9
练习一:

打印九九乘法表


for i in range(1,10):
for j in range(1,i+1):
print('%s*%s=%s' %(i,j,i*j),end=' ')
print()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
练习二:

打印金字塔


# 分析
'''
#max_level=5
* # current_level=1,空格数=4,*号数=1
*** # current_level=2,空格数=3,*号数=3
***** # current_level=3,空格数=2,*号数=5
******* # current_level=4,空格数=1,*号数=7
********* # current_level=5,空格数=0,*号数=9
数学表达式

空格数=max_level-current_level

号数=2current_level-1

'''

# 实现:

max_level=5

for current_level in range(1,max_level+1):

for i in range(max_level-current_level):

print(' ',end='') #在一行中连续打印多个空格

for j in range(2current_level-1):

print('',end='') #在一行中连续打印多个空格

print()