Python学习之集合的常用方法总结
什么是集合?
集合并不是一种数据处理类型,而是一种中间类型。
- 集合(set)是一个无序、不重复的元素序列
- 经常被用来处理两个列表进行交并差的处理性
- 集合与列表一样,支持所有的不可变数据类型
集合中所有的元素放在 {} 中间,并用逗号分开,例如:
{1, 2, 3},一个包含 3 个整数的列表
{‘a’, ‘b’, ‘c’},一个包含 3 个字符串的列表
集合与列表的区别
功能 | 列表 | 集合 |
---|---|---|
顺序 | 有序 | 无序 |
内容 | 可重复 | 不可重复 |
功能 | 用于数据的使用 | 用于数据的交集、并集、差集的获取 |
索引 | 有索引 | 无索引 |
符号 | [ ] —> [1, 2, 3] | { } —> {1, 2, 3} |
集合的创建方法
通过 set 函数创建集合,也可以使用有值的大括号来创建。 如 {1, 2} ,但不能使用空的大括号来创建。(空的大括号是一个空的字典)
示例如下:
test_set_01 = set() # ---> 一个空的集合 test_set_02 = set([1, 2, 3]) # ---> 传入列表或元组 test_set_03 = {1, 2, 3} # ---> 传入元素 test_set_04 = {} # ---> 这样的方式是错误的,这是一个空的字典 print(type(test_set_04)) # 执行结果如下: # ---> <class 'dict'>
test_list_01 = ['name', 'age', 'birthday'] test_set_01 = set(test_list_01) print(test_set_01) # 执行结果如下: # >>> {'name', 'age', 'birthday'} 可以看到,传入的并不是列表,而是列表的元素 test_list_02 = ['name', 'age', 'birthday', 'age'] test_set_02 = set(test_list_02) print(test_set_02) # 执行结果如下: # >>> {'name', 'age', 'birthday'} 可以看到,列表里重复的元素,做了去重的处理 test_list_03 = (1, 2, 3, 1, 5) test_set_03 = set(test_list_03) print(test_set_03) # 执行结果如下: # >>> {1, 2, 3, 5} 可以看到,元组里重复的元素,做了去重的处理 test_set_04 = {['name', 'age', 'birthday']} print(test_set_04) # 执行结果如下: # >>> TypeError: unhashable type: 'list' 集合内不可传入列表,否则会报错 test_set_05 = {{'name', 'age', 'birthday'}} print(test_set_05) # 执行结果如下: # >>> TypeError: unhashable type: 'set' 集合内同样也不可传入字典 test_set_06 = {'name', 1, 3.14, (666, 888)} print(test_set_06) # 执行结果如下: # >>> {'name', 3.14, 1, (666, 888)} 集合内可以传入不同的数据类型(列表不可以直接传入)
集合的增删改
add 函数
add 函数的功能:用于集合中添加一个元素,如果集合中已经存在该被添加的元素,则该函数不执行。
add 函数的用法:set.add(item) ;item 为要被添加到集合的元素;无返回值。
示例如下:
test_set = {'name', 'age', 'birthday'} test_set.add('sex') test_set.add('name') print(test_set) # 执行结果如下: # >>> {'sex', 'birthday', 'age', 'name'} 已存在的 'name' 元素,未再次执行添加
update 函数
update 函数的功能:在集合中加入一个新的集合(或者列表、元组、字符串),如果新集合内的元素在原集合中存在则无视。
update 函数的用法:set.update(iterable) ;iterable为集合、列表、元组、字符串;无返回值,直接作用于原集合。
示例如下:
test_set = set() test_list = ['name', 'age', 'birthday'] test_set.update(test_list) print(test_set) # 执行结果如下: # >>> {'birthday', 'age', 'name'} 列表的成员(元素)被添加进集合 test_tuple = (666, 888) test_set.update(test_tuple) print(test_set) # 执行结果如下: # >>> {'name', 'birthday', 'age', 888, 666} 元组的成员(元素)被添加进集合 name = 'Neo' test_set.update(name) print(test_set) # 执行结果如下: # >>> {'name', 'N', 'birthday', 'e', 'age', 'o', 888, 666} 字符串是每个字符都作为元素被添加进集合的
remove 函数
remove函数的功能:将集合中某个元素删除,如果该元素不存在则会报错。
remove函数的用法:set.remove(item) ;item 为当前集合中的一个元素;无返回值,直接作用于原集合。
需要注意的是,item 为集合中的某一个元素,而不是索引。
示例如下:
test_set = set() test_list = ['name', 'age', 'birthday'] test_set.update(test_list) print(test_set) # 执行结果如下: # >>> {'name', 'birthday', 'age'} test_set.remove('age') print(test_set) # 执行结果如下: # >>> {'birthday', 'name'} test_set_01 = set() test_set.remove('test') print(test_set_01) # 执行结果如下: # >>> KeyError: 'test' 'test'元素不存在则报错。
clear 函数
clear 函数的功能:清空当前集合中所有的元素
clear 函数的用法:set.clear() ;无返回值,直接作用于原集合。
示例如下:
test_set = set() test_list = ['name', 'age', 'birthday'] test_set.clear() print(test_set) # 执行结果如下: # >>> set()
del 方法删除集合
del 的功能:直接删除 (作用于集合,无法通过索引删除)
示例如下:
test_set = set() test_list = ['name', 'age', 'birthday'] test_set.update(test_list) print(test_set) # 执行结果如下: # >>> {'birthday', 'age', 'name'} del test_set print(test_set) # 执行结果如下: # >>> NameError: name 'test_set' is not defined.
关于集合的重要说明
- 集合无法通过索引获取元素
- 集合无获取元素的任何方法
- 集合只是用来处理列表或元组的一种临时类型,它不适合存储、传输数据
获取两个集合交、并、差集的函数
difference() 函数
什么是差集:
a 和 b 两个集合,由所属于 a 且不属于 b 的元素组成的集合叫做 a 集合 与 b 集合 的差集。
difference() 函数的功能:返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合中。
difference() 函数的用法:a_set.difference(b_set) ;b_set 为当前集合需要比对的集合;返回值为原集合作用于对比集合的差集。(即 a_set 与 b_set 的差集)
示例如下:
names_set_01 = {'Neo', 'Lily', 'Jack'} names_set_02 = {'Jack', 'Adem', 'Albina'} names_diff = names_set_01.difference(names_set_02) print(names_diff) # 执行结果如下: # >>> {'Lily', 'Neo'}
intersection() 函数
什么是交集?
a 和 b 两个集合,分别拥有相同的元素集,称之为 a 集合 与 b 集合 的交集。
intersection() 函数的功能:返回两个或者更多个集合中都包含有的元素。(即交集)
intersection() 函数的用法:a_set.inersection(b_set...) ;b_set… 为当前集合需要比对的一个或者多个集合;返回值为原集合作用于对比集合的交集。
示例如下:
names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'} names_set_02 = {'Jack', 'Adem', 'Albina'} names_set_03 = {'Apollo', 'Ben', 'Adem'} names_inter = names_set_01.intersection(names_set_02, names_set_03) print(names_inter) # 执行结果如下: # >>> {'Adem'}
union() 函数
什么是并集?
a 和 b 两个集合中所有的元素(去掉重复的),即为 a 集合 与 b 集合 的并集。
union() 函数的功能:返回多个集合的并集,即包含了所有集合的元素(重复的元素,只出现一次)
union() 函数的用法:a_set.union(b_set...) ;b_set… 为当前集合需要比对的一个或者多个集合;返回值为原集合作用于对比集合的并集。
示例如下:
names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'} names_set_02 = {'Jack', 'Adem', 'Albina'} names_set_03 = {'Apollo', 'Ben', 'Adem'} names_union = names_set_01.union(names_set_02, names_set_03) print(names_union) # 执行结果如下: # >>> {'Lily', 'Neo', 'Albina', 'Apollo', 'Jack', 'Ben', 'Adem'}
判断两个集合中是否存在相同的元素
isdisjoint() 函数
isdisjoint()函数的功能:判断两个集合是否包含相同的元素,如果没有返回 True , 否则就返回 False
isdisjoint()函数的用法:a_set.isdisjoint(b_set) ;b_set 为与当前集合用来判断的集合;返回值为布尔值
示例如下:
names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'} names_set_02 = {'Jack', 'Adem', 'Albina'} names_isdisjoint = names_set_01.isdisjoint(names_set_02) print(names_isdisjoint) # 执行结果如下: # >>> False names_set_01 = {'Neo', 'Lily', 'Jack'} names_set_02 = {'Ben', 'Adem', 'Albina'} names_isdisjoint = names_set_01.isdisjoint(names_set_02) print(names_isdisjoint) # 执行结果如下: # >>> True
拓展 - 集合的 ‘&、|、- 运算符’
&
符可以计算两个集合的交集,与集合的intersection()函数实现的功能一样
|
符可以计算两个集合的并集,与集合的union()函数实现的功能一样
-
运算符可以计算两个集合的差集,与集合的difference()函数实现的功能一样
代码示例如下:
# 交集 names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'} names_set_02 = {'Jack', 'Adem', 'Albina'} names_set_03 = {'Apollo', 'Ben', 'Adem'} names_inter = names_set_01.intersection(names_set_02, names_set_03) names_inter_01 = names_set_01 & names_set_02 & names_set_03 print(names_inter) print(names_inter_01) # 执行结果如下: # >>> {'Adem'} # >>> {'Adem'}
# 差集 names_set_01 = {'Neo', 'Lily', 'Jack'} names_set_02 = {'Jack', 'Adem', 'Albina'} names_diff = names_set_01.difference(names_set_02) names_diff_01 = names_set_01 - names_set_02 print(names_diff) print(names_diff_01) # 执行结果如下: # >>> {'Lily', 'Neo'} # >>> {'Lily', 'Neo'}
# 并集 names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'} names_set_02 = {'Jack', 'Adem', 'Albina'} names_set_03 = {'Apollo', 'Ben', 'Adem'} names_union = names_set_01.union(names_set_02, names_set_03) names_union_1 = names_set_01 | names_set_02 | names_set_03 print(names_union) print(names_union_1) # 执行结果如下: # >>> {'Adem', 'Albina', 'Neo', 'Jack', 'Lily', 'Ben', 'Apollo'} # >>> {'Adem', 'Albina', 'Neo', 'Jack', 'Lily', 'Ben', 'Apollo'}
&、|、- 与 intersection()、union()、difference()函数的不同之处
集合运算时:
intersection()、union()、difference()函数的参数可以是集合,也可以是列表或字典、字符串。
&、|、-运算符左右两边必须是集合。