写在之前
今天要讲的集合是和我们之前讲过的字符串,列表,元组,字典一样,也是一种数据类型,用 set 表示,翻译成中文叫“集合”。如果之前的数据类型忘记了,可以通过下面的连接去看。
集合的创建
集合的特点是元素无次序,不可重复,有的可变,有的不可变。我们之前写元组的时候说过它是列表的部分特征和字符串的部分特征的并集,那么这里的集合就是列表的部分特征和字典的部分特征的并集。
创建集合有两种方法,一种是 set(),一种是 { },在这里的话我们不推荐使用后一种,因为我们已经把 { } 给了字典,要避免歧义,在这里说后一种方法的原因是希望你知道有这么一种方法建立集合,免得在某个地方看到的时候你会奇怪为什么字典的格式不对,其实它可能是集合。
>>> a = set("leey")>>> aset(['y', 'e', 'l'])>>> b = set(['python','c++','java','c++'])>>> bset(['python', 'java', 'c++'])>>> c = { 'a','b','c','a'}>>> cset(['a', 'c', 'b'])复制代码
看到上面的例子了吗?输出无序,重复的元素也被去掉,这是一种非常简洁高效的元素去重方式。
集合的方法
集合的方法有很多,还记得怎么看吗?用 dir(set) 就可以看到不少集合的方法,每个函数的具体使用方法可以用 help() 找到,我在这里主要讲几个常用的。
1.add & update
add 是在集合中添加元素,在这里有一点要注意建立空集合的时候要用 set 而不是 { },请看下面的例子:
>>> a = {}>>> type(a)>>> a = set()>>> type(a) >>> a.add('rocky')>>> aset(['rocky'])复制代码
看到了吗?虽然字典和集合都用 { },但是直接用 a = { },得到的是字典而不是集合。在这里提一嘴,type() 函数是用来查看对象的类型的函数。
update 是将另一个集合合并过来的方法。
>>> a = set([1,2,3])>>> b = set(['a','b','c'])>>> a.update(b)>>> aset(['a', 1, 2, 3, 'b', 'c'])>>> bset(['a', 'c', 'b'])复制代码
2.pop & remove & clear
pop 每次删除一个,并返回删除的结果,因为集合没有顺序,所以是随机删除,并且 pop 没有参数。
>>> a = set([1,2,3])>>> a.pop()1>>> aset([2, 3])>>> a.pop(2)Traceback (most recent call last): File "", line 1, in TypeError: pop() takes no arguments (1 given)复制代码
remove 也是删除,它没有返回值,但是它可以删除指定元素,但是删除的必须是集合中的元素,否则会报错。
>>> a = set([1,2,3])>>> a.remove(1)>>> aset([2, 3])>>> a.remove(4)Traceback (most recent call last): File "", line 1, in KeyError: 4复制代码
clear 也是删除,但它是集合删除中惹不起的存在,因为它直接会把集合清空。
>>> a = set([1,2,3])>>> a.clear()>>> aset([])复制代码
集合的运算
集合的运算和我们数学中在我看来是一个样的,分为元素和集合,集合和集合。
首先来说元素和集合。元素和集合只有一种关系,那就是属于或者不属于某个集合。
>>> a = set([1,2,3])>>> 1 in aTrue>>> '1' in aFalse复制代码
然后再来说集合和集合。集合和集合比较常见的有 5 种关系,下面容我一一道来(假设我们有两个集合 A 和 B)。
1.A 与 B 相等
>>> a = set([1,2,3])>>> b = set([1,2,3])>>> a == bTrue>>> b = set(['a','b','c'])>>> a == bFalse复制代码
2.A 是 B 的子集
子集的意思就是 A 的元素在 B 里都有且 B 的元素个数比 A 多。可以用 A < B 或者 A.issubset(B) 判断,如果是 True 则表示 A 是 B 的子集。
>>> a = set([1,2,3])>>> b = set([1,2,3,'a','b'])>>> a < bTrue>>> a.issubset(b)True复制代码
3.A 和 B 的并集
并集的意思就是 A 和 B 中的所有元素,可以用 A | B 或者 A.union(B) 表示,吧并集的结果是生成一个新的对象,并不是在这两个集合上的扩充。
>>> a = set([1,2,3])>>> b = set([1,2,3,'a','b'])>>> c = a | b>>> cset(['a', 1, 2, 3, 'b'])>>> c = a.union(b)>>> cset(['a', 1, 2, 3, 'b'])复制代码
4.A 和 B 的交集
交集的意思就是 A 和 B 中公有的元素。可以用 A & B 或者 A.intersection(B) 表示,交集的结果也是生成一个新的对象。
>>> a = set([1,2,3])>>> b = set([1,2,3,'a','b'])>>> c = a & b>>> cset([1, 2, 3])>>> c = a.intersection(b)>>> cset([1, 2, 3])复制代码
5.A 相对 B 的补集
补集也叫差集,意思就是只属于 A 的元素但是不属于 B 的元素,你可以理解成 A 集合中的元素去掉 A 与 B 的交集。可以用 A - B 或者 A.difference(B) 表示。
>>> a = set(['a','b','c',1,2,3])>>> b = set(['a','b',1,4])>>> a - bset(['c', 3, 2])>>> a.difference(b)set(['c', 3, 2])复制代码
还有一点我想说的是,用这些运算的时候最好用带名字的函数,因为使用运算符的话可读性很差。
写在最后
到本篇为止,Python 中常见的对象类型我都写完了,算是完成了一个小目标,接下来的一个阶段的话开始写 Python 的语句方面,包括 if else,for 循环啦等等,因为在了解了基本的对象类型以后,就要学会如何去使用它们。
更多内容,欢迎关注公众号「Python空间」,期待和你的交流。