Python学习之不同数据类型间的转换总结
字符串与数字类型的转换
什么是类型转换?—> 将自身的数据类型变成新的数据类型,并拥有新的数据类型的所有功能的过程即为类型转换
为什么做类型转换?—> 为了方便更好的帮助处理业务,将类型变更为更适合业务场景的类型
举例:比如 a = '1' ,这是一个字符串类型,所以它无法执行数字类型的操作。
字符串与数字之间转换的要求
str —> number :必须是由数字组成的字符串才可以通过类型转换转为数字类型
int_str = '1024' ; float_str = '3.1415926'
number —> str : 无任何要求
字符串与数字之间的转换函数
原始类型 | 目标类型 | 函数 | 举例 |
---|---|---|---|
整型 | 字符串 | str | new_str = str(123456) |
浮点型 | 字符串 | str | new_str = str(3.1515926) |
字符串 | 整型 | int | new_int = int(‘1234’) |
字符串 | 浮点型 | int | new_float = int(‘3.1415926’) |
示例如下:
str_int = '1024' new_int = int(int_str) print(new_int) # 执行结果如下: # >>> 1024 # >>> <class 'int'> int_str = 3.1415926 new_str = str(int_str) print(new_str) print(type(new_str)) # 执行结果如下: # >>> 3.1415926 # >>> <class 'str'> int_and_str = '123abc' # 只有数字组成的字符串才可以通过类型转换转为数字类型 new_int = int(int_and_str) print(new_int) # 执行结果如下: # >>> ValueError: invalid literal for int() with base 10: '123abc'
字符串与列表之间的转换
split() 函数 - 字符串转列表
split() 函数 的功能:将字符串以一定的规则切割,并转换成列表。
split() 函数 的用法:string.split(sep=Node, maxsplit=-1) ;
- sep : 为作为切割识别的规则符号,不填写的情况下默认切割规则符号为空格;如果字符串不存在空格,则不分割成列表。
- maxsplit:将字符串以切割规则符号切割的次数,默认为 -1 , 即不限制次数。
- split() 函数 的 返回值为列表
示例如下:
name = 'My name is Neo' name_list = name.split() print(name_list) # 执行结果如下: # >>> ['My', 'name', 'is', 'Neo'] # >>> 可以看到已经将 'name' 以空格为切割规则符号切割成了每个单词为一个元素的列表 test_int = '1, 2, 3, 4' test_int_list = test_int.split(',') print(test_int_list) # 执行结果如下: # >>> ['1', ' 2', ' 3', ' 4'] # >>> 可以看到已经将 'test_int' 以逗号为切割规则符号切割成了每个单词为一个元素的列表 test_str = 'a|b|c|d|e' test_str_list = test_str.split('|', 2) print(test_str_list) # 执行结果如下: # >>> ['a', 'b', 'c|d|e'] # >>> 可以看到已经将 'test_str_list' 以 '|' 为切割规则符号切割成了两次 error_str = ' a~b~c ' test_error_str = error_str.split('') print(test_error_str) # 执行结果如下: # >>> ValueError: empty separator 注意:split()函数是不可以用空字符串作为切割规则符号的
join() 函数 - 列表转字符串
split() 函数 的功能:将列表以一定的规则切割,并转换成字符串。
split() 函数 的用法:'sep'.join(iterable) ;
- sep:生成字符串用来分割列表每个元素的符号
- iterable:非数字类型的列表或元组或集合
- join() 函数 的 返回值为一个字符串
- 需要注意的是:只有列表的元素为字符串的情况下才可以将列表转为字符串,列表元素为 数字、元组、字典等数据类型的情况下,则会报错。
示例如下:
test_info = ['a', 'b', 'c'] new_info = '-'.join(test_info) print(new_info) # 执行结果如下: # >>> a-b-c test_info_int = [1, 2, 3, 4] new_info_int = '-'.join(test_info_int) print(new_info_int) # 执行结果如下: # >>> TypeError: sequence item 0: expected str instance, int found test_info_tuple = [(1, ), (2, 3, 4)] new_info_tuple= '-'.join(test_info_tuple) print(new_info_tuple) # 执行结果如下: # >>> TypeError: sequence item 0: expected str instance, int found
数据类型转换 - 小练习
将字符串 'a e f h j k d l' , 转换为列表并进行排序,然后再转为字符串。
代码示例如下:
sort_str = 'a e f h j k d l' sort_str_list = sort_str.split(' ') print(sort_str_list) # 执行结果如下: # >>> ['a', 'e', 'f', 'h', 'j', 'k', 'd', 'l'] sort_str_list.sort() print(sort_str_list) # 执行结果如下: # >>> ['a', 'd', 'e', 'f', 'h', 'j', 'k', 'l'] sort_str = '|'.join(sort_str_list) print(sort_str) print(type(sort_str)) # 执行结果如下: # >>> a|d|e|f|h|j|k|l # >>> <class 'str'>
拓展 - sorted() 函数
sorted() 函数区别于 sort() 函数。sort() 函数为列表的内置函数,而sorted() 函数为python的内置函数,可以处理所有的数据类型。
示例如下:
sort_str_new = 'aefhjkdc' result = sorted(sort_str_new) print(result) # 执行结果如下: # >>> ['a', 'c', 'd', 'e', 'f', 'h', 'j', 'k'] print(''.join(result)) # 执行结果如下: # >>> acdefhjk
字符串与bytes通过编解码进行转换
什么是 bytes ?(比特类型) —> bytes 是一种二进制数据流,也是一种可传输的类型,在各个编程语言中都存在。也可以认为它是一种特殊的字符串,因为它长得和字符串几乎一模一样,同时也拥有字符串几乎所有的内置函数。我们完全可以像操作字符串一样操作 比特类型 (bytes),只不过字符串前需要加上 b 的标识。
示例如下:
bt = b'my name is Neo' print('\'bt\'的值为:', bt, ';\'bt\'的类型为:', type(bt)) # 执行结果如下: # >>> 'bt'的值为: b'my name is Neo' ;'bt'的类型为: <class 'bytes'> print(bt.capitalize()) # 执行结果如下: # >>> b'My name is neo' print(bt.replace('Neo', 'Jack')) # 执行结果如下: # >>> TypeError: a bytes-like object is required, not 'str' 这里的报错是因为我们替换的类型为字符串类型,正确的写法如下 print(bt.replace(b'Neo', b'Jack')) # 执行结果如下: # >>> b'my name is Jack' print(bt[0]) print(bt[-1]) print(bt[3:8]) # 执行结果如下: # >>> 109 这里的109是 'n' 的二进制流的显示方式 # >>> 111 这里的111是 'o' 的二进制流的显示方式 # >>> b'name ' print('\'N\'字符的索引位置为:', bt.find(b'N')) # 执行结果如下: # >>> 'N'字符的索引位置为: 11 test_info = b'my name is \'李雷\'' print(test_info) # 执行结果如下: # >>> SyntaxError: bytes can only contain ASCII literal characters. # 报错信息为"bytes"类型只支持ASCII码的字符 # 由此也引出了下文的 encode() 函数 与 decode() 函数
encode() 函数 - 字符串转 bytes
encode() 函数 的功能:将字符串转为比特(byte)类型
encode() 函数 用法:
用法:string.encode(encoding='utf-8', errors='strict')
参数:encoding 与 errors
- encoding 转换成的编码格式,如ascii、gbk、默认为 ‘utf-8’
- errors 出错时的处理方法,默认为 strict ;直接报错误,也可以选择 ignore 忽律错误
- 返回值为一个比特(bytes)类型
示例如下:
test_str = 'my name is HanMeimei' bytes_str = test_str.encode('utf-8') print(bytes_str) print(type(bytes_str)) # 执行结果如下: # >>> b'my name is HanMeimei' # >>> <class 'bytes'>
decode() 函数 - bytes 转字符串
decode() 函数 的功能:将比特(byte)类型转为字符串
decode() 函数 用法:
用法:string.encode(encoding='utf-8', errors='strict') ;
参数:encoding 与 errors; 注意,这里的 encoding 是解码的作用,encode() 函数 的 encoding 是 编码的作用。
- encoding 转换成的编码格式,如ascii、gbk、默认为 ‘utf-8’
- errors 出错时的处理方法,默认为 strict ;直接报错误,也可以选择 ignore 忽律错误
- 返回值为一个字符串类型
示例如下:
bytes_str = b'Python is very good' test_str = bytes_str.decode('utf-8') print(test_str) print(type(test_str)) # 执行结果如下: # >>> Python is very good # >>> <class 'str'>
str_date = 'my name is \'亚当\'' byte_date = str_date.encode('utf-8') print(byte_date) # 执行结果如下: # >>> b"my name is '\xe4\xba\x9a\xe5\xbd\x93'" 这是 utf-8 转化的中文的样子 print(byte_date.decode('utf-8')) # 执行结果如下: # >>> my name is '亚当'
列表、集合、元组的转换
列表元组集合间转换的函数
原始类型 | 目标类型 | 函数 | 举例 |
---|---|---|---|
列表 | 集合 | set | new_set = set([1, 2, 3, 4, 5]) |
列表 | 元组 | tuple | new_tuple = ([1, 2, 3, 4, 5] |
元组 | 集合 | set | new_set = set((1, 2, 3, 4, 5)) |
元组 | 列表 | list | new_set = set((1, 2, 3, 4, 5)) |
集合 | 列表 | list | new_list = list({1, 2, 3, 4, 5}) |
集合 | 元组 | tuple | new_tuple = tuple({1, 2, 3, 4, 5}) |