详解Pandas的三大利器(map,apply,applymap)

模拟数据

通过一个模拟的数据来说明3个函数的使用，在这个例子中学会了如何生成各种模拟数据。数据如下：

import pandas as pd
import numpy as np

boolean = [True, False]
gender = ["男","女"]
color = ["white","black","red"]

# 好好学习如何生成模拟数据：非常棒的例子
# 学会使用random模块中的randint方法

df = pd.DataFrame({"height":np.random.randint(160,190,100),
                     "weight":np.random.randint(60,90,100),
                     "smoker":[boolean[x] for x in np.random.randint(0,2,100)],
                     "gender":[gender[x] for x in np.random.randint(0,2,100)],
                     "age":np.random.randint(20,60,100),
                     "color":[color[x] for x in np.random.randint(0,len(color),100)]
                    })
df.head()

1、map

demo

map() 会根据提供的函数对指定序列做映射。

第一个参数 function 以参数序列中的每一个元素调用 function 函数，返回包含每次 function 函数返回值的新列表。

map(function, iterable)

实际数据

将gender中男变成1，女变成0

# 方式1：通过字典映射实现
dic = {"男":1, "女":0}  # 通过字典映射
df1 = df.copy()   # 副本，不破坏原来的数据df
df1["gender"] = df1["gender"].map(dic)
df1

# 方式2：通过函数实现
def map_gender(x):
    gender = 1 if x == "男" else 0
    return gender

df2 = df.copy()
# 将df["gender"]这个S型数据中的每个数值传进去
df2["gender"] = df2["gender"].map(map_gender)
df2

2、apply

apply方法的作用原理和 map方法类似，区别在于 apply能够传入功能更为复杂的函数，可以说 apply是 map的高级版

pandas 的 apply() 函数可以作用于 Series 或者整个 DataFrame，功能也是自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数。

在 DataFrame对象的大多数方法中，都会有 axis这个参数，它控制了你指定的操作是沿着0轴还是1轴进行。 axis=0代表操作对列columns进行， axis=1代表操作对行row进行

demo

上面的数据中将age字段的值都减去3，即加上-3

def apply_age(x,bias):
    return x + bias

df4 = df.copy()
# df4["age"]当做第一个值传给apply_age函数，args是第二个参数
df4["age"] = df4["age"].apply(apply_age,args=(-3,))

计算BMI指数

# 实现计算BMI指数：体重/身高的平方(kg/m^2)
def BMI(x):
    weight = x["weight"]
    height = x["height"] / 100
    BMI = weight / (height **2)

    return BMI

df5 = df.copy()
df5["BMI"] = df5.apply(BMI,axis=1)  # df5现在就相当于BMI函数中的参数x；axis=1表示在列上操作
df5

DataFrame型数据的 apply操作总结：

当 axis=0时，对每列columns执行指定函数；当 axis=1时，对每行row执行指定函数。
无论 axis=0还是 axis=1，其传入指定函数的默认形式均为 Series，可以通过设置 raw=True传入 numpy数组。
对每个Series执行结果后，会将结果整合在一起返回（若想有返回值，定义函数时需要 return相应的值）

apply实现需求

通过apply方法实现上面的性别转换需求。apply方法中传进来的第一个参数一定是函数

3、applymap

DF数据加1

applymap函数用于对DF型数据中的每个元素执行相同的函数操作，比如下面的加1：

频道导航

详解Pandas的三大利器(map,apply,applymap)

目录

模拟数据

1、map

demo

实际数据

2、apply

demo

apply实现需求

3、applymap

DF数据加1

保留2位有效数字

您可能感兴趣的文章: