时间:2022-08-31 11:14:23 | 栏目:C代码 | 点击:次
今天面试字节算法岗时被问到的问题,让我用C++实现一个softmax函数。softmax是逻辑回归在多分类问题上的推广。大概的公式如下:
即判断该变量在总体变量中的占比。
我们用vector来封装输入和输出,简单的按公式复现。
vector<double> softmax(vector<double> input) { double total=0; for(auto x:input) { total+=exp(x); } vector<double> result; for(auto x:input) { result.push_back(exp(x)/total); } return result; }
经过简单测试是正常的。
但是这时面试官提出了一个问题,即如果有较大输入变量时会怎么样?
由于 e^1000已经溢出了双精度浮点(double)所能表示的范围,所以变成了NaN(not a number)。
我们注意观察softmax的公式:
如果我们给上下同时乘以一个很小的数,最后答案的值是不变的。
那我们可以给每一个输入 x i 都减去一个值 a ,防止爆精度。
大致表示如下:
vector<double> softmax(vector<double> input) { double total=0; double MAX=input[0]; for(auto x:input) { MAX=max(x,MAX); } for(auto x:input) { total+=exp(x-MAX); } vector<double> result; for(auto x:input) { result.push_back(exp(x-MAX)/total); } return result; }
我们发现结果正常了。
#include <iostream> #include <vector> #include <math.h> using namespace std; vector<double> softmax(vector<double> input) { double total=0; double MAX=input[0]; for(auto x:input) { MAX=max(x,MAX); } for(auto x:input) { total+=exp(x-MAX); } vector<double> result; for(auto x:input) { result.push_back(exp(x-MAX)/total); } return result; } int main(int argc, char *argv[]) { int n; cin>>n; vector<double> input; while(n--) { double x; cin>>x; input.push_back(x); } for(auto y:softmax(input)) { cout<<y<<' '; } }