PCA 影响机器学习的可解释性吧?

2022-02-07 08:47:40 +08:00
 huzhikuizainali
比如样本有多个属性(变量):年龄,性别,年收入,年消费额,年投资额……如果直接做回归预测,比如预测样本第二年的消费额。出来的结果是有可解释性的。因为所有属性都在。

但是如果应用了 PCA 降维以后,原有属性都淹没在新的属性当中了吧?可是新属性的含义有不明。所以是不是影响机器学习结论的可解释性?

如果是,有什么可以增加解释性的的解决方法么?
1256 次点击
所在节点    机器学习
4 条回复
ypw
2022-02-07 09:45:44 +08:00
pca 可以提供每个属性的权重,并不是新属性含义不明。

事实上 pca 只是一个线性变换:

```py
np.dot(X, pca.components_.T)
```

参考链接: https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html
GrayXu
2022-02-07 11:43:45 +08:00
> 可是新属性的含义有不明

这句话是错误的。
huzhikuizainali
2022-02-07 14:50:40 +08:00
@GrayXu 比如原来 x1 ,x2……xm 代表不同的属性。PCA 以后变成 z1 ,z2……zk ( k<m )这是 z 和 x 怎么对应呢?有这方面的中文介绍么?
bstjanced555
2022-02-10 15:02:55 +08:00
或许 pca 可以看作是原始特征在另一空间的投影?这个空间是为了提取 x1...xm 与目标结果 y 对应的某些联合特征,也就相当于 1 楼说的属性权重

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/832148

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX