在实际使用机器学习算法时,面对训练集,是如何知道它是线性可分的,还是不可分的??

2016-05-12 15:49:41 +08:00
 tony1016
是因为尝试使用某种算法,比如 LR ,发现代价函数不收缩,从而确定不合适?
还是有什么标准,一开始就能确定训练集是线性可分的,还是不可分的??
2814 次点击
所在节点    云计算
3 条回复
menc
2016-05-12 18:20:24 +08:00
如果维数不高,可以任意取两维打出来看看,多取几次,两维都线性不可分,那么数据集就线性不可分了。

然而我一般不用。
直接上模型。

非线性模型, svm 啊, gbdt 啊,对线性可分的问题拟合能力也不错的。

如果要一个确定的方法确定是线性可分还是线性不可分,那这样的方法是不存在的,要不然 svm 的 kernel function 选什么就不是玄学了。
tony1016
2016-05-12 20:55:49 +08:00
@menc 哦,这样子,感谢
srlp
2016-05-13 07:28:13 +08:00
一般现实世界的,默认不可分吧。计算力足够的话,所有模型都强行上一次试试。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/278195

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX