在实际使用机器学习算法时，面对训练集，是如何知道它是线性可分的，还是不可分的？？ - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

Recommended Services

› Amazon Web Services

› ClearDB

这是一个创建于 3120 天前的主题，其中的信息可能已经有所发展或是发生改变。

是因为尝试使用某种算法，比如 LR ，发现代价函数不收缩，从而确定不合适？
还是有什么标准，一开始就能确定训练集是线性可分的，还是不可分的？？

3 条回复 • 2016-05-13 07:28:13 +08:00

1

menc

2016-05-12 18:20:24 +08:00

如果维数不高，可以任意取两维打出来看看，多取几次，两维都线性不可分，那么数据集就线性不可分了。

然而我一般不用。
直接上模型。

非线性模型， svm 啊， gbdt 啊，对线性可分的问题拟合能力也不错的。

如果要一个确定的方法确定是线性可分还是线性不可分，那这样的方法是不存在的，要不然 svm 的 kernel function 选什么就不是玄学了。

2

tony1016

OP

2016-05-12 20:55:49 +08:00

@menc 哦，这样子，感谢

3

srlp

2016-05-13 07:28:13 +08:00

一般现实世界的，默认不可分吧。计算力足够的话，所有模型都强行上一次试试。

关于 · 帮助文档 · 博客 · API · FAQ · 实用小工具 · 5039 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 24ms · UTC 01:11 · PVG 09:11 · LAX 17:11 · JFK 20:11
Developed with CodeLauncher
♥ Do have faith in what you're doing.