V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
tony1016
V2EX  ›  云计算

在实际使用机器学习算法时,面对训练集,是如何知道它是线性可分的,还是不可分的??

  •  
  •   tony1016 · 2016-05-12 15:49:41 +08:00 · 2815 次点击
    这是一个创建于 3120 天前的主题,其中的信息可能已经有所发展或是发生改变。
    是因为尝试使用某种算法,比如 LR ,发现代价函数不收缩,从而确定不合适?
    还是有什么标准,一开始就能确定训练集是线性可分的,还是不可分的??
    3 条回复    2016-05-13 07:28:13 +08:00
    menc
        1
    menc  
       2016-05-12 18:20:24 +08:00
    如果维数不高,可以任意取两维打出来看看,多取几次,两维都线性不可分,那么数据集就线性不可分了。

    然而我一般不用。
    直接上模型。

    非线性模型, svm 啊, gbdt 啊,对线性可分的问题拟合能力也不错的。

    如果要一个确定的方法确定是线性可分还是线性不可分,那这样的方法是不存在的,要不然 svm 的 kernel function 选什么就不是玄学了。
    tony1016
        2
    tony1016  
    OP
       2016-05-12 20:55:49 +08:00
    @menc 哦,这样子,感谢
    srlp
        3
    srlp  
       2016-05-13 07:28:13 +08:00
    一般现实世界的,默认不可分吧。计算力足够的话,所有模型都强行上一次试试。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5039 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 01:11 · PVG 09:11 · LAX 17:11 · JFK 20:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.