请教炼丹师们一个二分类的问题

2020-05-10 20:55:22 +08:00
 zxCoder
用 pytorch 实现的一个 FM 模型做一个二分类,然后 logloss 很大,然后发现训练样本大多数是准确的,但是有几个比如实际值是 0,预测值是 9.9999999,实际值是 1,预测值是 0.00000...,这是因为数据太少(数据集只有 600 行左右)的原因吗,还是因为模型撘错了。
1066 次点击
所在节点    问与答
4 条回复
Liyiw
2020-05-10 21:13:55 +08:00
1 、先统计正负样本的数量
2 、准不准确要在 val set 或者 test set 上面测,在训练样本上测没用的
zxCoder
2020-05-10 21:37:03 +08:00
@Liyiw 测试集效果也很差,用的交叉熵损失函数是 0.8 左右。。。有几个样本偏差得很奇怪,完全反的
neosfung
2020-05-11 08:51:14 +08:00
不对吧,你一个二分类模型,预测值只有 0 和 1 两个标签的概率。预测值怎么跑到 9.9999999
zxCoder
2020-05-11 11:16:58 +08:00
@neosfung 写错了,应该是 0.999999999

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/670332

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX