如何根据商品名称对商品进行分类

2020-08-23 17:10:55 +08:00
 funcookies
分类标准是现成的,不过标准给的只有类别名,和一些关键词。
例如: 移动通讯设备分类,关键词有手机。无机盐分类,关键词有氯化钠等。


有一些数据可以使用,不过有以下问题
1.分类质量不稳定,比如木炭,有的数据中分类是正确的,有的数据中就错误的归到煤炭。
2.商品种类局限性,有些东西数据量很小或者根本没有。
3.商品名称不规范,比如同样一款手机,有的数据是 Note8,有的数据就是 note 8.

目前能想到的就是对数据进行统计,同一种的东西哪个分类的数据多,就判定为那个分类。不过商品名称不规范,估计会有很多坑,而且遇到新东西就没法分类。

希望听听大家有什么好的思路或者建议。
1409 次点击
所在节点    问与答
4 条回复
imn1
2020-08-23 18:47:14 +08:00
这个其实挺适合深度学习的
murmur
2020-08-23 18:57:33 +08:00
我想问一下楼主的需求是什么,你从京东来看,那么多要录入的信息,又是介绍又是型号,起名就是个大学问,选分类相比之下几乎就没工作量
imn1
2020-08-23 19:25:37 +08:00
@murmur
我觉得楼主是平台方,不是进驻商家,需求就是纠正商家失误或滥用的分类选择

我以前遇到过类似的,(非电商)平台要求进驻商家预报几个大类,及下面若干小类,只要商家在这些类别有销售许可,平台不会太理会商家怎么分类。但遇到超出范围,需要另外申请,或者出现故意把范围外商品报在范围内,会处罚。因为工商会抽检,出现问题会影响平台利益
funcookies
2020-08-23 19:51:37 +08:00
@imn1 emm 。这个感觉需要比较长时间,目前只有一点 python 基础。
@murmur 信息的录入是对我来说不可控,收到的数据可能是任何东西,有些分类是对的,有些是故意误导的。需要对所有东西进行正确归类,找出哪些数据的提交者在作怪。
@imn1 和这个需求差不多,分类最后核心用途就是比对这个商家销售不符合经营范围或者他根本没有的商品。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/700728

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX