机器学习流程问题请教

2022-01-07 15:38:27 +08:00
 dtgxx

大佬们,我没怎么接触过机器学习,目前工作有些需求,想问下这个流程对不对:

因为数据集比较大,所以我打算通过大数据集群训练数据,通过算法训练得到模型,得到的模型是一个文件。然后把这个模型文件提取出来封装成一个分析模块,把这个分析模块给到一些单机的产品使用,用来预测业务结果。

这样的模式目前有吗?是否可以这样进行?

640 次点击
所在节点    问与答
2 条回复
conge
2022-01-08 09:16:50 +08:00
基本上就是这么个流程。

根据使用场景不同,数据集可能需要清洗和转换,所以你的分析模块在实际应用当中,还需要有数据清洗转换 feature selection 的模块,把来自于业务场景的数据,转换为分析模块的输入。

另外,还应该考虑,如果封装之后单机使用,如何更新模型的问题,毕竟,模型 deploy 之后,还可能面临新数据出现,使得原先的模型失效,准确率下降的问题。这就需要有一些监督机制和模型重新训练机制,来随时学习新数据,保证模型的表现符合预期。
dtgxx
2022-01-08 09:24:39 +08:00
非常感谢您!让我一下清晰了许多,也知道了一些注意点。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/826837

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX