github 地址: https://github.com/bowenpay/poormining
我们公司正在做一个贫困户的征信模型 v0.1 ,以发展农村金融。
为了争取开源世界的力量,开放了 2 个县的数据,共 33.5 万条 贫困户记录,每条记录有 33 个字段。时间跨度为 2014 年~2016 年, 3 年共 3 张表。这 2 个县,一个县用于建模,另一个县用于验证。
其中,需要建模预测下一年是否能脱贫以及下一年的人均年收入。
目前用随机森林模型预测是否脱贫,准确率高达 98% ;
用线性回归模型预测下一年人均年收入,在误差为 10%的情况下,准确率为 60%;
使用 Lasso 回归模型 和 岭回归模型 预测效果也为 60%左右。
欢迎大家来修改代码,使用更多的模型来预测,或者调整模型参数,以提高预测准确度。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.