项目是为客户现有企业分析系统建设一个新的数据渠道。
python 技术栈,基于 scrapy 框架。
抓取网站的数据,并对指定数据进行提取和跟踪。
同时提供接口服务,实现爬虫的管理和数据输出。
项目是我们和合作公司一起做的,但合作公司上周单方面终止合同,临时退出了项目。
团队内部商量后,觉得目前团队的工作量已经很饱和了,所以想找一个靠谱的团队或者个人把这块整体外包。
系统爬虫部分比较简单,最基本的爬虫开发即可满足需求;接口服务对并发、性能要求都不高,实现需求即可。
难点在于目标数据的鉴别,跟踪和提取,可能需要较复杂的算法来实现对特征量的识别和处理。
我们自己团队评估过,数据处理上,有一两个功能点我们目前没想出特别好的处理方式,其他的尽管能实现,但也挺麻烦。
所以,如果只是擅长基本的爬虫开发,请不要浪费时间来谈了,最好是有很丰富的数据处理经验。
具体需求涉及商业机密,联系后另行说明。
我们这边是公司,可以私人交易也可以签订正式商务合同,也可以接受在任意你选择的平台上交易。
有兴趣的请发邮件至 heqiliao2 #
outlook.com ,抱歉工作环境没法用 qq。
我会把核心需求在邮件尽可能简单的说一下,如果确定能做,那我在把正式的需求协议发给你,然后商量一下价格和工期。
谢谢
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/313442
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.