mains 最近的时间轴更新
mains

mains

V2EX 第 200090 号会员,加入于 2016-11-06 14:56:41 +08:00
根据 mains 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
mains 最近回复了
2017-12-23 11:45:28 +08:00
回复了 mains 创建的主题 Python 机器学习生成 xpath,进行通用爬虫
现在是可以根据文本内容自动推算出正文区域,设置 xpath 是更精确一点,不设置也行。(正常提取和 headless 等)

也设计了可视化的 xpath 提取工具,然后写入配置项,一个站 20s 左右。

现在就想人工介入的更少。
2017-12-23 11:24:36 +08:00
回复了 mains 创建的主题 Python 机器学习生成 xpath,进行通用爬虫
@scriptB0y 目前我的比印象笔记的 Chrome 剪藏插件识别率更好。因为我是组合通用抓取和 xpath 规则等。
edu 版本,零成本永久。。。可以激活 15 台设备(5 台桌面)。
2017-04-27 21:59:16 +08:00
回复了 libo26 创建的主题 分享发现 Feedly Pro 黑五八折优惠
@coldwinds @holong2000 大佬们,出 feedly 永久 pro 么?价格好商量 :-)
t2 http://imgur.com:80@v2ex0.ad.dlog.us/tRz19ev.jpg
t
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4874 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 10:02 · PVG 18:02 · LAX 03:02 · JFK 06:02
Developed with CodeLauncher
♥ Do have faith in what you're doing.