把 AAAI 和 ICML 等顶级会议近三年的所有作者邮箱爬一下出来,我只需要邮箱信息,不需要作者名字和单位,这个难度大不大?

2020-03-11 17:11:16 +08:00
 noblevil
3478 次点击
所在节点    Python
24 条回复
beimenjun
2020-03-11 17:15:27 +08:00
虽然说这种问题本质上是小马过河,但我觉得对于有这种疑问的人,这种需求难度很大。
Showfom
2020-03-11 17:23:17 +08:00
然后你群发尼日利亚王子?
noblevil
2020-03-11 17:25:32 +08:00
@Showfom 8 懂这个梗
noblevil
2020-03-11 17:26:39 +08:00
@beimenjun 哈哈 确实 我直接把导师复制过来了
bububububiu
2020-03-11 17:48:15 +08:00
虽然我觉得这个需求很简单,但我觉得问出难度大不大的,那难度肯定很大
bububububiu
2020-03-11 17:48:38 +08:00
dblp 应该可以下载 content list
lxk11153
2020-03-11 18:13:28 +08:00
大 [滑稽] 外包给我~ Contact: UVEgNDQzOTc0MTU5IC0vXy8uLS4uLy4uLy4tLy0uLy0tLg==
jimmyismagic
2020-03-11 18:15:40 +08:00
网站上直接拉一下不就好了,邮箱,姓名,摘要,基本都能看到的
crella
2020-03-11 18:20:22 +08:00
静态网页和能直接下载 json 的网站都挺好爬的吧……
noblevil
2020-03-11 18:42:41 +08:00
@bububububiu 只要是我没看到哪些网页上有给邮箱信息的 只有打开论文链接查看论文 PDF 才有邮箱 我到是想把所有 PDF 下载下来 处理一下 PDF 就好
noblevil
2020-03-11 18:45:28 +08:00
@lxk11153 我干活都没钱 还外包给别人 我才不干赔钱的买卖 哈哈哈
noblevil
2020-03-11 18:45:49 +08:00
@jimmyismagic 我也想这么跟我导师讲
noblevil
2020-03-11 18:46:13 +08:00
@crella 就是没看到这样的信息...
xupefei
2020-03-11 18:52:21 +08:00
要邮箱干啥,群发代发论文广告?
代发 ccf 和 sci 论文的邮件最近我每天都能收到三封,不过全被系统识别出来进垃圾箱了
noblevil
2020-03-11 18:53:24 +08:00
@xupefei 导师让我做什么 我就做什么呗 上面的事我哪里过问
Showfom
2020-03-11 20:43:03 +08:00
noblevil
2020-03-11 21:09:47 +08:00
@Showfom 有点意思... 长见识了 不过我是导师需要 我也不管他想干什么...
Showfom
2020-03-11 21:25:37 +08:00
@noblevil 他可能想做尼日利亚王子
rurishi
2020-03-11 21:28:51 +08:00
你把文件都爬下来然后 pdf 随便处理一下提取 email 地址就可以了
按不同站分析
写爬虫
处理 pdf
网站不乱搞什么动态验证的话写起来很快的。。。
plutoQ
2020-03-11 22:33:57 +08:00
@xupefei #14 我怎么收不到,我还挺想找人代发 ccf

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/651915

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX