一个科研狗开发的文献管理软件 Paperlib

2022-06-24 04:09:19 +08:00
 SorryChen

我是一个在计算机视觉里蝶泳的科研狗,一个文献管理软件基本是我的刚需。从硕到博这么多年用了各种各样的软件:Papers 、Mendely 、Readcub Papers 、Zotero ,没有一款能让我满意舒服的。


现有的软件

诚然这些软件都是伟大的软件,但是或多或少都有些小问题,比如:

  1. 无法精准的抓取到会议论文的发表情况
  2. 功能做的不咋地,一堆用不上的功能,每年太贵的订阅费 = =
  3. 太丑太丑了,像上个世纪的界面(没错说的就是你 zotero )
  4. ......

我想要的

而我想要的就是一个简简单单的论文管理软件:

  1. 他必须能精准地匹配到会议论文的发表情况。我认为这是一个文献管理软件最重要的功能。其他领域可能看期刊很多,但是像我们领域,大部分论文都是会议论文,我想 NLP 应该跟我们 CV 也差不多。但是会议不像期刊,很多都要很久才有 DOI ,有的甚至没有 DOI ,所以市面上的这些软件,几乎没有一个能很好的精准的匹配会议论文 metadata 的。我想要他精准匹配到是不是发表到 ICLR ICML NIPS ECCV 等会议上。而我不想每次写论文对对着一堆 arxiv publication 一个一个去搜他们发表在哪里的去做校对。
  2. 不需要什么花里胡哨的管理功能,就简单的 Tag ,Folder ,加星,Note 。
  3. 能够方便地进行检索,普通搜索,全文搜索,高级语法搜索,让我在开会时候想跟老师讨论一个论文的时候不需要手忙脚乱的去翻文件夹或者 Google 。。。
  4. 作为计算机行当,虽然 Github 的 star 能够收藏论文的代码仓库,但是并不容易找,更多时候还是去 google 。如果这个软件能帮我自动搜 code repository 然后存在软件里就好了。
  5. 当我准备开始写自己论文的时候,如果有方便的方式一键复制 bibtex 就好了。体验就好像打开 spotlight 输入关键词,直接回车粘贴。
  6. 它有一个简洁的 UI ,清晰的图标,至少看着不是上个世纪的。毕竟颜值就是生产力。

于是,一年多以前,在博士刚开始的时候,我就开始着手自己开发一个,符合上述需求的软件。

跟周围同学分享了一下,大家都觉得挺好用的。之前因为觉得不完美,害怕推广了之后自己没精力维护。经过一年多的打磨,这个软件也伴随我一年多的科研,加两次论文投稿。我已经把大部分功能做到我满意的地步了。所以在这里分享一下,给有同样需要的科研狗们!它就是 Paperlib !


Paperlib

使用简介

亮点

  1. 从 arXiv ,doi.org ,DBLP ,IEEE ,openreview.net ,PaperwithCode ,Google Scholar ,为每一篇论文尽量匹配精确的信息以及代码仓库。
  2. 全文搜索,高级搜索。
  3. 快速导出,一键复制 BibTex 。
  4. 为论文评分,分配标签、文件夹,加星,方便进行分类管理。
  5. 可以云同步数据,macOS win 双平台。
  6. 完全开源。

缺点

  1. 这是按照我一个人的科研习惯打造的,我不确定是否大家用的习惯。
  2. 对比 zotero 这软件,说实话因为自己没怎么用,我可能还不知道它有什么极其强大的功能,也许 Paperlib 这里没有。
  3. 开发者只有我一个人,我无法像大公司那样按时修 Bug 。现在基本是就是我周末没事的时候修一修。(不过自己已经很久没遇到什么恶性 bug 了)
  4. 我的领域是计算机视觉,我不确定其他计算机领域的人,比如 NLP 啊,数据库啊,啥的,能不能准确匹配好论文元数据。如果不准确可以开 Issue ,在软件里我定义了一系列 metadata scrapers ,我们可以一起开发更多的符合计算机领域的。但是目前计划是仅仅覆盖到计算机领域。因为其他领域真的不了解。
  5. Electron 。关于 Electron ,可能大部分人都不喜欢吧。实际上 Paperlib 是有 macOS 原生 swiftUI 版本的 branch 的,完成了一些基础的功能。但是作为一个人开发的软件,平时又要科研,想要维护好 win 和 mac 双平台,实在是太难了。最后我只能转为使用 Electron 。如果有任何喜欢 Paperlib 想接手 swiftUI 版本的同学,我非常欢迎。现在我看了看资源占用实际上也没有很夸张,比 zotero 是小一些的。。。可能因为没那么多乱七八糟的功能吧。。

最后的最后,祝大家科研顺利吧!

网址: https://paperlib.app/en/

Github: https://github.com/GeoffreyChen777/paperlib

15573 次点击
所在节点    分享创造
287 条回复
SorryChen
2022-08-08 21:18:38 +08:00
@henrylau0220 你好,你的这个问题我修复好啦,之前是因为 paperwithcode 的 API 如果按照标题搜索的话,只返回一个 repo ,现在是在标题搜索拿到对应的 id 之后再通过 id 搜索,最后得到所有 repo 之后取 star 数前三名的展示。现在你的这个论文应该能搜到相应的代码仓库了。
SorryChen
2022-08-08 21:20:20 +08:00
@henrylau0220 另外,那些保存界面和排序选项的功能也做好了。
SorryChen
2022-08-21 02:03:35 +08:00
@gdm 您好,这个功能已经实现啦,直接拖入 bibtex 就可以啦,欢迎尝试哈。同时也支持从 scihub 等地方搜索 pdf 啥的了。
SorryChen
2022-08-21 02:04:17 +08:00
@menc 您好,这个在 v1.9.6 已经实现啦。欢迎体验
gdm
2022-08-21 23:04:39 +08:00
@SorryChen 谢谢! 2 万 1 千条数据导入成功,软件运行状态良好
SorryChen
2022-08-21 23:06:42 +08:00
@gdm 两万一千??!! 佩服佩服。。也太多了。。。。刚好可以压力测试看看有没有什么卡顿。。。有任何问题欢迎继续反馈。。
gdm
2022-08-21 23:20:29 +08:00
@SorryChen 我用蜘蛛把全台湾同领域 I 的期刊抓下来,另外再用读秀数据提取了若干个出版社的书,就得到这么多东西了……
虽然我写论文用不到那么多数据,但等到引用的时候再抓就会很烦躁,索性全抓了。我这领域写博士论文,正常范围是 300-1000 个注脚,多抓一点准备起来也不亏
TimeLover
2022-08-31 09:13:07 +08:00
导出的快捷键似乎冲突,能不能提供改键功能?
SorryChen
2022-08-31 15:07:01 +08:00
@TimeLover 你说的导出具体是哪个哇?
TimeLover
2022-09-01 02:56:58 +08:00
MacOS 12.5.1, command + shift + K, command + shift + C, 似乎和我其它快捷键有冲突,所以用不了,想改键
TimeLover
2022-09-01 03:01:54 +08:00
除了快捷键问题,我还一直收到这个报错,不知道是否相关
Uncaught Exception:
TypeError: Object has been destroyed
at BrowserWindow.<anonymous> (/Applications/Paperlib.app/Contents/Resources/app.asar/dist/main/index.cjs:1:6179)
at BrowserWindow.emit (node:events:402:35)
SorryChen
2022-09-01 03:02:40 +08:00
@TimeLover ok 知道啦,下个版本更新,你也可 尝试下 cmd shift i 呼出的插件,写作的时候更方便
SorryChen
2022-09-01 03:04:18 +08:00
@TimeLover 这个很奇怪,请问是何时何种操作出现这种报错?
TimeLover
2022-09-01 03:17:57 +08:00
@SorryChen 就是我关闭窗口,保持后台运行状态,然后这时打开软件,就会报错。cmd shift i 每次只是一个 citation ,我都是导入很多 paper 之后一下子全选然后 cmd shift c 导出。还有一个请求,能不能添加 cmd a 全选的支持。感谢,我也是 phd ,软件很好用。
SorryChen
2022-09-01 03:29:10 +08:00
@TimeLover 你反馈的 bug 我会查一查,感谢建议
SorryChen
2022-09-01 07:15:23 +08:00
@TimeLover 您好 提出的 Bug 和改键需求已经修复和添加好了。

您可以先试试原来的键位是不是 OK 了,应该是可以正常工作了。如果不行再试试改键
TimeLover
2022-09-02 12:13:24 +08:00
@SorryChen 感谢,原来键位 work 了。
fl2d
2022-09-10 22:04:58 +08:00
如果数据库与 pdf 都可以直接用一个 onedrive 或 dropbox 同步就更方便了
SorryChen
2022-09-10 22:46:29 +08:00
@fl2d onedrive 这种同步盘是很难做数据库同步的,试想一下你在 A 电脑写入了一个放在 onedrive 的数据库文件,但是 onedrive 没有及时同步,你在 B 电脑同样也写了一些东西进数据库。此时该如何合并呢? onedrive 无法处理这种数据库合并。因为 onedrive 本来设计的就是同步文档而不是数据库的。
fl2d
2022-09-11 09:36:09 +08:00
@SorryChen
我感觉可以把数据库里的每条记录分别写成文件,放在同步文件夹里,这样就从同步数据库变为同步记录了?本地数据库做了任何修改后都要修改同步文件夹里的相应记录,同步文件夹里的记录被远程修改后本地数据库也修改。
倒也不是 feature request ,只是一个思路,不知是否可行?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/861794

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX