这两天我下载了 8000+份钢琴谱,皆来自于 everyone paino 的免费在线钢琴谱,本来是爬给自己玩 midi 用的,但昨天看到站里也有玩钢琴的朋友,那么就顺手分享出来。 8000+份谱子里面囊括了流行、古典、班得瑞、久石让、二次元、游戏等等各种各样的曲子,容量约 3.5G 。
由于没有分类整理,所以还请善用搜索。
每首曲子里既有五线谱,也有简谱,所以不懂五线谱的朋友也可以下载来用。
周日想弹琴,迫于没谱&懒,于是就写了个曲谱爬虫来收集谱子,周日通宵跑,周一上班摸鱼改爬虫 BUG,周一晚通宵上传到网盘。服务器用的阿里云 1M,服务器上开爬虫的速度还是不错的,但上传速度就很让人绝望了,传了我一个晚上+一个通宵呐,话说我的服务器上也就跑了一堆爬虫跟一个 Git,好像没用物尽其用?但也想不到到底该干啥了。写 python 爬虫真的简单,尤其是用了 BS4 库,我的 python 水平绝对是 3 流,居然也能两小时搞定一个爬虫(尽管 bug 很多)。预想的数据库功能还没加,曲目分类也没头绪,不过算了,反正谱子都下载下来了,先弹会儿琴先。
爬虫是用 python3 写的,代码十分简单且已托管到 Github,如果谁想更新曲谱库可以用爬虫的模式 2 跑一下。如果有想贡献代码的,非常欢迎。 https://github.com/VShawn/ScoreCrawler
如果有更多的曲谱想要下载,可以跟我提,吉他谱、尤克里里谱什么的都可以,我可以帮你们写对应的爬虫,不过要提供目标网站哟(而且要免费的网站)。
关于这 8k 曲谱,怎么分类是一个问题,就是怎么把流行音乐丢到 [流行音乐] 文件夹里,把动画音乐丢到 [二次元] 文件夹里,这个问题还困扰着我,不知道哪位有好的 idea 吗?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.