前言:是的,各位没有看错,我们为程序员和计算机系大学生编写了一本程序员专用的词典,叫做 consoleDict (肯搜词典)
缘起:今年 3 月,由于疫情等因素,在家休息的时候,读了一本英文的图书 PDF,内容比较复杂,在读书过程中国有些单词要查询,查的过程中发现有道、金山词霸对非常多编程相关单词存在无结果、各种含义混杂、释义不准确等问题,Google 也能搜到,但是时间较长,打断了读书的状态。 于是转向寻找编程的行业词典,发现并没有合适的词典,但是程序员和编程都是离不开英语的,于是隐约觉得可以搞一个编程相关的词典,准备着手搞搞看。
立项:花了一天多时间,抽取了上百个编程常用单词,在各大词典进行查询并记录结果,发现效果奇差,有兴趣的可以去有道、海词、金山搜下最简单的 git 、vim 、hash 、log 就能有具体的感受了。 于是下决心搞这么一个词典,除了提供最常见的通用释义,对于编程相关的释义,要单独进行标注和释义,要有单词的分布统计,某些单词还要有参考链接,这差不多就是目前 ConsoleDict 的样子,对了,除了网站还需要有个 chrome 扩展,方便在网页上划词直接翻译。
数据:首先要解决的就是通用释义,因为除了编程释义外,通用释义的数据和质量也很重要,在全网下载及购买了几十份各种词典数据后,经过对比选择了其中一份比较全面和质量较好的词典数据,有 300 多 W 单词和短语,通用释义就这样解决了
开发:于是开始了产品的功能设计、页面草图、管理后台、前台页面、用户体系等各项工作,并拉了几个之前的同事来一起开发,一个英语比较好的同事和我负责单词的标注释义及校对。
我们收集了前后端开发、APP 、大数据、Linux 、网络、运维、机器学习、网络安全等十几个分类的几百本英文技术图书,并对内容进行扫描,对所有单词进行词频的统计、清洗、降噪、纠错等工作,收集了几十本非技术 PDF 作为对照,依据词频出现数量等作为排序依据,在学习了大量词典编写相关知识后,对单词进行了尽可能准确的释义、参考链接选取、审核校对等工作。
前后我们花了 3 个多月时间完成了数千个编程词汇的释义工作,这些词汇里面除了编程最常见的单词之外,还包括了非常多的软件名、缩写等,对于能够寻找到权威参考链接的和官网的,我们都将相关链接作为参考链接放入了释义中
除了词汇释义外,我们还开发了网站,包括查询、用户系统、查询历史、浏览器扩展、支付、推广返点等模块,到 8 月底为止,经过反复的测试和核对,在质量满足了我们期望的情况下,在 8 月中旬进行了上线
英语:英语的重要性其实不必赘言,大量英文版图书都没有中译本,互联网上海量的资料只有英文版,代码基本上都是英文单词,可以说英文不好的程序员和英文好的程序员之间的差异,就如同百度和 Google 的差异一样大,衷心希望我们编写的词典,能够在大家开发的道路上为各位助一臂之力!
V2 首发:今天,我们选择了在 V2EX 进行首发,因为 V2 的朋友们,在我们心中是有极客范的,是乐于和敢于尝试新鲜事物的,是行走在互联网的前沿的一群人! 为了答谢 V2 的各位朋友,我们为 V2 的朋友们提供了一个专享的超低的 3 折优惠码 D4CB82 ,在购买页面的优惠码处填入使用,共计 30 次有效使用 ,手快有手慢无哦,欢迎各位使用并提出宝贵建议!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.