通过词典学单词

2022-05-23 18:06:37 +08:00
 HarrisonLee

断断续续学了这么多年的英语,虽然词汇量有 6k 左右,能看懂一般技术文档;但听说写一窍不通,曾经也尝试拯救过,但都没找到合适的工具,打算自己弄一个。


后来有次发现听不懂的原因不是词汇量不够,也不是语速太快,而是对最基本的单词和短语的发音都不敏感,所以打算从头开始弄。初步想法是通过电子词典,MDX 和 MDD 格式的文件解析出来,一条例句或短语解释是词条,可以针对每个单词选择所要加入的词条。最重要的是,单词或例句有音频,这样就可以练习听力,可以选只听单词或同时听例句等,也可以选每次听单词或例句的数量。还可以有其他设计,反正感觉就是很灵活。


有两个问题待 v 友帮忙解答:1 )使用电子词典(如牛津)的文件有没有什么法律风险? 2 )有没有 Java 或 JS 处理音频的方案,因为需要拼接单词和例句的音频。

1763 次点击
所在节点    奇思妙想
9 条回复
ruixue
2022-05-23 18:19:57 +08:00
自己用随便了,但是如果做出工具公开给其他用户用,未经授权直接内置其他版权词典的数据肯定属于侵权了,不内置数据要用户自己想办法找词典库加载进去还好一些
cathiabi
2022-05-23 18:35:44 +08:00
可以看看我做的

词典: https://aadps.net/2021/16534.html
语料库: https://aadps.net/2021/16537.html

测试账户 test/test1234

语音后台盗百度的。词典有版权问题没法弄,不过语料库是我自己买的数据。可以提提想法意见,如果确实很多人有需求,能众筹我来搞个独立的商业产品也不错。
fox
2022-05-23 19:54:28 +08:00
牛津不知道,但商业出版社出的辞典你拿来商用的话应该是侵权的。
出版社追究不追究是另外一回事。
83f420984
2022-05-23 19:55:58 +08:00
https://github.com/zhen-ke/mdict

最近刚写了这个,现在问题比较多🤣
fox
2022-05-23 19:56:18 +08:00
不过像 英-日 这种,有可以免费使用的词库(比如 JMdict 项目)。不知道 英英,英中 是否有类似的东西。
sillydaddy
2022-05-23 20:00:26 +08:00
看下这个带发音的数据库,
tatoeba-一个多语言例句项目: https://tatoeba.org/zh-cn
fox
2022-05-23 20:02:18 +08:00
不过说实话。要是真的为了学日语,没必要自己写一个项目。大概率你这样,做了一个工具出来,外语还是没学。真的学外语不需要创造个啥,你看外语专业的人大都不会写代码的,但是单词量很高。

英语不太懂,日语的话背词典有用,也没用。
说没用,还要看背哪一本辞典。比如学《广辞苑》、《日国》,那玩意是古典重视的,其实第一条第二条可能没啥实际用处。如果用《广辞苑》学现代日语,就是有点浪费时间了。
但如果学《三国》,那么可能意义就很大了。但是《三国》的例句又不够多。如果配合《三国》+《小学馆》,把用例精选,那么确实是非常好的学习素材。

可是单词量不到 1w 的人,做不到这些,这些已经进入了教材开发的领域了。

楼主单词量 6k 的话,不如学一学英语的教学法,别着急写个工具..
fox
2022-05-23 20:02:51 +08:00
*日语 - 外语
haah
2022-05-23 20:53:29 +08:00
你倒是真不怕麻烦,何不到 YOUTUBE 找个 BBC 视频跟着念!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/854771

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX