求训练识别手写英文加公式为 LaTeX 编码的机器学习程序

2017-07-28 09:45:19 +08:00
 i2000s
自己经常要把手写的英文加数学公式的 OneNote 笔记转换成 LaTeX,比较繁琐机械。求人工智能帮忙。自己搜了下,好像还比较麻烦,目前只有单一识别公式或者只适用于印刷体混合识别的软件。请推荐便于自主改进的程序包以同时识别文本与公式的混排,我可以逐渐训练之。

谢谢。
5251 次点击
所在节点    程序员
29 条回复
atempcode
2017-07-28 10:32:04 +08:00
i2000s
2017-07-28 10:37:17 +08:00
@atempcode 我了解这个工具,不过我不是要在线手写识别。而是希望把手头已经完成的手稿变为 LaTeX,同时包括文字和公式。谢谢。
snnn
2017-07-28 10:37:54 +08:00
我有。上次回地球探亲的时候忘了一起带回来了。
zetary
2017-07-28 10:45:03 +08:00
OneNote 自带这个功能啊…你在想什么呢
i2000s
2017-07-28 11:04:37 +08:00
@zetary OneNote 能把手写文字变文本,但是还没有把文字与公式混编的文件变 LaTeX 的功能吧?
hobochen
2017-07-28 11:16:19 +08:00
预算 1e7 人名币吧。。
ss098
2017-07-28 11:27:19 +08:00
http://webdemo.myscript.com/views/math.html

之前看的一个在线服务,这家貌似非常厉害。
zetary
2017-07-28 11:31:39 +08:00
@i2000s 是的,而且也不是 LaTex 那个是 MathML 吧
chinvo
2017-07-28 11:44:32 +08:00
楼主不会是某某搜题的高考机器人项目组的吧(逃
murmur
2017-07-28 11:46:14 +08:00
这种东西我认为就算是高考阅卷老师都得靠猜 数学和物理这些公式复杂起来是没底线的
catfish
2017-07-28 11:56:08 +08:00
想知道你有多少样本可以用来训练
i2000s
2017-07-28 12:07:58 +08:00
@catfish 这些是我每天的研究笔记,目前已经有不少了。正在写 200 页+的学位论文,还有几篇文章待发。虽然不算多,但可以笔耕不辍,源源不断,不断训练。我导师那里一堆的教学笔记,还有配套的部分书稿对应。
toml
2017-07-28 12:16:04 +08:00
@catfish 有的老师不是正好有 “不交作业就罚抄课本 XXX 次” 的习惯吗😏
ivechan
2017-07-28 12:34:02 +08:00
说实话可以考虑请人代抄. 这也是 人工的"人工智能".
zetary
2017-07-28 12:40:30 +08:00
要识别哪些是文字哪些是公式,还要把公式转成 LaTex …因为方位的原因识别公式效果都堪忧
i2000s
2017-07-28 12:52:50 +08:00
@zetary 对,说实话,这东西要实现起来还是有点难度。不过关键是这是个小众市场,除了考试教学之外没有太大的市场,所以商业化的产品目前我还没看到有。如果有同仁对此感兴趣,可以共同探讨。
catfish
2017-07-28 12:53:53 +08:00
@i2000s 太少了…起码也 2W 页吧。两万页的手写图片和对应的公式。
i2000s
2017-07-28 12:55:00 +08:00
@toml @ivechan 哈哈 你们这倒是有意思的积累数据的办法!
catfish
2017-07-28 12:55:08 +08:00
@toml 哈哈哈哈哈哈哈,这脑洞!不过只有小学生才会被罚抄吧。
i2000s
2017-07-28 12:57:31 +08:00
话说我有一个研究生阶段的老师布置的作业就是每人要把课堂的板书整理成电子版。有些人是提交的手写的扫描件,有些人提供的是最后的 LaTeX 版本,两者正好大体互为对照。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/378526

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX