为什么 NLP 发展这么多年了机器翻译还是经常翻译出狗屁不通的内容?难点在哪里?

2023-02-27 20:04:45 +08:00
 edis0n0
3173 次点击
所在节点    程序员
25 条回复
maemual
2023-02-27 20:25:25 +08:00
人工翻译都会出现一堆狗屁不通的内容。。。
cmdOptionKana
2023-02-27 20:37:35 +08:00
难在没有标准,无法评分。

比如 AlphaGo 围棋,每下一个子,好歹能看实地有没有变多、外势有没有变强、大龙有没有危险,下完也能清晰判断输赢。这样知道好不好,才能改进。

但翻译,很难评分啊(说的是机器自己给自己打分),翻译完了,好不好、对不对,这个都极难判断,而无法判断这个,就无法改进了。
TimePPT
2023-02-27 20:45:27 +08:00
日常翻译还好吧,专业领域翻译不太理想。主要的问题还是在对常识 /知识的处理,以及上下文的理解。
hhjswf
2023-02-27 20:57:05 +08:00
难点在于人类太难懂了。
laqow
2023-02-27 21:08:33 +08:00
机器学习得到的总是某种层面下的最优,人类只会没有最优制造最优
kangyue9999
2023-02-27 21:11:34 +08:00
难点在于机器学习的 golden=>人工翻译 还会翻译出一堆狗屁不通的东西
cocomiko
2023-02-27 21:41:23 +08:00
语言是文化一部分,不同文化之间本来就很难理解,思维方式方式也不一样,所以实质还是文化不相通,互相理解可太难了
mercury233
2023-02-27 23:05:25 +08:00
其实 openai 的翻译已经很强了,包括 chatgpt 和 whisper 内置的翻译,期待成品化的一天
lrigi
2023-02-28 00:22:19 +08:00
我天天用谷歌翻译,感觉还是挺满意的啊
现在的谷歌翻译还不够强吗
有点好奇楼主翻译的什么内容,给个例句么看看
lslqtz
2023-02-28 00:38:39 +08:00
即使进行大量数据标注, 翻译这个东西也很看场景. 还是语法的问题.
em70
2023-02-28 00:42:54 +08:00
因为缺少语言中间态,字面意思的转换会丢失大量的信息,chatgpt 是目前已知唯一可能得语言中间态
xxzlll
2023-02-28 00:44:00 +08:00
既想要信雅达的翻译效果,有不愿意支付高额的使用费用来支撑翻译软件公司去做数据标注和审核的工作,这世上哪有这么美的事?
liprais
2023-02-28 00:46:36 +08:00
deepl 已经不错了
你想要达到专业翻译的水平还不如自己学
edis0n0
2023-02-28 00:54:49 +08:00
@liprais #13 DeepL 经常改变原文意思 /t/890408
@lrigi #9 Google 英文还好,翻译日文经常一句剩半句,另外半句直接没了
HankLu
2023-02-28 01:00:03 +08:00
翻译,太难了,用现在的机器水平来要求翻译,太难为机器了
chern9511
2023-02-28 02:12:18 +08:00
语料,模型,还要挑专业场景,其实就是挺难的吧
Ocean810975
2023-02-28 09:47:59 +08:00
@edis0n0 deepl 德译英还行,差不多趋于完美了。德译中还是差点,
opentrade
2023-02-28 10:50:59 +08:00
难点在于你都意识不到它很难
macscsbf
2023-02-28 14:25:07 +08:00
我感觉 hybrid 挺不错的
aloop
2023-02-28 14:28:38 +08:00
@mercury233 whisper 是什么

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/919631

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX