UDPipe:一种用于自然语言处理(NLP)的工具/软件管线,主要实现分词、词形还原、词性标注(POS)、形态特征标注、依存句法分析等任务,常与 Universal Dependencies(UD) 标注体系配套使用。(在技术语境中也常写作 UDPipe。)
/ˈjuːdiːpaɪp/
I used UDPipe to tag parts of speech in my dataset.
我用 UDPipe 给我的数据集做了词性标注。
After training a model, UDPipe can tokenize text and produce a dependency parse for each sentence, which helps downstream NLP tasks.
在训练好模型后,UDPipe 可以对文本分词并为每个句子生成依存句法分析结果,从而帮助后续的自然语言处理任务。
“UDPipe”由 UD(Universal Dependencies,通用依存语法体系) + pipe(管线/流水线) 组成,含义是“面向 UD 的处理管线”,强调将多步语言分析串联成一条自动化流程。