V2EX  ›  英汉词典

CONLL-U

释义 Definition

CONLL-U 是一种常用的文本标注文件格式,用来存储依存句法分析词汇信息(如分词、词形还原、词性、形态特征、依存关系等),最常见于 Universal Dependencies(UD) 语料与工具链中。它通常以“每行一个词/符号、以制表符分列字段”的方式表示句子结构。(也常写作 CoNLL-U。)

发音 Pronunciation (IPA)

/ˌkɒnɛl ˈjuː/

例句 Examples

I converted the dataset to CONLL-U for training.
我把数据集转换成 CONLL-U 格式用于训练。

The parser outputs CONLL-U files that include lemmas, POS tags, and dependency arcs for each sentence.
该解析器会输出 CONLL-U 文件,其中包含每个句子的词元、词性标注以及依存弧等信息。

词源 Etymology

CoNLL 来自 Conference on Natural Language Learning(自然语言学习会议)相关共享任务中常用的标注格式传统;后缀 -U 通常指向 Universal Dependencies 生态中采用的扩展版本(用于更通用、更统一的跨语言句法标注与交换)。

相关词 Related Words

文献与作品 Literary / Notable Works

  • Universal Dependencies (UD) Documentation / Guidelines(UD 官方格式与字段说明中频繁出现 CoNLL-U)
  • Zeman et al., CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies(共享任务与数据发布大量使用 CoNLL-U)
  • Nivre et al., Universal Dependencies v1: A Multilingual Treebank Collection(UD 语料发布与格式实践中使用 CoNLL-U)
  • de Marneffe et al., Universal Stanford Dependencies(依存关系体系演进与数据交换实践中常见 CoNLL-U 表示)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   675 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 94ms · UTC 21:15 · PVG 05:15 · LAX 13:15 · JFK 16:15
♥ Do have faith in what you're doing.