Text Classification
释义 Definition
文本分类:将文本(如新闻、邮件、评论、论文摘要等)自动归入预先设定的类别(如“体育/财经”“垃圾邮件/非垃圾邮件”“正面/负面”)的任务,常见于自然语言处理与信息检索中。
发音 Pronunciation (IPA)
/tɛkst ˌklæsɪfɪˈkeɪʃən/
例句 Examples
Text classification can help filter spam emails.
文本分类可以帮助过滤垃圾邮件。
Using machine learning, the company built a text classification system that tags customer reviews by sentiment and topic.
利用机器学习,这家公司构建了一个文本分类系统,用情感与主题给用户评论打标签。
词源 Etymology
text 源自拉丁语 textus(“织物、编织;引申为‘文字的组织’”),后来指“文本”。classification 来自拉丁语 classis(“类别、等级”)与后缀 -fication(“使成为/把……做成某种形式”)。合在一起即“对文本进行归类”。
相关词 Related Words
文学与著作中的用例 Literary & Notable Works
- Speech and Language Processing(Dan Jurafsky & James H. Martin)——在文本分类、情感分析等章节中讨论该术语与方法。
- Introduction to Information Retrieval(Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze)——以文档/文本分类作为信息检索的重要应用之一。
- “Machine Learning in Automated Text Categorization”(Fabrizio Sebastiani)——经典综述论文,系统梳理文本分类(text categorization/classification)的概念与算法。