V2EX  ›  英汉词典

Jaccard

定义 Definition

Jaccard(雅卡尔)通常指Jaccard 相似系数 / Jaccard 指数:用来衡量两个集合(或两段文本的词集合等)相似程度的指标,计算方式是交集大小 ÷ 并集大小。取值范围一般为 0 到 1,越接近 1 表示越相似。(也常用于对应的 Jaccard 距离:1 − Jaccard 指数。)

发音 Pronunciation

/ʒaˈkɑːr/

例句 Examples

Jaccard similarity is useful for comparing two sets of keywords.
Jaccard 相似系数适合用来比较两组关键词的相似度。

In document clustering, we computed the Jaccard index between each pair of articles based on their word sets, then built a similarity graph for community detection.
在文档聚类中,我们根据文章的词集合计算每对文章之间的 Jaccard 指数,再构建相似度图用于社群发现。

词源 Etymology

Jaccard来自人名,源于瑞士植物学家 Paul Jaccard(保罗·雅卡尔)。他在研究植物群落的相似性时提出了相关的度量方法,因此该相似系数/指数以他的姓氏命名。

相关词 Related Words

文学与著名作品 Literary & Notable Works

  • Paul Jaccard 的经典论文与著作中讨论了用于比较群落的相似度思想(常被视为该指数的源头之一),如与植物群落分布/比较相关的研究写作(19—20 世纪之交的植物地理学文献)。
  • Introduction to Information Retrieval(Manning, Raghavan, Schütze)在信息检索场景中提到 Jaccard coefficient(例如用于集合式特征/词项集合的相似性比较)。
  • Mining of Massive Datasets(Leskovec, Rajaraman, Ullman)在大规模数据挖掘与近似相似搜索(如 shingles/集合相似)语境中使用并讨论 Jaccard similarity
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2122 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 13:45 · PVG 21:45 · LAX 05:45 · JFK 08:45
♥ Do have faith in what you're doing.