双向聚类 / 双聚类:一种同时对数据矩阵的行和列进行聚类的方法,用来找出“在某些特定特征(列)上表现相似的一组对象(行)”的子矩阵模式。常用于基因表达数据、推荐系统、文本-词项矩阵等。(也常写作 bi-clustering 或称 co-clustering,但侧重点略有差异。)
/ˈbaɪˌklʌstərɪŋ/
Biclustering helps find groups of genes that behave similarly under specific conditions.
双向聚类有助于找出在特定条件下表现相似的一组基因。
Unlike standard clustering, biclustering can reveal local patterns by clustering rows and columns simultaneously in a sparse, high-dimensional matrix.
不同于传统聚类,双向聚类可以在稀疏的高维矩阵中同时对行与列聚类,从而揭示局部模式。
由前缀 bi-(“两者、双重”)+ clustering(“聚类”)构成,字面意思就是“双重聚类”。该术语在数据挖掘与生物信息学语境中广泛使用,强调对“对象-特征”两维同时分组,以发现局部一致结构。