数据血缘(关系):指数据从产生、采集、处理、转换、汇总到消费/展示的全流程来源与流向记录,说明数据“从哪里来、经过了什么处理、到哪里去”,常用于数据治理、审计合规、影响分析与问题追踪。
/ˈdeɪtə ˈlɪniɪdʒ/
We use data lineage to track where each dashboard number comes from.
我们用数据血缘来追踪仪表盘上的每个数字究竟来自哪里。
Without end-to-end data lineage, a small change in one table can silently break downstream reports and compliance metrics.
如果没有端到端的数据血缘,一个表里的小改动就可能悄悄影响下游报表和合规指标。
lineage 原意是“血统、世系、谱系”,来自中古法语 linage,与拉丁语 linea(“线、线条”)相关,带有“沿着一条线追溯来源”的含义。与 data(数据)组合后,data lineage 借用了“家族谱系”的比喻,用来表达数据的“来源谱系”和“传递路径”。