V2EX  ›  英汉词典
Enqueued related words: Data Wrangling

Data Cleaning

定义 Definition

“data cleaning”指数据清洗/数据清理:对原始数据进行检查与处理,修正或删除错误、重复、缺失、不一致的数据,并将格式统一,使数据更适合分析与建模。(也常写作 data cleansing,含义基本相同。)

发音 Pronunciation

/ˈdeɪtə ˈkliːnɪŋ/ (也常见 /ˈdætə ˈkliːnɪŋ/)

例句 Examples

I spent the morning doing data cleaning.
我花了一上午在做数据清洗。

Before we trained the model, we performed data cleaning to remove duplicates, fix inconsistent dates, and handle missing values.
在训练模型之前,我们进行了数据清洗:去除重复记录、修正不一致的日期,并处理缺失值。

词源 Etymology

“data”来自拉丁语 datum(“给出的东西”),后发展为“资料/数据”;“cleaning”来自古英语 clǣne(“干净的”)及其动词形式。组合成“data cleaning”这一术语后,在统计学、数据库与数据科学语境中专指“把数据变得可用、可靠的整理过程”。

相关词 Related Words

文学与著作 Notable Works

  • R for Data Science(Hadley Wickham & Garrett Grolemund)——讨论数据导入与整理,常用“cleaning data / data cleaning”表述
  • Python for Data Analysis(Wes McKinney)——在数据处理章节中频繁出现“data cleaning”
  • Data Science for Business(Foster Provost & Tom Fawcett)——以商业数据为背景谈数据准备与清洗的重要性
  • The Data Warehouse Toolkit(Ralph Kimball 等)——在数据仓库与ETL流程中涉及数据清洗概念与实践
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   734 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 22:17 · PVG 06:17 · LAX 14:17 · JFK 17:17
♥ Do have faith in what you're doing.