即使读完数据清理在维基百科上,当该术语用于数据库时,我仍然不清楚数据清理到底是什么。
它是一个正式工程负责人是否有预定义的方式来执行数据清理?如果有,我应该研究的关键字是什么?
- 或者 -
它是一个一般的或者是一个简单来说清理数据库中不一致数据的术语?
什么是数据清理?
答案1
在数据库上下文中,它是对与模式一致但在更高级别上有错误的数据的更正,例如无效的信用卡号和 SSN、重复记录、格式不匹配等等。
它是一个通用的、宽泛的术语,只有在特定的案例环境中才具有特定的含义。
答案2
我创建了“数据清理”程序,用于定期检查和修复数据库问题,这些问题可能不适合实时检查(即在输入数据时检查错误、不一致或重复)。清理程序可以修复特定类型的错误,例如检查邮政编码输入是否与城市/州相匹配,或者根据地址查找客户姓名的变体(重复客户)。
有时,当数据库非规范化(出于性能原因)时,清理例程可以在“非高峰”时间检查数据库,以确保数据保持一致。