数据质量的检查与修复_备份

数据质量的检查与修复

Clouder场景化技能认证课程9.9元起>>

50 沙箱点
提示: 实验资源会在固定时间后释放,请创建资源后尽快操作。

实验评分

平均时长

4 小时

难易程度

普通

实验编号

SL4002

学习次数

5

实验概述

数据质量的控制在做数据分析或者建模之前是必不可少的步骤,如果在做数据分析或者建模之前没有对数据的质量进行探查,那么很有可能数据分析和建模的结果是错误的,那之前所有的工作都会前功尽弃。通过本实验,学员可以熟练掌握利用Python实现基本的数据质量检查与修复,包括查找缺失值,处理离群值,检查重复数据元组,检查数据不一致性,检查数据删失和截断等。本实验的源数据为存放在agri数据库中的zj_agri表和sc_agri表,通过本实验将会在数据库practice中生成zj_clean_agri表和sc_clean_agri表。(practice数据库用于做实验,agri数据库里的数据是已经准备好的数据)。

实验目的

1.     熟练使用Python进行数据质量的检查

2.     熟练运用Python进行数据质量的修复

实验架构