实验评分
平均时长
4 小时
难易程度
普通
实验编号
SL4002
学习次数
5 次
实验概述
数据质量的控制在做数据分析或者建模之前是必不可少的步骤,如果在做数据分析或者建模之前没有对数据的质量进行探查,那么很有可能数据分析和建模的结果是错误的,那之前所有的工作都会前功尽弃。通过本实验,学员可以熟练掌握利用Python实现基本的数据质量检查与修复,包括查找缺失值,处理离群值,检查重复数据元组,检查数据不一致性,检查数据删失和截断等。本实验的源数据为存放在agri数据库中的zj_agri表和sc_agri表,通过本实验将会在数据库practice中生成zj_clean_agri表和sc_clean_agri表。(practice数据库用于做实验,agri数据库里的数据是已经准备好的数据)。
1. 熟练使用Python进行数据质量的检查
2. 熟练运用Python进行数据质量的修复
课程相关资源
可下载资源