统计数据的预处理包括哪些内容 统计数据的预处理包括

【统计数据的预处理包括哪些内容 统计数据的预处理包括】

统计数据的预处理包括哪些内容 统计数据的预处理包括

文章插图
统计数据的预处理包括描述及探索性分析、缺失值处理、异常值处理、数据变换技术、信度与效度检验、宏观数据诊断等六大类 。
数据预处理(data preprocessing)是指在主要的处理以前对数据进行的一些处理 。如对大部分地球物理面积性观测数据在进行转换或增强处理之前,首先将不规则分布的测网经过插值转换为规则网的处理,以利于计算机的运算 。另外,对于一些剖面测量数据,如地震资料预处理有垂直叠加、重排、加道头、编辑、重新取样、多路编辑等 。现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意 。为了提高数据挖掘的质量产生了数据预处理技术 。数据预处理有多种方法:数据清理,数据集成,数据变换,数据归约等 。这些数据处理技术在数据挖掘之前使用,大大提高了数据挖掘模式的质量,降低实际挖掘所需要的时间 。数据的预处理是指对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理 。