数据的基本统计与非参数检验 下载本文

内容发布更新时间 : 2024/6/27 0:12:26星期一 下面是文章的全部内容请认真阅读。

北京建筑大学

理学院信息与计算科学专业实验报告

课程名称《数据分析》实验名称 数据的基本统计与非参数检验 实验地点基C-423 日期 2016 . 3 .17 姓名 班级 学号 指导教师 成绩

【实验目的】

(1)熟悉数据的基本统计与非参数检验分析方法; (2)熟悉撰写数据分析报告的方法; (3)熟悉常用的数据分析软件SPSS。 【实验要求】

根据各个题目的具体要求,完成实验报告 【实验内容】

根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别对数据的“家庭收入”、“现住面积”,进行数据的基本统计量分析,撰写相应的分析报告; 根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分别分析不同学历对家庭收入、现住面积是否有显著影响,撰写相应的分析报告。

根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析家庭收入与10000元是否有显著差异,撰写相应的分析报告。

根据附件“住房状况调查”给出的相关数据,请选用恰当的分析方法,分析婚姻状况对家现住面积是否有显著影响,撰写相应的分析报告。

根据附件“减肥茶数据”给出的相关数据,请选用恰当的分析方法,分析该减肥茶对减肥是否有显著影响,撰写相应的分析报告。 【分析报告】 1.

表一 家庭收入和现住面积的基本描述统计量

N

有效 缺失

均值

家庭收入

2993 0 17696.1567 现住面积

2993 0 62.7241 均值的标准误 中值 众数 标准差 方差 偏度 偏度的标准误 峰度 峰度的标准误 百分位数

25 50 75

279.64310 15000.0000 10000.00 15298.80341 2.341E8 5.546 .045 55.425 .089 10000.0000 15000.0000 20000.0000 .47349 60.0000 60.00 25.90383 671.008 .910 .045 3.078 .089 45.0000 60.0000 80.0000 表一说明, 家庭收入方面:

被调查者中家庭收入的均值为17696.16元,中值为15000元,普遍收入为10000元; 家庭收入的标准差和方差都相对较大,所以,各家庭收入之间有明显的差异; 偏度大于零,说明右偏;峰度大于零,说明数据呈尖峰分布;

由家庭收入的四分位数可知,25%的家庭,收入在10000以下,有50%的家庭,收入在15000以下,有75%的家庭,收入在20000以下; 现住面积方面:

被调查者中现住面积的均值为62.724平方米,中值为60平方米,普遍面积为60平方米; 现住面积的标准差和方差都相对较大,所以,各家庭现住面积之间有明显的差异;

偏度近似等于零,说明现住面积数据对称分布;峰度大于零,说明现住面积数据为尖峰分布; 由现住面积的四分位数可知,25%的家庭,现住面积为45平方米以下,有50%的家庭,现住面积在60平方米以下,有75%的家庭,现住面积在80平方米以下。

图一:家庭收入直方图

该图表明,家庭收入分布存在一定的右偏。

图二:现住面积直方图

该图形象的展示了现住面积的数据分布比标准正态分布更陡峭。