实验二 描述性统计分析 下载本文

内容发布更新时间 : 2025/2/11 0:37:45星期一 下面是文章的全部内容请认真阅读。

实验二 描述性统计分析

一、实验目的

学习利用SPSS进行描述性统计分析,编制变量数列。

二、实验内容及实验步骤

(一)探索分析(Explore过程)

实验内容:

下表为30名10岁少儿的身高(cm)资料,试作探索性分析。

身高 身高

编号 编号

男孩 女孩 男孩 女孩 1 121.4 133.4 9 128.2 125.4 2 131.5 132.7 10 137.4 137.5 3 132.6 130.1 11 135.5 120.9 4 129.2 136.7 12 129.0 138.8 5 134.1 139.7 13 132.2 138.6 6 135.8 133.0 14 140.9 141.4 7 140.4 140.3 15 129.3 137.5 8 136.0 124.0

实验步骤:

1.建立数据文件。

定义少儿身高的变量名为Height,然后再定义一个变量为SEX,用于作性别分组。顺序输入少儿身高的原始数据,在变量SEX中,男孩输入1、女孩输入2,并设置其值标签。

2.选择菜单“Analyze→Descriptive Statistics→Explore”,弹出“Explore”对话框。现欲对少儿身高资料进行分组的探索性分析,故在对话框左侧的变量列表中选x,使之进入Dependent List框,再选变量sex,使之进入Factor List框。

3.单击“Statistics”按钮,弹出“Explore: Statistics”对话框,选中Descriptives、M-estimators、Outliers、Percentiles以及Grouped Frequency tables。单击“Continue”按钮返回“Explore”对话框。

4.点击“Plot”按钮弹出“Explore: Plot”对话框,在Boxplot栏内选“Factor levels together”,按组别进行箱图绘制;在“Descriptive”栏内选“Stem-and-leaf”,作茎叶情形描述。单击“Continue”按钮返回“Explore”对话框。

5.单击“OK”按钮,得到输出结果。 结果分析:

1. 描述统计量:

分组显示男女各组的均值、置信区间、5%修正均值、中位数、方差、标准差、最小值、最大值、全距、四分位间距、偏度和峰度。

DescriptivesHeightGender0Mean95% ConfidenceInterval for Mean5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosisMean95% ConfidenceInterval for Mean5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosisStatistic134.0000130.4765137.5235134.3167136.700040.4836.36261120.9141.420.508.70-.894-.275132.9000130.0706135.7294133.0944132.600026.1045.10924121.4140.919.506.80-.424.496Std. Error1.64282Lower BoundUpper Bound1.5801.1211.31920Lower BoundUpper Bound.5801.121 2.M估计

M-EstimatorsGender01Huber'saM-Estimator135.4183132.9127Tukey'sbBiweight136.2104133.0901Hampel'scM-Estimator135.1852133.0153Andrews'dWave136.2327133.0904Heighta. The weighting constant is 1.339.b. The weighting constant is 4.685.c. The weighting constants are 1.700, 3.400, and 8.500d. The weighting constant is 1.340*pi. 3.百分位数

PercentilesPercentiles50136.7000132.6000136.7000132.6000WeightedAverage(Definition 1)Tukey's HingesHeightHeightGender01015120.9000121.400010122.7600125.480025130.1000129.2000131.4000129.250075138.8000136.0000138.7000135.900090140.7400140.600095..

4.极值

Extreme ValuesHeightGender0Highest12345123451234512345Case Number2922202728262324181714710861912415Value141.4140.3139.7138.8138.6120.9124.0125.4130.1132.7140.9140.4137.4136.0135.8121.4128.2129.0129.2129.3Lowest1HighestLowest

5.正态性检验

Tests of NormalityKolmogorov-SmirnovStatisticdfSig..19815.119.11215.200*aHeightGender01Shapiro-WilkStatisticdf.89515.96315Sig..079.751*. This is a lower bound of the true significance.a. Lilliefors Significance Correction 由上可以看出,在0.05水平下不能拒绝正态性假设。

6.QQ图

Normal Q-Q Plot of Heightfor Gender= 021Expected Normal0-1-2120125130135140145Observed ValueNormal Q-Q Plot of Heightfor Gender= 121Expected Normal0-1-2120125130135140Observed Value

由上图可以看出,各组数据均在直线周围,因此可以认为他们服从正态分布。而

且男性数据与直线拟合更好,说明更近似于正态分布,这一点从正态性检验结果5可以证实。

(二)描述性分析(Descriptives过程)

实验内容:

调查20名男婴的出生体重(克)资料如下,试作描述性统计。

2770 2915 2795 2995 2860 2970 3087 3126 3125 4654 2272 3503 3418 3921 2669 4218 3707 2310 2573 3881

实验步骤:

1.建立数据文件。 激活数据管理窗口,定义男婴出生体重的变量名为X,然后输入男婴出生体重的原始数据。

2.选择菜单“Analyze→Descriptive Statistics→Descriptives”,弹出“Descriptives”对话框。在对话框左侧的变量列表中选x,进入“Variable(s)” 框。并选中“Save standardized value as variables”项。

3.单击“OK”按钮,得到输出结果。

(三)频数分析(Frequencies过程)

实验内容:

调查100名健康女大学生的血清总蛋白含量(g%)如下表,试作频数分析。

7.43 7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.35 8.05 7.95 7.56 7.50 7.88 7.20 7.20 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.27 7.04 7.72 6.88 6.73 6.73 6.73 7.27 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.03 7.43 7.35 7.95 7.04 7.65 7.27 7.72 8.43 7.50 7.65 7.04 实验步骤:

1.建立数据文件。

定义血清总蛋白含量的变量名为X,然后输入血清总蛋白含量的原始数据. 2.数据预分析

选择菜单“Analyze→Descriptive Statistics→Explore”,在弹出对话框中选择 血清总蛋白含量 进入Dependent List;并在Display 选项中选择plots→plots?→Boxplots→None→Descriptive→Stem-and-leaf→continue. 根据茎叶图,观察数据是否分布均匀,从而确定是采用等距式分组还是异距式分组。根据经验公式确定组数以及组距,并确定适当组限。

3.计算频数

对原始数据进行重新编码,利用Transform→Recode→Into Different Variables将该100名健康女大学生的血清总蛋白含量分组并赋值给新变量NewVar。

选择菜单“Analyze→Descriptive Statistics→Frequencies”,弹出