数据文件的建立与编辑 下载本文

内容发布更新时间 : 2024/5/5 1:41:40星期一 下面是文章的全部内容请认真阅读。

第二讲:数据文件的建立与编辑管理

一、数据文件的建立 1、测量方式(Measure)

运用统计学方法分析时十分强调“对号入座”。SPSS中变量有三种测量方式,分别是: 尺度变量(Scale) 顺序变量(Ordinal)、 分类变量(Nominal):

各对应与统计学中的计量资料、等级资料以及计数资料(包括二分类与无序多分类)。在SPSS的默认的情况下,所有的数值、文字输入都将被作为Scale处理,不同的是输入数值将完整保留,而文字全都是被转变为

2、定义变量(Variable View)

运行SPSS后,将进入Data Editor界面,如下:

窗口顶部显示为“SPSS Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、工具栏。特别的,工具栏下方的是数据栏,数据栏下方则是数据管理窗口的主界面。该界面和EXCEL极为相似,由若干行和列组成,每行对应了一条记录(Case),每列则对应了一个变量(Variable)。由于现在我们没有输入任何数据,所以行、列的标号都是灰色的。请注意第一行第一列的单元格边框为深色,表明该数据单元格为当前单元格。如果直接输入数据很可能不能满足统计分析的要求,所以首先要定义变量。单击Variable View:

这就是变量定义窗口,我们需要对变量名称(Name)、类型(Type)、宽度(Width)、小数位数(Decimals)、变量标签(Label)、变量值标签(Values)、缺失值(Missing)、显示数据的宽度(Columns)、对齐方式(Align)、测量方式(Measure)。

Name:总长度不可以超过8个字符(4个汉字);系统不分大小写,首字符必须是字母(或汉字),其

后可接字母或数字,尽量不要在变量名称中使用标点符号或运算符号(例如:?、-、!、*等);不可以将下划线 “_”和圆点“.”作为变量名的最后一个字符(但是在中文输入法,例如清华紫光时上述法则有时不成立);变量名不可使用“all、and、by、eq、ge、gt、le、ne、not、or、to、with等SPSS系统保留字。

Type:在SPSS系统中,共有8种类型的变量设置,单击Type:

Numeric:标准数值型;这是系统默认型别,可以在width和decimal中调节总长度与小数位

数(小数点也占一位)。

Comma:带逗号的数值型;整数部分从右向左每3位加一个逗号;例如原始数据是6789.401,

如果选择comma,则按照6,789.401录入;在data view中SPSS将它还原为6789.401。

Dot:带句号的数值型;整数部分从右向左每3位加一个圆点而小数点表达为逗号;例如原始

数据是7889.12,如果选择dot,则按照7.889,12录入;在data view中SPSS仍将表达为7.889,12。

Scientific notation:科学计数型;例如原始数据为78.123,输入时仍可按照78.123输入,

但是SPSS将会把它转变为7.8E+01(7.8123×101)表达。

Date:日期型;使用者可以从系统提示的日期显示形式中选择自己需要的;

例如选择dd-mmm-yyyy,则2009年2月20日应该输入为20-FEB-2009;如果选择

mm/dd/yyyy,则应该输入为02/20/2009。但是无论是何种输入方式,data型资料将不能直接参与运算,必须通过有关的日期转换函数转换后才行。

Dollar:带美元符号的数值型;使用者可以从系统提供的形式中选择,系统将自动生成美元符

号。默认为11位数(1000亿),如果超出将按照科学计数法表达,同时数据前加美元符号。

Custom currency:自定义数值型;共有5种形式,系统将其分别命名为CCA(CC为custom

currency的简写,A表示第一种)至CCE,可以在edit-option-currency选项卡中作定义,定义之后可以从sample output预览修改结果。

String:字符串型;选择该中表达类型后,使用者可以在data view中输入中文或英文。字符

串型变量不能参与统计运算,而且字符串中大小写字母将被系统辨认为两个完全不同的字符。

Width:输入时的变量值宽度,默认为8位。 Decimals:小数位数,默认为2位。

Label:变量标签;用于说明变量所代表的实际意义,特别对于在name中无法准确表达的变量名称可

以通过标签详细说明。

Values:变量值标签;用于详细说明变量值的具体意义,特别是对于分类变量或等级变量往往用具体

数值代替分类或等级,此时最好定义数值的变量标签以备分析与查阅方便。例如变量名称为sex,其label为调查对象性别,values分别是0代表男性、1代表女性。