统计专业实验-实验06-聚类分析 下载本文

内容发布更新时间 : 2024/12/25 10:08:11星期一 下面是文章的全部内容请认真阅读。

重庆工商大学数学与统计学院

《统计专业实验》课程

实验报告

实验课程:_统计专业实验 指导教师:__ 叶 勇_

专业班级: 统计专业二班 ___

学生姓名: __殷 婷___

学生学号: 2010101217_____

实 验 报 告

实验项目 实验日期 实验目的 实验六 聚类分析 2013-4-5 实验地点 80608 了解聚类分析的原理,并掌握聚类分析的方法和过程。 1.根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据, 对世界20个国家和地区进行聚类分析,并对结果进行判断。数据见实验指导书。 2.根据2008年全国各省市居民消费结构,进行聚类分析。 3.对重庆市各区县的经济发展类型进行聚类分析。 实验内容 实验思考题解答: 1.变量的测度类型有哪些? 变量的测度类型包括间距尺度、有序尺度和名义尺度 2.系统聚类法的思想是什么? (或变量)品(或变量)总能聚到合适的类中。 3.最短距离法是不是一种优良的系统聚类方法,为什么?它适合于什么形态类的聚类? 类延伸的情况。 S形的类。 4.组间联结法和组内联结法都是计算所有样本对的平均距离,请说明其区别? 组内平均本对 组间联结法利用了离易受极端值影响的弱点。 了类内部相似性的变化。

2

实验运行程序、基本步骤及运行结果: 1. 根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据, 对 世界20个国家和地区进行聚类分析,并对结果进行判断。 根据信息基础设施的发展状况,已知20个国家和地区信息基础设施基本数据如表: 其中:call-每千人拥有电话线,movecall-每千户居民蜂窝移动电话数 fee-高峰时每3分钟国际电话成本,computer-每千人拥有计算机数 mips-每千人中计算机运算功率(每秒百万指令),net-每千人互联网用户数 no 国家 Call 631.6 498.4 557.6 684.1 644 620.3 498.4 469.4 434.5 81.9 138.6 92.2 174.9 169 262.2 195.5 78.6 13.6 559.1 521.1 movecall 161.9 143.2 70.6 281.8 93.5 248.6 147.5 56.1 73 16.3 8.2 9.8 5 6.5 49.4 88.4 27.8 0.3 42.9 122.5 fee 0.36 3.57 2.18 1.4 1.98 2.56 2.5 3.68 3.36 3.02 1.4 2.61 5.12 3.68 2.66 4.19 4.95 6.28 1.27 0.98 computer 403 176 199 286 234 296 284 119 99 19 31 34 24 40 68 53 22 2 201 248 mips 26073 10223 11571 16660 13621 17210 13578 6911 5795 876 1411 1751 1101 1796 3067 2734 1662 101 11702 14461 Net 35.34 6.26 9.48 29.39 22.68 21.84 13.49 1.72 1.66 0.52 1.28 0.35 0.48 1.45 3.09 1.25 0.11 0.01 4.76 11.91 1 美国 2 日本 3 德国 4 瑞典 5 瑞士 6 丹麦 7 新加坡 8 中国台湾 9 韩国 10 巴西 11 智利 12 墨西哥 13 俄罗斯 14 波兰 15 匈牙利 16 马来西亚 17 泰国 18 印度 19 法国 20 英国 步骤: 1.在SPSS中输入数据,每个数据指标为一个变量; 2.选择SPSS的聚类分析功能 Analyze->Classify->Hierarchical cluster Analysis 3.选择六个信息基础变量到分析变量框中,“国家”到案例标识变量框中; 4.指定聚类方法和输出格式。 注意对距离的选择和聚类方法的选择。 将主要的步骤和SPSS的运行结果记录下来,根据树形图或冰柱图对结论进行分析。

3