内容发布更新时间 : 2024/12/24 0:01:58星期一 下面是文章的全部内容请认真阅读。
基于weka的数据分类分析
实验题目 姓名 基于weka的数据分类分析 班级 小组合作 否 12级信管学 号 班 一、实验目的 1、 使用数据挖掘中的分类算法,对数据集进行分类训练并测试; 2、 应用不同的分类算法,比较他们之间的不同; 3、 了解Weka平台的基本功能与使用方法。 二.实验环境 1、win7+eclipse+weak; 2、实验室网络环境 三、 实验内容与步骤 (一)数据准备及预处理 1、 格式转换方式; (二)三种分类方法分析 1、决策树分类; 2、K最近邻算法分类; 3、朴素贝叶斯分类; 4、三类分类方法的校验结果比较; 四、实验过程与分析 (一) 数据准备及预处理 1、 格式转换方式; 原始数据是excel文件保存的xlsx格式数据,需要转换成Weka支持的arff文件格式或csv文件格式。由于Weka对arff格式的支持更好,这里我们选择arff格式作为分类器原始数据的保存格式。 转换方法:在excel中打开“weather.xlsx”,选择菜单文件->另存为,在弹出的对话框中,文件名输入“weather”,保存类型选择“CSV(逗号分隔)”,保存,我们便可得到“weather.csv”文件;然后,打开Weka的Exporler,点击Open file按钮,打开刚才得到的“weather”文件,点击“save”按钮,在弹出的对话框中,文件名输入“weather”,文件类型选择“Arff data files(*.arff)”,这样得到的数据文件为“weather.arff”。 (二)三种分类方法分析 1、 决策树分类: 用“Explorer”打开刚才得到的“train-data.arff”,并切换到“Class”。点“Choose”按钮选择“tree (weka.classifiers.trees.j48)”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: 2、 K最近邻算法分类: 点“Choose”按钮选择“laze->ibk”,这是WEKA中实现的决策树算法。 选择Cross-Validatioin folds=10,然后点击“start”按钮: