数据预处理实验1 下载本文

内容发布更新时间 : 2024/5/29 8:15:22星期一 下面是文章的全部内容请认真阅读。

重庆交通大学信息科学与工程学院

实验报告

级:

曙光 1701 班

姓名

学号:

实验项目名称:数据导入与预处理实验一

实验项目性质:

验证性、设计性

实验所属课程:

《数据导入与预处理》

实验室 ( 中心 ) :

语音楼八楼

指导教师:

实验完成时间:

2019

年11

月1

一.实验目的

1. 了解和掌握数据库的恢复, 数据库数据的变换, 数据的统计以及可视化;掌握 Json 数据集的 API 下载方法,数据提取,以及导入其他数

据结构的方法。

2. 了解和掌握不同数据格式之间的转换方法; 掌握用计算机编程语 言实现数据的格式转换以及数据信息的提取。

二.实验要求

1. 安装 Mysql 数据库,以及 mysql workbench 客户端,

2. 下载对公众开放的安然 (Enron) 公司的电子邮件数据集。

下载地址:

3. 在 mysql 中恢复 Enron 数据库。 4.

数据统计每一天和每一周发邮件的数量,并用可视化软件实现

可视化。

5. 采用 iTunes API 做个小实验,利用关键词来生成 JSON数据结果集。 iTunes 是由 Apple 公司提供的一个音乐服务,任何人都可以利用

iTunes 服务来查找歌曲、 艺术家和专辑。 在查找的时候需要把搜索关

键词添加到 iTunes API URL的后面。 URL中, =后面的是搜索关键词,

是一个乐队的名字, the Growlers 。 注意: URL中用 +代替空格字符,

URL不允许包含空格字符。

iTunes API 会根据提供的关键词从音乐库中返回 50 个结果。整个结果集形成一个 JSON文件,每一条音乐信息中的元素,以名字 - 值 的格式存放在 JSON文件中。

The Growlers

Apple iTunes 的开发文档:

6. 使用一种熟悉的语言,编写程序,将下载下来的 the Growlers

所有音乐的歌名提取出来,并可视化显示。

三、需求分析

1. 提取出安然公司数据集中的每天的阅读量和每周的阅读量,并

画出趋势图

2. 提取出 iTunes 中的 trackname 数据

四、实验过程

1. 安装好 Mysql 和 Mysql Workbench