网站访问排队系统研究与实现 201002251剖析 下载本文

内容发布更新时间 : 2024/6/6 12:11:42星期一 下面是文章的全部内容请认真阅读。

网站访问排队系统研究与实现

网站访问排队系统研究与实现

杨喆 中国人民大学附属中学(100080)

摘要

互联网与我们的学习和生活越来越密切。我们经常会遇到网站访问速度慢的问题。目前虽然有一些解决办法,但往往需要较大的资金、设备和研发投入。我受到银行排队机的启发,提出了把现实世界的排队机系统应用到网络虚拟世界中,通过设定虚拟服务区容量以避免网站出现堵塞或瘫痪,同时通过让等待访问者了解排队情况和自己的位置,减轻了访问者等候的焦虑。另外,通过倒计时加询问的方式,解决了访问超时和继续访问的矛盾。基于以上研究,我设计并实现了一个网站访问排队实验系统WebQ,它结构简单、易于移植和使用。经过网络实际测试,验证了设计方案的可行性和有效性。

一、 网站访问的工作原理

我们的学习和生活越来越离不开互联网了。通过访问各种类型的网站,可以了解国家大事、学习最新知识、和同学朋友交流,甚至可以完成选课、订票、购物等。

互联网是以TCP/IP协议为基础建立起来的一个巨大的计算机网络。而万维网(World Wide Web,简称WWW)是互联网中最重要、应用最广泛的一部分,它由成千上万个网页、文件等网络资源构成,并通过超链接形成一个纷繁复杂的庞大网络。万维网是在90年代初由蒂姆·伯纳斯-李发明的,他于1991年8月6日建立了世界上第一个网站,截至到2009年5月全球网站数量突破2.3亿,网民已突破10亿人。本文中如无特殊说明,不再区分互联网和万维网。

万维网包括三个重要内容:用URL格式写的网页地址,用HTML写的网页,用HTTP进行网络对话。下面是关于它们的介绍:

(1) 统一资源定位符URL(Uniform Resource Locator):它为万维网上每一

1

网站访问排队系统研究与实现

个网页或其它网络资源提供统一的标识,就是我们通常说的网页地址,以方便查找。它通常包含域名+目录+文件名等三部分。其中域名是网站服务器在互联网上的位置,目录和文件名是网页文件在网站服务器中的具体位置。 例如:http://www.rdfz.cn/xstd/xszp/zjlx/t20020710_6360.htm 就是人大附中网站上“我看鲁迅”网页的地址。当我们上网时,只需要在电脑的互联网浏览器上键入你想访问的网站地址(即网站首页的网页地址),或者点击一个网页上的超链接,就可以开始网站的访问;

(2) 超文本置标语言HTML(HyperText Markup Language):我们用HTML语言来描绘每一个网页。网页可以包含文本、图片、视音频、动画等丰富的内容。网站由许许多多相互链接的网页构成,存放在网站服务器中,网站服务器又称为WWW服务器。

(3) 超文本传输协议HTTP(HyperText Transfer Protocol):它是我们在万维网上进行通信的“语言”。当我们访问一个网站时,实际上就是通过浏览器向一个网站发出一个HTTP请求,而网站服务器在收到请求后,将对这个请求进行响应,发回HTML网页,于是我们在浏览器上就看到了所访问的网页。

图一、人大附中网站“我看鲁迅”网页

让我们来看一看通过互联网访问一个网站的全过程。假设我们要访问人大附中网站中“我看鲁迅”网页,首先我们在电脑的互联网浏览器(例如微软公司的Internet Explorer,谷歌公司的Chrome、Mozilla公司的FireFox等)地址栏中输入网页地址“http://www.rdfz.cn/xstd/xszp/zjlx/t20020710_6360.htm”,浏览器由这个网

2

网站访问排队系统研究与实现

页地址形成HTTP请求,发往人大附中网站 “www.rdfz.cn”,该网站的服务器根据收到的网页地址中目录和文件部分“xstd/xszp/zjlx/t20020710_6360.htm”,在硬盘中找到该文件及其相关文件(例如图像文件等),通过互联网发回浏览器,浏览器将它们拼接成完整的网页并呈现出来(见图一),这就是网站访问的全过程。

以上我们介绍了互联网、万维网,以及访问网站的基本过程。在下一节中我们将分析影响网站访问速度的原因。

二、 影响网站访问速度的原因

互联网在给网民带来信息查询、沟通、电子交易等便利的同时,由于种种原因,经常出现访问速度慢,需要长时间等待的现象。因此有人将WWW戏称为World-Wide Wait。从上一节介绍的网站访问过程中可以看出,任何一个环节出现延迟,都可能影响访问,例如上网接入网络带宽不够、遇到上网高峰期、上网的电脑本身运行出现问题等等,本文将重点从网站角度来考虑阻塞问题。

从网站角度看,影响访问速度的原因包括:网站接入互联网的带宽,网站服务器的性能等。网站一般通过将动态网页静态化、在各地部署大量高性能服务器、对访问流量均衡分配、增购网站接入带宽等方式来支持正常访问。这需要专门的研发以及大量经费投入。网站访问量波动很大,如果按最大容量来设计和部署,将形成很大的浪费,在管理上也不经济,更何况根本无法准确预知未来的最大访问量。因此无论是大型网站还是普通网站,都无法根本避免访问高峰拥堵现象的出现。

尤其是对于网上购票、网上选课、网上申报项目等类型的网站,往往访问停留时间较长,又容易出现突发的访问高峰(如截止日期临近时)。即使在网络条件很好的情况下,常常也会遇到“堵塞”。这是因为网站服务器虽然能够同时为许多访问者提供服务,但仍有一定限度。超过了这一限度,服务器就会“过载”,导致访问速度非常缓慢。这时如果有更多网民加入,还可能导致服务器出现瘫痪,使网站完全无法访问。2008年奥运门票购票网站就因为过载而出现故障。我和身边的朋友在网上选课、查分时,由于大家心情非常迫切、访问时间又都很集中,也常常出现“堵死”现象。

综上所述,虽然已有一些改善网站访问速度的技术和方法,但这些方法往往需要大量的研发及资金投入。即使如此,在遇到突发性访问高峰时,由于网站服务器过载,仍可能出现拥堵。

论文将从下列条件出发开展研究:

条件一:网站接入带宽可以始终满足访问需要;

3