一种基于信息熵的web信息提取的方法研究 -