基于内容冗余的Web信息抽取