网络信息资源检索与利用第二次作业 下载本文

内容发布更新时间 : 2024/11/5 5:17:14星期一 下面是文章的全部内容请认真阅读。

准确性和查全率。 2. 支持主流的中文编码标准。包括GBK(汉字内码扩展规范)、GB2312(简体)、BIG5(繁体),并且能够在不同的编码之间转换。 3. 智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。 4. 检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。 5. 百度搜索支持二次检索(又称渐进检索或逼进检索)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。 6. 相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。 7. 运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。百度搜索引擎在中国境内提供搜索服务,可大大缩短检索的响应时间(一个检索的平均响应时间小于0.5秒) 8. 可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。 9. 检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。 10. 智能性、可扩展的搜索技术保证最快最多的收集互联网信息。拥有目前世界上最大的中文信息库,为用户提供最准确、最广泛、最具时效性的信息提供了坚实基础。 11. 分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。 12. 高可配置性使得搜索服务能够满足不同用户的需求。 13. 先进的网页动态摘要显示技术。 14. 独有百度快照, 15. 支持多种高级检索语法,使用户查询效率更高、结果更准。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“link:”,还将继续增加其它高效的搜索语法。 Google作为全球最大的多语言搜索引擎,在国际上占有的市场越来越大,成为互联网最具潜力的企业,以下就介绍下GOOGLE搜索引擎的主要特点: 1.特有的PR技术,PR 能够对网页的重要性做出客观的评价。PR是GOOGLE评价一个网站质量高低的重要标准,PR分为十个等级,从容不1至10,PR越高代表网站质量和权威性越高,排名也就越靠前。 2.更新和收录快,GOOGLE收录新站一般在十个工作日左右,是所有搜索引擎收录最快的,更新也比较稳定,一般一个星期都会有大的更新。 3.重视链接的文字描述和链接的质量,链接的文字描述也就是做链接用的文字,这个文字对GOOGLE排名起一定作用,因此我们建议如果网站要做某些关键词,在交换链接时要用这个关键词做链向你网站,链接的质量与链接网站的权威性和与你站是否相关有关,权威越高侧你站获得的排名越好, 4.重视Description描述,多次研究发现,那些在GOOGLE排名好的网站在描述中匀含有关键词,而且有些重复二次,因此可推断其对描述还是相当重视。 五、超文本匹配分析:Google 的搜索引擎同时也分析网页内容。并不采用单纯扫描基于网页的文本(网站发布商可以通过元标记控制这类文本)的方式,而是分析网页的全部内容以及字体、分区及每个文字精确位置等因素。同时还会分析相邻网页的内容,以确保返回与用户查询最相关的结果。 他们的搜索排序方式与广告展现也有不同,百度有竞价排名,而Google是机器程序自动排序,完全按照预先设计的机器程序来处理,没有人为的干预来操纵其排名。 成绩评定: 该生对待本次实验的态度 □认真 □良好 □一般 □比较差。 本次实验的过程情况 □很好 □较好 □一般 □比较差 对实验结果的分析 □很好 □良好 □一般 □比较差 文档书写符合规范程度 □很好 □良好 □一般 □比较差 综合意见: 成绩 指导教师签名 日期