内容发布更新时间 : 2024/11/19 18:42:17星期一 下面是文章的全部内容请认真阅读。
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
图11.3-9 去除空格
添加前缀:将所需要的前缀添加到待处理字符串前面
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
图11.3-10 添加前缀
添加后缀:将所需要的后缀添加到待处理字符串前面
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
图11.3-11 添加后缀
HTML转码:将实体引用转化为普通文本
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
图11.3-12 HTML转码
实体引用如下:
引用符 < > & ' "
表11.3-1 实体引用
综合运用:利用前缀、HTML转码、替换完成格式化数据综合运用
被引用字符
< > & ‘ “
八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
图11.3-1 综合运用
一般来说,对付较为复杂的数据,可能一次简单的格式化处理并不能完成,我们需要在一次处理后再进行再次格式化处理,因此,了解格式化各操作的运用很有必要,合理搭配一定能处理拿到我们想要的数据。
以上为八爪鱼正则工具简单运用,了解正则工具各位置释义与作用,配合后续章节学习正则语法,对正则的掌握有良好的促进作用