八爪鱼·云采集网络爬虫软件
www.bazhuayu.com
正则表达式使用工具教?/p>
正则表达?/p>
-
教程
正则表达式是烦琐的,
但是它是强大的,
在八爪鱼中,
学会正则表达式的应用能让你的数据
展示更加规范化,
所提取数据字段表达更加精准?/p>
合理的运用正则,
除了提升你的数据展示
规范?/p>
字段表达精准之外,还会给你带来绝对的成就感?/p>
只要认真阅读本教程,结合八爪?/p>
正则表达式工具实战应用,掌握正则表达式是非常容易的?/p>
内容列表?/p>
11.1
正则表达?/p>
-
简?/p>
11.2
正则表达?/p>
-
简单示?/p>
11.3-
正则表达?/p>
-
八爪鱼正则工?/p>
11.4
正则表达?/p>
-
语法
11.5
正则表达?/p>
-
正则表达式及简单应?/p>
11.1
正则表达?/p>
-
简?/p>
正则表达式(
Regular Expression
),按英文直译是“规范化表达”,其作用是将复杂模糊的
源数据通过正则表达式转化为简单直观的目标数据。例如:
?/p>
150ABCD
?/p>
“一百五
ABCD
?/p>
?/p>
One hundred and fiftyABCD
?/p>
分析思考过程:
以上字符串中?/p>
我们的源文本数据分别为:
?/p>
?/p>
150ABCD
?/p>
?/p>
“一百五
ABCD
?/p>
?/p>
?/p>
One hundred
and fiftyABCD
?/p>
假设我们要提取目标数据为:字符串中以数字开头的数据
那么我们约束条件为:只取字符串中以数字开头的源数?/p>
将此约束条件转化为正则表达式为:
[0-9](.+)\b
其中?/p>
[0-9]
的语义为开?/p>
1
位为
0-9
开头,中间间隔以通配符?/p>
”代替,
(.+)
语义为字符串
长度不做限定?/p>
\b
的语义为,匹配一个边界?/p>
正则后的目标数据:?/p>
150ABCD
?/p>
通过这个简单例子,
我们大致了解到了为什么要用正则与正则所能实现的效果?/p>
讲通俗点就
是,正则只是将我们的意愿(提取字符串中以数字开头的数据)以表达式的形式展现出来
?/p>
[0-9](.+)\b
),并最终通过表达式匹配到所需要的目标数据(?/p>
150ABCD
”),所以灵活运