最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
python中re清理html标签的函数
时间:2014-11-12 编辑:简简单单 来源:一聚教程网
首先,运行 Python 解释器,导入 re 模块并编译一个 RE:
代码如下 | 复制代码 |
#!python |
现在,你可以试着用 RE 的 [a-z]+ 去匹配不同的字符串。一个空字符串将根本不能匹配,因为 + 的意思是 “一个或更多的重复次数”。 在这种情况下 match() 将返回 None,因为它使解释器没有输出。你可以明确地打印出 match() 的结果来弄清这一点。
代码如下 | 复制代码 |
#!python >>> p.match("") |
例子
代码
代码如下 | 复制代码 |
def formatHtml(input): regular = re.compile('<\\bp\\b[^>]*>',re.IGNORECASE) input = regular.sub(' ',input) |
是用re注意:
1、def sub(pattern, repl, string, count=0, flags=0):
第三个参数是count很容易误用成flags.
2、re.sub('<8888(\g<0>)>',s) 其中g<0>表示捕获的分组字符,0表示匹配的整个字符串,1表示第一个分组
3、(
(
常用正则表达式中特殊字符
^匹配字符串的开始。
$匹配字符串的结尾。
\b匹配一个单词的边界。
\d匹配任意数字。
\D匹配任意非数字字符。
x?匹配一个可选的x字符(换句话说,它匹配1次或者0次x字符)。
相关文章
- PHP导出数据超时的优化建议解读 10-31
- PHP之mysql位运算解析 10-31
- Laravel实现登录跳转功能解析 10-31
- php双向队列解读 10-31
- Laravel异常上下文解决教程 10-24
- php数组查询元素位置方法介绍 10-24