最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
python实现html代码转义转换的例子
时间:2014-12-18 编辑:简简单单 来源:一聚教程网
之前记录了从网上翻来的 Python HTMLParser处理HTML转义字符 文档。不过在对带有中文字符的内容进行处理的时候会报错,代码如下:
代码如下 | 复制代码 |
# cat html.py |
报错内容如下:
代码如下 | 复制代码 |
Traceback (most recent call last): |
解决方法如下:
代码如下 | 复制代码 |
#/usr/bin/python |
需要载入sys模块,重新设置默认编码为utf8,就不会出错了。不过要处理的内容只不过是一个文章的title部分,而常用的html转义内容也就如下几个:
字符 十进制 转义字符
" " "
& & &
< < <
> > >
不断开空格(non-breaking space)
注:不常用的具体可以参看开源中国在线工具上的html转义字符表。
于是决定使用python的replace功能实现一个简单的转义功能函数,具体如下:
代码如下 | 复制代码 |
#/usr/bin/python #coding=utf-8 def replace_html(s): s = s.replace('"','"') s = s.replace('&','&') s = s.replace('<','<') s = s.replace('>','>') s = s.replace(' ',' ') s = s.replace(' - 361way.com','') print s replace_html(title) |
优点就是快速简洁,不依赖于模块,实用时也无需再reload sys模块指定默认编码。
相关文章
- ubb转换成html 08-05
- HTML与UBB代码互相转换 07-19
- html转换成UBB代码 05-24
- ubb 转换成html代码 04-29
- ubb转换成html 代码 03-15
- ubb代码转化html代码 01-12