一聚教程网：一个值得你收藏的教程网站

ps教程 | flash教程 | 路由器设置 | Jsp教程 | 加入收藏

首页 php教程 asp.net教程 css教程网页制作网页特效手机开发办公数码

当前位置：一聚教程网 > php教程 > python

推荐专题

最新下载

1

全能指南针
大小：41.63 MB 类型： 生活服务
2

GO2货源
大小：53.75 MB 类型： 学习理财
3

期货先锋
大小：65.80 MB 类型： 学习理财
4

加画框
大小：40.68 MB 类型： 图片拍照
5

今日蒙城
大小：100.62 MB 类型： 资讯阅读
6

夜间护眼
大小：7.23 MB 类型： 生活服务
7

辞海
大小：113.41 MB 类型： 学习理财
8

购物党
大小：56.09 MB 类型： 生活服务
9

手心输入法
大小：41.40 MB 类型： 系统工具
10

云端课堂
大小：58.04 MB 类型： 商务办公

热门教程

1

《寻找夏日的宝物》全事件流程如何过
时间：2022-10-19 类型： 单机攻略
2

苹果版的avnight卡播放面问题解决
时间：2018-01-26 类型： 手机软件
3

《绯月仙行录》魔界怎么到达
时间：2022-12-30 类型： 单机攻略
4

《泰拉瑞亚》控制台指令代码汇总
时间：2022-12-16 类型： 单机攻略
5

《赛博朋克2077》边缘行者彩蛋触发地点介绍
时间：2022-09-21 类型： 单机攻略
6

《塔王之王》日常如何玩
时间：2022-11-28 类型： 手游攻略
7

抖音成人版叫什么名字抖音成人版介绍
时间：2018-09-05 类型： 手机软件
8

八重头异闻奇谭真结局触发介绍
时间：2023-09-04 类型： 手游攻略
9

2023十款注册就送金币的捕鱼手游分享
时间：2023-08-08 类型： 手游攻略
10

《鹅鸭杀》官网网址分享
时间：2023-01-05 类型： 单机攻略

Python提取网页中的超链接地址方法

时间：2014-08-21 编辑：简简单单来源：一聚教程网

最近正在学习Python，打算用作爬虫开发。既然要做爬虫，首先就要抓取网页，并且从网页中提取出超链接地址。

下面是最简单的实现方法，先将目标网页抓回来，然后通过正则匹配a标签中的href属性来获得超链接，代码如下：

代码如下

复制代码

import urllib2
import re

url = 'http://www.111com.net/'

req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()

links = re.findall(r'href＼=＼"(http＼:＼/＼/[a-zA-Z0-9＼.＼/]+)＼"', doc)
for a in links:
print a

如果抓取的111cn的内容他就会把所有的以http开头的连接地址全部提取出来了，其实就是获取当前页面的外链了。

上一个： PHP设计模式-单例模式学习笔记
下一个： php中使用数组的内部指针控制函数遍历数组

相关文章

热门栏目