一聚教程网:一个值得你收藏的教程网站

最新下载

热门教程

Python抓取远程图片程序代码

时间:2014-06-20 编辑:简简单单 来源:一聚教程网

 代码如下 复制代码


#!/usr/bin/python
import re
import urllib

def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html

def getImg(html):
reg = r’src=”(.*?\.jpg)”‘
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,’%s.jpg’ % x)
x+=1
return imglist

html = getHtml(“http://www.111com.net″)
print getImg(html)

原理非常的简单:一个下载网页到本地存储到变量,然后再利用正则获取图片地址之后再使用urllib.urlretrieve下载图片到本址即可。

热门栏目