具体代码如下所示:
- #coding=utf8
- from urllib import request
- import re
- import urllib,os
- url='http://tieba.baidu.com/p/3840085725'
- def get_image(url):
- #获取页面源码
- page = urllib.request.urlopen(url)
- html = page.read()
- #解码,否则报错
- html = html.decode('utf8')
- #正则匹配获取()的内容
- reg = r'src="(https.+?.[jpg,png])"'
- imge = re.compile(reg)
- # 获取正则匹配的数据,"(.+?.jpg)" 的数据,返回一个list
- imglist = imge.findall(html)
- return imglist
- def save_img(imglist):
- dir = os.path.join(os.path.dirname(__file__),'img')
- i=1
- for img in imglist:
- #python3格式化字符串的另一种写法
- imgpath = f'{dir}\\image{i}.jpg'
- try:
- #urlretrieve下载图片并保存到本地
- urllib.request.urlretrieve(img,imgpath)
- i += 1
- print(u'图片开始下载')
- except Exception:
- print(f'image:{img}下载失败')
- continue
- imglist = get_image(url)
- save_img(imglist)
总结
以上所述是小编给大家介绍的python3 爬取图片的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对w3xue网站的支持!