在该网页检查元素
Tagged Tags:

www.yabovip4.com ,先随机感受一下这么些网址:

亚搏app官方网站 ,但那只是一张图片的原委,得再看看别的的图片是否同等。检查一下开采都是那般。那标准纵然解析实现了。能够开首写代码了

 1 #!/usr/bin/env python
 2 # _*_ coding utf-8 _*_
 3 from bs4 import BeautifulSoup
 4 import requests
 5 
 6 i = 0
 7 url = 'https://unsplash.com/'
 8 html = requests.get(url)
 9 soup = BeautifulSoup(html.text, 'lxml')
10 
11 img_class = soup.find_all('div', {"class": "IEpfq"})        # 找到div里面有class = "IEpfq"的内容
12 
13 for img_list in img_class:
14     imgs = img_list.find_all('img')                         # 接着往下找到 img 标签
15     for img in imgs:
16         src = img['src']                                    # 以"src"为 key,找到 value
17         r = requests.get(src, stream=True)
18         image_name = 'unsplash_' + str(i) + '.jpg'          # 图片命名
19         i += 1
20         with open('./img/%s' % image_name, 'wb') as file:   # 打开文件  
21             for chunk in r.iter_content(chunk_size=1024):   # 以chunk_size = 1024的长度进行遍历
22                 file.write(chunk)                           
23         print('Saved %s' % image_name)

www.yabovip4.com 1

 能够看见,图片
img 在二个 div 的 tag 里面,何况 class =
”IEpfq“,但是那么多内容,即便有一点乱,但实则看 src = ” “ 就行了。

在该网页检查元素。在该网页检查元素。运作结果:

 

www.yabovip4.com 2

在该网页检查元素。在该网页检查元素。接下去在此之前对网页进行解析:

方今发觉一个网址www.unsplash.com
( 未有广告制作费哈,纯粹感到不错
),网页做得很精粹,上边也都以一些免费的摄像照片,认为很难堪,就调整利用蹩脚的技艺写个爬虫下载图片。

 

Saved unsplash_0.jpg
Saved unsplash_1.jpg
         ......
Saved unsplash_19.jpg
Saved unsplash_20.jpg    

在该网页检查成分,选取个中一张图片查看它的代码

 

  www.yabovip4.com 3

发表评论

电子邮件地址不会被公开。 必填项已用*标注