姜蕴 发表于 2019-3-9 10:14

【原创源码】【python】 爬去每日必应图片

本帖最后由 姜蕴 于 2019-3-9 11:25 编辑

```
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

__author__ = 'jiangwenwen'

from bs4 import BeautifulSoup
import requests
import time
import os

# 获取图片地址
content = requests.get("https://cn.bing.com/?mkt=zh-CN").text
soup = BeautifulSoup(content, "lxml")
img_url = "https://cn.bing.com/" + soup.find(id="bgLink")["href"]
print(img_url)
str_time = time.strftime("%Y-%m-%d")
month = time.strftime("%m")

# 下载图片并保存到指定位置
img = requests.get(img_url)
img_path = r"H:\bing\%s" % (month)
if img.status_code == 200:
    # 如果文件夹不存在则创建
    folder = os.path.exists(img_path)
    if not folder:
      os.mkdir(img_path)
    open(r"H:\bing\%s\%s.jpg" % (month, str_time), 'wb').write(img.content)
```

chen4321 发表于 2019-3-9 10:24

我见过这个玩意的c#版本,那是一个长,Python大法好

快乐小风 发表于 2019-3-9 10:37

不太懂 c# , 这个就是整个 html 里提取一个 href , 应该没什么难的吧

kizzlepc 发表于 2019-3-9 10:55

有收获,谢谢楼主

bbn 发表于 2019-3-9 11:47

这么短啊,不过还是看不懂,没学过。

uper2011 发表于 2019-3-9 13:37

赞,但是好像只能抓id="bgLink"的才行。。。
作为python小白给个赞{:1_921:}

姜蕴 发表于 2019-3-9 14:45

uper2011 发表于 2019-3-9 13:37
赞,但是好像只能抓id="bgLink"的才行。。。
作为python小白给个赞

因为必应要给这个图片设置css样式,一般不会变,万一变了的话f12找一下就好了。

nc1120917035 发表于 2019-3-11 09:38

看起来好像是只爬取一张?建议find改为findall然后对结果分别进行爬取就完美了

姜蕴 发表于 2019-3-11 12:51

nc1120917035 发表于 2019-3-11 09:38
看起来好像是只爬取一张?建议find改为findall然后对结果分别进行爬取就完美了

必应每天只有一张图片吧。
页: [1]
查看完整版本: 【原创源码】【python】 爬去每日必应图片