【原创源码】【python】爬去每日必应图片

姜蕴发表于 2019-3-9 10:14

本帖最后由姜蕴于 2019-3-9 11:25 编辑

```
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

__author__ = 'jiangwenwen'

from bs4 import BeautifulSoup
import requests
import time
import os

# 获取图片地址
content = requests.get("https://cn.bing.com/?mkt=zh-CN").text
soup = BeautifulSoup(content, "lxml")
img_url = "https://cn.bing.com/" + soup.find(id="bgLink")["href"]
print(img_url)
str_time = time.strftime("%Y-%m-%d")
month = time.strftime("%m")

# 下载图片并保存到指定位置
img = requests.get(img_url)
img_path = r"H:\bing\%s" % (month)
if img.status_code == 200:
# 如果文件夹不存在则创建
folder = os.path.exists(img_path)
if not folder:
os.mkdir(img_path)
open(r"H:\bing\%s\%s.jpg" % (month, str_time), 'wb').write(img.content)
```

chen4321 发表于 2019-3-9 10:24

我见过这个玩意的c#版本，那是一个长，Python大法好

快乐小风 发表于 2019-3-9 10:37

不太懂 c# , 这个就是整个 html 里提取一个 href , 应该没什么难的吧

kizzlepc 发表于 2019-3-9 10:55

有收获，谢谢楼主

bbn 发表于 2019-3-9 11:47

这么短啊，不过还是看不懂，没学过。

uper2011 发表于 2019-3-9 13:37

赞，但是好像只能抓id="bgLink"的才行。。。
作为python小白给个赞{:1_921:}

姜蕴发表于 2019-3-9 14:45

uper2011 发表于 2019-3-9 13:37
赞，但是好像只能抓id="bgLink"的才行。。。
作为python小白给个赞

因为必应要给这个图片设置css样式，一般不会变，万一变了的话f12找一下就好了。

nc1120917035 发表于 2019-3-11 09:38

看起来好像是只爬取一张？建议find改为findall然后对结果分别进行爬取就完美了

姜蕴发表于 2019-3-11 12:51

nc1120917035 发表于 2019-3-11 09:38
看起来好像是只爬取一张？建议find改为findall然后对结果分别进行爬取就完美了

必应每天只有一张图片吧。

页: [1]

吾爱破解 - 52pojie.cn's Archiver

【原创源码】【python】 爬去每日必应图片

【原创源码】【python】爬去每日必应图片