Listentomusic 发表于 2024-5-21 15:03

微信公众号文章图片 / 壁纸下载

本帖最后由 Listentomusic 于 2024-6-20 00:18 编辑

简单的公众号图片壁纸下载;
```python
import re
import requests


url = 'https://mp.weixin.qq.com/s/E0TTnkG0-kWetdf49edh9g'

headers = {
    'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/124.0.0.0 Safari/537.36"
}

response = requests.get(url=url, headers=headers).text
rule = re.compile('data-src="([^"]+)"').findall(response)
i = 1
for line in rule:
    # 过滤掉非链接的数据
    if line.startswith('https') or line.startswith('http'):
      images_data = requests.get(url=line, headers=headers).content
      with open('./壁纸/' + str(i) + '.jpg', 'wb') as f:
            f.write(images_data)
      print('正在下载第: ' + str(i) + '张图片')
      i += 1
print('壁纸全部下载完成, 请注意查看!')
```

打包好的工具:https://minjiankezhan.lanzouo.com/iERoU2292rdg
非常抱歉,这几天太忙了打包出错后没研究今天有空整了一下抱歉哈!

wkdxz 发表于 2024-5-21 15:59

效果不错,我测试时会报路径错误和https错误,小改了下。

# -*- coding: utf-8 -*-
import re
import requests
import os
import urllib3

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

url = "https://mp.weixin.qq.com/s/E0TTnkG0-kWetdf49edh9g"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
    "Chrome/124.0.0.0 Safari/537.36"
}

response = requests.get(url=url, headers=headers).text
rule = re.compile('data-src="([^"]+)"').findall(response)
i = 1

img_path = "E:/壁纸"
if not os.path.exists(img_path):
    os.makedirs(img_path)

for line in rule:
    # 过滤掉非链接的数据
    if line.startswith(("https", "http")):
      images_data = requests.get(url=line, headers=headers).content
      with open(f"{img_path}/{str(i)}.jpg", "wb") as f:
            f.write(images_data)
      print("正在下载第 " + str(i) + " 张图片")
      i += 1

print("壁纸全部下载至【" + img_path + "】文件夹下, 请注意查看!")

Listentomusic 发表于 2024-5-30 23:59

ouyangbao 发表于 2024-5-30 20:48
微信公众号里面的视频要是能下载就好了

一会我去看看,如果可以的话就更新

Listentomusic 发表于 2024-5-22 13:00

wongto 发表于 2024-5-22 07:21
楼主怎么弄复制也可以,才行。不是单独下载。

复制代码,下载requests模块就可以跑了,晚点我打包一下哈!

wapjsx 发表于 2024-5-21 15:32

感觉很不错~~加油!

Listentomusic 发表于 2024-5-21 17:15

wkdxz 发表于 2024-5-21 15:59
效果不错,我测试时会报路径错误和https错误,小改了下。

# -*- coding: utf- ...

学习了,刚学的爬虫不太会学{:301_993:}

hackerSQL 发表于 2024-5-21 17:29

anorith 发表于 2024-5-21 17:53

wkdxz 发表于 2024-5-21 15:59
效果不错,我测试时会报路径错误和https错误,小改了下。

# -*- coding: utf- ...

这个很实用,代码也相当简短

lfm333 发表于 2024-5-21 20:37

试了一下,的确可以下载,感谢分享

hjsen 发表于 2024-5-21 20:43

loveyao6688 发表于 2024-5-21 20:52

感谢大佬分享。

fanglei99 发表于 2024-5-21 21:24

页: [1] 2 3 4 5 6
查看完整版本: 微信公众号文章图片 / 壁纸下载