Python爬取小姐姐图片代码的实践

l2430478 发表于 2021-1-11 13:18

本帖最后由 l2430478 于 2021-1-12 21:43 编辑

编程需要有耐心，需要有信心，不会我们可以摸索，本机环境建立好了，就可以拿别人的代码进行实践，模仿，修改。
只有摸索，才知道每一步的含义，好的代码多保存起来，便于下次我们借鉴。
朋友分享一个爬美女图片的代码，我尝试运行，并分析给大家。
此爬虫仅需要安装需要安装 pip install requests（不会的参考自学笔记七）
实践网站：https://www.vmgirls.com/（我看网站中已经打广告要出售，想练习代码的抓紧啦）
这个代码我看了，需要先找到一个带图片的网页，我随机打开了一个网页。https://www.vmgirls.com/15159.html
# requests 请求需要提前在Terminal中安装 pip install requests
import os
import time

import requests
# re正则
import re
# 改变自己身份
headers = {
'User-Agent': 'asbasdf'
}
# 请求网页
print("请输入你要爬取网站的链接")
httpurl = input()
response = requests.get(httpurl,headers = headers)
print(response.request.headers)
print(response.text)
html = response.text
# 解析网页
# view-source:https://www.vmgirls.com/15159.html
# 链接前加view-source查看网页源代码
dir_name = re.findall('<h1 class="post-title h1">(.*?)</h1>',html)[-1]
if not os.path.exists(dir_name):
os.mkdir(dir_name)
# 正则查找
urls = re.findall('<a href="(.*?)" alt=".*?" title=".*?">',html)
print(urls)
# 保存图片
for url in urls:
time.sleep(1)
# 图片名字
name = url.split('/')[-1]
response = requests.get("https:"+url,headers = headers)
print(name+"正在下载")
with open(dir_name+'/'+name,'wb') as f:
f.write(response.content)
print('下载完毕')

alt+回车后，出现一个输入框，粘贴https://www.vmgirls.com/15159.html进去，并回车。
就在默认文件夹（不会看默认文件夹的看我上个帖子）下生成一个文件夹，里面是该网页的图片。

我们尝试修改网址，随机找一个。https://www.vmgirls.com/14597.html
再次运行代码，图片再次生成，来来来，大家看下效果。

除了得到图片外，我们其实可以深入分析该代码。
代码运行后，调取了很多东西，这是已经爬成功的代码，有空的朋友可以研究研究，
可以尝试调用文字并保存到本地，能够快速提高水平。

来来来，给你们一个网址，你们练习爬。
https://www.vmgirls.com/13487.html

longling 发表于 2021-1-11 13:28

咳咳。养眼啊，哈哈

fhqiigdn 发表于 2021-1-11 13:31

Python是个好东西啊，被你们这么用。。。

列明发表于 2021-1-11 13:31

不知道會不會因為你提供了美女圖片網站而被刪帖，總之，保存收藏就完了。

VIP007 发表于 2021-1-11 13:34

这个颜值

colorfuldays 发表于 2021-1-11 13:36

原来PYTHON是这么用的啊，学习了

advancejar 发表于 2021-1-11 13:37

写re需要不停调试，beautifulsoup简单多了

ygxgdjj 发表于 2021-1-11 13:41

我不想爬美女，有没有帅哥啥的网站

Jacky168 发表于 2021-1-11 13:45

回帖支持楼主！

xiaoshan1818 发表于 2021-1-11 13:45

会代码，的都点赞，学习学习，但是没有动力{:1_936:}

页: [1] 2 3 4 5

吾爱破解 - 52pojie.cn's Archiver

Python爬取小姐姐图片代码的实践