吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1800|回复: 9
收起左侧

[其他转载] python

[复制链接]
姜云岩 发表于 2020-8-30 17:33
这是第二次发帖(水贴 求助帖不算在内)  
还有一个问题  我用这个idle 写的 (见捕获.jpg 捕获.PNG ) 无论是注释还是字符串出现中文就会出现无法保存的现象呢   
之前用的也是 但是没有这样问题的 但是前一阵硬盘坏了 重新下 就有问题了   有知道的大佬请赐教呢

正文  做了一个 爬取 一个tupianzy  的图片  的小爬虫  主要是反爬不强  而且我还需要积分升级
里面的 useragent  需要还你自己 的  页码范围呢可以改 我设了延时一秒  给个积分.gif  

import time

def donext():
import requests
from bs4 import BeautifulSoup
import re
from getapic import getone

referer='https://www.tupianzj.com/meinv/xinggan/'
url = 'https://www.tupianzj.com/meinv/xinggan/list_176_'+str(num)+'.html'
headers = {
    'cookie': 'Hm_lvt_2311e8dc240a647bd81bf77808b3ac51=1598757084; Hm_lpvt_2311e8dc240a647bd81bf77808b3ac51=1598757245; Hm_lvt_c08bad6ac66a035b30e72722f365229b=1598758817; Hm_lpvt_c08bad6ac66a035b30e72722f365229b=1598772585',
    'referer': referer,
    'user-agent': '这个要换你自己的  用我的你也用不了 '

    }
r = requests.get(url = url,headers = headers)
soup = BeautifulSoup(r.content,'lxml')
with open('21.txt','w') as f:
    f.write(str(soup))
    f.close
ul = soup.find('ul',class_='list_con_box_ul')
links = re.findall('src="(.*?)"',str(ul))
for i in links:
    i = i.replace('rn','')
    getone(i)

num = 1

num就是下载的起始页  下一行的50是终止页   两个数字随便改动的  别太离谱就可以

for num in range(50):
donext()
num= num +1
time.sleep(1)
print(str(num)+'gewangyetupian')


样例.PNG
实例.PNG

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

挑灯看花 发表于 2020-8-30 18:05
user-agent都可以通用。cookie就不一样了,楼主正好弄错了
旋风中的小聪明 发表于 2020-8-30 18:03
头像被屏蔽
枫子树 发表于 2020-8-30 18:25
Zeaf 发表于 2020-8-30 19:15
挑灯看花 发表于 2020-8-30 18:05
user-agent都可以通用。cookie就不一样了,楼主正好弄错了

正解,而且cookie也能用吧只不过用着别人的信息
挑灯看花 发表于 2020-8-30 19:22
Zeaf 发表于 2020-8-30 19:15
正解,而且cookie也能用吧只不过用着别人的信息

一直用一个cookie请求很容易就判断为爬虫了
 楼主| 姜云岩 发表于 2020-8-30 20:08
Zeaf 发表于 2020-8-30 19:15
正解,而且cookie也能用吧只不过用着别人的信息

哈哈  学到了学到了
cherrypi 发表于 2020-8-30 20:09
学习了学习了!
 楼主| 姜云岩 发表于 2020-8-31 09:17
挑灯看花 发表于 2020-8-30 18:05
user-agent都可以通用。cookie就不一样了,楼主正好弄错了

收到 感谢回复  大爷有空常来玩啊
c03xp 发表于 2020-9-1 17:26
爬妹子高手
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 02:51

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表