吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2198|回复: 28
收起左侧

[已解决] 有关python爬虫的问题

[复制链接]
城南彼岸花复开 发表于 2021-2-3 14:54
本帖最后由 城南彼岸花复开 于 2021-2-4 15:52 编辑

请问论坛各位大佬们,网站是有什么反爬机制吗
今天遇到一个网站,每个页面都有一堆贼长的字符串,
比如这样CombId=a8f4c6c6-d307-48e8-bf32-42ff1fed9385%2Cd66d62d0-0efc-4507-8618-4e4c719362da&IsDef=0
用python爬虫爬了个寂寞,同一个爬虫怕iqy一点问题都没有
求大佬支招这种该怎么爬取网站数据

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

头像被屏蔽
细水流长 发表于 2021-2-3 15:05
提示: 作者被禁止或删除 内容自动屏蔽
头像被屏蔽
52pojie666z 发表于 2021-2-3 15:05
 楼主| 城南彼岸花复开 发表于 2021-2-3 15:07
 楼主| 城南彼岸花复开 发表于 2021-2-3 15:12

一个医院的,但是不知道52能不能在这种帖子发网址
xian54966 发表于 2021-2-3 15:13
找找字符串的来源,拼凑起网址就行
 楼主| 城南彼岸花复开 发表于 2021-2-3 15:23
xian54966 发表于 2021-2-3 15:13
找找字符串的来源,拼凑起网址就行

我这个爬目标网站只一个页面都不行,没有返回值,同一个爬虫能爬iqy的一个页面,就很奇怪
fanvalen 发表于 2021-2-3 15:29
一种网页是js的
一种就是链接有请求权限,不是说你拼接出url就能访问,有的是在headers里验证 存活 鉴权 来自那个页面请求 做的一类防盗链
 楼主| 城南彼岸花复开 发表于 2021-2-3 15:45
fanvalen 发表于 2021-2-3 15:29
一种网页是js的
一种就是链接有请求权限,不是说你拼接出url就能访问,有的是在headers里验证 存活 鉴权  ...

学习了,不过还得看看,这个网站似乎不用拼接
Light紫星 发表于 2021-2-3 15:50
发网址看一下?一般浏览器能访问的理论上爬虫就能爬
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 07:52

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表