吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2724|回复: 29
收起左侧

[Python 原创] python selenium自动化过指纹检测

[复制链接]
devilpanama 发表于 2024-3-8 23:44
本帖最后由 devilpanama 于 2024-3-8 23:46 编辑

最近有个自动化的项目,用的是python+selenium实现网页自动化,目的是实现自动化发文
问题:正常打开发布页面可以发布并且网页自带了自动保存功能,用selenium打开的浏览器提示保存失败,也无法进行后续操作
初步分析:现在一般网站的反爬都是检测UA头或者js检测环境,分析失败和成功的区别也就是selenium的问题
初步尝试:先用调试模式打开浏览器,再用python操作
[Asm] 纯文本查看 复制代码
start chrome --remote-debugging-port=9527 --user-data-dir="F:\selenium"

打开浏览器后运行python
[Python] 纯文本查看 复制代码
from selenium import webdriver
from selenium.webdriver.chrome.options import Options

# 以下代码是使用 Python 接管已经打开的浏览器
options = Options()
options.add_experimental_option("debuggerAddress", "127.0.0.1:64829")
browser = webdriver.Chrome(options=options)

结果:失败

再次分析:想到了之前看的一篇文章,关于浏览器指纹的问题,大概意思就是不管你怎么打开浏览器,浏览器呈现出来的特征值都一样,即视为同一指纹同一个环境
查看指纹特征网址:https://bot.sannysoft.com/
方法:改变指纹特征
工具:stealth.min.jspuppeteer中用于抹去自动化程序特征的。当他被单独提取出来后就可以在selenium中加载并使用,使得可以抹掉selenium中的自动化特征,从而绕过一些网站或者验证程序的机器人检测。
代码如下
[Python] 纯文本查看 复制代码
from selenium import webdriver

STEALTH_JS = r'stealth.min.js'
with open(STEALTH_JS) as f:
    js = f.read()

    # print(js)
chromedriver_path = r"C:\XXXXXXXX\chromedriver.exe"
options = webdriver.ChromeOptions()
driver = webdriver.Chrome(chromedriver_path,options=options)
driver.execute_cdp_cmd(
    cmd="Page.addScriptToEvaluateOnNewDocument",
    cmd_args={
        "source": js
    }
)

# 打开一个标签页
driver.get("https://bot.sannysoft.com/")


结果:成功







免费评分

参与人数 5吾爱币 +11 热心值 +5 收起 理由
Zzxy + 1 + 1 谢谢@Thanks!
tana + 1 + 1 我很赞同!
soughing + 1 + 1 我很赞同!
丶峰宇 + 1 + 1 热心回复!
爱飞的猫 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

luxiaole 发表于 2024-3-28 09:34
看了大佬的分享,突然有了学python的想法
lzmomo 发表于 2024-3-20 08:57
本帖最后由 lzmomo 于 2024-3-20 09:03 编辑

运行后提示
driver = webdriver.Chrome(chromedriver_path, options=options)
TypeError: __init__() got multiple values for argument 'options'
zhu2023 发表于 2024-3-9 01:42
istat 发表于 2024-3-9 08:06
谢谢分享。
天道法海 发表于 2024-3-9 12:04
奇怪的知识又增加了,我就说之前怎么有些站爬不了。
itanium 发表于 2024-3-9 15:29
这种应该只适合一般简单 的网站,如果像baidu这种,应该也是无效,我现在试过一些网还是会出现真人验证,而使用正常 chrome就不会
soughing 发表于 2024-3-9 21:03
正在学Python,以后应该能用上
 楼主| devilpanama 发表于 2024-3-9 21:28
itanium 发表于 2024-3-9 15:29
这种应该只适合一般简单 的网站,如果像baidu这种,应该也是无效,我现在试过一些网还是会出现真人验证,而 ...

没有通用的爬虫方法,都是见招拆招
turmasi1234 发表于 2024-3-10 08:04
看了大佬的分享,突然有了学python的想法
ab123 发表于 2024-3-10 12:01
果然爬虫还是道高一尺魔高一丈,学习了
xiaoxinx123 发表于 2024-3-10 16:40
正在学爬虫在抓取腾讯视频遇到困难
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 16:58

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表