吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1345|回复: 11
收起左侧

[讨论] 好久没发帖了 发个selenium版回忆回忆

  [复制链接]
lihu5841314 发表于 2021-7-24 20:22
[Asm] 纯文本查看 复制代码
from  selenium   import webdriver
from  selenium.webdriver.common.by import By
from  selenium.webdriver.support.wait import WebDriverWait
import selenium.webdriver.support.expected_conditions as  EC
import time,requests,os
from multiprocessing.dummy import Pool

url = 'https://www.renrendoc.com/paper/137639109.html'
# 声明浏览器对象,将chromedriver驱动放在chrome浏览器安装目录下,指定驱动的绝对路径
browser = webdriver.Chrome(executable_path=r'C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chromedriver.exe')
wait = WebDriverWait(browser, 10)



try:
    browser.get(url)
    for  i  in  range(2):
        
        wait.until(EC.presence_of_element_located((By.CLASS_NAME, 'fc2e')))  # 等待fc2e元素加载完成
        keyword = browser.find_element_by_class_name('fc2e')           # 获取元素  
        browser.execute_script('arguments[0].click();',keyword)    # 用selenium的js点击元素  当然也可以用.clink(有些个别的点不了)
        time.sleep(2)
    browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')   #将滚动条滚到底部  玩法很多比如豆瓣电影排行榜的ajax就可以用这个爬
    time.sleep(1)
    wait.until(EC.presence_of_element_located((By.ID, 'page')))
    doc = browser.find_element_by_id('page')
    docs = doc.find_elements_by_tag_name('img')
    imgs = []
    for i  in  docs:
         img_url = i.get_attribute('src')
         imgs.append(img_url)
finally:
    browser.close()


headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.106 Safari/537.36',
}

def res(url):
    name = url.split('-')[-1]
    resp = requests.get(url,headers=headers).content
    path = 'imgs' + '/' +name
    with  open(path,'wb') as  f:
         f.write(resp)
    print('下载完毕')

pool = Pool(4)
if  not  os.path.exists('imgs'):
    os.makedirs('imgs')
pool.map(res,imgs)
pool.close()
pool.join()
print('over')







免费评分

参与人数 1吾爱币 +1 收起 理由
lichunlin688 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| lihu5841314 发表于 2021-7-24 20:24
自己占一楼  selenium  虽然慢些 但有些需要解密的网站 不需要解密了   功能很牛皮
rettrey 发表于 2021-7-24 20:49
真的有人会爬虫用selenium吗?这个好像一般都用在测试吧?
lichunlin688 发表于 2021-7-24 21:05
 楼主| lihu5841314 发表于 2021-7-24 21:13
rettrey 发表于 2021-7-24 20:49
真的有人会爬虫用selenium吗?这个好像一般都用在测试吧?

很多得加密网站  爬不下来 就用selenium   试试 很好用
ttxp 发表于 2021-7-24 21:59
这里是回忆了
那年夏天52 发表于 2021-7-24 22:08
rettrey 发表于 2021-7-24 20:49
真的有人会爬虫用selenium吗?这个好像一般都用在测试吧?

要知道selenium本身就是一个自动化工具,而不是自动化测试工具。国人爱用来做测试而已。
头像被屏蔽
Threat1024 发表于 2021-7-25 08:45
提示: 作者被禁止或删除 内容自动屏蔽
虚无空幻 发表于 2021-7-25 10:41
人这运气,昨天我还在搜,今天直接看到主页有人发,em..... 考虑要不要来张彩票
 楼主| lihu5841314 发表于 2021-7-25 10:43
虚无空幻 发表于 2021-7-25 10:41
人这运气,昨天我还在搜,今天直接看到主页有人发,em..... 考虑要不要来张彩票

必须来一张500万的
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 00:34

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表