吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 431|回复: 0
收起左侧

[求助] splash爬wy新闻数据没有完全获取到

[复制链接]
loadwuai 发表于 2023-11-30 21:21
lua = """
function main(splash, args)
    splash:set_user_agent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36')
    assert(splash:go(args.url))
    assert(splash:wait(2))
   
    get_display_style = splash:jsfunc([[
      function(){
        return document.getElementsByClassName('load_more_btn')[0].style.display;
      }
    ]])
   
    while (true)
    do  
      
        splash:runjs("document.getElementsByClassName('load_more_btn')[0].scrollIntoView(true)")
      
        splash:wait(3)
      
        splash:select(".load_more_btn").click()
      
        display_style = get_display_style()
      
        if(display_style== 'none')
        then
            break  
        end
    end
    assert(splash:wait(2))
    return splash:html()   
   
end
"""



url = "http://192.168.0.105:8050/execute"

resp = requests.get(url, params={"url":"https://news.163.com","lua_source": lua})

print(resp.text)
以上代码执行返回后缺了一些内容,通过源网页上全部加载后,可以看到如下图片内容 2023-11-30_210452.PNG 但是通过Python的request请求返回数据中缺少了这么一块数据,只有从下面1个节点开始 2023-11-30_210925.PNG
通过splash网业端进行网页源码获取,也是可以获取到的。 2023-11-30_211517.PNG

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 18:45

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表