吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5246|回复: 9
收起左侧

[Python 转载] 关于爬虫的

[复制链接]
猎鹰呼叫猎狗 发表于 2017-4-18 16:30
小白刚学爬虫的,想采集QQ群人员的信息。登陆的是WEBQQ,想抓取QQ号码以及别的信息。然后右键  检查,但是,除过我的QQ号码可以看到,群里别人的QQ号码都看不到(看截图)。不知道怎么采集数据。在源码里看到了这个   <script type="text/javascript">   网上查了一下,说是动态的数据。是这样的吗?所以,想请教大神指点一二!!!
这是网页的源代码<!DOCTYPE html><html><head>    <meta charset="UTF-8">    <title>QQ</title>    <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" />    <meta name="format-detection" content="telephone=no" />    <meta name="apple-mobile-web-app-capable" content="yes" />    <meta name="mqq-bottom-ad" content="no" />    <script type="text/javascript" charset="utf-8">        document.domain = "qq.com";        var speedTempCache = {}, pageStartTime = Date.now();        speedTempCache["7832-22-1"] = {};        speedTempCache["7832-22-1"]["1"] = pageStartTime;    </script><link rel="stylesheet" type="text/css"  /></head><body class="black">    <div id="bgAllImage"></div>    <div class="wrap">        <div id="main_container" style="display:none;"></div>        <div id="container" class="container" style="display:none;">        </div>        <div id="guide" class="guide-tips" >            <h2 >Smart QQ</h2>            <div class="tips">                不管身处何地,手持何物<br/>QQ让你沟通无障碍            </div>            <div class="login-tips">                <!-- <img src="style/image/logo.png" > -->                <div class="btn btn_blue " onclick="mq.main.gotoLogin();">登录</div>            </div>            <div id="qrcode" >                <div>扫一扫,记下我们的网址</div>                <br/>                <img src="http://pub.idqqimg.com/smartqq/css/image/qrcode.png" width="200">                            </div>        </div>    </div>    <!--    【云云无情,腾腾有爱】    如果你没有100个“往来”好友,那就来腾讯领红包吧!红包精彩,腾讯更精彩!    http://www.ipresst.com/jointencent    -------------华丽的分割线-------------    【前端特工】    “据内线消息,TX公司将于近期推出一个新的HTML5重磅产品。    公司担心该产品会带来威胁,特命你潜入TX,探查底细……”    http://codestar.alloyteam.com    -->    <script type="text/javascript">        speedTempCache["7832-22-1"]["2"] = Date.now();    </script>     <script src="http://pub.idqqimg.com/smartqq/js/mq.js?t=20161220"></script>    </body></html>

右键,检查群员之后的

右键,检查群员之后的

按找到我QQ号码的方式,数据应该在<li>标签下的 class= list_item _uin =" "

按找到我QQ号码的方式,数据应该在<li>标签下的  class= list_item _uin ="  "

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 猎鹰呼叫猎狗 发表于 2017-4-18 16:33
网页源代码怎么变成这样;
Conver 发表于 2017-4-18 16:55
NewType 发表于 2017-4-18 17:57
nodejs + jsdom 可以这么提取
[JavaScript] 纯文本查看 复制代码
var myFriend = new Array();
$("li.list_item").each(function() {
    var item = new Array(2);
    item["nickname"] = $(this).find("p.member_nick").text();
    item["qq"] = $(this).attr("_uin");
    myFriend.push(item);
});
console.log(myFriend);
 楼主| 猎鹰呼叫猎狗 发表于 2017-4-18 19:18
Conver 发表于 2017-4-18 16:55
JS,就这点提示,自己琢磨

那就应该是动态的了,我看看
 楼主| 猎鹰呼叫猎狗 发表于 2017-4-18 19:19
NewType 发表于 2017-4-18 17:57
nodejs + jsdom 可以这么提取
[mw_shl_code=javascript,true]var myFriend = new Array();
$("li.list_it ...

居然有点看不懂。。。
逗啊逗 发表于 2017-4-18 21:33 来自手机
肯定在js里啊
 楼主| 猎鹰呼叫猎狗 发表于 2017-4-19 22:46
a6120035 发表于 2017-4-19 17:13
如果是动态加载的话,浏览器F12打开,看里面的链接,会找到获取数据的链接,直接抓那个链接就能拿到数据了 ...

查了之后,说是动态数据回掉的。却找不到。是我的方法有问题还是。。。。

这张图片是Response返回的内容,里面可以看到我的qq朋友(打码了)。但是,“uin” 里面的内容还不是号码

这张图片是Response返回的内容,里面可以看到我的qq朋友(打码了)。但是,“uin” 里面的内容还不是号码

这张图片,是在舒心之后,点击所有的链接,大多数都是这个样子,报错。

这张图片,是在舒心之后,点击所有的链接,大多数都是这个样子,报错。

同上

同上

同上,这个看到是JSON 格式的,但是,似乎并没有找到数据

同上,这个看到是JSON 格式的,但是,似乎并没有找到数据
小胖啊小胖 发表于 2017-10-1 21:40
腾讯的登录还有一个qkeys验证,每次都是不一样的,似乎是个随机数,这个没有公布,所以现在劫持QQ空间也没有以前那么容易了,模拟登录可能也会被禁掉。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-27 02:47

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表