吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 25409|回复: 153
收起左侧

[Python 转载] 用python爬取jk小姐姐照片慢慢看

    [复制链接]
致远啊 发表于 2020-12-29 19:14
本帖最后由 wushaominkk 于 2021-1-8 10:13 编辑

前言

本人python新手一枚,目前只有爬取jk链接,还未写保存本地(这块还没看过...)
大佬勿喷,代码仅供参考,最后返回json格式数据

代码

可完善下,例如加个多线程下载图片

import requests
import time
import json
def get_text_between(txt, left, right):
    num1 = txt.index(left) + len(left)      #index查找字符所在位置
    num2 = txt.index(right)                 #len取字符长度
    w_return = txt[num1:num2]               #取txt区间的字符数据
    return w_return
def get_url(url):
    try:
        r = requests.get(url,params="",headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '})
        r.raise_for_status()
        #转码
        r.encoding = 'utf-8'
        return r.text
    except:
        print("Failed!")
def get_jk_img(jk_item_id):
    try:
        url = "https://bcy.net/item/detail/"+jk_item_id+"?_source_page=hashtag"
        r = requests.get(url,params="",headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) '})
        r.raise_for_status()
        r.encoding = 'utf-8'
        fanhui = get_text_between(r.text,'JSON.parse("','");')
        return fanhui
    except:
        print("Failed!")
def get_jk_data():

    #url = "https://bcy.net/apiv3/common/circleFeed?circle_id=492&since=" + str(int(time.time())) + ".000000&sort_type=2&grid_type=10&_signature=UCWcwAAgEByiCq6HuAav5VAlnNAAA-T"
    #上面的链接是获取最新的,下面的好像是推荐内容的
    url = "https://bcy.net/apiv3/common/circleFeed?circle_id=492"

    # 获取网页数据
    jk_json = get_url(url)
    #解码json,转成字典
    jk = json.loads(jk_json)
    #取jk数目
    jk_num = len(jk['data']['items'])

    data  = {}
    for i in range(0, jk_num):
        data_ = {}
        jk_item_id  =  jk['data']['items'][i]['item_detail']['item_id']#文章id
        img_json = json.loads(get_jk_img(jk_item_id).replace(r'\"',r'"'))#jk图片的json
        img_num = len(img_json['detail']['post_data']['multi'])#jk图片的数量
        dataimg={}
        for i2 in range(0, img_num):
            #jk图片链接
            img_url = img_json['detail']['post_data']['multi'][i2]['path'].encode('utf-8').decode("unicode_escape")
            dataimg[i2]= img_url

        jk_plain =  jk['data']['items'][i]['item_detail']['plain']#文章标题
        data_[0] =  jk_item_id
        data_[1] =  jk_plain
        data_[2] = dataimg
        data[len(data)]=data_

    return data

if __name__ == '__main__':
    data = get_jk_data()
    print(json.dumps(data))



点评

我仿佛发现了积分财富密码☺  发表于 2021-3-5 15:40
这个美女手上拿的是什么遥控器???  发表于 2020-12-29 20:01

免费评分

参与人数 30吾爱币 +28 热心值 +27 收起 理由
lpy88542585 + 1 + 1 我很赞同!
NightStreetWalk + 1 + 1 我很赞同!
NB1437 + 1 + 1 我很赞同!
Coptis2020 + 1 谢谢@Thanks!
guoruihotel + 1 + 1 谢谢@Thanks!
空不了 + 1 + 1 热心回复!
huangbing3 + 1 + 1 我很赞同!
Gsn. + 1 + 1 谢谢@Thanks!
a542013194 + 1 + 1 谢谢@Thanks!
wayi + 1 + 1 热心回复!
DrPilgrim + 1 + 1 快乐来了,总是能学到新东西哈哈哈,感谢楼主!!
sakizqt + 1 + 1 标题🐂啊,下次来个远程操控
77978986 + 1 + 1 我很赞同!
xiaorr + 1 + 1 谢谢@Thanks!
kxs2018 + 1 我很赞同!
红楼只为yi梦 + 1 我很赞同!
海德 + 1 + 1 手握大权!~
ToT、 + 1 + 1 嚯嚯嚯,小姐姐手里拿的快乐吗
叹浮生_ + 1 谢谢@Thanks!
sakura沙冥 + 1 + 1 我很赞同!
厕所飞机男 + 1 + 1 谢谢@Thanks!
ekkor + 1 + 1 用心讨论,共获提升!
Wzx157 + 1 + 1 谢谢@Thanks!
zx618 + 1 + 1 用心讨论,共获提升!
我来了老大 + 1 + 1 鼓励转贴优秀软件安全工具和文档!
wwww0913 + 1 + 1 谢谢@Thanks!
lk7058 + 1 + 1 我很赞同!
咖喱土豆 + 1 热心回复!
zhouqhui + 1 + 1 鼓励转贴优秀软件安全工具和文档!
kk1212 + 1 + 1 谢谢@Thanks!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

南岸 发表于 2020-12-29 19:23
标题取得好,jk漏的少

免费评分

参与人数 1热心值 +1 收起 理由
广岛的风 + 1 我很赞同!

查看全部评分

彼岸花约定 发表于 2020-12-29 19:37
夜空飞行 发表于 2020-12-29 19:17
muyu1314520 发表于 2020-12-29 19:18
66666666
老何i 发表于 2020-12-29 19:20
自己动手,丰衣足食
迦南圣经 发表于 2020-12-29 19:21
牛皮这个标题。
1369452145 发表于 2020-12-29 19:26
南岸 发表于 2020-12-29 19:23
标题取得好,jk漏的少

尽说老实话
sler369 发表于 2020-12-29 19:28
果然是大佬,自己动手
hw520wh 发表于 2020-12-29 19:32

我已经好了
jokony 发表于 2020-12-29 19:32
支持顶起了。。。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-22 08:31

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表