吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2246|回复: 7
收起左侧

[Python 转载] 边学python边爬取酷6网短视频 爽

[复制链接]
千千骨 发表于 2020-3-23 22:04
本帖最后由 wushaominkk 于 2020-3-24 11:20 编辑

思路 分析确定路径 传递参数发送请求 得到数据解析数据遍历列表发送链接视频请求保存数据
在项目新建一个video文件夹 运行如图 可以正常下载
image.png



[Python] 纯文本查看 复制代码
import requests    #导入模块
import json

#思路  分析确定路径 传递参数
base_url ="https://www.ku6.com/video/feed?pageNo=0&pageSize=40&subjectId=76"
headers = {
           'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.75 Safari/537.36',
                      }


#发送请求 得到数据
response = requests.get(base_url,headers=headers)
data = response.text
#print(data)
#解析数据
#转类型
json_data = json.loads(data)   #字典 py可交互数据
data_list = json_data["data"] #列表
#print(data_list)
#遍历列表
for data1 in data_list:
    #取值
    video_title = data1["title"] + ".mp4" #文件名
    video_url = data1["playUrl"]     #链接
    #print(video_title,video_url)
    #print(video_title)
    #print(video_url)
    print("正在下载:",video_title)

#发送链接视频请求
    video_data = requests.get(video_url,headers=headers).content  #二进制   wb   
#保存数据
    with open("video\\" + video_title,"wb") as f:
         f.write(video_data)
         print("下载完成....")

链接也是写死,跟直播一起敲的,开始遇到只下载最后一个视频,一步一步打印后面发现是FOR循环的没对齐,新手很容易遇到这种格式问题,大家遇到这种情况一定要对齐了。在学pytho可以一起交流,这段时间一直在学还是什么也不懂,可能没找到方法get到那个点,
比如我想实现xls表格里面有下面四个链接 然后按顺序读取放到url那里,按顺序下载,下载好一个,就在xls表格后面一个写个 已完成  下载不了的就写 失败 这样 ,有没有大佬解疑

https://2.2.2.2V07PNO3UPLA.mp4   已完成
https://2.2.2.3V07PNO3UPLA.mp4   失败
https://2.2.2.3V07PNO3UPLA.mp4   失败
https://2.2.2.3V07PNO3UPLA.mp4

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

wushaominkk 发表于 2020-3-24 11:20
发帖前注意排版,已帮你编辑,下次注意
110006600 发表于 2020-3-23 22:22
czp13 发表于 2020-3-23 22:30
青蛙考拉 发表于 2020-3-23 23:05
然而我应该怎么用,为什么没有成品呢,没有成品的技术都是苍白的
miguo835 发表于 2020-3-24 11:33
掌握基础之后,就是个不断敲代码的过程了。
vagrantear 发表于 2020-3-24 12:19
感谢楼主分享,过来学习一波
laochaguan 发表于 2021-2-1 22:25
感谢分享
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 19:37

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表