python爬虫mou视频教程【师傅领进门，修行靠个人】

倾情 · 发表于 2020-2-26 10:44

分享一个爬虫视频用于学习，仅供学习。这个用的是单线程，后期改造一下。
俗话说，师傅领进门，修行靠个人。提供一个思路爬虫视频，下面的大家自己研究吧。
代码使用的时候创一个文件夹

import urllib
from lxml import etree
import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"
}

def main():
    # 请求首页地址
    url = 'http://699pic.com/media/'
    req = requests.get(url, headers=headers)
    ae_html = req.content.decode()
    # print(ae_html)

    # 获取首页需要的每个视频地址
    dom = etree.HTML(ae_html)
    ae_video_html_url_list = dom.xpath(
        '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/@href')
    # 获取视频的名字和时间长度
    ae_video_name1_list = dom.xpath(
        '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/h3/text()')
    ae_video_time2_list = dom.xpath(
        '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/span/text()')
    # print(ae_video_time2)
    print(ae_video_html_url_list)
    # print(ae_video_name1_list)
    for name, time, url in zip(ae_video_name1_list, ae_video_time2_list, ae_video_html_url_list):
        # url=url.strip("/")
        # 找到视频网页地址
        url = "http://699pic.com" + url
        # print(url)
        # 请求这个网页
        req_video = requests.get(url, headers=headers)
        dom_url = etree.HTML(req_video.content.decode())
        # 获取这个网页中的内容，获取其中的视频高清视频地址。
        ae_video_url_list = dom_url.xpath('//div[@class="video-show"]//video/source/@src')
        # 请求这个高清视频的地址

        ae_video_url = 'http:' + ae_video_url_list[0]
        print("视频真实地址：", ae_video_url)
        # print(ae_video_url)
        req_video = requests.get(ae_video_url, headers=headers)

        # 获取视频名字和时间
        url_name = ae_video_url.split(".")
        time = time.strip("-").strip().replace(':', "-")
        video_name = name + time + "." + url_name[-1]
        # print(video_name)
        print(video_name, "正在下载………")

        # 保存
        with open(r"I:\Pchong\pc_video\ae-video\{}".format(video_name), 'wb')as f:
            f.write(req_video.content)
        print(video_name, "下载完成！！")

if __name__ == '__main__':
    main()

ytfrdfiw · 发表于 2020-2-29 11:30

石昊荒天帝发表于 2020-2-26 10:57
视频在哪

这个不是python学习代码，只是利用python代码爬别人的视频代码。

石昊荒天帝 · 发表于 2020-2-26 10:57

提示: 作者被禁止或删除内容自动屏蔽

twostudy · 发表于 2020-2-26 11:04

这个不错，谢谢分享。学习了

Hikiii · 发表于 2020-2-26 11:08

带佬牛笔！！

wuji84131421 · 发表于 2020-2-26 11:13

感谢分享向大佬学习下

wblank · 发表于 2020-2-26 11:17

感谢分享。大老牛逼，

nanscript · 发表于 2020-2-26 11:25

下载后还是有水印

倾情 · 发表于 2020-2-26 11:33

石昊荒天帝发表于 2020-2-26 10:57
视频在哪

你需要自己创个文件夹，如文中图所示

baixiaoqiya · 发表于 2020-2-26 11:50

感谢大佬提供思路

wwwyangood · 发表于 2020-2-26 11:54

教程不适合我们初级菜鸟学习~

帐号		自动登录	找回密码
密码			注册[Register]

石昊荒天帝石昊荒天帝当前离线好友阅读权限 0 听众最后登录 1970-1-1 头像被屏蔽	石昊荒天帝发表于 2020-2-26 10:57 吾爱破解论坛没有任何官方QQ群，禁止留联系方式，禁止任何商业交易。提示: 作者被禁止或删除内容自动屏蔽
	如何升级？如何获得积分？积分对应解释说明！
	回复支持举报

[Python 转载] python爬虫mou视频教程【师傅领进门，修行靠个人】

免费评分

免费评分