倾情 发表于 2020-2-26 10:44

python爬虫mou视频教程【师傅领进门,修行靠个人】


分享一个爬虫视频用于学习,仅供学习。这个用的是单线程,后期改造一下。
俗话说,师傅领进门,修行靠个人。提供一个思路爬虫视频,下面的大家自己研究吧。
代码使用的时候创一个文件夹




```
import urllib
from lxml import etree
import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"
}


def main():
    # 请求首页地址
    url = 'http://699pic.com/media/'
    req = requests.get(url, headers=headers)
    ae_html = req.content.decode()
    # print(ae_html)

    # 获取首页需要的每个视频地址
    dom = etree.HTML(ae_html)
    ae_video_html_url_list = dom.xpath(
      '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/@href')
    # 获取视频的名字和时间长度
    ae_video_name1_list = dom.xpath(
      '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/h3/text()')
    ae_video_time2_list = dom.xpath(
      '//div[@class="list-item video-list clearfix"]/ul/li/a[@class="video-name fl"]/span/text()')
    # print(ae_video_time2)
    print(ae_video_html_url_list)
    # print(ae_video_name1_list)
    for name, time, url in zip(ae_video_name1_list, ae_video_time2_list, ae_video_html_url_list):
      # url=url.strip("/")
      # 找到视频网页地址
      url = "http://699pic.com" + url
      # print(url)
      # 请求这个网页
      req_video = requests.get(url, headers=headers)
      dom_url = etree.HTML(req_video.content.decode())
      # 获取这个网页中的内容,获取其中的视频高清视频地址。
      ae_video_url_list = dom_url.xpath('//div[@class="video-show"]//video/source/@src')
      # 请求这个高清视频的地址

      ae_video_url = 'http:' + ae_video_url_list
      print("视频真实地址:", ae_video_url)
      # print(ae_video_url)
      req_video = requests.get(ae_video_url, headers=headers)

      # 获取视频名字和时间
      url_name = ae_video_url.split(".")
      time = time.strip("-").strip().replace(':', "-")
      video_name = name + time + "." + url_name[-1]
      # print(video_name)
      print(video_name, "正在下载………")

      # 保存
      with open(r"I:\Pchong\pc_video\ae-video\{}".format(video_name), 'wb')as f:
            f.write(req_video.content)
      print(video_name, "下载完成!!")


if __name__ == '__main__':
    main()

```

ytfrdfiw 发表于 2020-2-29 11:30

石昊荒天帝 发表于 2020-2-26 10:57
视频在哪

这个不是python学习代码,只是利用python代码爬别人的视频代码。

石昊荒天帝 发表于 2020-2-26 10:57

twostudy 发表于 2020-2-26 11:04

这个不错,谢谢分享。学习了{:1_918:}

Hikiii 发表于 2020-2-26 11:08

带佬牛笔!!

wuji84131421 发表于 2020-2-26 11:13

感谢分享向大佬学习下

wblank 发表于 2020-2-26 11:17

感谢分享。大老牛逼,

nanscript 发表于 2020-2-26 11:25

下载后还是有水印:lol

倾情 发表于 2020-2-26 11:33

石昊荒天帝 发表于 2020-2-26 10:57
视频在哪

你需要自己创个文件夹,如文中图所示

baixiaoqiya 发表于 2020-2-26 11:50

感谢大佬提供思路

wwwyangood 发表于 2020-2-26 11:54

教程不适合我们初级菜鸟学习~
页: [1] 2 3
查看完整版本: python爬虫mou视频教程【师傅领进门,修行靠个人】