吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 4633|回复: 14
收起左侧

[Python 转载] 用selenium+谷歌浏览器爬取美拍视频真实链接

  [复制链接]
niebaohua 发表于 2018-11-26 21:42
本帖最后由 niebaohua 于 2018-11-26 21:53 编辑

准备工具:
   selenium模块(pip install selenium)
   谷歌浏览器
   chromedriver.exe(版本要和你的谷歌版本一致或者高于)


由于本人刚学python 不久,并不会什么解密的模块 只能这样慢慢
地模拟浏览器爬了  美拍的视频都加密了,只有当你点击播放的时
侯  视频的真实链接才会暴露出来,所以我就用了这个方法一个一个
爬咯。


有什么补充的你们可以补充一下,我也不太会这些模块


[Python] 纯文本查看 复制代码
from selenium import webdriver
import time
driver = webdriver.Chrome() #实例化对象

driver.get("https://www.meipai.com/user/32821588")#用户的页面
while 1:
    time.sleep(1)
    video_href = driver.find_elements_by_xpath("//div[@class='feed-video pr cp']")
    video_title = driver.find_elements_by_xpath("//li[@class='feed-item pr']")
    #爬取第一个视频
    first_video = driver.find_element_by_xpath(".//div[@class='mp-h5-player-layer-video']/video").get_attribute("src")
    first_title = video_title[0].find_element_by_xpath(".//h1").text
    print(first_title,first_video)
    for i in range(1,len(video_href)):#从每一页的第二个视频开始
        play = video_href[i].find_element_by_xpath(".//span[@class='pa detail-play']")
        play.click()#点击播放按钮  让视频真实链接显示出来
        src = video_href[i].find_element_by_xpath(".//div[@class='mp-h5-player-layer-video']/video").get_attribute("src")
        title = video_title[i].find_element_by_xpath(".//h1").text
        print(title,src)
        time.sleep(1)# 增加一秒的延迟
    #获取下一页
    next_page = driver.find_element_by_xpath("//a[@class='paging-next dbl']")
    if next_page == '':
        break
    next_page.click()#点击下一页

driver.quit()#关闭浏览器


代码可能不规范   见谅...


附上爬的陈翔六点半的视频真实链接
QQ截图20181126133619.png

新建文本文档.txt

173 Bytes, 下载次数: 13, 下载积分: 吾爱币 -1 CB

工具和陈翔六点半成品

免费评分

参与人数 6吾爱币 +6 热心值 +4 收起 理由
GDTOWN + 1 我很赞同!
zwg876 + 1 + 1 用心讨论,共获提升!
lds114 + 1 我很赞同!
mrleochan + 1 + 1 用心讨论,共获提升!
kesshei + 1 + 1 用心讨论,共获提升!
戒为良药 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| niebaohua 发表于 2018-11-26 21:57
免费评分有没有

免费评分

参与人数 1吾爱币 +1 收起 理由
爱生活爱VIVI + 1 热心回复!

查看全部评分

 楼主| niebaohua 发表于 2019-2-18 19:46
lmmmr9 发表于 2019-2-18 11:08
写个协程慢慢爬嘛,这个单线程太慢了吧

之前刚学 会的不多  现在可以直接爬它的链接 然后解密 (看的网上的思路)用多线程直接下载,多线程还是不太懂  好像有好几种
头像被屏蔽
爱生活爱VIVI 发表于 2018-11-26 21:54
 楼主| niebaohua 发表于 2018-11-26 21:56
爱生活爱VIVI 发表于 2018-11-26 21:54
千图 包图这样的可以吗

可以用更简单的方法,只不过应该爬不到原图
头像被屏蔽
爱生活爱VIVI 发表于 2018-11-26 22:18
提示: 作者被禁止或删除 内容自动屏蔽
爱吃鸡魔人 发表于 2018-11-26 22:56
你做一个selenium登陆淘宝的我给你评分
 楼主| niebaohua 发表于 2018-11-26 23:19
爱吃鸡魔人 发表于 2018-11-26 22:56
你做一个selenium登陆淘宝的我给你评分

我菜鸡一个现在, 以后会有可能
吾爱好地方 发表于 2018-11-27 00:00
很有用,谢谢楼主!
aopao 发表于 2018-11-27 08:28
爱生活爱VIVI 发表于 2018-11-26 22:18
嗯 要是有他们站的会员的话能爬吗

可以爬取,就是怕他们监控,你下载太多会被封的。。。
yc19951005 发表于 2018-11-27 11:18
mark一下 等有时间再看看
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-16 04:28

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表