好友
阅读权限10
听众
最后登录1970-1-1
|
本帖最后由 niebaohua 于 2018-11-26 21:53 编辑
准备工具:
selenium模块(pip install selenium)
谷歌浏览器
chromedriver.exe(版本要和你的谷歌版本一致或者高于)
由于本人刚学python 不久,并不会什么解密的模块 只能这样慢慢
地模拟浏览器爬了 美拍的视频都加密了,只有当你点击播放的时
侯 视频的真实链接才会暴露出来,所以我就用了这个方法一个一个
爬咯。
有什么补充的你们可以补充一下,我也不太会这些模块
[Python] 纯文本查看 复制代码 from selenium import webdriver
import time
driver = webdriver.Chrome() #实例化对象
driver.get("https://www.meipai.com/user/32821588")#用户的页面
while 1:
time.sleep(1)
video_href = driver.find_elements_by_xpath("//div[@class='feed-video pr cp']")
video_title = driver.find_elements_by_xpath("//li[@class='feed-item pr']")
#爬取第一个视频
first_video = driver.find_element_by_xpath(".//div[@class='mp-h5-player-layer-video']/video").get_attribute("src")
first_title = video_title[0].find_element_by_xpath(".//h1").text
print(first_title,first_video)
for i in range(1,len(video_href)):#从每一页的第二个视频开始
play = video_href[i].find_element_by_xpath(".//span[@class='pa detail-play']")
play.click()#点击播放按钮 让视频真实链接显示出来
src = video_href[i].find_element_by_xpath(".//div[@class='mp-h5-player-layer-video']/video").get_attribute("src")
title = video_title[i].find_element_by_xpath(".//h1").text
print(title,src)
time.sleep(1)# 增加一秒的延迟
#获取下一页
next_page = driver.find_element_by_xpath("//a[@class='paging-next dbl']")
if next_page == '':
break
next_page.click()#点击下一页
driver.quit()#关闭浏览器
代码可能不规范 见谅...
附上爬的陈翔六点半的视频真实链接 |
-
-
-
新建文本文档.txt
173 Bytes, 下载次数: 13, 下载积分: 吾爱币 -1 CB
工具和陈翔六点半成品
免费评分
-
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|