用Python爬取小姐姐磁力链接回来,慢慢看

lifeixue 发表于 2021-5-28 16:03

自从接触Python爬虫，身体一天不如一天
虽然python可以爬取图片视频什么的，不过最大的缺点就是身体营养跟不上（正在学爬虫/准备学爬虫的小伙伴们,要注意身体哦）
哈哈，不说笑了，先来几张小姐姐图片

看了小姐姐图片后的你营养还跟的上吗？(来瓶营养快线补一下)

话不多说,直接上代码（初学python,代码写的很烂,心里很清楚）各位大佬不要见笑哦import requests
from lxml import etree

search = input("请输入您要查询的关键字（不要有空格/特殊符号）：")
page_num = int(input("请输入需要获取的页数（如:1,2,3）："))
url = "https://www.zhaocili608.xyz/s.php?q={}".format(search)
head = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36"
}
re = requests.get(url=url, headers=head).text
h = etree.HTML(re)
p_next = h.xpath("//tbody/tr/td/a/text()")# 下一页（用于判断是否有下一页）
for p in range(1, page_num+1):# 页码数量
# 判断是否有下一页
if "下一页" in p_next:
   page = h.xpath("//tbody/tr/td/a/@href").replace("//", "https://")# 页码
   baseurl = page.replace("2.html", "{}.html").format(p)# 完整页码
else:
   baseurl = url
print("--------------正在为您查找（第{0}页）：【{1}】的相关信息--------------".format(p, search))
r = requests.get(url=baseurl, headers=head).text
html = etree.HTML(r)
lst = html.xpath("//tbody/tr/td/a[@target='_blank']")
# 获取页面每个资源的详情数据
for i in lst:
   fp = open(search+".txt", "a", encoding="utf-8")# 持久化存储数据(不覆盖内容)

   href = i.xpath("./@href").replace("//", "https://")# 详情链接
   response = requests.get(url=href, headers=head).text
   tree = etree.HTML(response)

   title = tree.xpath("//div[@class='container']//h2/text()")# 标题
   fp.write("标题：" + title + "\n")# 写入标题
   print("标题：", title)

   data = tree.xpath("//div[@class='container']//div[@class='row']/dl/dd/text()")# 日期
   fp.write("日期：" + data + "\n")# 写入日期
   print("日期：", data)

   size = tree.xpath("//div[@class='container']//div[@class='row']/dl/dd/text()")# 文件大小
   fp.write("文件大小：" + size + "\n")# 写入文件大小
   print("文件大小：", size)

   magnet = tree.xpath("//div[@class='container']//div/input/@value")# 磁力链接
   fp.write("磁力链接：" + magnet + "\n"*2)# 写入磁力链接
   print("磁力链接：", magnet)
   print()
# 判断是否有下一页（继续/结束循环）
if "下一页" in p_next:
   pass
else:
   print("资源获取完毕！")
   break

有磁力工具,我不用,就用python抓取,诶,就是玩儿:lol
源码：

看门猫 发表于 2021-5-28 16:14

抓了磁力链接，我不下载，诶，就是玩儿;www

那年夏天52 发表于 2021-5-28 16:30

磁力工具呢？

blindcat 发表于 2021-5-28 16:10

感谢楼主分享源码，学习下

djzhao 发表于 2021-5-28 16:22

诶,就是玩儿{:301_978:}

goodista 发表于 2021-5-28 17:01

所以我的Python水平一直保持不涨，是有具体原因的

登高闻曲 发表于 2021-5-28 17:06

我也在学习python爬虫，感谢楼主分享

rainbow270118 发表于 2021-5-28 17:24

我曾经也弄过，但是被封IP了，估计爬的有点狠了

lxhwan100 发表于 2021-5-28 17:31

5楼说的对，磁力工具呢{:301_998:}

hshcompass 发表于 2021-5-28 18:47

感谢楼主分享源码，学习下

页: [1] 2 3 4 5 6 7

吾爱破解 - 52pojie.cn's Archiver

用Python爬取小姐姐磁力链接回来,慢慢看