24WOK 发表于 2023-4-16 20:46

电影天堂???就这啊

#   1.定位到2023必看片
#   2.从2020必看片提取子页面的链接地址
#   3.请求子页面的链接地址,拿到我们想要的链接地址

#   确认是服务器端渲染
#   提取源代码   requests
#   通过re来提取有效信息   re

import re
import requests

domain = "https://www.dytt89.com/"
resp = requests.get(domain, verify=False)   #   verify=False    去掉安全验证
resp.encoding = 'gb2312'    #指定字符编码

n = "电影天堂.txt"

# print(resp.text)



#   拿到ul里面的li
obj1 = re.compile(r"2023必看热片.*?<ul>(?P<THING>.*?)"
                  r"</ul>", re.S)
obj2 = re.compile(r"<a href='(?P<HREF>.*?)'", re.S)

obj3 = re.compile(r'◎片  名(?P<MOVIE>.*?)<br />.*?'
                  r'<td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="(?P<DOWNLORD>.*?)">', re.S)


rt1 = obj1.finditer(resp.text)
child_href_list =[]

for i in rt1:
    ul = i.group('THING')

    #   html中,a标签表示超链接,<a href='url'>周杰伦</a>

    #   提取子页面链接
    rt2 = obj2.finditer(ul)
    for o inrt2:
      href = o.group('HREF')

      #   拼接子页面的url地址,    域名+子页面地址
      child_href = domain+href.strip('/')
      child_href_list.append(child_href)   #   把子页面保存进字典


    #   提取子页面内容
    for href in child_href_list:
      cd_rt = requests.get(href, verify=False)
      cd_rt.encoding = 'gbk'

      rt3 = obj3.search(cd_rt.text)

      # print(rt3.group('MOVIE'))
      # print(rt3.group('DOWNLORD'))

      # break   #测试用
      all_ = rt3.group('MOVIE') + "----->" + rt3.group('DOWNLORD')
      with open(n, "a", encoding="gbk") as f:
            f.write(all_ + "\n")
f.close()
print("over")


苏紫方璇 发表于 2023-4-16 21:50

推荐使用下面的方法插入代码
【公告】发帖代码插入以及添加链接教程(有福利)
https://www.52pojie.cn/thread-713042-1-1.html
(出处: 吾爱破解论坛)

Monklamn 发表于 2023-4-17 09:28

本帖最后由 Monklamn 于 2023-4-17 09:29 编辑

resp = requests.get(domain, verify=False)# verify=False    去掉安全验证

InsecureRequestWarning已经去掉验证,我本地运行还是会提示报错{:1_924:}

24WOK 发表于 2023-4-16 21:51

苏紫方璇 发表于 2023-4-16 21:50
推荐使用下面的方法插入代码
【公告】发帖代码插入以及添加链接教程(有福利)
https://www.52pojie.cn/t ...

好嘞,学到了

kaixuan1158 发表于 2023-4-16 22:08

学习一下{:1_893:}

Sky℃ 发表于 2023-4-16 22:25

学习学习,感谢

husu1012 发表于 2023-4-16 22:29

谢谢 马住

zhizhe135 发表于 2023-4-16 22:32

学以致用

ideapad 发表于 2023-4-16 22:37

直接能用吗

snowshine 发表于 2023-4-16 22:47

学习了,一直用电影天堂下载电影电视剧

mcse2006 发表于 2023-4-16 22:48

不懂就问,这是要干啥
页: [1] 2 3 4 5 6 7 8 9
查看完整版本: 电影天堂???就这啊