吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1506|回复: 1
收起左侧

[Python 转载] [Scrape Center - ssr3]带Basic Authentication的数据爬取

[复制链接]
三滑稽甲苯 发表于 2022-2-13 16:52
Scrape Center: https://scrape.center/
今日题目: https://ssr2.scrape.center/
首先登录,用户名密码均为 admin
login.png
后续步骤便与以前分析的完全一样了。
HTTP Basic Authentication 在 Python 中的实现方法有以下两种:
1. requests 库自动处理,只需要设置 auth=(username, password)
2. 手动添加 Authorization: Basic <base64 of 'username:password'> 请求头
简单起见,我们采用方法1。
完整代码:
[Python] 纯文本查看 复制代码
from requests import Session
from bs4 import BeautifulSoup as bs
from time import time

start = time()
x = Session()
x.auth = ('admin', 'admin')
url = 'https://ssr3.scrape.center'
for i in range(1, 10):
    r = x.get(f'{url}/page/{i}')
    soup = bs(r.text, 'html.parser')
    cards = soup.find_all('div', class_='el-card__body')
    print(f'Page {i}/10')
    for card in cards:
        print()
        print(' ', card.h2.text)
        tags = card.find('div', class_='categories').find_all('span')
        print('  Score:', card.find('p', class_='score').text[-3:])
        print('  Tags:', ' '.join([tags[i].text for i in range(len(tags))]))
        infos = card.find_all('div', class_='info')
        # print('  Info:', ''.join([i.text[-1:] for i in infos[0]]))
        spans = infos[0].find_all('span')
        print('  Country:', spans[0].text)
        print('  Duration:', spans[2].text)
        print('  Release date:', infos[1].text[-1:-3])
        print('  Link:', url + card.find('a', class_='name')['href'])
    print()
print(f'Time used: {time() - start}s')
input()

免费评分

参与人数 2吾爱币 +8 热心值 +2 收起 理由
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
blindcat + 1 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

blindcat 发表于 2022-2-13 21:07
欢迎分析讨论交流,吾爱破解论坛有你更精彩!
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 08:34

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表