吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 931|回复: 8
收起左侧

[求助] 学习爬虫第3天,尝试爬取亚运会奖牌榜,各位提提意见

[复制链接]
ZX0228 发表于 2023-10-12 16:03
学习爬虫第三天,尝试爬取亚运会奖牌榜,但是合计有点问题,有没有大佬指点指点
[Python] 纯文本查看 复制代码
import requests
from bs4 import BeautifulSoup

url = 'https://tiyu.baidu.com/major/home/%E6%9D%AD%E5%B7%9E%E4%BA%9A%E8%BF%90%E4%BC%9A/tab/%E5%A5%96%E7%89%8C%E6%A6%9C/from/pc'

response = requests.get(url)
html_content = response.text
soup = BeautifulSoup(html_content, "html.parser")

pm = soup.select("span.title")
gj = soup.select("div.region-text.c-line-clamp1")
jp = soup.select("div.medal-num[style='color:#D59F36;']")
yp = soup.select("div.medal-num[style='color:#7F7F7F;']")
tp = soup.select("div.medal-num[style='color:#FB7F32;']")
hj = soup.select("div.total-num")

data_list = []

for i in range(len(pm)):
    data = {
        "排名": pm[i].get_text(),
        "国家": gj[i].get_text(),
        "金牌": jp[i].get_text(),
        "银牌": yp[i].get_text(),
        "铜牌": tp[i].get_text(),
        "合计": hj[i].get_text()
    }
    data_list.append(data)

for lists in data_list:
    print(lists)

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| ZX0228 发表于 2023-10-12 16:05
合计错行了,
vista_info 发表于 2023-10-12 16:53
可以再细致点F12看请求 https://tiyu.baidu.com/go/major/api/header?match=%E6%9D%AD%E5%B7%9E%E4%BA%9A%E8%BF%90%E4%BC%9A&tab=%E5%A5%96%E7%89%8C%E6%A6%9C&page=home&tab_type=single&cb=jsonp_1697100675066_31992
 楼主| ZX0228 发表于 2023-10-12 17:21
kai-memory 发表于 2023-10-12 16:53
可以再细致点F12看请求 https://tiyu.baidu.com/go/major/api/header?match=%E6%9D%AD%E5%B7%9E%E4%BA%9A%E ...

查找div.total-num标签中第一个就是合计,应该从第二条数据开始提取,才学了2  3他只是我没想明白怎么取
wanjiaoer 发表于 2023-10-12 17:54

学习
学习
oncet 发表于 2023-10-12 19:27
//*[@id="sfr-app"]/div/div[2]/div/div/div/main/section/div[1]/b-grouplist-sticky/div/div[3]/div/div/div[2]/div/div[2]/div[2]/a[1]/div/div[4]
头像被屏蔽
zadmg 发表于 2023-10-12 21:08
提示: 该帖被管理员或版主屏蔽
hkhkhk 发表于 2023-10-12 21:35
我想学习爬虫 建议从哪开始
小明无敌 发表于 2023-10-12 22:00
hkhkhk 发表于 2023-10-12 21:35
我想学习爬虫 建议从哪开始

JavaScript开始
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 19:38

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表