吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1418|回复: 31
上一主题 下一主题
收起左侧

[Python 原创] Python爬取龙虎榜

[复制链接]
跳转到指定楼层
楼主
xixi2008 发表于 2024-12-29 15:38 回帖奖励
本帖最后由 xixi2008 于 2024-12-29 15:43 编辑

新手学习Python,Python爬取龙虎榜,终于编译通过了,发上来交流学习下,数据输出为两种格式,可以自己修改。

import requests
from bs4 import BeautifulSoup
import pandas as pd
# 定义目标URL
url = 'http://m.tetegu.com/longhubang/?src=topnav&r=0.36531248951690687'  # 替换为实际的龙虎榜数据页面
# 发送HTTP请求
response = requests.get(url)
response.encoding = 'utf-8'
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 提取数据
data = []
table = soup.find('table')  # 假设数据在表格中
if table:
    for row in table.find_all('tr'):
        cols = row.find_all('td')
        cols = [ele.text.strip() for ele in cols
        if cols:  # 过滤掉空行
            data.append(cols)
# 转换为DataFrame
if data:
    df = pd.DataFrame(data)
   
    # 打印列数
    print(f"列数: {df.shape[1}")
   
    # 根据实际情况调整列名
    df.columns = [f'Column{i+1}' for i in range(df.shape[1])]  # 动态生成列名
    # 保存为excel.xlsx文件
    df.to_excel('excel.xlsx', index=False)
    print('数据已成功保存到excel.xlsx文件中')
    # 保存为mart.dat文件
    df.to_csv('mart.dat', index=False, sep='\t')
    print('数据已成功保存到mart.dat文件中')
else:
    print('未找到数据')

免费评分

参与人数 4吾爱币 +4 热心值 +3 收起 理由
timeni + 1 + 1 用心讨论,共获提升!
skrillexxx + 1 + 1 我很赞同!
hfol85 + 1 + 1 谢谢@Thanks!
wuaiwxh + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

推荐
苏紫方璇 发表于 2024-12-29 15:50
代码插入方法可以参考置顶帖教程
推荐
IT大小白 发表于 2024-12-29 22:44
[Python] 纯文本查看 复制代码
# 需要cmd安装库: pip install requests beautifulsoup4 pandas openpyxl -i https://mirror.baidu.com/pypi/simple
# 注意pandas库需要openpyxl或者xlsxwriter
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 定义目标URL
url = 'http://m.tetegu.com/longhubang/?src=topnav&r=0.36531248951690687'  # 替换为实际的龙虎榜数据页面
# 发送HTTP请求
response = requests.get(url)
response.encoding = 'utf-8'
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 提取数据
data = []
table = soup.find('table')  # 假设数据在表格中
if table:
    for row in table.find_all('tr'):
        cols = row.find_all('td')
        cols = [ele.text.strip() for ele in cols]
        if cols:  # 过滤掉空行
            data.append(cols)

# 转换为DataFrame
if data:
    df = pd.DataFrame(data)

    # 保存为excel.xlsx文件,不包含表头
    df.to_excel('excel.xlsx', index=False, header=False)
    print('数据已成功保存到excel.xlsx文件中,不包默认含表头')

    # 保存为mart.dat文件,不包含表头
    df.to_csv('mart.dat', index=False, sep='\t', header=False)
    print('数据已成功保存到mart.dat文件中,不包默认含表头')
else:
    print('未找到数据')
3#
大番茄 发表于 2024-12-29 15:58
4#
aaa123321 发表于 2024-12-29 16:43
先点个赞,插个眼,回头发财了来梭哈。。
5#
tnancy2kk 发表于 2024-12-29 17:36
太棒了,感谢分享!
6#
Soar119 发表于 2024-12-29 19:14
插个眼,成为大佬
7#
Childe0426 发表于 2024-12-29 19:39
复制过来,不行
8#
 楼主| xixi2008 发表于 2024-12-29 20:06 |楼主
没装完库是编译不过的,我也是走了很大弯路的。
9#
gy001715 发表于 2024-12-29 20:27
谢谢分享
10#
earlc 发表于 2024-12-29 21:44
这个有用,码克了
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-1 21:07

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表