[Python] 纯文本查看 复制代码 # 需要cmd安装库: pip install requests beautifulsoup4 pandas openpyxl -i https://mirror.baidu.com/pypi/simple
# 注意pandas库需要openpyxl或者xlsxwriter
import requests
from bs4 import BeautifulSoup
import pandas as pd
# 定义目标URL
url = 'http://m.tetegu.com/longhubang/?src=topnav&r=0.36531248951690687' # 替换为实际的龙虎榜数据页面
# 发送HTTP请求
response = requests.get(url)
response.encoding = 'utf-8'
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 提取数据
data = []
table = soup.find('table') # 假设数据在表格中
if table:
for row in table.find_all('tr'):
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
if cols: # 过滤掉空行
data.append(cols)
# 转换为DataFrame
if data:
df = pd.DataFrame(data)
# 保存为excel.xlsx文件,不包含表头
df.to_excel('excel.xlsx', index=False, header=False)
print('数据已成功保存到excel.xlsx文件中,不包默认含表头')
# 保存为mart.dat文件,不包含表头
df.to_csv('mart.dat', index=False, sep='\t', header=False)
print('数据已成功保存到mart.dat文件中,不包默认含表头')
else:
print('未找到数据') |