吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 5661|回复: 24
收起左侧

[Python 转载] 爬取天天基金网数据(源代码)

  [复制链接]
在外DE孩子 发表于 2021-3-15 22:58
import requests
import json
import re
import pandas as pd
import time

def get_data(code,name,page=233):
    df_list = []
    for index in range(page):
        url = 'http://api.fund.eastmoney.com/f10/lsjz?callback=jQuery18308375575830705777_1615814760997&fundCode={}&pageIndex={}&pageSize=20&startDate=&endDate=&_=1615815223845'.format(code,index)
        headers = {
            'Referer': 'http://fund.eastmoney.com/',
            'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
        }
        resp = requests.get(url, headers = headers)
        html = resp.text
        res = re.findall('\((.*?)\)',html)
        datas = json.loads(res[0])["Data"]["LSJZList"]
        df = pd.DataFrame(datas)
        print(df)
        df_list.append(df)
    df_data = pd.concat(df_list)
    df_data.to_csv('./{}.csv'.format(name,code),encoding='utf-8-sig' ,index=False)
    print(df_data)

def get_fund_ranking(num):
    base_url = 'http://fund.eastmoney.com/data/rankhandler.aspx?op=ph&dt=kf&ft=all&rs=&gs=0&sc=6yzf&st=desc&sd=2020-03-15&ed=2021-03-15&qdii=&tabSubtype=,,,,,&pi={}&pn=50&dx=1&v=0.9215528965887285'.format(num)
    headers = {
        # 防盗链 确定来路
        'Referer': 'http://fund.eastmoney.com/data/fundranking.html',
        # 身份证
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
    }
    response = requests.get(base_url, headers=headers)
    # print(response.text)
    result = re.findall('"(.*?)"', response.text)
    print(result)
    print(len(result))
    for i in result:
        code = i.split(',')[0]
        name = i.split(',')[1]
        get_data(code, name)
        time.sleep(5)

get_fund_ranking(1)

免费评分

参与人数 3吾爱币 +2 热心值 +3 收起 理由
拾贰先生 + 1 + 1 用心讨论,共获提升!
我行我素WU + 1 热心回复!
just4fun + 1 + 1 谢谢@Thanks!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| 在外DE孩子 发表于 2021-3-30 22:43
laochaguan 发表于 2021-3-30 15:15
大佬,如果能增加搜索关键字指数,爬取数据,生成表格,热切期待啊!

好建议,后续我再更新代码,您后续再关注下
广西小鱼 发表于 2021-10-8 14:56
大佬,能不能做一个。可以抓取天天基金网基金吧某用户发的全部帖子?包括文字、图片以及帖子下别人的所有回复。抓取成Word或者PDF,这样可以搜索其内容。非常感谢!
caochanyue 发表于 2021-3-16 09:26
yorkxiao 发表于 2021-3-27 14:08
看不懂怎么使用  
laochaguan 发表于 2021-3-30 14:55
感谢大佬分享
laochaguan 发表于 2021-3-30 15:15
大佬,如果能增加搜索关键字指数,爬取数据,生成表格,热切期待啊!
laochaguan 发表于 2021-3-31 20:07
在外DE孩子 发表于 2021-3-30 22:43
好建议,后续我再更新代码,您后续再关注下

感谢大佬,期待中
yorkxiao 发表于 2021-4-12 22:39
可是具体怎么使用呢
HidendDragon 发表于 2021-4-13 13:39
本帖最后由 HidendDragon 于 2021-4-13 13:50 编辑

感谢大佬分享!
我行我素WU 发表于 2021-5-12 18:44
虽然看不懂,楼主还是辛苦了
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2025-1-12 09:54

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表