吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 4091|回复: 11
收起左侧

[Python 转载] 小白爬取所有混合基金的基金代码

  [复制链接]
a5228172 发表于 2020-10-23 20:15
违规麻烦联系删除    - -
只爬出基金代码  其他的都没有爬取   EXCEL没有处理好    单列不会处理
import pandas as pd,re
import requests
import random
#http://fund.eastmoney.com/HH_jzzzl.html
def main():
        aa1=[]
        datalist = {}
        for i in range(1,23):
                baseurl = "http://fund.eastmoney.com/Data/Fund_JJJZ_Data.aspx?t=1&lx=3&letter=&gsid=&text=&sort=zdf,desc&page="+str(i)+",200&dt=1603365267841&atfc=&onlySale=0"
                html = getdata(baseurl)
                # print(html)
                # html = duquwenjian()
                aa1.extend(jiexIDAta(html))
                print(f'第{i}页')
        datalist['基金代码'] = aa1
        save(datalist,".\\123.xls")
        # html = duquwenjian()
def getdata(baseurl):
        user_agent_list = ['Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.71 Safari/537.1 LBBROWSER','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)','Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.84 Safari/535.11 SE 2.X MetaSr 1.0','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/4.4.3.4000 Chrome/30.0.1599.101 Safari/537.36','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36']
       
        headers = {
        "User-Agent":random.choice(user_agent_list)
        }

        data = {} #,params=data
        try:
                response = requests.get(baseurl,headers=headers ,timeout=1)
                if response.status_code == 200:
                        with open("123.txt","w+",encoding="utf-8") as f:
                                f.write(str(response.text))
                        return response.text
        except RequestsException:
                return None
def jiexidata(html):
        a  = re.findall(".*datas:\[(.*)],count.*",html,re.S)
        a  = str(a)[2:]
        # print(a)
        a = re.sub("\[","",a)
        a = re.sub('"',"",a)
        a = re.split("],",a)
        # print(len(a))
        a1 = []                #基金代码
        a2 = []                #基金名称       
        a3 = []                #单位净值当天
        a4 = []                #累计净值当天
        a5 = []                #单位净值昨天
        a6 = []                #累计净值昨天
        # print(a[0])
        for i in range(0,len(a)):
                # print(a[i])
                b = re.split(",",a[i])
                a1.append(b[0])
        return a1
def duquwenjian():
        with open("123.txt","r",encoding="utf-8") as f:
                        a = f.read()
        f.close
        return a
def save(a,savepath):
        students = pd.DataFrame(a)
        # print(list(a.keys())[0])
        # students = students.set_index(list(a.keys())[0])
        students.to_excel(savepath)
if __name__ == '__main__':
        main()
B98%ZUH@0W{F9VN@6`1PO)Q.png

免费评分

参与人数 2吾爱币 +2 热心值 +2 收起 理由
chinawolf2000 + 1 + 1 热心回复!
黑色小星星 + 1 + 1 我很赞同!

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

Pengpo 发表于 2021-1-23 21:06
Sun_Dream 发表于 2020-12-8 12:19
近一月        近三月        近六月        近一年        基金经理        基金公司        成立日期        基金规模        赎回状态     这些信息怎么爬啊楼主    ...

我也想知道,请问层主研究出来了吗
Sun_Dream 发表于 2020-12-8 12:19
近一月        近三月        近六月        近一年        基金经理        基金公司        成立日期        基金规模        赎回状态     这些信息怎么爬啊楼主   要天天基金的数据
woyaoshangshiqi 发表于 2020-10-23 21:00
Ranger233 发表于 2020-10-23 23:02
今天又是关灯喝凉水的一天。。。
huazang110 发表于 2020-10-23 23:05
一片绿油油的稻田,一下回到解放前,又白玩一个月
xushifu 发表于 2020-10-23 23:13
天天吃大面  韭菜割了一波又一波
任逍遥 发表于 2020-10-24 17:47
诺安配银河的路过
wanshiz 发表于 2020-10-25 07:54
谢谢楼主,真错的
elvisluciker999 发表于 2020-10-26 10:54
已经做的很棒了 我也在学习中
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 19:29

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表