【python】爬取某网站被技术难住,求大佬帮忙解决
本帖最后由 lll333lll20 于 2019-10-2 14:45 编辑新手小白一枚,爬取球探网,想要获取当前比赛的信息保存到excel表格,经过network分析该网站获取的数据是js执行文件,不知道如何转换为python的列表或字典然后存储到excel表格。求大佬帮忙解决或提供思路。
要爬取的网址是:http://free.win007.com/live.aspx?Edition=1&lang=0&ad=%B9%D9%B7%BD%CD%C6%BC%F65%D0%C7%D5%FD%CD%F8%C6%BD%CC%A8&adurl=http://gg.yb22.net/gg.php%3Fid=2400&color=F0F0E0&sound=0
经过network分析得出我要的数据是来自这个链接:http://free.win007.com/VbsXml/bfdata.js?823 ,获取数据如下
如何通过该数据提取并存入excel?要求存入到表格有【比赛id】【主队】【客队】【主队进球数】【客队进球数】,这些数据是在数组A里面的内容,怎么处理数组A,我不知道该如何下手 正则 无所不能 都能让你下载下来了,就用正则处理,提取出格式化数据,然后保存
页:
[1]