【python】爬取某网站被技术难住，求大佬帮忙解决

lll333lll20 发表于 2019-10-1 06:59

本帖最后由 lll333lll20 于 2019-10-2 14:45 编辑

新手小白一枚，爬取球探网，想要获取当前比赛的信息保存到excel表格，经过network分析该网站获取的数据是js执行文件，不知道如何转换为python的列表或字典然后存储到excel表格。求大佬帮忙解决或提供思路。
要爬取的网址是：http://free.win007.com/live.aspx?Edition=1&lang=0&ad=%B9%D9%B7%BD%CD%C6%BC%F65%D0%C7%D5%FD%CD%F8%C6%BD%CC%A8&adurl=http://gg.yb22.net/gg.php%3Fid=2400&color=F0F0E0&sound=0

经过network分析得出我要的数据是来自这个链接：http://free.win007.com/VbsXml/bfdata.js?823 ，获取数据如下

如何通过该数据提取并存入excel？要求存入到表格有【比赛id】【主队】【客队】【主队进球数】【客队进球数】，这些数据是在数组A里面的内容，怎么处理数组A，我不知道该如何下手

1170 发表于 2019-10-1 12:35

正则无所不能

ermao 发表于 2019-10-1 13:22

timsxh 发表于 2019-10-12 18:16

都能让你下载下来了，就用正则处理，提取出格式化数据，然后保存

页: [1]

吾爱破解 - 52pojie.cn's Archiver

【python】爬取某网站被技术难住，求大佬帮忙解决