Python采集VIP收费QQ音乐,一起来听周董最新的《说好不哭》,省3块不香吗?
环境:[*]windows
[*]python3.6.5
模块:
[*]requests
[*]selenium
[*]json
[*]re
[*]urllib环境与模块介绍完毕后,就可以来实行我们的操作了。
完整源码:
链接:https://pan.baidu.com/s/1_oPawjY1zRflSvd8HjUJXQ
提取码:0uv6
过期后留言我补!第1步:通过一个解析网站:http://www.douqq.com/qqmusic/我们可以发现,只需要在这里填写QQ音乐的地址,即可获取我们想要的音乐源文件。https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922202959989-1782816440.png 第二步:获取到QQ音乐的地址,打开我们的QQ音乐首页https://y.qq.com/https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203025925-964315829.png 通过源文件,我们可以发现里面并没有我们想要的数据:https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203045304-670604886.png 那么,我们再来抓包分析:https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203101708-148826980.png发现确实有我们想要的数据,但是当我们看到 headers报文当中的 url时,发现都是加密过后的数据!https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922212837597-2138866162.png所以涉及到了JS加密,那么 会有很多人感觉到很难,所以我们可以选择另外一个python模块selenium,直接获取我们的element 元素: https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203137220-76864541.png源代码为:
url=f'https://y.qq.com/portal/search.html#page=1&searchid=1&remoteplace=txt.yqq.top&t=song&w={name}'driver.get(url)driver.implicitly_wait(10)data=driver.find_element_by_xpath('//div[@class="songlist__item"]//span[@class="songlist__songname_txt"]/a').get_attribute('href')
这里的url是通过简单分析得到的结论,只需要修改w参数即可得到不同的音乐。第三步把我们渠道的data链接利用到我们的解析网站:http://www.douqq.com/qqmusic/抓包分析:https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203214585-27154613.png可以发现这个是一个post请求,然后我们的表单提交的数据,就是我们的QQ音乐地址!第四步:模拟访问这个post请求,拿到我们的返回数据:
https://common.cnblogs.com/images/copycode.gifheaders = { 'Accept': 'application/json, text/javascript, */*; q=0.01', 'Accept-Encoding': 'gzip, deflate', 'Accept-Language': 'zh-CN,zh;q=0.9', 'Connection': 'keep-alive', 'Content-Length': '65', 'Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8', 'Host': 'www.douqq.com', 'Origin': 'http://www.douqq.com', 'Referer': 'http://www.douqq.com/qqmusic/', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36', 'X-Requested-With': 'XMLHttpRequest',}data = {'mid': '前面取到的音乐地址'}url = 'http://www.douqq.com/qqmusic/qqapi.php'req = requests.post(url, data=data, headers=headers).text
https://common.cnblogs.com/images/copycode.gif
它的返回值: https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203325899-107791485.png可以发现MV对应的链接有偏差,不是一个规则的URL,所以在此可以进行数据精炼,得到最终音乐链接:
req = json.loads(req)req = req.replace('\/\/', '//').replace('\/', '/')rg = re.compile('"mp3_l":"(.*?)",')rs = re.findall(rg, req)第五步:下载音乐:
urlretrieve(rs, name+'.mp3')效果:
https://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203443368-1620841921.pnghttps://img2018.cnblogs.com/blog/1813177/201909/1813177-20190922203407324-1206359369.png 想听歌不需要这么麻烦 报错
Warning (from warnings module):
File "D:\2345Downloads\QqMusicSpider.py", line 70
chrome_options=option)
DeprecationWarning: use options instead of chrome_options
Traceback (most recent call last):
File "D:\Program Files\Python37\Python37\lib\site-packages\selenium\webdriver\common\service.py", line 76, in start
stdin=PIPE)
File "D:\Program Files\Python37\Python37\lib\subprocess.py", line 775, in __init__
restore_signals, start_new_session)
File "D:\Program Files\Python37\Python37\lib\subprocess.py", line 1178, in _execute_child
startupinfo)
FileNotFoundError: 系统找不到指定的文件。
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "D:\2345Downloads\QqMusicSpider.py", line 70, in <module>
chrome_options=option)
File "D:\Program Files\Python37\Python37\lib\site-packages\selenium\webdriver\chrome\webdriver.py", line 73, in __init__
self.service.start()
File "D:\Program Files\Python37\Python37\lib\site-packages\selenium\webdriver\common\service.py", line 83, in start
os.path.basename(self.path), self.start_error_message)
selenium.common.exceptions.WebDriverException: Message: 'chromedriver.exe' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home 能不能把下载的歌分享下 充钱就可以听了{:1_907:} zl33333 发表于 2019-9-24 15:46
报错
Warning (from warnings module):
缺少 驱动, 百度下,如何下载chromdriver 如果你是用的谷歌浏览器的话! emm接口好像失效了,获取到的链接都不能用 收费歌曲下载不了,参考验证:
搜索 说好不哭 然后输入序号1后报错
搜索 夜曲 会出现一部分歌曲,但是直接报错,无法继续 python大佬~ 赞 God_Fire 发表于 2019-9-24 18:07
收费歌曲下载不了,参考验证:
搜索 说好不哭 然后输入序号1后报错
搜索 夜曲 会出现一部分歌曲,但是直 ...
部分歌曲下不了,说好不哭 只有MV
页:
[1]
2