susheng 发表于 2022-9-3 20:47

批量抓取公众号,下载公众号话题音频和视频

前段时间发过帖子 批量下载公众号文章里的音频和视频,今天再说说批量下载公众号话题,以这个话题为例,先复制话题链接:


代码示例:
topic_url=input("输入话题链接")
biz=re.search(r'__biz=(.*?)&',topic_url).group(1)
album_id=re.search(r'album_id=(.*?)&',topic_url).group(1)
response = requests.get(topic_url, headers=headers)
response = requests.get(topic_url, headers=headers)
voiceids = re.findall('data-voiceid="(.*)"',response.text)
msgids = re.findall('data-msgid="(.*)"',response.text)
links = re.findall('data-link="(.*)"',response.text)
titles = re.findall('data-title="(.*)" data-voiceid',response.text)
print(titles,len(voiceids))
for i,j in zip(titles,voiceids):
    voice_url = f'https://res.wx.qq.com/voice/getvoice?mediaid={j}'
    # print(i,voice_url)
    audio_data = requests.get(voice_url,headers=headers)
    print('正在下载音频:'+i+'.mp3')
    with open(i+'.mp3','wb') as f:
      f.write(audio_data.content)

输入话题链接 ,下载效果,下载视频一样的:








kk1212 发表于 2022-9-4 09:34

楼主,可以打包成工具不?

大张呀 发表于 2022-9-5 09:53

侃遍天下无二人 发表于 2022-9-4 10:10
视频真的好下载吗,如果是音频很容易提取到链接,但要是视频是从v.qq.com引用的,下载下来就得做各种复杂的 ...

图片是九阴真经嘛?

feiyu361 发表于 2022-9-4 09:01

太好了,感谢分享

iceschool 发表于 2022-9-4 09:40

同问,求打包工具TAT

netqing 发表于 2022-9-4 10:02

优秀总你优秀点的

侃遍天下无二人 发表于 2022-9-4 10:10

视频真的好下载吗,如果是音频很容易提取到链接,但要是视频是从v.qq.com引用的,下载下来就得做各种复杂的解密操作

tangyidianxia 发表于 2022-9-4 11:06

感谢楼主终于会抓公众号文章了

Yangxiao112 发表于 2022-9-4 11:24

谢谢分享

你是我的人 发表于 2022-9-4 11:49

感谢分享

missyou999 发表于 2022-9-4 11:58

感谢的大佬分享
页: [1] 2 3 4
查看完整版本: 批量抓取公众号,下载公众号话题音频和视频