简单做个爬虫下点歌听

buluo533 · 发表于 2024-7-31 22:30

找到个不错的听歌网站，爬虫安排上

比较简单的一个爬虫

[Python] 纯文本查看 复制代码

import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
import os


def Menu(key):
    global dic
    url = f"https://www.gequbao.com/s/{key}"
    response = requests.get(url, headers=headers).text
    soup = BeautifulSoup(response, "lxml")
    song_list = soup.find_all("div", class_="row")
    count = len(song_list)
    print("共有歌曲：", count - 2)
    for i in song_list[1:count - 1]:
        song_name = i.find("div", class_='col-5').find("a").text.replace("\n", "").replace("\r", "").replace(" ", "")
        singer_name = i.find("div", class_='col-4').text.replace("\n", "").replace("\r", "").replace(" ", "")
        url = i.find("div", class_='col-3').find("a").get("href")
        down_url = 'https://www.gequbao.com' + url
        dic[song_name] = down_url
        print(f"歌曲：{song_name}----歌手：{singer_name}")


def Download(song_name):
    url = dic[song_name]
    id= url.split('/')[4]
    data_url=f'https://www.gequbao.com/api/play_url?id={id}&json=1'
    response = requests.get(data_url, headers=headers).json()
    sava_url = response['data']['url']
    sava(sava_url, song_name)

def sava(song_down, song_name):
    if not os.path.exists("./歌曲"):
        os.mkdir("./歌曲")

    response = requests.get(song_down, headers=headers).content
    with open(f"./歌曲/{song_name}.mp3", "wb") as f:
        f.write(response)
    print("下载成功")



if __name__ == '__main__':
    key = input("输入歌曲搜索关键词：")
    ua = UserAgent().random
    headers = {
        "User-Agent": ua
    }
    dic = {}
    Menu(key)
    song_key = input("输入下载歌曲名：")
    Download(song_key)

大致实现过程是通过他的一个搜索接口进行关键词搜索，找到自己需要的歌，然后下载
大佬可以是封装，我还没搞懂pyqt5的线程和信号槽，主线程要卡死就不献丑了

kongwu596 · 发表于 2024-8-1 02:52

我这种菜鸡饭喂到嘴都不会吃

silenough · 发表于 2024-8-4 20:04

本帖最后由 silenough 于 2024-8-4 20:06 编辑

顺手优化下：
1、用索引做key，避免搜出多个同名歌曲，只能down最后一个，实际可能不是想找的song；
2、加个循环，用q和s控制，免得每次都要运行；

import requests
from bs4 import BeautifulSoup
from fake_useragent import UserAgent
import os

g_http = 'https://www.xxx.com'  # 使用前把xxx替换下

def Menu(key):
    global dic
    url = f"{g_http}/s/{key}"
    response = requests.get(url, headers=headers).text
    soup = BeautifulSoup(response, "lxml")
    song_list = soup.find_all("div", class_="row")
    count = len(song_list)
    print("共有歌曲：", count - 2)
    for index, i in enumerate(song_list[1:count - 1]):
        song_name = i.find("div", class_='col-5').find("a").text.replace("\n", "").replace("\r", "").replace(" ", "")
        singer_name = i.find("div", class_='col-4').text.replace("\n", "").replace("\r", "").replace(" ", "")
        url = i.find("div", class_='col-3').find("a").get("href")
        down_url = g_http + url
        dic[index] = (song_name, down_url)
        print(f"序号：{index}, 歌曲：{song_name}, 歌手：{singer_name}")

def Download(index):
    url = dic[index][1]
    id = url.split('/')[4]
    data_url = f'{g_http}/api/play_url?id={id}&json=1'
    response = requests.get(data_url, headers=headers).json()
    sava_url = response['data']['url']
    sava(sava_url, dic[index][0])

def sava(song_down, song_name):
    if not os.path.exists("./歌曲"):
        os.mkdir("./歌曲")

    response = requests.get(song_down, headers=headers).content
    with open(f"./歌曲/{song_name}.mp3", "wb") as f:
        f.write(response)
    print("下载成功")

if __name__ == '__main__':
    while (True):
        key = input("输入歌曲搜索关键词：")
        if key == "q":
            exit(0)
        ua = UserAgent().random
        headers = {
            "User-Agent": ua
        }
        dic = {}
        Menu(key)

        down_loop = True
        while (down_loop):
            key2 = input("输入下载歌曲序号：")
            if key2 == "q":
                exit(0)
            if key2 == "s":
                break
            Download(int(key2))

nowns · 发表于 2024-8-1 00:25

厉害厉害

p1nk · 发表于 2024-8-1 00:50

谢谢作者大大啦

zhilai · 发表于 2024-8-1 01:51

也许直接用python的线程？不需要一定要pyqt的线程吧。

huakai200 · 发表于 2024-8-1 04:40

我是个外行看不懂还是要感谢你分享出来

ccz · 发表于 2024-8-1 06:10

多谢楼主分享

xszraa · 发表于 2024-8-1 06:14

python运行代码显示缺少模块

zhufuan · 发表于 2024-8-1 06:41

老师，这个有exe程序吗，我不会py

jinghuasy001 · 发表于 2024-8-1 08:07

感谢作者的分享

帐号		自动登录	找回密码
密码			注册[Register]

[Python 原创] 简单做个爬虫下点歌听

免费评分