[重发] python音乐可视化

bob666zxj 发表于 2024-7-23 11:49

本帖最后由 bob666zxj 于 2024-7-23 13:42 编辑

[重发]
由于本人账号原因，重新注册了一个账号，为了防止误会，本贴选用转载的方式
请不要在本帖下回复，评分，谢谢。

之前文章的链接已失效

MusicVisualizer 是一个基于 Python 的实时音乐可视化项目，旨在将音频数据转化为动态的视觉效果。通过结合 analyzer 库进行音乐分析和 pygame 库进行图形绘制，MusicVisualizer 能够实时显示音乐的声波和鼓点，使用户在听觉之外还能享受视觉上的盛宴。

项目原理
[*]
音乐分析：

[*]使用 analyzer 库对输入的音频文件进行分析。
[*]提取音频的关键特征，如声波形状和鼓点位置。
[*]实时处理音频数据，确保可视化效果与音乐同步。
[*]
图形绘制：

[*]利用 pygame 库创建一个图形窗口。
[*]在窗口中动态绘制声波形状，根据音频频谱的变化显示不同的视觉效果。
[*]通过鼓点检测，将鼓点转化为视觉上的高亮或其他特殊效果，增强音乐的节奏感。
项目特点
[*]实时处理：MusicVisualizer 能够实时分析音频并动态显示声波和鼓点，保证视觉效果与音频同步。
[*]直观界面：使用 pygame 提供简洁直观的图形界面，用户可以轻松观看音乐的可视化效果。
[*]高扩展性：项目结构清晰，代码模块化设计，便于扩展和定制新的可视化效果。

百度网盘：https://pan.baidu.com/s/1mDRjmq9aho3eyhoRp07oMA?pwd=1234
123云盘：https://www.123pan.com/s/RxBQjv-rXU8d.html
解压密码：52pojie

main.py
# 导入所需的模块和类
from AudioAnalyzer import * # 导入AudioAnalyzer类，用于音频分析
import random                # 导入random模块，用于生成随机数
import colorsys             # 导入colorsys模块，用于颜色系统转换

# 定义一个函数，生成随机颜色
def rnd_color():
# 使用random模块生成介于0到1之间的随机值作为色相（h）、饱和度（s）和亮度（l）
h, s, l = random.random(), 0.5 + random.random() / 2.0, 0.4 + random.random() / 5.0
# 将色相、亮度和饱和度从HLS色彩空间转换为RGB色彩空间，并将结果量化为整数，范围在0-255之间
return

# 创建一个AudioAnalyzer对象
analyzer = AudioAnalyzer()

filename="1.wav"

# 加载指定的音频文件进行分析
analyzer.load(filename) # 使用load方法加载音频文件

# 初始化 pygame
pygame.init()

# 获取显示信息对象
infoObject = pygame.display.Info()

# 设置屏幕宽度和高度
screen_w = int(infoObject.current_w/2)
screen_h = int(infoObject.current_w/2)

# 设置显示模式
screen = pygame.display.set_mode()

# 获取当前时间戳
t = pygame.time.get_ticks()
getTicksLastFrame = t

# 初始化时间计数器
timeCount = 0

# 初始化低音平均值和触发值
avg_bass = 0
bass_trigger = -30
bass_trigger_started = 0

# 设置最小和最大分贝值
min_decibel = -80
max_decibel = 80

# 设置圆的颜色
circle_color = (40, 40, 40)
# 设置多边形的默认颜色
polygon_default_color =
polygon_bass_color = polygon_default_color.copy()
polygon_color_vel =

# 初始化多边形列表和颜色
poly = []
poly_color = polygon_default_color.copy()

# 设置圆的中心位置
circleX = int(screen_w / 2)
circleY = int(screen_h/2)

# 设置圆的最小和最大半径及初始半径和速度
min_radius = 100
max_radius = 150
radius = min_radius
radius_vel = 0

# 定义不同频率组的范围和计数
bass = {"start": 50, "stop": 100, "count": 12}
heavy_area = {"start": 120, "stop": 250, "count": 40}
low_mids = {"start": 251, "stop": 2000, "count": 50}
high_mids = {"start": 2001, "stop": 4000, "count": 20}

# 频率组列表
freq_groups =

# 初始化条形图列表
bars = []

# 临时条形图列表
tmp_bars = []

# 初始化长度变量
length = 0

for group in freq_groups:# 遍历频率组

g = []# 初始化组列表

s = group["stop"] - group["start"]# 计算组的时间间隔

count = group["count"]# 获取组的计数

reminder = s % count# 计算时间间隔的余数

step = int(s / count)# 计算每步的时间间隔

rng = group["start"]# 获取组的起始时间

# 遍历 count 次
for i in range(count):

   # 初始化 arr 为 None
   arr = None

   # 如果 reminder 大于 0
   if reminder > 0:
         # 减少 reminder
         reminder -= 1
         # 生成一个数组，范围从 rng 到 rng + step + 2
         arr = np.arange(start=rng, stop=rng + step + 2)
         # 更新 rng
         rng += step + 3
   else:
         # 生成一个数组，范围从 rng 到 rng + step + 1
         arr = np.arange(start=rng, stop=rng + step + 1)
         # 更新 rng
         rng += step + 2

   # 将生成的数组添加到 g 中
   g.append(arr)

   # 增加 length
   length += 1

# 将 g 添加到 tmp_bars 中
tmp_bars.append(g)

# 计算每个条形图的角度间隔
angle_dt = 360/length

# 初始化角度
ang = 0

# 遍历临时条形图列表
for g in tmp_bars:
gr = []
# 遍历每个条形图中的元素
for c in g:
   # 添加一个旋转的音频条到图形列表中
   gr.append(
         RotatedAverageAudioBar(circleX+radius*math.cos(math.radians(ang - 90)), circleY+radius*math.sin(math.radians(ang - 90)), c, (255, 0, 255), angle=ang, width=8, max_height=370))
   # 更新角度
   ang += angle_dt

# 将生成的条形图列表添加到bars中
bars.append(gr)

# 加载音乐文件并播放
pygame.mixer.music.load(filename)
pygame.mixer.music.play(0)

running = True
while running:

avg_bass = 0
poly = []

# 获取当前时间戳
t = pygame.time.get_ticks()
deltaTime = (t - getTicksLastFrame) / 1000.0
getTicksLastFrame = t

timeCount += deltaTime

# 用指定的颜色填充屏幕
screen.fill(circle_color)

# 遍历所有事件
for event in pygame.event.get():
   # 如果事件类型是退出，则设置运行标志为False
   if event.type == pygame.QUIT:
         running = False

# 遍历所有的 bars
for b1 in bars:
   # 遍历 b1 中的每一个元素
   for b in b1:
         # 更新 b 的所有属性，包括时间增量、音乐播放位置和分析器
         b.update_all(deltaTime, pygame.mixer.music.get_pos() / 1000.0, analyzer)
for b in bars:
   avg_bass += b.avg

avg_bass /= len(bars)

# 如果平均低音值大于触发阈值
if avg_bass > bass_trigger:
   # 如果低音触发尚未开始
   if bass_trigger_started == 0:
         bass_trigger_started = pygame.time.get_ticks()
   # 如果低音触发持续时间超过2秒
   if (pygame.time.get_ticks() - bass_trigger_started)/1000.0 > 2:
         polygon_bass_color = rnd_color()
         bass_trigger_started = 0
   # 如果低音颜色尚未设置
   if polygon_bass_color is None:
         polygon_bass_color = rnd_color()
   # 计算新的半径
   newr = min_radius + int(avg_bass * ((max_radius - min_radius) / (max_decibel - min_decibel)) + (max_radius - min_radius))
   radius_vel = (newr - radius) / 0.15

   # 计算颜色变化速度
   polygon_color_vel = [(polygon_bass_color - poly_color)/0.15 for x in range(len(poly_color))]

# 如果半径大于最小半径
elif radius > min_radius:
   bass_trigger_started = 0# 初始化低音触发标志
   polygon_bass_color = None# 初始化多边形低音颜色
   radius_vel = (min_radius - radius) / 0.15# 计算半径变化速度
   polygon_color_vel = [(polygon_default_color - poly_color)/0.15 for x in range(len(poly_color))]# 计算多边形颜色变化速度

# 如果半径等于最小半径
else:
   bass_trigger_started = 0# 低音触发开始标志
   poly_color = polygon_default_color.copy()# 复制默认的多边形颜色
   polygon_bass_color = None# 多边形的低音颜色
   polygon_color_vel = # 多边形颜色的速度

   radius_vel = 0# 半径速度
   radius = min_radius# 最小半径

radius += radius_vel * deltaTime

# 更新多边形颜色的循环
for x in range(len(polygon_color_vel)):
   # 计算多边形颜色的新值，考虑颜色变化速度和时间增量
   value = polygon_color_vel*deltaTime + poly_color
   # 更新多边形的颜色
   poly_color = value

# 更新条形图位置和状态的循环
for b1 in bars:
   for b in b1:
         # 计算子弹的位置，基于圆心和半径以及子弹的角度
         b.x, b.y = circleX+radius*math.cos(math.radians(b.angle - 90)), circleY+radius*math.sin(math.radians(b.angle - 90))
         # 更新子弹的矩形区域
         b.update_rect()
         # 将子弹矩形区域的特定点添加到多边形中
         poly.append(b.rect.points)
         poly.append(b.rect.points)
# 绘制多边形
pygame.draw.polygon(screen, poly_color, poly)
# 绘制圆形
pygame.draw.circle(screen, circle_color, (circleX, circleY), int(radius))

pygame.display.flip()

pygame.quit()

AudioAnalyzer.py

import math

import matplotlib.pyplot as plt
import librosa.display
import numpy as np

import pygame

def bin_search(arr, target):
# 初始化中间索引、最小索引和最大索引
index = int(len(arr) / 2)
min_index = 0
max_index = len(arr) - 1
found = False

# 如果目标值小于数组最小值，返回0
if target < arr:
   return 0

# 如果目标值大于数组最大值，返回数组长度减1
if target > arr:
   return len(arr) - 1

# 循环直到找到目标值
while not found:

   # 如果最小索引接近数组末尾，返回数组长度减1
   if min_index == len(arr) - 2:
         return len(arr) - 1

   # 如果目标值在当前索引值和下一个索引值之间或等于当前索引值，返回当前索引
   if arr < target < arr or arr == target:
         return index

   # 如果当前索引值大于目标值，更新最大索引
   if arr > target:
         max_index = index
   else:
         # 否则更新最小索引
         min_index = index

   # 更新中间索引
   index = int((min_index + max_index) / 2)

def rotate(xy, theta):
# 通过旋转矩阵在二维平面上旋转点
cos_theta, sin_theta = math.cos(theta), math.sin(theta)

# 返回旋转后的坐标
return (
   xy * cos_theta - xy * sin_theta,
   xy * sin_theta + xy * cos_theta
)

def translate(xy, offset):
# 根据偏移量平移点
return xy + offset, xy + offset

def clamp(min_value, max_value, value):
# 将值限制在最小值和最大值之间
if value < min_value:
   return min_value

if value > max_value:
   return max_value

return value

class AudioAnalyzer:
# 音频分析器类，用于加载音频文件并进行频谱分析

def __init__(self):
   # 初始化类实例的属性
   self.frequencies_index_ratio = 0# 频率索引比率
   self.time_index_ratio = 0# 时间索引比率
   self.spectrogram = None# 频谱图，包含根据频率和时间索引的分贝值

def load(self, filename):
   # 加载音频文件并生成频谱图
   time_series, sample_rate = librosa.load(filename)# 从文件中获取音频信息

   # 获取包含根据频率和时间索引的幅度值的矩阵
   stft = np.abs(librosa.stft(time_series, hop_length=512, n_fft=2048*4))

   self.spectrogram = librosa.amplitude_to_db(stft, ref=np.max)# 将矩阵转换为分贝矩阵

   frequencies = librosa.core.fft_frequencies(n_fft=2048*4)# 获取频率数组

   # 获取时间周期数组
   times = librosa.core.frames_to_time(np.arange(self.spectrogram.shape), sr=sample_rate, hop_length=512, n_fft=2048*4)

   self.time_index_ratio = len(times)/times# 计算时间索引比率

   self.frequencies_index_ratio = len(frequencies)/frequencies# 计算频率索引比率

def show(self):
   # 显示频谱图
   librosa.display.specshow(self.spectrogram,
                              y_axis='log', x_axis='time')

   plt.title('spectrogram')
   plt.colorbar(format='%+2.0f dB')
   plt.tight_layout()
   plt.show()

def get_decibel(self, target_time, freq):
   # 根据给定的时间和频率获取分贝值
   return self.spectrogram

def get_decibel_array(self, target_time, freq_arr):
   # 根据给定的时间和频率数组获取分贝值数组
   arr = []

   for f in freq_arr:
         arr.append(self.get_decibel(target_time,f))

   return arr

class AudioBar:
# 初始化音频条的属性
def __init__(self, x, y, freq, color, width=50, min_height=10, max_height=100, min_decibel=-80, max_decibel=0):
   # 初始化音频分析器的基本属性
   self.x, self.y, self.freq = x, y, freq
   self.color = color
   self.width, self.min_height, self.max_height = width, min_height, max_height
   self.height = min_height
   self.min_decibel, self.max_decibel = min_decibel, max_decibel
   self.__decibel_height_ratio = (self.max_height - self.min_height)/(self.max_decibel - self.min_decibel)

# 更新音频条的高度
def update(self, dt, decibel):
   # 计算期望的高度，基于当前的音量和高度比例
   desired_height = decibel * self.__decibel_height_ratio + self.max_height
   # 计算速度，基于期望高度和当前高度的差异
   speed = (desired_height - self.height)/0.1
   # 更新当前高度，基于计算的速度和时间差
   self.height += speed * dt
   # 确保当前高度在最小和最大高度之间
   self.height = clamp(self.min_height, self.max_height, self.height)

# 在屏幕上渲染音频条
def render(self, screen):
   pygame.draw.rect(screen, self.color, (self.x, self.y + self.max_height - self.height, self.width, self.height))

class AverageAudioBar(AudioBar):
"""
继承自AudioBar类，用于表示音频条的平均值。
"""

def __init__(self, x, y, rng, color, width=50, min_height=10, max_height=100, min_decibel=-80, max_decibel=0):
   """
   初始化AverageAudioBar对象。

   参数:
         x (int): 音频条的x坐标。
         y (int): 音频条的y坐标。
         rng (range): 用于计算平均值的范围。
         color (str): 音频条的颜色。
         width (int): 音频条的宽度，默认为50。
         min_height (int): 音频条的最小高度，默认为10。
         max_height (int): 音频条的最大高度，默认为100。
         min_decibel (int): 最小分贝值，默认为-80。
         max_decibel (int): 最大分贝值，默认为0。
   """
   # 调用父类的初始化方法，传递相关参数
   super().__init__(x, y, 0, color, width, min_height, max_height, min_decibel, max_decibel)

   # 设置随机数生成器
   self.rng = rng

   # 初始化平均值为0
   self.avg = 0

def update_all(self, dt, time, analyzer):
   """
   更新音频条的平均值。

   参数:
         dt (float): 时间间隔。
         time (float): 当前时间。
         analyzer (AudioAnalyzer): 音频分析器对象。
   """
   # 初始化平均值为0
   self.avg = 0

   # 遍历范围中的每个元素，累加分析器获取的分贝值
   for i in self.rng:
         self.avg += analyzer.get_decibel(time, i)

   # 计算平均值
   self.avg /= len(self.rng)

   # 更新数据
   self.update(dt, self.avg)

class RotatedAverageAudioBar(AverageAudioBar):
# 继承自AverageAudioBar类，用于处理旋转的音频条

def __init__(self, x, y, rng, color, angle=0, width=50, min_height=10, max_height=100, min_decibel=-80, max_decibel=0):
   # 初始化方法，设置旋转音频条的属性
   super().__init__(x, y, 0, color, width, min_height, max_height, min_decibel, max_decibel)
   self.rng = rng
   self.rect = None
   self.angle = angle

def render(self, screen):
   # 在屏幕上绘制旋转音频条
   pygame.draw.polygon(screen, self.color, self.rect.points)

def render_c(self, screen, color):
   # 在屏幕上绘制旋转音频条，使用指定的颜色
   pygame.draw.polygon(screen, color, self.rect.points)

def update_rect(self):
   # 更新旋转音频条的矩形区域并旋转
   self.rect = Rect(self.x, self.y, self.width, self.height)
   self.rect.rotate(self.angle)

class Rect:
# 初始化矩形对象的属性
def __init__(self,x ,y, w, h):
   # 初始化矩形的坐标和尺寸
   self.x, self.y, self.w, self.h = x,y, w, h

   # 初始化点的列表
   self.points = []

   # 计算原点位置
   self.origin =
   # 计算偏移量
   self.offset = + x, self.origin + y]

   # 初始旋转角度为0
   self.rotate(0)

# 旋转矩形对象
def rotate(self, angle):
   # 计算旋转前的模板点
   template = [
         (-self.origin, self.origin),
         (-self.origin + self.w, self.origin),
         (-self.origin + self.w, self.origin - self.h),
         (-self.origin, self.origin - self.h)
   ]

   # 旋转模板点并应用偏移量
   self.points =

# 在屏幕上绘制矩形对象
def draw(self,screen):
   pygame.draw.polygon(screen, (255,255, 0), self.points)

fuqinggui 发表于 2024-7-23 12:30

感谢大佬分享

happylele531 发表于 2024-7-23 12:48

感谢分享，一直在找这样的软件

ACCSP 发表于 2024-7-23 13:11

感谢大佬，大佬牛批

arkizat 发表于 2024-7-23 13:31

感谢大佬分享

ldwb6666 发表于 2024-7-23 13:31

有解压密码？

ljjzone0915 发表于 2024-7-23 13:41

有点看不懂{:1_937:}

bob666zxj 发表于 2024-7-23 13:43

ldwb6666 发表于 2024-7-23 13:31
有解压密码？

解压密码：52pojie

happytonakai 发表于 2024-7-23 19:40

感谢分享，好评如潮

1434015845 发表于 2024-7-23 21:11

感谢大佬，下一个看看怎么样

页: [1] 2 3

吾爱破解 - 52pojie.cn's Archiver

[重发] python音乐可视化