pycharts实现数据可视化分析
本帖最后由 buluo533 于 2024-7-23 09:02 编辑既然前面也完成了某音评论区爬取,接下来用pycharts完成数据分析内容
比较简单的几个图表样式进行分析,大佬们仅供借鉴{:1_893:}
from pyecharts.charts import *
import pandas as pd
from pyecharts import options as opts
from pyecharts.globals import CurrentConfig
import jieba
from collections import Counter
CurrentConfig.ONLINE_HOST = "https://cdn.kesci.com/lib/pyecharts_assets/" # 提高加载速度
init_opts = opts.InitOpts(width="1200px", height="800px")
#读取文件,根据自己保存文件路径
datas = pd.read_excel('某音评论.xlsx')
#清洗空值
df = datas.dropna()
#计算评论区IP分布
ip_count = df['ip属地'].value_counts()
#利用unque函数生成列表
ip = df['ip属地'].unique().tolist()
#切割数据,根据年-月-日计算时间分布
df[['日期', '时间']] = df['时间'].str.split(' ', expand=True)
data_time = df['日期']
data_time_list = data_time.unique().tolist()
data_time_count = data_time.value_counts()
#根据个人需要设计停用词
stopwords = ['的', '了', '是', '在', '有', '和', '与', '一个', '这', '那', '他', '她', '我们', '你们', '它们', '1', '2',
'3', '6', ]
#jieba库分词
word = ))]
#计算词频
word_counts = Counter(word)
#过滤停用词
filtered_words = [(word, count) for word, count in word_counts.items() if word not in stopwords]
#生成词云图
wordcloud = (
WordCloud()
.add("", filtered_words, word_size_range=)
.set_global_opts(title_opts=opts.TitleOpts(title="评论区词云图"))
)
#生成饼状图
pie = (
Pie(init_opts=init_opts)
.add("ip分布", ,
radius=["40%", "75%"]
)
.set_global_opts(title_opts=opts.TitleOpts(title="评论区分布图"),
legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_right="2%")
)
)
#折线图
line = (
Line(init_opts)
.add_xaxis(data_time_list)
.add_yaxis('时间(年-月-日)', data_time_count)
.set_global_opts(
title_opts=opts.TitleOpts(title='活动时间分析'),
legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_left="2%")
)
)
#柱状图
bar=(
Bar()
.add_xaxis(data_time_list)
.add_yaxis('日期(年-月-日)',data_time_count.tolist())
.set_global_opts(
title_opts=opts.TitleOpts(title='柱状图')
)
)
#实例化page对象,用于页面布局
page = Page()
page.add(
wordcloud,
pie,
line,
bar
)
page.render('评论区.html') 图片奉上
buluo533 发表于 2024-7-23 09:55
还能改吗?忘加了
发布的原创是可以编辑修改的,只不过要重新走一遍审核,还有想请教一下,DrissionPage自动化爬取某音评论区https://www.52pojie.cn/thread-1946507-1-1.html
中的代码:https://www.douyin.com/aweme/v1/web/comment/list/?,这个是自己F12检查代码,替换成自己想要的采集的视频的是吧,昨晚测试了一下,替换了采集到的是空 不忘形影 发表于 2024-7-23 10:39
发布的原创是可以编辑修改的,只不过要重新走一遍审核,还有想请教一下,DrissionPage自动化爬取某音评论 ...
不是在这个位置修改需要采集的视频,这个https://www.douyin.com/aweme/v1/web/comment/list/?是抓到的他的数据接口,原理是通过数据接口的监听,拿到数据,直接在page.get()修改需要视频网址 这么流的吗 看不到效果图, 是因为没上传吗 正好我需要这个工具来显示 怎么不配个图 excel分享下吧,我看看怎么玩的 有效果图会更好 longhun 发表于 2024-7-23 09:42
excel分享下吧,我看看怎么玩的
上一篇的帖子生成的就是这个文件的excel 不忘形影 发表于 2024-7-23 09:44
有效果图会更好
还能改吗?忘加了{:1_936:} 优秀,拯救了最近做数据被可视化折磨的我