buluo533 发表于 2024-7-23 09:00

pycharts实现数据可视化分析

本帖最后由 buluo533 于 2024-7-23 09:02 编辑

既然前面也完成了某音评论区爬取,接下来用pycharts完成数据分析内容
比较简单的几个图表样式进行分析,大佬们仅供借鉴{:1_893:}
from pyecharts.charts import *
import pandas as pd
from pyecharts import options as opts
from pyecharts.globals import CurrentConfig
import jieba
from collections import Counter

CurrentConfig.ONLINE_HOST = "https://cdn.kesci.com/lib/pyecharts_assets/" # 提高加载速度
init_opts = opts.InitOpts(width="1200px", height="800px")

#读取文件,根据自己保存文件路径
datas = pd.read_excel('某音评论.xlsx')

#清洗空值
df = datas.dropna()

#计算评论区IP分布
ip_count = df['ip属地'].value_counts()

#利用unque函数生成列表
ip = df['ip属地'].unique().tolist()

#切割数据,根据年-月-日计算时间分布
df[['日期', '时间']] = df['时间'].str.split(' ', expand=True)
data_time = df['日期']
data_time_list = data_time.unique().tolist()
data_time_count = data_time.value_counts()

#根据个人需要设计停用词
stopwords = ['的', '了', '是', '在', '有', '和', '与', '一个', '这', '那', '他', '她', '我们', '你们', '它们', '1', '2',
'3', '6', ]

#jieba库分词
word = ))]

#计算词频
word_counts = Counter(word)

#过滤停用词
filtered_words = [(word, count) for word, count in word_counts.items() if word not in stopwords]

#生成词云图
wordcloud = (
WordCloud()
.add("", filtered_words, word_size_range=)
.set_global_opts(title_opts=opts.TitleOpts(title="评论区词云图"))
)

#生成饼状图
pie = (
Pie(init_opts=init_opts)
.add("ip分布", ,
radius=["40%", "75%"]
)
.set_global_opts(title_opts=opts.TitleOpts(title="评论区分布图"),
legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_right="2%")
)

)

#折线图
line = (
Line(init_opts)
.add_xaxis(data_time_list)
.add_yaxis('时间(年-月-日)', data_time_count)
.set_global_opts(
title_opts=opts.TitleOpts(title='活动时间分析'),
legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_left="2%")
)
)

#柱状图
bar=(
Bar()
.add_xaxis(data_time_list)
.add_yaxis('日期(年-月-日)',data_time_count.tolist())
.set_global_opts(
title_opts=opts.TitleOpts(title='柱状图')

)
)

#实例化page对象,用于页面布局
page = Page()
page.add(
wordcloud,
pie,
line,
bar
)
page.render('评论区.html')

buluo533 发表于 2024-7-23 10:00

图片奉上

不忘形影 发表于 2024-7-23 10:39

buluo533 发表于 2024-7-23 09:55
还能改吗?忘加了

发布的原创是可以编辑修改的,只不过要重新走一遍审核,还有想请教一下,DrissionPage自动化爬取某音评论区https://www.52pojie.cn/thread-1946507-1-1.html
中的代码:https://www.douyin.com/aweme/v1/web/comment/list/?,这个是自己F12检查代码,替换成自己想要的采集的视频的是吧,昨晚测试了一下,替换了采集到的是空

buluo533 发表于 2024-7-23 10:48

不忘形影 发表于 2024-7-23 10:39
发布的原创是可以编辑修改的,只不过要重新走一遍审核,还有想请教一下,DrissionPage自动化爬取某音评论 ...

不是在这个位置修改需要采集的视频,这个https://www.douyin.com/aweme/v1/web/comment/list/?是抓到的他的数据接口,原理是通过数据接口的监听,拿到数据,直接在page.get()修改需要视频网址

665544 发表于 2024-7-23 09:27

这么流的吗

tomliu 发表于 2024-7-23 09:34

看不到效果图, 是因为没上传吗

Lun0144 发表于 2024-7-23 09:39

正好我需要这个工具来显示

xmqxmq110 发表于 2024-7-23 09:41

怎么不配个图

longhun 发表于 2024-7-23 09:42

excel分享下吧,我看看怎么玩的

不忘形影 发表于 2024-7-23 09:44

有效果图会更好

buluo533 发表于 2024-7-23 09:54

longhun 发表于 2024-7-23 09:42
excel分享下吧,我看看怎么玩的

上一篇的帖子生成的就是这个文件的excel

buluo533 发表于 2024-7-23 09:55

不忘形影 发表于 2024-7-23 09:44
有效果图会更好

还能改吗?忘加了{:1_936:}

Don4R 发表于 2024-7-23 09:56

优秀,拯救了最近做数据被可视化折磨的我
页: [1] 2 3 4 5
查看完整版本: pycharts实现数据可视化分析