吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1162|回复: 40
收起左侧

[Python 原创] pycharts实现数据可视化分析

  [复制链接]
buluo533 发表于 2024-7-23 09:00
本帖最后由 buluo533 于 2024-7-23 09:02 编辑

[Python] 纯文本查看 复制代码
既然前面也完成了某音评论区爬取,接下来用pycharts完成数据分析内容
比较简单的几个图表样式进行分析,大佬们仅供借鉴{:1_893:}
[Python] 纯文本查看 复制代码
from pyecharts.charts import *
import pandas as pd
from pyecharts import options as opts
from pyecharts.globals import CurrentConfig
import jieba
from collections import Counter

CurrentConfig.ONLINE_HOST = "https://cdn.kesci.com/lib/pyecharts_assets/" # 提高加载速度
init_opts = opts.InitOpts(width="1200px", height="800px")

#读取文件,根据自己保存文件路径
datas = pd.read_excel('某音评论.xlsx')

#清洗空值
df = datas.dropna()

#计算评论区IP分布
ip_count = df['ip属地'].value_counts()

#利用unque函数生成列表
ip = df['ip属地'].unique().tolist()

#切割数据,根据年-月-日计算时间分布
df[['日期', '时间']] = df['时间'].str.split(' ', expand=True)
data_time = df['日期']
data_time_list = data_time.unique().tolist()
data_time_count = data_time.value_counts()

#根据个人需要设计停用词
stopwords = ['的', '了', '是', '在', '有', '和', '与', '一个', '这', '那', '他', '她', '我们', '你们', '它们', '1', '2',
'3', '6', ]

#jieba库分词
word = [i for i in jieba.cut(str(df['内容']))]

#计算词频
word_counts = Counter(word)

#过滤停用词
filtered_words = [(word, count) for word, count in word_counts.items() if word not in stopwords]

#生成词云图
wordcloud = (
WordCloud()
.add("", filtered_words, word_size_range=[20, 100])
.set_global_opts(title_opts=opts.TitleOpts(title="评论区词云图"))
)

#生成饼状图
pie = (
Pie(init_opts=init_opts)
.add("ip分布", [list(z) for z in zip(ip, ip_count)],
radius=["40%", "75%"]
)
.set_global_opts(title_opts=opts.TitleOpts(title="评论区分布图"),
legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_right="2%")
)

)

#折线图
line = (
Line(init_opts)
.add_xaxis(data_time_list)
.add_yaxis('时间(年-月-日)', data_time_count)
.set_global_opts(
title_opts=opts.TitleOpts(title='活动时间分析'),
legend_opts=opts.LegendOpts(orient="vertical", pos_top="15%", pos_left="2%")
)
)

#柱状图
bar=(
Bar()
.add_xaxis(data_time_list)
.add_yaxis('日期(年-月-日)',data_time_count.tolist())
.set_global_opts(
title_opts=opts.TitleOpts(title='柱状图')

)
)

#实例化page对象,用于页面布局
page = Page()
page.add(
wordcloud,
pie,
line,
bar
)
page.render('评论区.html')

免费评分

参与人数 4吾爱币 +9 热心值 +4 收起 理由
苏紫方璇 + 7 + 1 欢迎分析讨论交流,吾爱破解论坛有你更精彩!
vicmay + 1 + 1 我很赞同!
shengruqing + 1 我很赞同!
哈哈呵呵哒哒 + 1 + 1 向大佬膜拜

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| buluo533 发表于 2024-7-23 10:00
图片奉上

2.png
3.png
4.png
1.png
不忘形影 发表于 2024-7-23 10:39
buluo533 发表于 2024-7-23 09:55
还能改吗?忘加了

发布的原创是可以编辑修改的,只不过要重新走一遍审核,还有想请教一下,DrissionPage自动化爬取某音评论区https://www.52pojie.cn/thread-1946507-1-1.html
中的代码:https://www.douyin.com/aweme/v1/web/comment/list/?,这个是自己F12检查代码,替换成自己想要的采集的视频的是吧,昨晚测试了一下,替换了采集到的是空
 楼主| buluo533 发表于 2024-7-23 10:48
不忘形影 发表于 2024-7-23 10:39
发布的原创是可以编辑修改的,只不过要重新走一遍审核,还有想请教一下,DrissionPage自动化爬取某音评论 ...

不是在这个位置修改需要采集的视频,这个https://www.douyin.com/aweme/v1/web/comment/list/?是抓到的他的数据接口,原理是通过数据接口的监听,拿到数据,直接在page.get()修改需要视频网址
665544 发表于 2024-7-23 09:27
这么流的吗
tomliu 发表于 2024-7-23 09:34
看不到效果图, 是因为没上传吗
Lun0144 发表于 2024-7-23 09:39
正好我需要这个工具来显示
xmqxmq110 发表于 2024-7-23 09:41
怎么不配个图
longhun 发表于 2024-7-23 09:42
excel分享下吧,我看看怎么玩的
不忘形影 发表于 2024-7-23 09:44
有效果图会更好
 楼主| buluo533 发表于 2024-7-23 09:54
longhun 发表于 2024-7-23 09:42
excel分享下吧,我看看怎么玩的

上一篇的帖子生成的就是这个文件的excel
 楼主| buluo533 发表于 2024-7-23 09:55

还能改吗?忘加了
Don4R 发表于 2024-7-23 09:56
优秀,拯救了最近做数据被可视化折磨的我
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-24 14:04

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表