吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1504|回复: 5
收起左侧

[求助] python

[复制链接]
吧啦哔哩啵 发表于 2020-11-25 21:25
从键盘输入一个中文字符串变量s,内部包含中文标点符号问题
问题1:用jieba分词,计算字符串s的中文词汇个数,不包括中文标点符号。显示输出分词后的结果,用“/”分割,以及中文词汇个数。示列如下:
输入:
不论是对数据进行挖掘还是建模,都离不开数据可视化的问题。
输出:
不论是//数据/进行/挖掘/还是/建模//离不开/数据/可视化//问题
中文词语个数:13
在此问题的基础上,统计分词后的词汇出现的次数,用字典结构保存。显示输出每个词汇出现的次数,以及出现次数最多的词汇。如果有多个词汇
出现的次数一样多,都要显示出来,实例如下:
不论是:1
对:1
数据:2
进行:1
挖掘:1
还是:1
建模:1
都:1
离不开:1
可视化:1
的:1
问题:1
出现最多的是(数据)2
求大佬解答,小白一枚,感激不尽

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

麦米尔加弗德 发表于 2020-11-25 22:13
这不是挺简单的吗、、、、、、、、首先你要知道各个模块怎么用,新手先把基础学好
prxor 发表于 2020-11-25 22:13
堂语尘 发表于 2020-11-25 22:16
YuerWang 发表于 2020-11-25 22:25
[Python] 纯文本查看 复制代码
import jieba
content="不论是对数据进行挖掘还是建模,都离不开数据可视化的问题。"
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~,。、 :':
    content = content.replace(ch, "")
spilt_content=jieba.lcut(content)
result={}
max=0
for item in spilt_content:
    if(item in result):
        result[item]=result[item]+1
    else:
        result[item]=1
for r in result:
    if(max in result):
        if (result[r] > result[max]):
            max = r
    else:
        max=r
    print(r+":"+str(result[r]))
print("出现最多的是("+max+"):"+str(result[max])+"次")


随便写的 对python也不熟,反正能跑
gongsui 发表于 2020-11-25 23:07
用'/'分割,然后取出现次数(应该有现成的库的,你百度下)
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 10:51

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表