python
从键盘输入一个中文字符串变量s,内部包含中文标点符号问题问题1:用jieba分词,计算字符串s的中文词汇个数,不包括中文标点符号。显示输出分词后的结果,用“/”分割,以及中文词汇个数。示列如下:
输入:
不论是对数据进行挖掘还是建模,都离不开数据可视化的问题。
输出:
不论是/对/数据/进行/挖掘/还是/建模/都/离不开/数据/可视化/的/问题
中文词语个数:13
在此问题的基础上,统计分词后的词汇出现的次数,用字典结构保存。显示输出每个词汇出现的次数,以及出现次数最多的词汇。如果有多个词汇
出现的次数一样多,都要显示出来,实例如下:
不论是:1
对:1
数据:2
进行:1
挖掘:1
还是:1
建模:1
都:1
离不开:1
可视化:1
的:1
问题:1
出现最多的是(数据):2次求大佬解答,小白一枚,感激不尽 这不是挺简单的吗、、、、、、、、首先你要知道各个模块怎么用,新手先把基础学好 说实话这不是python语法练习题吗,发错区了吧 这是求解吗? import jieba
content="不论是对数据进行挖掘还是建模,都离不开数据可视化的问题。"
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~,。、 :':
content = content.replace(ch, "")
spilt_content=jieba.lcut(content)
result={}
max=0
for item in spilt_content:
if(item in result):
result=result+1
else:
result=1
for r in result:
if(max in result):
if (result > result):
max = r
else:
max=r
print(r+":"+str(result))
print("出现最多的是("+max+"):"+str(result)+"次")
随便写的 对python也不熟,反正能跑 用'/'分割,然后取出现次数(应该有现成的库的,你百度下)
页:
[1]