吧啦哔哩啵 发表于 2020-11-25 21:25

python

从键盘输入一个中文字符串变量s,内部包含中文标点符号问题
问题1:用jieba分词,计算字符串s的中文词汇个数,不包括中文标点符号。显示输出分词后的结果,用“/”分割,以及中文词汇个数。示列如下:
输入:
不论是对数据进行挖掘还是建模,都离不开数据可视化的问题。
输出:
不论是/对/数据/进行/挖掘/还是/建模/都/离不开/数据/可视化/的/问题
中文词语个数:13
在此问题的基础上,统计分词后的词汇出现的次数,用字典结构保存。显示输出每个词汇出现的次数,以及出现次数最多的词汇。如果有多个词汇
出现的次数一样多,都要显示出来,实例如下:
不论是:1
对:1
数据:2
进行:1
挖掘:1
还是:1
建模:1
都:1
离不开:1
可视化:1
的:1
问题:1
出现最多的是(数据):2次求大佬解答,小白一枚,感激不尽

麦米尔加弗德 发表于 2020-11-25 22:13

这不是挺简单的吗、、、、、、、、首先你要知道各个模块怎么用,新手先把基础学好

prxor 发表于 2020-11-25 22:13

说实话这不是python语法练习题吗,发错区了吧

堂语尘 发表于 2020-11-25 22:16

这是求解吗?

YuerWang 发表于 2020-11-25 22:25

import jieba
content="不论是对数据进行挖掘还是建模,都离不开数据可视化的问题。"
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~,。、 :':
    content = content.replace(ch, "")
spilt_content=jieba.lcut(content)
result={}
max=0
for item in spilt_content:
    if(item in result):
      result=result+1
    else:
      result=1
for r in result:
    if(max in result):
      if (result > result):
            max = r
    else:
      max=r
    print(r+":"+str(result))
print("出现最多的是("+max+"):"+str(result)+"次")

随便写的 对python也不熟,反正能跑

gongsui 发表于 2020-11-25 23:07

用'/'分割,然后取出现次数(应该有现成的库的,你百度下)
页: [1]
查看完整版本: python