python

吧啦哔哩啵 发表于 2020-11-25 21:25

从键盘输入一个中文字符串变量s，内部包含中文标点符号问题
问题1：用jieba分词，计算字符串s的中文词汇个数，不包括中文标点符号。显示输出分词后的结果，用“/”分割，以及中文词汇个数。示列如下：
输入：
不论是对数据进行挖掘还是建模，都离不开数据可视化的问题。
输出：
不论是/对/数据/进行/挖掘/还是/建模/都/离不开/数据/可视化/的/问题
中文词语个数：13
在此问题的基础上，统计分词后的词汇出现的次数，用字典结构保存。显示输出每个词汇出现的次数，以及出现次数最多的词汇。如果有多个词汇
出现的次数一样多，都要显示出来，实例如下：
不论是：1
对：1
数据：2
进行：1
挖掘：1
还是：1
建模：1
都：1
离不开：1
可视化：1
的：1
问题：1
出现最多的是(数据)：2次求大佬解答，小白一枚，感激不尽

麦米尔加弗德 发表于 2020-11-25 22:13

这不是挺简单的吗、、、、、、、、首先你要知道各个模块怎么用，新手先把基础学好

prxor 发表于 2020-11-25 22:13

说实话这不是python语法练习题吗，发错区了吧

堂语尘 发表于 2020-11-25 22:16

这是求解吗？

YuerWang 发表于 2020-11-25 22:25

import jieba
content="不论是对数据进行挖掘还是建模，都离不开数据可视化的问题。"
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~，。、：':
content = content.replace(ch, "")
spilt_content=jieba.lcut(content)
result={}
max=0
for item in spilt_content:
if(item in result):
   result=result+1
else:
   result=1
for r in result:
if(max in result):
   if (result > result):
         max = r
else:
   max=r
print(r+":"+str(result))
print("出现最多的是（"+max+"）："+str(result)+"次")

随便写的对python也不熟，反正能跑

gongsui 发表于 2020-11-25 23:07

用'/'分割，然后取出现次数（应该有现成的库的，你百度下）

页: [1]

吾爱破解 - 52pojie.cn's Archiver

python