吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2201|回复: 21
收起左侧

[求助] Python统计单词个数

[复制链接]
judgecx 发表于 2019-12-18 17:33
Python统计单词个数我会实现我的问题是
我输入hello and boy girl 这些单词不被统计怎么写没什么思路

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

SuperCatCool 发表于 2019-12-18 17:41
先分割,再遍历,遍历时创建单词为key的字典,value为统计个数
MUTED 发表于 2019-12-18 17:47
问题没说清楚,是说输入这些单词应该被统计而你的代码跑出来没被统计,还是说你要实现这些单词不被统计?
0xkevin 发表于 2019-12-18 17:49
[Python] 纯文本查看 复制代码
def getText():
    txt = open("1.txt", "r").read()
    txt = txt.lower()
    for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
        txt = txt.replace(ch, " ")   #将文本中特殊字符替换为空格
    return txt

hamletTxt = getText()
words  = hamletTxt.split()
counts = {}
for word in words:			
    counts[word] = counts.get(word,0) + 1
items = list(counts.items())
items.sort(key=lambda x:x[1], reverse=True) 
for i in range(10):
    word, count = items[i]
    print ("{0:<10}{1:>5}".format(word, count))
rong1667 发表于 2019-12-18 17:55
[Python] 纯文本查看 复制代码
str_1='hello and boy girl'
str_1_list=str_1.split(' ')#以空格分隔
print(len(str_1_list))
kesai 发表于 2019-12-18 18:05
我在python电子书上看到过类似的,统计汉姆雷特里的单词
kesai 发表于 2019-12-18 18:06
本帖最后由 kesai 于 2019-12-18 18:11 编辑

[Python] 纯文本查看 复制代码
# @Description : 词频统计
def getText():
    txt = open('hamlet.txt', 'r').read()
    txt = txt.lower()
    for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
        txt = txt.replace(ch, " ")  # 将文本中特殊字符替换为空格
    return txt

def taleSecond(item):
        return item[1]


txt = getText()
words = txt.split()
counts = dict()
for word in words:
    counts[word] = counts.get(word, 0)+1
print(counts)
items = list(counts.items())
#items.sort(key=taleSecond,reverse=True)
items.sort(key=lambda x: x[1], reverse=True)

for i in range(0, 10):
        word, count = items[i]  # 数组赋值,我擦
        print('{0:<10}{1:>5}'.format(word,count))
 楼主| judgecx 发表于 2019-12-18 18:29
MUTED 发表于 2019-12-18 17:47
问题没说清楚,是说输入这些单词应该被统计而你的代码跑出来没被统计,还是说你要实现这些单词不被统计?

是我输入这些单词不要被统计! 不是我没跑出了
而是我不要统计这些单词
欧布奥特曼 发表于 2019-12-18 18:32
看来楼上的大大都解决了
kesai 发表于 2019-12-18 18:33
把不要统计的单词从统计结果里排除不就行啦
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 22:42

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表