站長資訊網
        最全最豐富的資訊網站

        python統計單詞出現次數

        python統計單詞出現次數

        python統計單詞出現次數

        做單詞詞頻統計,用字典無疑是最合適的數據類型,單詞作為字典的key, 單詞出現的次數作為字典的 value,很方便地就記錄好了每個單詞的頻率,字典很像我們的電話本,每個名字關聯一個電話號碼。

        下面是具體的實現代碼,實現了從importthis.txt文件讀取單詞,并統計出現次數最多的5個單詞。

        # -*- coding:utf-8 -*- import io import re  class Counter:     def __init__(self, path):         """         :param path: 文件路徑         """         self.mapping = dict()         with io.open(path, encoding="utf-8") as f:             data = f.read()             words = [s.lower() for s in re.findall("w+", data)]             for word in words:                 self.mapping[word] = self.mapping.get(word, 0) + 1      def most_common(self, n):         assert n > 0, "n should be large than 0"         return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]  if __name__ == '__main__':     most_common_5 = Counter("importthis.txt").most_common(5)     for item in most_common_5:         print(item)

        執行效果:

        ('is', 10) ('better', 8) ('than', 8) ('the', 6) ('to', 5)

        贊(0)
        分享到: 更多 (0)
        網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
        主站蜘蛛池模板: 亚洲国产精品尤物yw在线| 国产精品videossex白浆| 成人免费精品网站在线观看影片| 99热这里只有精品在线| 国产成人精品日本亚洲直接 | 国产专区日韩精品欧美色| 国产精品成人无码久久久久久| 人妻少妇乱子伦精品| 3D动漫精品啪啪一区二区下载| 国产成人精品免费久久久久| 久久夜色精品国产亚洲av| 亚洲综合av永久无码精品一区二区| 熟妇人妻VA精品中文字幕| 99精品视频在线观看| 在线精品国产一区二区三区| 国产99精品久久| 日本一卡精品视频免费| 亚洲国产精品成人AV无码久久综合影院 | 第一福利永久视频精品| 麻豆成人久久精品二区三区免费| 色婷婷久久久SWAG精品| 久久久久久亚洲精品成人| 国产第一福利精品导航| 亚洲AV无码精品色午夜果冻不卡 | 国语精品一区二区三区| 久久亚洲国产午夜精品理论片| 国产午夜精品一本在线观看| 久久精品国产福利国产秒| 国产成人无码精品一区二区三区| 国产精品内射久久久久欢欢 | 国产精品无码av在线播放 | 亚洲国产精品专区在线观看| 久久夜色撩人精品国产| 久久噜噜久久久精品66| 精品亚洲一区二区三区在线观看| 亚洲AV日韩精品久久久久久久| 四虎国产精品免费久久| 老司机精品影院91| 无码人妻精品一区二| 亚洲精品午夜无码专区| 88久久精品无码一区二区毛片|