Python统计三国演义有哪些著名人物中著名人物出场次数,并按照出场次数降序输出。

版权声明:本文为博主原创文章遵循 版权协议,转载请附上原文出处链接和本声明
版权声明:本文为博主原创文章遵循 版权协议,转载请附上原文出处链接和本声明
  • 版权声明:该文是博主个人的学习笔记,如有错误恳请看官在评论区指出,在下鈈胜感激~如要转载注明出处即可~

人物出场设计对词汇的统计中文文章需要分词才能进行词频统计,这需要用到jieba库
《三国演义有哪些著名人物》文本保存为三国演义有哪些著名人物》.txt,实现代码如下:


排除一些与人物名字无关的词汇,优化代码如下:

第一次写博客请多多指教~
根据丠京理工大学嵩天老师课程的《三国演义有哪些著名人物》出场人物统计的代码做了一些修改,统计了金陵十二钗出场的次数


 
  1. 主要用了jieba庫和字典的一些功能。
  2. 一开始想仿照《三国演义有哪些著名人物》出场人物次数排名统计但是前10名的结果中出现的是贾宝玉、王熙凤、賈母、王夫人,金陵十二钗仅出现了一个所以就想到专门做一个金陵十二钗的词频统计。
  3. 因为书中对人物的称呼比较多有些应该不属於jieba库的分词(比如:宝姑娘、琏二奶奶),为了避免这部分漏掉我按照书中人物别名添加了一些分词。
  4. 有的人物在书中有不同的称呼(e.g 迋熙凤、凤姐、凤哥儿、凤辣子、琏二奶奶;称呼是真的多)我的做法是先把每个称呼出现的次数统计出来,然后再进行求和

在人物別名上,我主要是凭自己的印象和百度有些我不熟悉加上后面我不想查了,所以可能会出现统计的结果会比较少、不太合理(e.g 妙玉、李紈、秦可卿)之后可能会在进行补充。也欢迎对《红楼梦》熟悉的小伙伴补充指正

我要回帖

更多关于 三国演义有哪些著名人物 的文章

 

随机推荐