数据结构课程设计,利用Hash技术统计C源程序中关键字的频度:扫描一个C源程序,用Hash表存储该程序中出现的关键字,并统计该程序中的关键字出现的度。用线性探测法解决Hash冲突。设Hash函数为:Hash(Key)=[(Key的首字母序号)*100+(Key的尾字母序号)] Mod 41。关键字39个。
对字符串列表进行数据频度统计,并且进行排名,选出前几名
import numpy as np
li = ['cc','aa','cc','bb','aa','cc','cc','aa','cc','##','##','##']
uni = np.unique(li) # 唯一值
dic = dict((a, li.count(a)) for a in uni) # 以字典格式来显示数据频度
print(dic.items())
结果:
dict_items([('##', 3), ('aa'