Linux安全网 - Linux操作系统_Linux 命令_Linux教程_Linux黑客

会员投稿 投稿指南 本期推荐:
搜索:
您的位置: Linux安全网 > Linux编程 > » 正文

Python 新浪微博 各种表情使用频率(2)

来源: 未知 分享至:

11 pass
12 cols=line.split(\'t\')
13 if len(cols)<20:
14 continue
15 n+=1
16 es=[]
17 #if cols[2].find(\'[\')!=-1 and cols[2].find(\']\')!=-1:
18 info=cols[2]
19 for i in re.findall(r\'[S+?]\',info.decode(\'utf-8\')):
20 data=i[1:-1].encode(\'utf-8\')
21 if d.has_key(data):
22 if cols[14]==\'f\':
23 d[data][0]+=1
24 d[data][2]+=1
25 else:
26 d[data][1]+=1
27 d[data][2]+=1
28 else:
29 if cols[14]==\'f\':
30 d[data]=[1,0,1]
31 else:
32 d[data]=[0,1,1]
33 print \'Total records num \'+str(n)
34 return d
35 pass
36 def WriteDict(self):
37 d=self.__collection()
38 f=open(\'F:/keys.txt\',\'w\')
39 for k in d:
40 f.write(k+\'t\')
41 f.write(str(d[k][0])+\'t\')
42 f.write(str(d[k][1])+\'t\')
43 f.write(str(d[k][2])+\'n\')
44 f.close()
45 pass
46 def Run(self):
47 self.WriteDict()
48 pass

脚本运行结果:

\"\"
把结果放到EXCEL里面重新排序,得到如下结果:

\"\"
至于怎么解读这个结果,有没有意义,各有各的想法

5、今晚才把正则认真看了一下,虽然很久之前就知道应该掌握正则表达式

6、没有写博客的习惯,写得难看见谅。

晚安


Tags:
分享至:
最新图文资讯
1 2 3 4 5 6
验证码:点击我更换图片 理智评论文明上网,拒绝恶意谩骂 用户名:
关于我们 - 联系我们 - 广告服务 - 友情链接 - 网站地图 - 版权声明 - 发展历史