11 pass12 co
ls=line.
split(
\'t\')
13 if len(cols)<20:
14 continue15 n+=1
16 es=[]
17 #if cols[2].find(\'[\')!=-1 and cols[2].find(\']\')!=-1:
18 info=cols[2]
19 for i
in re.findall(r
\'[S+?]\',info.decode(
\'utf-8\')):
20 data=i[1:-1].encode(
\'utf-8\')
21 if d.has_key(data):
22 if cols[14]==
\'f\':
23 d[data][0]+=1
24 d[data][2]+=1
25 else:
26 d[data][1]+=1
27 d[data][2]+=1
28 else:
29 if cols[14]==
\'f\':
30 d[data]=[1,0,1]
31 else:
32 d[data]=[0,1,1]
33 print \'Total records num \'+str(n)
34 return d
35 pass36 def WriteDict(self):
37 d=self.
__collection()
38 f=open(
\'F:/keys.txt\',
\'w\')
39 for k
in d:
40 f.write(k+
\'t\')
41 f.write(str(d[k][0])+
\'t\')
42 f.write(str(d[k][1])+
\'t\')
43 f.write(str(d[k][2])+
\'n\')
44 f.close()
45 pass46 def Run(self):
47 self.WriteDict()
48 pass
脚本运行结果:

把结果放到EXCEL里面重新排序,得到如下结果:

至于怎么解读这个结果,有没有意义,各有各的想法
5、今晚才把正则认真看了一下,虽然很久之前就知道应该掌握正则表达式
6、没有写博客的习惯,写得难看见谅。
晚安