请教一个文本处理的方法!

2016-04-13 08:01:39 +08:00
 coolloves

有些文本内容如下: a1 b1 a1 c1 a1 d1 ... a2 b2 a2 c2 a2 d2 ......

每天大约有几百万条这种格式的日志,目前想处理下,把以下两条第二列的内容合并, a1 b1 a1 c1

做成以下格式的 a1 b1 c1 a1 d1 ...... a2 b2 c2 a2 d2 ......

有什么可行的办法呢.多谢大家

2031 次点击
所在节点    问与答
6 条回复
coolloves
2016-04-13 08:02:04 +08:00
换行怎么没打出来......
Devin
2016-04-13 08:45:39 +08:00
用 awk 应该可以
楼主 append 把问题描述清楚吧
coolloves
2016-04-13 09:11:01 +08:00
@Devin awk 我一般处理单行居多,如何合并特定的两行,我不太会
我目前是用 rsyslog 来做日志格式处理的,但是也是基于单行
clino
2016-04-13 09:15:19 +08:00
写几行 python 吧
irenicus
2016-04-13 09:32:00 +08:00
python 或者 perl
wvuu
2016-04-13 11:30:51 +08:00
awk '{if($2 != a){b=$3" "$4;c=1}else{print(c != 0)?$1" "$2" "b" "$3" "$4:$0;c=0}a=$2}'

这个命令只能按照你目前的格式处理,如果你的日志根这个格式不一样,结果会有问题。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/270608

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX