亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 4351 | 回復(fù): 13
打印 上一主題 下一主題

[文本處理] 請(qǐng)問對(duì)文本中重復(fù)的字段計(jì)數(shù)應(yīng)該如何處理?將計(jì)數(shù)的1,2,3在添加到該行最后 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2013-11-20 16:48 |只看該作者 |倒序?yàn)g覽
本帖最后由 qooweds 于 2013-11-20 16:49 編輯

我有一個(gè)csv文件,第三個(gè)字段是ip
我想在每行的末尾添加一個(gè)字段,代表該ip出現(xiàn)的次數(shù),
比如192.168.1.1在文中是第二次出現(xiàn),行尾就加上2

文本內(nèi)容類似為:
aa,bb,192.168.1.1,cc
dd,ee,192.168.1.2,ff
gg,hh,192.168.1.1,ii
jj,kk,192.168.1.3,ll

期待的結(jié)果為:
aa,bb,192.168.1.1,cc,1
dd,ee,192.168.1.2,ff,1
gg,hh,192.168.1.1,ii,2
jj,kk,192.168.1.3,ll,1

請(qǐng)問怎么處理好呢?
用sed還是awk好呢?

論壇徽章:
32
處女座
日期:2013-11-20 23:41:20雙子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00處女座
日期:2014-07-22 17:30:47獅子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥豬
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58處女座
日期:2014-12-02 09:17:52程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-06-16 22:20:002015亞冠之塔什干火車頭
日期:2015-06-20 23:28:22
2 [報(bào)告]
發(fā)表于 2013-11-20 16:52 |只看該作者
果斷用awk啦~
  1. [root@localhost ~]# awk -F, '{print $0","++a[$3]}' i
  2. aa,bb,192.168.1.1,cc,1
  3. dd,ee,192.168.1.2,ff,1
  4. gg,hh,192.168.1.1,ii,2
  5. jj,kk,192.168.1.3,ll,1
  6. [root@localhost ~]# cat i
  7. aa,bb,192.168.1.1,cc
  8. dd,ee,192.168.1.2,ff
  9. gg,hh,192.168.1.1,ii
  10. jj,kk,192.168.1.3,ll
  11. [root@localhost ~]#
復(fù)制代碼

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2013-11-20 16:53 |只看該作者
我自己用awk寫了下
cat test.csv | awk -F"," '{print $3","$1","$2","$4}' |sort |awk -F"," 'BEGIN{i=1}{y=x;x=$1;{if(x==y){i++;print $0","i}else{i=1;print $0","i}}}'

將ip放到第一列,然后sort,通過awk把計(jì)數(shù)打印到行尾,然后再用awk將ip打印的順序換回去,貌似很復(fù)雜...

論壇徽章:
1
2015亞冠之吉達(dá)阿赫利
日期:2015-09-09 16:42:38
4 [報(bào)告]
發(fā)表于 2013-11-20 16:53 |只看該作者
回復(fù) 1# qooweds
  1. awk -F, '{c[$3]++;print $0","c[$3]}'
復(fù)制代碼



   

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
5 [報(bào)告]
發(fā)表于 2013-11-20 16:55 |只看該作者
  1. awk 'BEGIN{FS=OFS=","}{print $0,++a[$3]}' urfile
復(fù)制代碼

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2013-11-20 16:57 |只看該作者
感謝大家!
懂了!
數(shù)組好方便

論壇徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16賽季CBA聯(lián)賽之北京
日期:2016-07-06 15:42:0715-16賽季CBA聯(lián)賽之同曦
日期:2016-06-12 10:38:0915-16賽季CBA聯(lián)賽之佛山
日期:2016-05-27 11:54:56黃金圣斗士
日期:2015-12-02 11:44:35白銀圣斗士
日期:2015-11-25 14:32:43白銀圣斗士
日期:2015-11-23 12:53:352015亞冠之布里斯班獅吼
日期:2015-10-21 16:55:482015亞冠之首爾
日期:2015-09-01 16:46:052015亞冠之德黑蘭石油
日期:2015-08-31 11:39:192015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-08-28 21:06:5315-16賽季CBA聯(lián)賽之廣東
日期:2016-07-12 14:58:53
7 [報(bào)告]
發(fā)表于 2013-11-20 17:07 |只看該作者
  1. awk 'BEGIN{FS=OFS=","}{print $0,++a[$3]}'
復(fù)制代碼

論壇徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
8 [報(bào)告]
發(fā)表于 2013-11-20 17:08 |只看該作者
  1. awk -F, '{a[$3]++;print $0,a[$3]}' 1
復(fù)制代碼

論壇徽章:
8
雙子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12處女座
日期:2013-09-23 11:43:14處女座
日期:2013-10-09 19:48:21獅子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13雙魚座
日期:2014-06-13 21:52:31
9 [報(bào)告]
發(fā)表于 2013-11-21 21:28 |只看該作者
來個(gè)perl的
  1. perl -F',' -lane 'print "$_,$h{$F[2]}" if ++$h{$F[2]}'
復(fù)制代碼
回復(fù) 1# qooweds


   

論壇徽章:
32
處女座
日期:2013-11-20 23:41:20雙子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00處女座
日期:2014-07-22 17:30:47獅子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥豬
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58處女座
日期:2014-12-02 09:17:52程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-06-16 22:20:002015亞冠之塔什干火車頭
日期:2015-06-20 23:28:22
10 [報(bào)告]
發(fā)表于 2013-11-21 21:45 |只看該作者
回復(fù) 9# kernel69
可以更短些:
  1. perl -F, -lane 'print $_.",".++$h{$F[2]}'
復(fù)制代碼
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP