亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 5064 | 回復(fù): 4
打印 上一主題 下一主題

[文本處理] 使用awk模擬group by和count的問題 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2013-12-20 12:15 |只看該作者 |倒序?yàn)g覽
有一個(gè)文本如下:
1  A  1
2  B  2
3  C  1
4  D  1
5  E  3
6  A  2
7  B  1
8  C  2
9  D  3

第一個(gè)需求根據(jù)第二個(gè)字段進(jìn)行分組計(jì)算數(shù)量可以使用:
awk '{a[$2]+=1}END{for (i in a)print i,a[i]}' file

第二個(gè)需求根據(jù)第二個(gè)字段進(jìn)行分組并且字段3等于1:
awk '{if ($3 ==1){a[$2]+=1}{for (i in a)print i,a[i]}}' file

問題一:
現(xiàn)在想讓第二和第三個(gè)字段進(jìn)行分組后求和也就是最后生成的結(jié)果是:
A 1 1
A 2 1
B 2 1
B 1 1
C 1 1
C 2 1
D 1 1
D 3 1
E 3 1

問題二:
第一個(gè)需求和第二個(gè)需求可以合并成一條命令,并且只讀一次文本么?

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2013-12-20 12:22 |只看該作者
我知道第一個(gè)問題了
awk '{a[$2,$3]+=1}END{for (i in a)print i,a[i]}' file
就可以兩個(gè)同時(shí)分組了,最后打印的時(shí)候怎么拆分呢?

論壇徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16賽季CBA聯(lián)賽之北京
日期:2016-07-06 15:42:0715-16賽季CBA聯(lián)賽之同曦
日期:2016-06-12 10:38:0915-16賽季CBA聯(lián)賽之佛山
日期:2016-05-27 11:54:56黃金圣斗士
日期:2015-12-02 11:44:35白銀圣斗士
日期:2015-11-25 14:32:43白銀圣斗士
日期:2015-11-23 12:53:352015亞冠之布里斯班獅吼
日期:2015-10-21 16:55:482015亞冠之首爾
日期:2015-09-01 16:46:052015亞冠之德黑蘭石油
日期:2015-08-31 11:39:192015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-08-28 21:06:5315-16賽季CBA聯(lián)賽之廣東
日期:2016-07-12 14:58:53
3 [報(bào)告]
發(fā)表于 2013-12-20 12:26 |只看該作者
  1. awk '{s=1;a[$2]++}END{for(i in a)for(j=1;j<=a[i];j++)print i,j,s}' file   
復(fù)制代碼

論壇徽章:
32
處女座
日期:2013-11-20 23:41:20雙子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00處女座
日期:2014-07-22 17:30:47獅子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥豬
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58處女座
日期:2014-12-02 09:17:52程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-06-16 22:20:002015亞冠之塔什干火車頭
日期:2015-06-20 23:28:22
4 [報(bào)告]
發(fā)表于 2013-12-20 12:57 |只看該作者
本帖最后由 yestreenstars 于 2013-12-20 13:00 編輯

第一個(gè)需求:
  1. [root@localhost ~]# awk '{a[$2" "$3]++}END{while(++i<=asorti(a,b))print b[i],a[b[i]]}' i
  2. A 1 1
  3. A 2 1
  4. B 1 1
  5. B 2 1
  6. C 1 1
  7. C 2 1
  8. D 1 1
  9. D 3 1
  10. E 3 1
  11. [root@localhost ~]#
復(fù)制代碼
第二個(gè)需求:
  1. [root@localhost ~]# awk '{a[$2]++}$3=="1"{b[$2]++}END{for(i in a)print i,a[i],+b[i]}' i
  2. A 2 1
  3. B 2 1
  4. C 2 1
  5. D 2 1
  6. E 1 0
  7. [root@localhost ~]#
復(fù)制代碼

論壇徽章:
0
5 [報(bào)告]
發(fā)表于 2013-12-20 15:28 |只看該作者
謝謝,果然好用。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP