亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 2213 | 回復: 6
打印 上一主題 下一主題

關鍵詞重復行格式化輸出問題 [復制鏈接]

論壇徽章:
1
操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-04-01 06:20:00
跳轉到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2012-01-30 15:59 |只看該作者 |倒序瀏覽
有一個文本文件,樣式如下:
tab1        tab2        tab3
aa        ee        11
bb        ff        22
cc        gg        33
dd        hh        55
aa        ee        77
bb        ff        11
cc        gg        88
dd        hh        33
以第三列內容為關鍵詞,分離出關鍵詞重復的行;
上面的例子,有11,33兩個關鍵詞有重復行;
關鍵詞重復行11內容為:
aa        ee        11
bb        ff        11
和關鍵詞重復行33內容為:
cc        gg        33
dd        hh        33
然后輸出2個文本,11和33
11的格式為:
aa-bb
ee-ff
33的格式為:
cc-dd
gg-hh

如果用awk或者sek的話,該如何寫代碼?
非常感謝!
同時預祝大伙燈節(jié)愉快,歡樂吉祥。

論壇徽章:
1
2015亞冠之吉達阿赫利
日期:2015-09-09 16:42:38
2 [報告]
發(fā)表于 2012-01-30 16:30 |只看該作者
awk 'c[$3]++ {print a[$3]"-"$1"\n" b[$3]"-"$2 > $3} {a[$3]=$1;b[$3]=$2} ' file

論壇徽章:
1
操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-04-01 06:20:00
3 [報告]
發(fā)表于 2012-01-30 17:28 |只看該作者
非常感謝樓上的。對于英文字符的文本沒問題。
不過對于含有中文或者日文的文本就沒用了。是否可以修改?謝謝

論壇徽章:
1
2015亞冠之吉達阿赫利
日期:2015-09-09 16:42:38
4 [報告]
發(fā)表于 2012-01-30 17:36 |只看該作者
回復 3# fzfh
  1. cat file
  2. aa        ee        11
  3. bb        你        我
  4. cc        gg        33
  5. 他        你        我
  6. aa        ee        77
  7. bb        ff        11
  8. cc        gg        88
  9. dd        hh        33

  10. awk 'c[$3]++ {print a[$3]"-"$1"\n" b[$3]"-"$2 > $3} {a[$3]=$1;b[$3]=$2} '  file

  11. cat 我
  12. bb-他
  13. 你-你
復制代碼

論壇徽章:
1
操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-04-01 06:20:00
5 [報告]
發(fā)表于 2012-01-30 18:07 |只看該作者
哦。學習一下,如果原始文件為20列呢?
dragon23452345 該用戶已被刪除
6 [報告]
發(fā)表于 2012-01-31 11:16 |只看該作者
提示: 作者被禁止或刪除 內容自動屏蔽

論壇徽章:
1
操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-04-01 06:20:00
7 [報告]
發(fā)表于 2012-01-31 14:10 |只看該作者
有達人已經(jīng)提供了任意列數(shù),任意列號為關鍵詞的awk代碼,發(fā)上來以饗大家。
  1. awk -vkey=3 'NR==1{L=NF}{b[$key]++;for(i=1;i<=NF;i++)if(i!=key)a[i,$key]=a[i,$key]?a[i,$key]"-"$i:$i}END{for(i=1;i<=L;i++)for(j in b)if(b[j]>1 && i!=key)print a[i,j]>j}' file
復制代碼
通過key值來制定關鍵詞列號。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP