亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
123下一頁
最近訪問板塊 發(fā)新帖
查看: 45410 | 回復: 21
打印 上一主題 下一主題

[文本處理] 麻煩大神給寫個匹配代碼,謝謝! [復制鏈接]

論壇徽章:
31
程序設計版塊每日發(fā)帖之星
日期:2016-02-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-20 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-26 06:20:00每日論壇發(fā)貼之星
日期:2016-07-26 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-27 06:20:00每日論壇發(fā)貼之星
日期:2016-07-27 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-28 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-29 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-02 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-08 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-09 06:20:00
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2016-08-05 17:41 |只看該作者 |倒序瀏覽


a.txt及 b.txt兩個源文檔

a.txt
  1. 123456789
  2. 234567890
  3. 345678901
  4. 456789012
  5. 112233445566
  6. 111222333444
  7. 222233335555
復制代碼
b.txt
  1. 1234567
  2. 2345678
  3. 3456789
  4. 4567890
復制代碼
要求:a文檔中的每一行的前7位必須匹配b文檔

輸出結(jié)果:
  1. 123456789
  2. 234567890
  3. 345678901
  4. 456789012
復制代碼
謝謝大神





論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發(fā)貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯(lián)賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發(fā)帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯(lián)賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯(lián)賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯(lián)賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯(lián)賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯(lián)賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發(fā)帖之星
日期:2016-01-27 06:20:00每日論壇發(fā)貼之星
日期:2015-12-28 06:20:00
2 [報告]
發(fā)表于 2016-08-05 17:58 |只看該作者
  1. awk '
  2. BEGIN{
  3.   while(getline < "b.txt"){
  4.     len = length($1);
  5.     lens[len];
  6.     if(len == 0) continue;
  7.     full[$1];
  8.     if(min == "" || min > len) min = len;
  9.     if(max == "" || max < len) max = len;
  10.   }
  11.   #print "min="min,"max="max
  12.   if(min >= 1){
  13.     for(n in full){
  14.       key = substr(n,1, min-1);
  15.       part[key]
  16.     }
  17.   }
  18. }
  19. {
  20.   key = substr($0,1,min-1);
  21.   if(key in part){
  22.     for(n=min;n<=max;n++){
  23.       if(n in lens){
  24.         key = substr($0,1,n);
  25.         if(key in full){
  26.           print $0;
  27.           next;
  28.         }
  29.       }
  30.     }
  31.   }
  32. }'
復制代碼

論壇徽章:
2
luobin
日期:2016-06-17 17:46:36lufei
日期:2016-06-17 17:49:16
3 [報告]
發(fā)表于 2016-08-05 18:02 |只看該作者
grep -f b.txt a.txt   

論壇徽章:
31
程序設計版塊每日發(fā)帖之星
日期:2016-02-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-20 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-26 06:20:00每日論壇發(fā)貼之星
日期:2016-07-26 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-27 06:20:00每日論壇發(fā)貼之星
日期:2016-07-27 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-28 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-29 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-02 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-08 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-09 06:20:00
4 [報告]
發(fā)表于 2016-08-05 18:09 |只看該作者


回復 2# Windows19
回復 3# hz_oracle



辛苦了,大神

手似流水啊,神速

謝謝

馬上實戰(zhàn)去

論壇徽章:
307
程序設計版塊每周發(fā)帖之星
日期:2016-04-08 00:41:33操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-09-02 06:20:00每日論壇發(fā)貼之星
日期:2015-09-02 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-04 06:20:00每日論壇發(fā)貼之星
日期:2015-09-04 06:20:00每周論壇發(fā)貼之星
日期:2015-09-06 22:22:00程序設計版塊每日發(fā)帖之星
日期:2015-09-09 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-19 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-20 06:20:00每日論壇發(fā)貼之星
日期:2015-09-20 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-22 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-09-24 06:20:00
5 [報告]
發(fā)表于 2016-08-05 19:17 |只看該作者
3樓方法 簡單易行 效率高!

論壇徽章:
31
程序設計版塊每日發(fā)帖之星
日期:2016-02-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-20 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-26 06:20:00每日論壇發(fā)貼之星
日期:2016-07-26 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-27 06:20:00每日論壇發(fā)貼之星
日期:2016-07-27 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-28 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-29 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-02 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-08 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-09 06:20:00
6 [報告]
發(fā)表于 2016-08-05 20:09 |只看該作者
本帖最后由 bmne 于 2016-08-05 20:10 編輯

回復 5# sunzhiguolu



大神好

正要來回報呢

a.txt    100M左右     b.txt  5M 左右

二樓大神的代碼,速度飛馳,不到1分鐘吧

三樓大神的代碼,比較不動,死機了。內(nèi)存全吃干凈


我正在找原因。重新啟動電腦。我再試。感覺不可能效率差這么多

數(shù)據(jù)結(jié)果的準確性我還沒法下結(jié)論







   

論壇徽章:
30
申猴
日期:2014-04-10 09:43:532015年亞洲杯紀念徽章
日期:2015-03-20 14:40:232015亞冠之阿爾納斯爾
日期:2015-06-02 18:59:042015亞冠之阿爾希拉爾
日期:2015-06-30 15:22:572015亞冠之大阪鋼巴
日期:2015-07-20 10:44:332015亞冠之阿爾納斯爾
日期:2015-10-28 14:57:5215-16賽季CBA聯(lián)賽之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16賽季CBA聯(lián)賽之山西
日期:2016-07-25 21:54:2715-16賽季CBA聯(lián)賽之北京
日期:2016-10-27 12:07:2315-16賽季CBA聯(lián)賽之八一
日期:2017-07-07 16:39:0915-16賽季CBA聯(lián)賽之吉林
日期:2017-09-04 12:14:43
7 [報告]
發(fā)表于 2016-08-05 20:45 |只看該作者
  1. awk 'FNR==NR{a[substr($0,1,7)]=$0;next}{print a[$0]}' a.txt b.txt
復制代碼
回復 6# bmne


   

論壇徽章:
31
程序設計版塊每日發(fā)帖之星
日期:2016-02-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-20 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-26 06:20:00每日論壇發(fā)貼之星
日期:2016-07-26 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-27 06:20:00每日論壇發(fā)貼之星
日期:2016-07-27 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-28 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-29 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-02 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-08 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-09 06:20:00
8 [報告]
發(fā)表于 2016-08-05 20:57 |只看該作者
回復 7# zxy877298415


大神,再看看你的代碼

我提取出來的數(shù)據(jù)太少了,請再看看

辛苦

   

論壇徽章:
31
程序設計版塊每日發(fā)帖之星
日期:2016-02-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-20 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-26 06:20:00每日論壇發(fā)貼之星
日期:2016-07-26 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-27 06:20:00每日論壇發(fā)貼之星
日期:2016-07-27 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-28 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-07-29 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-02 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-06 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-08 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-08-09 06:20:00
9 [報告]
發(fā)表于 2016-08-05 21:13 |只看該作者
回復 3# hz_oracle


大神,請重新調(diào)整下代碼

兩次了,強行關(guān)機。否則,死機狀態(tài)

辛苦


   

論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發(fā)貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯(lián)賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發(fā)帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯(lián)賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯(lián)賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯(lián)賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯(lián)賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯(lián)賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發(fā)帖之星
日期:2016-01-27 06:20:00每日論壇發(fā)貼之星
日期:2015-12-28 06:20:00
10 [報告]
發(fā)表于 2016-08-05 21:44 |只看該作者
回復 9# bmne
  1. grep -Ff b.txt a.txt
復制代碼
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP