亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 7429 | 回復: 17
打印 上一主題 下一主題

[文本處理] 幫忙寫一個查找特定字符串的腳本 [復制鏈接]

論壇徽章:
0
跳轉到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2012-07-19 08:46 |只看該作者 |倒序瀏覽
我有文件1,有400MBytes,很大,里面格式為時間在內(nèi)容:
-----------文件1--------------
......
2012.07.08    this is an sample text
2012.06.04    find this string
2011.09.09    get this one
2001.10.18    thank you all
2001.06.14    find this string
2003.07.07    get this one
......
-------------------------

文件2里面存有我需要尋找的字符串,
-----------文件2-------------
find this string
get this one
-----------------------------

我需要一個腳本,能夠從文件1里面取得所有文件2中有的字符串的行,也就是
$腳本 文件1 文件2
最后能得到結果
-----------結果-------------
2012.06.04    find this string
2011.09.09    get this one
2001.06.14    find this string
2003.07.07    get this one
----------------------------
不知道像awk適合處理這么大的文件不?或者有誰能用perl幫我寫一個。謝謝大家了。

論壇徽章:
0
2 [報告]
發(fā)表于 2012-07-19 08:52 |只看該作者
  1. awk 'NR==FNR{array[$1]}NR>FNR{if(($2 in array)){print $0}}' f2 f1
復制代碼

論壇徽章:
0
3 [報告]
發(fā)表于 2012-07-19 08:58 |只看該作者
  1. grep -f file2 file1
復制代碼

論壇徽章:
0
4 [報告]
發(fā)表于 2012-07-19 09:07 |只看該作者
趕緊去試試,謝謝,等會反饋結果

論壇徽章:
5
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亞洲杯之朝鮮
日期:2015-03-13 22:47:33IT運維版塊每日發(fā)帖之星
日期:2016-01-09 06:20:00IT運維版塊每周發(fā)帖之星
日期:2016-03-07 16:27:44
5 [報告]
發(fā)表于 2012-07-19 09:20 |只看該作者
一條純grep命令就行了,不用寫腳本。:wink:

論壇徽章:
0
6 [報告]
發(fā)表于 2012-07-19 09:21 |只看該作者
還不行哦大家,grep的時候文件小是可以的,但是文件大了就顯示“”grep: Invalid range end“。

論壇徽章:
0
7 [報告]
發(fā)表于 2012-07-19 09:24 |只看該作者
回復 2# dahaoshanhe

這條命令有個問題,
比如文件1中有相同的,比如
2012.03.05    find    this string
2012.08.09    find    not this string

而文件2中為:
find     this string
這樣子它會把文件1兩句都匹配到,其實第二句是不要的
   

論壇徽章:
5
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亞洲杯之朝鮮
日期:2015-03-13 22:47:33IT運維版塊每日發(fā)帖之星
日期:2016-01-09 06:20:00IT運維版塊每周發(fā)帖之星
日期:2016-03-07 16:27:44
8 [報告]
發(fā)表于 2012-07-19 09:26 |只看該作者
回復 7# andloani

   幾百M,用grep沒有問題的。

    那哪些行要,哪些行不要,這得弄清楚啊。

論壇徽章:
0
9 [報告]
發(fā)表于 2012-07-19 09:33 |只看該作者
回復 8# blackold


    弄明白了,是因為文件2中有一些字符包含”-“這個符號,grep會把它識別是為范圍,怎么讓它不識別"-"呢?

論壇徽章:
0
10 [報告]
發(fā)表于 2012-07-19 09:37 |只看該作者
回復 7# andloani
  1. awk 'NR==FNR{array[$1" "$2" "$3]}NR>FNR{if(($2" "$3" "$4 in array)){print $0}}' f2 f1
復制代碼
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP