天堂8中文在线最新版官网,亚洲av日韩精品久久久久久久

論壇徽章:: 0

電梯直達

1樓 [收藏(0)] [報告]

發(fā)表于 2012-07-19 08:46 |只看該作者 |倒序瀏覽

我有文件1，有400MBytes，很大，里面格式為時間在內(nèi)容：
-----------文件1--------------
......
2012.07.08 this is an sample text
2012.06.04 find this string
2011.09.09 get this one
2001.10.18 thank you all
2001.06.14 find this string
2003.07.07 get this one
......
-------------------------

文件2里面存有我需要尋找的字符串,
-----------文件2-------------
find this string
get this one
-----------------------------

我需要一個腳本，能夠從文件1里面取得所有文件2中有的字符串的行，也就是
$腳本文件1 文件2
最后能得到結果
-----------結果-------------
2012.06.04 find this string
2011.09.09 get this one
2001.06.14 find this string
2003.07.07 get this one
----------------------------
不知道像awk適合處理這么大的文件不？或者有誰能用perl幫我寫一個。謝謝大家了。

文庫|博客

使用正則表達式與lex實現(xiàn)詞法分析器
C語言的MIPS匯編實現(xiàn)（四）SWITCH
Requested init /linuxrc failed (error -2).
比較 csv 文件中數(shù)據(jù)差異
LMD ElPack v2019.7新版亮點：Transparent mode全新升級|附下載

dahaoshanhe

小富即安

論壇徽章:: 0

2樓 [報告]

發(fā)表于 2012-07-19 08:52 |只看該作者

awk 'NR==FNR{array[$1]}NR>FNR{if(($2 in array)){print $0}}' f2 f1

復制代碼

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

jiejie455

稍有積蓄

論壇徽章:: 0

3樓 [報告]

發(fā)表于 2012-07-19 08:58 |只看該作者

grep -f file2 file1

復制代碼

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

andloani

白手起家

論壇徽章:: 0

4樓 [報告]

發(fā)表于 2012-07-19 09:07 |只看該作者

趕緊去試試，謝謝，等會反饋結果

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

blackold

大富大貴

論壇徽章:: 5

5樓 [報告]

發(fā)表于 2012-07-19 09:20 |只看該作者

一條純grep命令就行了，不用寫腳本。:wink:

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

andloani

白手起家

論壇徽章:: 0

6樓 [報告]

發(fā)表于 2012-07-19 09:21 |只看該作者

還不行哦大家，grep的時候文件小是可以的，但是文件大了就顯示“”grep: Invalid range end“。

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

andloani

白手起家

論壇徽章:: 0

7樓 [報告]

發(fā)表于 2012-07-19 09:24 |只看該作者

回復 2# dahaoshanhe

這條命令有個問題，
比如文件1中有相同的，比如
2012.03.05 find this string
2012.08.09 find not this string

而文件2中為：
find this string
這樣子它會把文件1兩句都匹配到，其實第二句是不要的