平臺(tái) 論壇博客文庫

› 論壇 › 程序設(shè)計(jì) › Shell › 在"大海里撈針"的perl腳本。

在"大海里撈針"的perl腳本。 [復(fù)制鏈接]

woodie

小富即安

論壇徽章:: 1

電梯直達(dá)

1樓 [收藏(0)] [報(bào)告]

發(fā)表于 2006-02-10 21:16 |只看該作者 |倒序?yàn)g覽

論壇里有網(wǎng)友問在一個(gè)有非常多很大文件的目錄中搜索的問題，顯然這時(shí)我們最關(guān)心的是性能的。你可能會(huì)說最好用C來做，不過在好的算法下shell的性能也許能夠滿足要求。這里我們假定我們要查找的東西只會(huì)出現(xiàn)一次。那么：
1.我們的程序應(yīng)該在找到匹配后放棄搜索其它文件；
2.由于文件的行數(shù)也很大，所以程序在找到匹配后退出當(dāng)前文件的搜索。
如果直接用shell來做，可能會(huì)碰到命令行長度或參數(shù)數(shù)目的限制問題，如果用xargs重新裝配命令行，也有些很難處理的麻煩。所以索性用perl寫了一個(gè)，請(qǐng)大家指正：

#!/usr/bin/perl
die "usage: $0 path pattern\n" unless @ARGV == 2;
($path, $pattern)=@ARGV;
$, = " ";
print $path;
opendir(DH, $path) or die "cannot open dir!";
while($file = readdir(DH)) {
next if (!open(FH, "./".$file));
while(<FH>) {
print $file, $1 if (m/($pattern)/);
if ($1) {
printf STDERR "found in %s line %d!\nexiting...\n", $file, $.;
exit 0; # change this to "next;" (no ") if you want to find in other files
}
}
close(FH);
}
closedir(DH);
print STDERR "not found.";
exit 1

復(fù)制代碼

討論：
1.如果要查找的東西不止會(huì)出現(xiàn)一次，但在每個(gè)文件中不會(huì)出現(xiàn)多次，那我們就得在其它文件中繼續(xù)搜索�？梢詫⑸厦婺_本中帶注釋的一行改為：

next;

復(fù)制代碼

2.如果在每個(gè)文件中也可能重復(fù)出現(xiàn)，那就沒辦法取巧了，只好將帶注釋的一行刪掉。你最好去用C寫個(gè)程序，或者找到其它特征在算法上提高查找的速度。

[ 本帖最后由 woodie 于 2006-2-10 21:20 編輯 ]

文庫|博客

使用正則表達(dá)式與lex實(shí)現(xiàn)詞法分析器
C語言的MIPS匯編實(shí)現(xiàn)（四）SWITCH
Requested init /linuxrc failed (error -2).
比較 csv 文件中數(shù)據(jù)差異
LMD ElPack v2019.7新版亮點(diǎn)：Transparent mode全新升級(jí)|附下載

dbcat

豐衣足食

論壇徽章:: 0

2樓 [報(bào)告]

發(fā)表于 2006-02-10 21:35 |只看該作者

原帖由 woodie 于 2006-2-10 21:16 發(fā)表
論壇里有網(wǎng)友問在一個(gè)有非常多很大文件的目錄中搜索的問題，顯然這時(shí)我們最關(guān)心的是性能的。你可能會(huì)說最好用C來做，不過在好的算法下shell的性能也許能夠滿足要求。這里我們假定我們要查找的東西只會(huì)出現(xiàn)一次。那 ...

哇...精品,精品
收藏

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫RadonDB知多少？

返回列表

Chinaunix › 論壇 › 程序設(shè)計(jì) › Shell › 在"大海里撈針"的perl腳本。

積分 0, 距離下一級(jí)還需積分

亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

在"大海里撈針"的perl腳本。 [復(fù)制鏈接]

在"大海里撈針"的perl腳本。 [復(fù)制鏈接]