- 論壇徽章:
- 0
|
本帖最后由 fikong2005 于 2011-05-17 16:41 編輯
目前需要準(zhǔn)實(shí)時的對文件進(jìn)行處理,然后入庫,因?yàn)閿?shù)據(jù)庫性能已經(jīng)不堪重負(fù),因此在入庫前對數(shù)據(jù)進(jìn)行文件級別的過濾。
整個控制流程采用perl,但是對文件進(jìn)行過濾是最耗時的工作,因此想問一下大蝦門,采用shell,sed,awk和perl哪種對文本處理的性能會強(qiáng)悍一點(diǎn)。
主要的過濾功能如下:
A文件是詳單(大概2G左右),B文件是維度(幾十M),A文件根據(jù)B文件里面不存在的維度進(jìn)行過濾。
如:
A文件:
A,DFSFD,FWFDG,DFSFDS
B,FDSFD,FSDFDS,FDSFER
C,FDSDRR,FDSDRG,DFDW
D,DRFSDR,FWRG,FDWRRD
B文件:
A
B
則過濾后,僅剩下:
A,DFSFD,FWFDG,DFSFDS
B,FDSFD,FSDFDS,FDSFER
請?zhí)峁┮幌滦阅茏顑?yōu)的核心代碼,謝謝;) |
|