- 論壇徽章:
- 0
|
本帖最后由 C307307 于 2011-05-15 15:16 編輯
回復 10# Shell_HAT
其實是對文本進行操作,對源文件的內容每一行添加兩個字段,寫入到新文件,但新文件不能超過指定大小。
判斷是否超標是在寫完后的,因為在每行寫入后去判斷肯定會影響速度。所以直接在文件寫完后,split下。
這樣的文件有10個
i=1
while i<=10
do
awk生成新的文件。
split新文件
……
i++
done
舉例:
file_0001.dat,file2_0002.dat,……,file_0010.dat,每個文件的大小為45M,但要求生成的文件大小不能超過 10M(這個不定):
file_0001.dat有45M,則要分成5個文件,分別為 new_file_0001.dat,newfile_0002.dat,……,newfile_0005.dat,不管newfile_0005.dat是否
到達10M,file_0002.dat必須從newfile_0006.dat開始分割。所以最后肯定會生成50個文件,
文件從newfile_0001.dat到newfile_0050.dat.
文件序號如何連續(xù) 0001.dat到0050.dat??
要求速度快額 |
|