亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 2617 | 回復(fù): 7
打印 上一主題 下一主題

130W的文件分類腳本求優(yōu)化 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2012-06-27 15:00 |只看該作者 |倒序?yàn)g覽
現(xiàn)有郵件備份大約130W以上的郵件,需要更具郵件內(nèi)發(fā)件人和收件人做分類,保存到不同的目錄下面。

目前使用所有郵件list和所有用戶list,用2個(gè)for做這個(gè)文件循環(huán)查詢。    第一個(gè)for是查郵件list,第二個(gè)for是查用戶list,因?yàn)橛脩魯?shù)畢竟少的多了。

然后發(fā)現(xiàn)4cor的cpu,其中只能使用到一個(gè)core,而且?guī)缀跽紳M了,其他3個(gè)空閑。 腳本無法重復(fù)運(yùn)行,系統(tǒng)響應(yīng)會(huì)很慢很慢。 目前跑了1天,只完成百分之幾的量。


求一下方法,如何能高效快速。。!

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2012-06-27 15:24 |只看該作者
本帖最后由 personball 于 2012-06-27 15:27 編輯

回復(fù) 1# very_99


    最多多開幾個(gè)進(jìn)程去后臺(tái)執(zhí)行,可以分割下待處理的資源,進(jìn)程對(duì)不同部分進(jìn)行處理

另外提醒下:循環(huán)體內(nèi)的代碼最好少涉及io,不然再怎么優(yōu)化代碼也會(huì)慢死,最好先提取一下文件關(guān)鍵信息,做完分類后再根據(jù)分類結(jié)果去做IO方面的事

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2012-06-27 15:49 |只看該作者
放后臺(tái)也無法并發(fā)運(yùn)行,單個(gè)cpu占用馬上100%  系統(tǒng)異常慢。
  1. for  所有郵件list文件
  2. do
  3.    for  所有用戶list
  4.      do  grep 發(fā)信用戶 如果在郵件內(nèi)容里  就 cp 到特定目錄

  5. done
  6. done
復(fù)制代碼

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2012-06-27 16:09 |只看該作者
1:這樣的邏輯比較難受,下面的awk的類似邏輯,讀一遍userlist,就可以了;
  1. awk 'BEGIN{while(getline<userlistfile){diretory[user]=xxxxx;}}{xxxxxxx}' maillist
復(fù)制代碼
2:還有就是2樓的建議,IO的操作最好可以集中完成,并且盡量的少;

論壇徽章:
0
5 [報(bào)告]
發(fā)表于 2012-06-27 16:24 |只看該作者
jils2013 發(fā)表于 2012-06-27 16:09
1:這樣的邏輯比較難受,下面的awk的類似邏輯,讀一遍userlist,就可以了;2:還有就是2樓的建議,IO的操作 ...




讀一遍的可以理解了。  遍歷一遍maillist,把發(fā)送的,接收的,CC, BCC 的都處理一下。 這樣比較好,

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2012-06-27 16:28 |只看該作者
一個(gè)郵件內(nèi) 發(fā)送人的好寫了。

收件人是多人的話,語句怎么搞?


收件人是多人時(shí)候,是在一行的 用;做間隔
cc是多人的時(shí)候, 是多行的。

論壇徽章:
0
7 [報(bào)告]
發(fā)表于 2012-06-27 16:40 |只看該作者
郵件內(nèi)內(nèi)容格式為:
  1. *************
  2. *****************
  3. From:= FSDFDSsdfxfsadffdsfdsf <sender@xxx.com>
  4. To:= <d@com;e@com:f@com>
  5. Cc:= <a@xxx.com>;
  6.          <b@xxx.com>
  7. ***************8
  8. *****************
  9. ***********88
復(fù)制代碼

論壇徽章:
2
白羊座
日期:2013-11-18 19:52:42辰龍
日期:2014-09-07 07:46:06
8 [報(bào)告]
發(fā)表于 2012-07-05 09:22 |只看該作者
把兩個(gè)for的完整代碼貼出來看看
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP