亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
最近訪問(wèn)板塊 發(fā)新帖
查看: 3528 | 回復(fù): 7
打印 上一主題 下一主題

[文本處理] 多文件排序 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2013-10-18 11:26 |只看該作者 |倒序?yàn)g覽
有四個(gè)有序文件(文件較大),要把他們合并成一個(gè)有序文件,應(yīng)該怎么做?

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
2 [報(bào)告]
發(fā)表于 2013-10-18 11:31 |只看該作者
[root@ tmp]# cat file1
a
b
c
[root@ tmp]# cat file2
h
i
j
[root@ tmp]# cat file3
d
e
f
[root@ tmp]# cat file4
x
y
z
[root@ tmp]# cat file[1-4] | sort
a
b
c
d
e
f
h
i
j
x
y
z

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2013-10-18 11:34 |只看該作者
回復(fù) 2# Shell_HAT

這樣做太慢了,沒(méi)有利用到原文件有序這個(gè)特性
A
B
C
D
從算法上看,可以依次讀出A B C D的每一行,把最小的輸出,最小的文件再讀一行,其他文件不變。循環(huán)處理直到結(jié)束。
但是我不知道用bash怎么實(shí)現(xiàn)
   

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
4 [報(bào)告]
發(fā)表于 2013-10-18 11:41 |只看該作者
回復(fù) 3# guocanwen


1、“原文件有序這個(gè)特性”能代表四個(gè)文件沒(méi)有重復(fù)行嗎?
2、“原文件有序這個(gè)特性”能代表最小文件的第二行一定比第二文件的第一行小嗎?

論壇徽章:
0
5 [報(bào)告]
發(fā)表于 2013-10-18 11:48 |只看該作者
回復(fù) 4# Shell_HAT
A: 1 3 5
B: 2 3 5
C: 2 4 6
D: 3 4 7
step 1
分別讀入
a=1(從A中讀。
b=2(從B中讀。
c=2 (從C讀取)
d=3 (從D讀取)
step 2:
a= min{a, b, c,d}, 輸出 a(1)。 a 繼續(xù)從A讀取一行,此時(shí)a =3
step 3:
b= min{a, b, c,d},  輸出 b(2)。b從B中讀取一行,此時(shí)b = 3
step 4:
c= min{a, b, c,d}, 輸出 c(2)。c從C中讀取一行,此時(shí)c = 4
step 5:
a= min{a, b, c,d}, 輸出 a(3)。 a 繼續(xù)從A讀取一行,此時(shí)a =5
step 6:
b= min{a, b, c,d},  輸出 b(3)。b從B中讀取一行,此時(shí)b = 5
step 7:
d= min{a, b, c,d},  輸出 d(3)。d從D中讀取一行,此時(shí)b = 4
...
這樣處理只需要掃描一遍,速度是很快的
   

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2013-10-18 11:50 |只看該作者
回復(fù) 4# Shell_HAT
重復(fù)行也不影響的


   

論壇徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16賽季CBA聯(lián)賽之北京
日期:2016-07-06 15:42:0715-16賽季CBA聯(lián)賽之同曦
日期:2016-06-12 10:38:0915-16賽季CBA聯(lián)賽之佛山
日期:2016-05-27 11:54:56黃金圣斗士
日期:2015-12-02 11:44:35白銀圣斗士
日期:2015-11-25 14:32:43白銀圣斗士
日期:2015-11-23 12:53:352015亞冠之布里斯班獅吼
日期:2015-10-21 16:55:482015亞冠之首爾
日期:2015-09-01 16:46:052015亞冠之德黑蘭石油
日期:2015-08-31 11:39:192015亞冠之薩濟(jì)拖拉機(jī)
日期:2015-08-28 21:06:5315-16賽季CBA聯(lián)賽之廣東
日期:2016-07-12 14:58:53
7 [報(bào)告]
發(fā)表于 2013-10-18 12:04 |只看該作者
圍觀下

論壇徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年紀(jì)念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役紀(jì)念章
日期:2022-04-24 14:33:24
8 [報(bào)告]
發(fā)表于 2013-10-18 12:41 |只看該作者
回復(fù) 5# guocanwen


    明白你的意思了。頂樓就該把這個(gè)說(shuō)清楚,不要讓別人去猜。
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過(guò)ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP