亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 3101 | 回復: 9
打印 上一主題 下一主題

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行) [復制鏈接]

論壇徽章:
0
跳轉到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2004-10-26 10:13 |只看該作者 |倒序瀏覽
            

比如文本是一個非常大的文本,里面有很多完全一樣的行,包括"\"的續(xù)行
如:

 I love shell = I love UC
 I love shell = I love UC
 I love shell = I love UC
   Pig is flying in the sky \
   and I am looking \
   at it
   Pig is flying in the sky \
   and I am looking \
   at it

   希望處理之后的結果是這樣的:
 I love shell = I love UC (m=3)
   Pig is flying in the sky \
   and I am looking \
   at it (m=2)

請大家?guī)兔τ茫悖螅瑁澹欤欤珹WK,SED...anything of Linux
實現(xiàn)此功能~~~ 謝謝

                
 

論壇徽章:
0
2 [報告]
發(fā)表于 2004-10-26 10:34 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

沒人頂啊....自己頂一個先

論壇徽章:
0
3 [報告]
發(fā)表于 2004-10-26 19:26 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

原帖由 "sunkey" 發(fā)表:
            

比如文本是一個非常大的文本,里面有很多完全一樣的行,包括"\"的續(xù)行
如:

 I love shell = I love UC
 I love shell = I love UC
 I l..........



nawk '{str=$0;while($0 like /\/$/){getline;str=str "〇"  $0}a[str]++}END{for(x in a){i=1;split(x,b,"〇";while(i<a[x])print b[i++];printf("%s (m=%d)\n",b,a[x])}}  infile


我的是日文鍵盤裝了中文系統(tǒng)那個 波浪 的符號打不出來用 like 替代的

論壇徽章:
1
榮譽會員
日期:2011-11-23 16:44:17
4 [報告]
發(fā)表于 2004-10-26 20:30 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

看不明白,幫你丁頁

論壇徽章:
0
5 [報告]
發(fā)表于 2004-10-27 11:28 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

原帖由 "james_dlc" 發(fā)表:
nfile


我的是日文鍵盤裝了中文系統(tǒng)那個 波浪 的符號打不出來用 like 替代的



景仰一下~~~~      

  
能不能解釋一下程序的執(zhí)行??另外,如果有空白行,那么這個程序也會把空白
的重復給算進去了...

論壇徽章:
0
6 [報告]
發(fā)表于 2004-10-28 10:33 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

原帖由 "sunkey" 發(fā)表:

  
能不能解釋一下程序的執(zhí)行??另外,如果有空白行,那么這個程序也會把空白
的重復給算進去了...



上次寫的太繁瑣了,另外對于空行的問題
修改了一下

nawk '$0{str=$0;while($0~/\/$/){getline;str=str "\n" $0}a[str]++}END{for(x in a)print x,"(m=" a[x] ""} infile

論壇徽章:
0
7 [報告]
發(fā)表于 2004-10-28 15:00 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

我也看不明白,幫你頂.

論壇徽章:
0
8 [報告]
發(fā)表于 2004-10-28 17:44 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

[quote]原帖由 "james_dlc"]infile[/quote 發(fā)表:




  實際上可能這樣還是有問題的, 你把所有的LINE都存到數(shù)組里面,

如果是一個非常大(比如上百M)的文本而言,可能會有問題(雖然我沒有試驗)

而且效率可能不太好...

另外,如果存在換行的話呢??

論壇徽章:
0
9 [報告]
發(fā)表于 2004-10-28 19:36 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

原帖由 "sunkey" 發(fā)表:




  實際上可能這樣還是有問題的, 你把所有的LINE都存到數(shù)組里面,

如果是一個非常大(比如上百M)的文本而言,可能會有問題(雖然我沒有試驗)

而且效率可能不太好...

另外,如果存在換行的話呢??


關于效率問題我認為在內存里處理數(shù)據(jù)是最快的,而且unix系統(tǒng)內存大都在1GB
以上,而且還可以使用磁盤緩存的。并且如是100M的文件平均相同行數(shù)為4的話
內存利用小于30M
如是個人電腦的話,相信你沒有那么大的數(shù)據(jù)量。明天我找個2GB的文件試一下再給你答案。

另外,如果存在換行的話 ----不明白?如何樣式的換行?不是以 \ 為結尾的?還請明示。

論壇徽章:
0
10 [報告]
發(fā)表于 2004-10-30 01:16 |只看該作者

高手幫忙:如何合并文本中相臨的相同行(包括續(xù)行)

在單位試了一下,內存是32GB 用了個1。8GB的文件測試
自然們沒問題,文件太大的話硬盤空間有問題,所以暫時無法回答你,抱歉
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP