亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 9371 | 回復(fù): 16
打印 上一主題 下一主題

如何去掉重復(fù)的字符串 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2007-09-19 21:07 |只看該作者 |倒序?yàn)g覽
一個(gè)具有幾百萬行URL字符串的文件,如果去掉里面重復(fù)的URL?

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2007-09-19 21:14 |只看該作者
菜單 -> 編輯 -> 代替
輸入 URL
回車
OK

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2007-09-19 21:20 |只看該作者

  1. #include <iostream>
  2. #include <fstream>
  3. #include <set>
  4. #include <string>
  5. #include <iterator>
  6. #include <algorithm>

  7. using namespace std;

  8. int main()
  9. {
  10.     string      line;
  11.     set<string> uniq_set;
  12.     ifstream    infile("pathname");

  13.     istream_iterator<string> inbeg(infile), inend;
  14.     copy( inbeg, inend, inserter(uniq_set, uniq_set.begin()) );
  15.    
  16.     infile.close();
  17.     ofstream outfile("pathname");
  18.    
  19.     copy( uniq_set.begin(), uniq_set.end(), ostream_iterator<string>(outfile, "\n") );
  20. }
復(fù)制代碼

[ 本帖最后由 antigloss 于 2007-9-19 21:39 編輯 ]

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2007-09-19 21:23 |只看該作者
uniq -u

論壇徽章:
0
5 [報(bào)告]
發(fā)表于 2007-09-19 21:33 |只看該作者
幾百萬行的概念: 5*1000*1000*128

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2007-09-19 22:06 |只看該作者
unix下,
sort -u

論壇徽章:
1
榮譽(yù)版主
日期:2011-11-23 16:44:17
7 [報(bào)告]
發(fā)表于 2007-09-20 09:13 |只看該作者
對(duì)每個(gè)URL串進(jìn)行搜索?沒想到更好的辦法。

論壇徽章:
0
8 [報(bào)告]
發(fā)表于 2007-09-20 09:59 |只看該作者

回復(fù) #7 aero 的帖子

文件中每一行為一個(gè)URL,將文件中重復(fù)的URL去掉

論壇徽章:
0
9 [報(bào)告]
發(fā)表于 2007-09-20 10:26 |只看該作者
原帖由 ivhb 于 2007-9-19 22:06 發(fā)表
unix下,
sort -u



嗬嗬,c 的話,可以參考 sort 的src實(shí)現(xiàn)。

論壇徽章:
0
10 [報(bào)告]
發(fā)表于 2007-09-20 10:50 |只看該作者
這樣行嗎:
建一棵樹(二叉樹,b樹...),把文件中的url讀取后存入樹中(重復(fù)的當(dāng)然就不用再寫入了),讀完后重寫文件,至于效率我就不清楚了...
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP