亚洲av乱码中文一区二区三区,性饥渴的农村熟妇

論壇徽章:: 0

電梯直達

1樓 [收藏(0)] [報告]

發(fā)表于 2014-01-08 18:02 |只看該作者 |倒序瀏覽

比如說['/home/tmp2','/home', '/home/tmp1', '/usr', '/usr/bin'] 變成 ['/home', '/usr']
這個列表里面的目錄是隨機排列的，我如何保留最頂層涵蓋范圍最大的那幾個目錄，并且把所有子目錄都丟棄?
沒有思路，該怎么做？

文庫|博客

使用正則表達式與lex實現(xiàn)詞法分析器
C語言的MIPS匯編實現(xiàn)（四）SWITCH
Requested init /linuxrc failed (error -2).
比較 csv 文件中數(shù)據(jù)差異
LMD ElPack v2019.7新版亮點：Transparent mode全新升級|附下載

timespace

大富大貴

論壇徽章:: 11

2樓 [報告]

發(fā)表于 2014-01-08 19:40 |只看該作者

如果可以排序：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
def main():
uniq = []
def comdir(x, y):
if x and y.startswith(x):
return x
else:
uniq.append(y)
return y
dirs = ['/var/log', '/var/lib',
'/home/tmp2','/home', '/home/tmp1',
'/usr', '/usr/bin'
]
dirs.sort()
# 排序后的目錄名稱符合如下規(guī)則：如果一組目錄能合并為一個目錄，
# 那么該組目錄必定連續(xù)出現(xiàn)，且該組第一個元素就是那個公共的目錄。
reduce(comdir, dirs, '')
# 預期結果：['/home', '/usr', '/var/lib', '/var/log']
print uniq
if __name__ == '__main__':
main()

復制代碼

回復 1# liaozd

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

修杰_JIANG

白手起家

論壇徽章:: 1

3樓 [報告]

發(fā)表于 2014-01-08 20:24 |只看該作者

>>>
>>> import re
>>> a = ['/home/tmp2', '/home', '/home/tmp1', '/usr', '/usr/bin']
>>> for i in a:
... b.append(re.findall('/*\w+', i)[0])
...
>>> list(set(b))
['/usr', '/home']

復制代碼

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

icymirror

小富即安

論壇徽章:: 4

15-16賽季CBA聯(lián)賽之新疆
日期:2016-04-01 09:10:58

4樓 [報告]

發(fā)表于 2014-01-09 09:45 |只看該作者

本帖最后由 icymirror 于 2014-01-09 14:05 編輯

回復 1# liaozd

思路：
1. 把路徑頭找出來

rawdata = ['/home/tmp2','/home', '/home/tmp1', '/usr', '/usr/bin'] # 原始數(shù)據(jù)
newdata = [item[:item.find('/', 1) if item.find('/', 1) > 0 else len(item)] for item in rawdata] # 取出各個原始數(shù)據(jù)(路徑的開頭)

復制代碼

2. 根據(jù)出現(xiàn)的頻率來確定是否保留 (不確定需要的 bar ,所以，只統(tǒng)計頻率)

import collections
freqdict = collections.defaultdict(int) # 確保如果找不到 key，返回一個整數(shù)，0
for item in newdata:
freqdict[item] += 1

復制代碼

3. 頻率排序，結果自己過濾

result = [(value, key) for key, value in freqdict.iteritems()] # 構造一個由元組 (頻率, 路徑) 組成的列表
result.sort(reverse=True) # 列表排序，從大到小，方便從開頭開始取結果

復制代碼

Sorry，之前沒有改完就回復了，現(xiàn)在是完成之后的內(nèi)容。

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

pitonas

家境小康

論壇徽章:: 5

5樓 [報告]

發(fā)表于 2014-01-09 12:55 |只看該作者

也還是看不懂。
{:2_170:}

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

liaozd

稍有積蓄

論壇徽章:: 0

6樓 [報告]

發(fā)表于 2014-01-09 14:36 |只看該作者

回復 2# timespace

謝謝，不過考慮這種情況'/home' 和 '/homeland/'

python是否有判斷兩個目錄是否是互為子目錄的模塊函數(shù)？

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

李營長

腰纏萬貫

論壇徽章:: 0

7樓 [報告]

發(fā)表于 2014-01-09 16:03 |只看該作者

回復 1# liaozd

def getroot(d):
ds = d.split("/")
#print(ds)
return ds[1]
if __name__ == "__main__":
dirlist = ['/var/log', '/var/lib',
'/home/tmp2','/home', '/home/tmp1',
'/usr', '/usr/bin' ]
dirdict = dict()
for d in dirlist:
rootn = getroot(d)
dirdict[rootn] = dirdict.get(rootn, 0) + 1
keys = dirdict.keys()
for x in keys:
print(x)

復制代碼

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

liaozd

稍有積蓄

論壇徽章:: 0

8樓 [報告]

發(fā)表于 2014-01-09 16:45 |只看該作者

本帖最后由 liaozd 于 2014-01-09 16:51 編輯

回復 2# timespace

修改了一下，不知道是不是還有不完備的地方

#!/usr/bin/env python
uniq = []
def comDir(x,y):
# 所有目錄的結尾都加‘/’
if x is not '' and not x.endswith('/'):
x += '/'
if not y.endswith('/'):
y += '/'
print x, y
if x and y.startswith(x):
return x
else:
uniq.append(y)
return y
dirs = ['/var/log', '/var/lib',
'/home/tmp1','/home', '/home/tmp1/tmp2', ‘/homeland’
]
dirs.sort()
reduce(comDir, dirs, '')
print uniq

復制代碼

輸出
['/home/', '/homeland/', '/var/lib/', '/var/log/']

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

timespace

大富大貴

論壇徽章:: 11

9樓 [報告]

發(fā)表于 2014-01-09 17:05 |只看該作者

本帖最后由 timespace 于 2014-01-09 17:15 編輯

回復 8# liaozd
哦，明白你意思了，是要讓路徑名規(guī)范化，然后才能準確的用startswith ？

推薦用：

>>> from os.path import normpath
>>> dir1 = ['/usr/lib/', 'usr/../lib', '/usr//lib']
>>> dir2 = [normpath(e) for e in dir1]
>>> dir2
['/usr/lib', 'lib', '/usr/lib']

復制代碼

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

ssfjhh

富足長樂

論壇徽章:: 4

10樓 [報告]

發(fā)表于 2014-01-09 18:15 |只看該作者

本帖最后由 ssfjhh 于 2014-01-09 18:18 編輯

一行搞定。

In [1]: a = ['/home/tmp2','/home', '/home/tmp1', '/usr', '/usr/bin']
In [2]: [i for i in a if i.rpartition('/')[0] not in a]
Out[2]: ['/home', '/usr']

復制代碼

實戰(zhàn)分享：從技術角度談機器學習入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關系型數(shù)據(jù)庫RadonDB知多少？

亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

一堆目錄名組成的list，如何保留覆蓋范圍最大的那幾個目錄 [復制鏈接]