亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 4104 | 回復(fù): 16
打印 上一主題 下一主題

[文本處理] 怎么將分成一個個小區(qū)段然后找到某字符重復(fù)數(shù)大于3次的區(qū)段 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2019-01-29 13:57 |只看該作者 |倒序瀏覽
原始文件是這樣的(以空格為分隔符):
1 1509 - 0 13 CHH CTC U U U U 244
1 1511 + 0 5 CHH CAA U U U U 245
1 1517 - 0 14 CHH CTT U U U U 246
1 1521 + 1 4 CHH CAA U M U M 247
1 1559 + 1 5 CHH CCC M U U M 263
1 1560 + 1 5 CHH CCA U U U U 264
1 1561 + 3 4 CHH CAT M M U M 265
1 1564 - 0 18 CHH CAT U U U M 266
1 1566 + 0 8 CHH CTC U U U U 267
1 1726 + 2 0 CHH CCC U M U U 373
1 1727 + 0 2 CHH CCA U U U U 374
1 1728 + 0 2 CHH CAC U M U M 375
1 1730 + 2 0 CHH CAA U M U M 376
1 1733 + 0 2 CHH CTC U U U U 377
1 1735 + 0 2 CHH CAA U U U M 378
1 1738 - 0 5 CHH CTT U U U M 379
1 1743 - 0 4 CHH CAC U U U U 382
1 1746 - 1 3 CHH CAA U U U U 383
1 1747 + 0 1 CHH CCA U U U U 384
1 1748 + 0 1 CHH CAC U M U U 385
1 1750 + 1 0 CHH CTA N M U M 386
1 1775 - 1 1 CHH CTC U M U U 399
1 1776 - 0 2 CHH CCT N U U U 400
1 1777 - 0 2 CHH CCC U U U U 401
1 1778 + 0 1 CHH CAA U U U U 402
希望得到的結(jié)果:把最后一列($12)是連續(xù)的數(shù)字作為一個區(qū)段,如果這個區(qū)段里倒數(shù)第二列($11)字符‘M’出現(xiàn)次數(shù)大于3次,則輸出這一區(qū)段,否則跳過不輸出。
結(jié)果:1 1559 + 1 5 CHH CCC M U U M 263
1 1560 + 1 5 CHH CCA U U U U 264
1 1561 + 3 4 CHH CAT M M U M 265
1 1564 - 0 18 CHH CAT U U U M 266
1 1566 + 0 8 CHH CTC U U U U 267

1 1726 + 2 0 CHH CCC U M U U 373
1 1727 + 0 2 CHH CCA U U U U 374
1 1728 + 0 2 CHH CAC U M U M 375
1 1730 + 2 0 CHH CAA U M U M 376
1 1733 + 0 2 CHH CTC U U U U 377
1 1735 + 0 2 CHH CAA U U U M 378
1 1738 - 0 5 CHH CTT U U U M 379

論壇徽章:
8
2016科比退役紀(jì)念章
日期:2018-10-24 08:24:0115-16賽季CBA聯(lián)賽之北控
日期:2019-03-12 14:34:562016科比退役紀(jì)念章
日期:2019-04-01 10:33:0915-16賽季CBA聯(lián)賽之山東
日期:2019-04-17 12:46:3215-16賽季CBA聯(lián)賽之廣夏
日期:2019-05-09 16:40:4015-16賽季CBA聯(lián)賽之廣夏
日期:2019-10-10 15:33:4015-16賽季CBA聯(lián)賽之遼寧
日期:2019-10-15 08:37:0615-16賽季CBA聯(lián)賽之北控
日期:2021-03-30 15:53:34
2 [報告]
發(fā)表于 2019-01-29 16:39 |只看該作者
沒能看懂你的意思- -
一列不是最多一個字符 M 嗎? 怎么叫出現(xiàn)次數(shù)大于3次?你的結(jié)果  也只是有一行有3個M啊。

論壇徽章:
0
3 [報告]
發(fā)表于 2019-01-30 21:48 來自手機(jī) |只看該作者
不好意思,沒表達(dá)清楚,我的意思是每個區(qū)段的所有行第11列至少重復(fù)3次

論壇徽章:
0
4 [報告]
發(fā)表于 2019-01-30 21:48 來自手機(jī) |只看該作者
不好意思,沒表達(dá)清楚,我的意思是每個區(qū)段的所有行第11列至少重復(fù)3次

論壇徽章:
0
5 [報告]
發(fā)表于 2019-01-30 21:48 來自手機(jī) |只看該作者
不好意思,沒表達(dá)清楚,我的意思是每個區(qū)段的所有行第11列至少重復(fù)3次

論壇徽章:
6
程序設(shè)計版塊每日發(fā)帖之星
日期:2016-05-11 06:20:00操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-05-12 06:20:00每日論壇發(fā)貼之星
日期:2016-05-12 06:20:00操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-05-14 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2016-05-31 06:20:00每日論壇發(fā)貼之星
日期:2016-05-31 06:20:00
6 [報告]
發(fā)表于 2019-01-31 22:50 |只看該作者
本帖最后由 1cpuer 于 2019-01-31 23:10 編輯



#,; PWD=/mnt/i/je-d/sou-d :=12628=: # 2019-01-31 23:07:05 1548947225
#.: awk '{a[$0]++}$0 ~ /[M|N]/{for(j in a)if(a[$11]>3);print a[j],$0}' file | nl
     1  1  1 1521 + 1 4 CHH CAA U M U M 247
     2  1  1 1559 + 1 5 CHH CCC M U U M 263
     3  1  1 1561 + 3 4 CHH CAT M M U M 265
     4  1  1 1564 - 0 18 CHH CAT U U U M 266
     5  1  1 1726 + 2 0 CHH CCC U M U U 373
     6  1  1 1728 + 0 2 CHH CAC U M U M 375
     7  1  1 1730 + 2 0 CHH CAA U M U M 376
     8  1  1 1735 + 0 2 CHH CAA U U U M 378
     9  1  1 1738 - 0 5 CHH CTT U U U M 379
    10  1  1 1748 + 0 1 CHH CAC U M U U 385
    11  1  1 1750 + 1 0 CHH CTA N M U M 386
    12  1  1 1775 - 1 1 CHH CTC U M U U 399
    13  1  1 1776 - 0 2 CHH CCT N U U U 400

#,; PWD=/mnt/i/je-d/sou-d :=12630=: # 2019-01-31 23:09:52 1548947392
#.: awk '{a[$0]++}$11 ~ /[M|N]/{for(j in a)if(a[$11]>3);print $0}' file
1 1521 + 1 4 CHH CAA U M U M 247
1 1559 + 1 5 CHH CCC M U U M 263
1 1561 + 3 4 CHH CAT M M U M 265
1 1564 - 0 18 CHH CAT U U U M 266
1 1728 + 0 2 CHH CAC U M U M 375
1 1730 + 2 0 CHH CAA U M U M 376
1 1735 + 0 2 CHH CAA U U U M 378
1 1738 - 0 5 CHH CTT U U U M 379
1 1750 + 1 0 CHH CTA N M U M 386

評分

參與人數(shù) 1信譽(yù)積分 +5 收起 理由
hechao7021 + 5 很給力!

查看全部評分

論壇徽章:
8
2016科比退役紀(jì)念章
日期:2018-10-24 08:24:0115-16賽季CBA聯(lián)賽之北控
日期:2019-03-12 14:34:562016科比退役紀(jì)念章
日期:2019-04-01 10:33:0915-16賽季CBA聯(lián)賽之山東
日期:2019-04-17 12:46:3215-16賽季CBA聯(lián)賽之廣夏
日期:2019-05-09 16:40:4015-16賽季CBA聯(lián)賽之廣夏
日期:2019-10-10 15:33:4015-16賽季CBA聯(lián)賽之遼寧
日期:2019-10-15 08:37:0615-16賽季CBA聯(lián)賽之北控
日期:2021-03-30 15:53:34
7 [報告]
發(fā)表于 2019-02-01 13:42 |只看該作者
看了半天總算明白樓主的意思了- -。
還是用awk,寫了個相對直接的算法,可能有點(diǎn)啰嗦,沒考慮效率,樓主給的數(shù)據(jù)測試通過。
awk腳本:test.awk
  1. {
  2.     if (saveLine)
  3.     {
  4.         res[i++]=saveLine
  5.         split(saveLine,t)
  6.         currentNum=t[12]
  7.         a[t[11]]++              #計M數(shù)
  8.         nextNum=$12
  9.         if (nextNum!=currentNum+1)
  10.         {
  11.             saveLine=$0         #不連續(xù),保存當(dāng)前行
  12.             delete res          #不連續(xù),保存的前一行可以刪除了
  13.             a["M"]=0
  14.             next                #跳過后面代碼,awk循環(huán)控制讀入下一行
  15.         }
  16.     }

  17.     #連續(xù)數(shù)字的行
  18.     do
  19.     {
  20.         currentNum=$12
  21.         res[i++]=$0             #存儲連續(xù)的結(jié)果
  22.         a[$11]++                #計M數(shù)
  23.         if (getline)
  24.             nextNum=$12
  25.         else                    #已經(jīng)是最后一行了,退出循環(huán)
  26.             break
  27.     } while (nextNum==currentNum+1)

  28.     #print "M:" a["M"]
  29.     if (a["M"]>=3)
  30.     {
  31.         for (var in res)
  32.             print res[var]
  33.     }

  34.     saveLine = $0               #已讀進(jìn)來的這行不連續(xù),需要保存,供下次用
  35.     delete res                  #清除存儲的結(jié)果
  36.     a["M"]=0                    #M數(shù)清0
  37.     #                           awk 循環(huán)控制讀入下一行
  38. }
復(fù)制代碼


運(yùn)行:
  1. awk -f test.awk file.txt
復(fù)制代碼

結(jié)果:
  1. 1 1559 + 1 5 CHH CCC M U U M 263
  2. 1 1560 + 1 5 CHH CCA U U U U 264
  3. 1 1561 + 3 4 CHH CAT M M U M 265
  4. 1 1564 - 0 18 CHH CAT U U U M 266
  5. 1 1566 + 0 8 CHH CTC U U U U 267
  6. 1 1726 + 2 0 CHH CCC U M U U 373
  7. 1 1727 + 0 2 CHH CCA U U U U 374
  8. 1 1728 + 0 2 CHH CAC U M U M 375
  9. 1 1730 + 2 0 CHH CAA U M U M 376
  10. 1 1733 + 0 2 CHH CTC U U U U 377
  11. 1 1735 + 0 2 CHH CAA U U U M 378
  12. 1 1738 - 0 5 CHH CTT U U U M 379
復(fù)制代碼

評分

參與人數(shù) 1信譽(yù)積分 +5 收起 理由
hechao7021 + 5 很給力!

查看全部評分

論壇徽章:
0
8 [報告]
發(fā)表于 2019-02-01 17:52 |只看該作者
我就是看了很多次也不明白,所以放棄

論壇徽章:
16
IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-08-24 06:20:00綜合交流區(qū)版塊每日發(fā)帖之星
日期:2015-10-14 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-10-25 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-11-06 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-04-15 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-05-21 06:20:00綜合交流區(qū)版塊每日發(fā)帖之星
日期:2016-08-16 06:20:002015七夕節(jié)徽章
日期:2015-08-21 11:06:17IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-08-14 06:20:00
9 [報告]
發(fā)表于 2019-02-14 17:17 |只看該作者
本帖最后由 expert1 于 2019-02-14 17:50 編輯
  1. awk 'NR==1{ start =$12;  temp =$0; count=0 }NR>1{

  2.    if($12 == start + 1) {

  3.                    if ($11 == "M") count++ ;

  4.                    temp = temp"\n"$0; start=$12


  5.    }else {
復(fù)制代碼

論壇徽章:
16
IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-08-24 06:20:00綜合交流區(qū)版塊每日發(fā)帖之星
日期:2015-10-14 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-10-25 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-11-06 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-04-15 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-05-21 06:20:00綜合交流區(qū)版塊每日發(fā)帖之星
日期:2016-08-16 06:20:002015七夕節(jié)徽章
日期:2015-08-21 11:06:17IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-08-14 06:20:00
10 [報告]
發(fā)表于 2019-02-14 17:22 |只看該作者
論壇很很慢啊,唉,也快到掛的感覺。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP