亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 2203 | 回復: 7
打印 上一主題 下一主題

[文本處理] 文本分隔處理問題 [復制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2016-01-08 17:03 |只看該作者 |倒序瀏覽
本帖最后由 Arthur_ 于 2016-01-08 17:04 編輯

我想用shell 做個文本分隔例如一個文件含如下內(nèi)容, 沒思路了 請教下各位 謝謝。

  1. ------ START ------
  2. AAAAAAAAAAAAAA
  3. AAAAAAAAAAAAAA
  4. AAAAAAAAAAAAAA
  5. AAAAAAAAAAAAAA
  6. ------ END ---------
  7. ------ START ------
  8. BBBBBBB
  9. ------ END ---------
  10. ------ START ------
  11. CCCCCCC
  12. ------ END ---------
復制代碼
通過shell想分隔成3個文件
文件1:
  1. ------ START ------
  2. AAAAAAAAAAAAAA
  3. AAAAAAAAAAAAAA
  4. AAAAAAAAAAAAAA
  5. AAAAAAAAAAAAAA
  6. ------ END ---------
復制代碼
文件2:
  1. ------ START ------
  2. BBBBBBB
  3. ------ END ---------
復制代碼
文件3
  1. ------ START ------
  2. CCCCCCC
  3. ------ END ---------
復制代碼

論壇徽章:
5
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亞洲杯之朝鮮
日期:2015-03-13 22:47:33IT運維版塊每日發(fā)帖之星
日期:2016-01-09 06:20:00IT運維版塊每周發(fā)帖之星
日期:2016-03-07 16:27:44
2 [報告]
發(fā)表于 2016-01-08 17:19 |只看該作者
回復 1# Arthur_


    csplit

論壇徽章:
20
卯兔
日期:2015-01-26 22:05:142015亞冠之薩濟拖拉機
日期:2015-09-10 15:15:282015亞冠之阿爾希拉爾
日期:2015-09-25 17:37:53程序設(shè)計版塊每日發(fā)帖之星
日期:2015-10-03 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-09 06:20:00CU十四周年紀念徽章
日期:2015-12-17 09:07:15程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:34程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:34程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:342015亞冠之廣州富力
日期:2015-08-27 19:29:56每日論壇發(fā)貼之星
日期:2015-08-26 06:20:002015亞冠之阿爾希拉爾
日期:2015-05-18 17:26:27
3 [報告]
發(fā)表于 2016-01-08 17:54 |只看該作者
  1. awk '/START/{f=FILENAME""++n}{print > f}' file
復制代碼

論壇徽章:
1
技術(shù)圖書徽章
日期:2016-02-03 16:35:25
4 [報告]
發(fā)表于 2016-01-08 19:04 |只看該作者
simon@kami:~/8.1.2016$ csplit testfile /START/ -n2 -s {*} -f file
simon@kami:~/8.1.2016$ ls
file00  file01  file02  file03  testfile

黑哥我根據(jù)你提醒做了一次,為啥會分割出4個文件file00 file01 file02 file03,而file00是空的,而file01 02 03是正確的結(jié)果

回復 2# blackold


   

論壇徽章:
20
程序設(shè)計版塊每日發(fā)帖之星
日期:2015-10-11 06:20:0015-16賽季CBA聯(lián)賽之山東
日期:2016-05-28 18:18:5615-16賽季CBA聯(lián)賽之新疆
日期:2017-04-12 22:55:4715-16賽季CBA聯(lián)賽之青島
日期:2017-06-26 18:30:0315-16賽季CBA聯(lián)賽之四川
日期:2017-09-04 12:27:0315-16賽季CBA聯(lián)賽之福建
日期:2018-02-09 14:28:3315-16賽季CBA聯(lián)賽之同曦
日期:2018-04-17 12:43:3415-16賽季CBA聯(lián)賽之浙江
日期:2018-07-14 13:27:4015-16賽季CBA聯(lián)賽之吉林
日期:2018-09-13 15:48:2915-16賽季CBA聯(lián)賽之新疆
日期:2016-05-07 05:05:3215-16賽季CBA聯(lián)賽之八一
日期:2016-03-14 12:32:06程序設(shè)計版塊每日發(fā)帖之星
日期:2015-12-12 06:20:00
5 [報告]
發(fā)表于 2016-01-08 19:08 |只看該作者
csplit file /START/ -n2 -s {*} -f file -b "%02d"; rm -rf file00
命令解釋
/[正則表達式]/ #匹配文本樣式,比如/START/,從第一行到包含START的匹配行。
{*} #表示根據(jù)匹配重復執(zhí)行分割,直到文件尾停止,使用{整數(shù)}的形式指定分割執(zhí)行的次數(shù)。
-s #靜默模式,不打印其他信息。
-n #指定分割后的文件名后綴的數(shù)字個數(shù)。比如01、02、03等。
-f #指定分割后的文件名前綴。
-b #指定后綴格式。比如%02d,類似于C語言中的printf參數(shù)格式。
rm -rf file00 #是刪除第一個文件,因為分割后的的第一個文件沒有內(nèi)容,匹配的單詞就位于文件的第一行中。

論壇徽章:
307
程序設(shè)計版塊每周發(fā)帖之星
日期:2016-04-08 00:41:33操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-09-02 06:20:00每日論壇發(fā)貼之星
日期:2015-09-02 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-04 06:20:00每日論壇發(fā)貼之星
日期:2015-09-04 06:20:00每周論壇發(fā)貼之星
日期:2015-09-06 22:22:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-09 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-19 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-20 06:20:00每日論壇發(fā)貼之星
日期:2015-09-20 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-22 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-24 06:20:00
6 [報告]
發(fā)表于 2016-01-08 21:17 |只看該作者
本帖最后由 sunzhiguolu 于 2016-01-08 22:11 編輯

回復 4# 陳卓文
  1. -z, --elide-empty-files    remove empty output files
復制代碼
csplit file /START/ -f file -n2 -s {*} -z

   

論壇徽章:
307
程序設(shè)計版塊每周發(fā)帖之星
日期:2016-04-08 00:41:33操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-09-02 06:20:00每日論壇發(fā)貼之星
日期:2015-09-02 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-04 06:20:00每日論壇發(fā)貼之星
日期:2015-09-04 06:20:00每周論壇發(fā)貼之星
日期:2015-09-06 22:22:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-09 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-19 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-20 06:20:00每日論壇發(fā)貼之星
日期:2015-09-20 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-22 06:20:00程序設(shè)計版塊每日發(fā)帖之星
日期:2015-09-24 06:20:00
7 [報告]
發(fā)表于 2016-01-08 22:37 |只看該作者
利用 csplit 能否得到這樣的結(jié)果?
文件1:
  1. AAAAAAAAAAAAAA
  2. AAAAAAAAAAAAAA
  3. AAAAAAAAAAAAAA
  4. AAAAAAAAAAAAAA
復制代碼
文件2:
  1. BBBBBBB
復制代碼
文件3:
  1. CCCCCCC
復制代碼

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
8 [報告]
發(fā)表于 2016-01-09 00:29 |只看該作者
回復 7# sunzhiguolu


$ awk -vF="F" -vN=1 -vD=1 'BEGIN{if(N=="")N=1}/^---+ +END +---+/{S=0;close(FN);N++}S{print $0 > FN}/^---+ +START +---+/{S=1;FN=F N;if(D)print FN}' FILE
F1
F2
F3

$ grep . F?
F1:AAAAAAAAAAAAAA
F1:AAAAAAAAAAAAAA
F1:AAAAAAAAAAAAAA
F1:AAAAAAAAAAAAAA
F2:BBBBBBB
F3:CCCCCCC
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP