亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 4127 | 回復(fù): 18
打印 上一主題 下一主題

[文本處理] 求教各位大神怎么提取一個文件中兩個標(biāo)記之間的文本 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2014-01-24 11:19 |只看該作者 |倒序瀏覽
本帖最后由 roskin 于 2014-01-24 14:57 編輯

我現(xiàn)在有個文件 a.txt,需要提取其中“[begin]”和“[end]”之間的文本,并且把文本輸入到 b.txt 中。求教各路大神怎么弄,不勝感激。
b.txt輸出的內(nèi)容需要不包含“[begin]”和“[end]”

a.txt的內(nèi)容如下:

  1. bbbbbbbbbbbbbb
  2. ffffff
  3. [begin]
  4. ggggggg
  5. eeeeeeee
  6. uuuuuuuu

  7. ooooooo
  8. [end]
  9. zzzzzzzz
復(fù)制代碼
----------------我是分割線-----------------

感謝各路大神,我成功把文本拿出來了,大家好給力啊這么快就有了這么多答案,小弟不勝感激非常感動

不過新問題出來了,我想把[begin]和[end]輸入到變量然后傳入sed來提取文本,但是這樣做之后反而把[begin]和[end]之外的文本提取出來了,二者之間的文本卻沒有出來,這個是怎么回事?
以6樓大神代碼為例,代碼如下
  1. c="\[begin\]"
  2. d="\[end\]"
  3. sed -n "/$c/,/$d/{//!p}"
復(fù)制代碼

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [報告]
發(fā)表于 2014-01-24 11:32 |只看該作者
回復(fù) 1# roskin

$ sed -n '/\[begin\]/,/\[end\]/p' a.txt > b.txt

$ cat b.txt
[begin]
ggggggg
eeeeeeee
uuuuuuuu

ooooooo
[end]

   

論壇徽章:
0
3 [報告]
發(fā)表于 2014-01-24 11:47 |只看該作者
回復(fù) 2# jason680

這個命令輸出會吧[begin]和[end]帶上,我需要除去這兩行

論壇徽章:
33
榮譽會員
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT運維版塊每日發(fā)帖之星
日期:2016-04-17 06:23:27操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-04-18 06:20:00IT運維版塊每日發(fā)帖之星
日期:2016-04-24 06:20:0015-16賽季CBA聯(lián)賽之天津
日期:2016-05-06 12:46:59
4 [報告]
發(fā)表于 2014-01-24 11:56 |只看該作者
jason680 發(fā)表于 2014-01-24 11:32
回復(fù) 1# roskin

$ sed -n '/\/,/\[end\]/p' a.txt > b.txt

  1. $ sed -n '/\[begin\]/,/\[end\]/p' a.txt | egrep -v '\[begin\]|\[end\]' > b.txt
復(fù)制代碼

論壇徽章:
3
摩羯座
日期:2014-03-05 14:58:52巨蟹座
日期:2014-04-03 15:14:32摩羯座
日期:2014-04-24 12:50:34
5 [報告]
發(fā)表于 2014-01-24 13:56 |只看該作者
  1. $ cat input.file
  2. bbbbbbbbbbbbbb
  3. ffffff
  4. [begin]
  5. ggggggg
  6. eeeeeeee
  7. uuuuuuuu

  8. ooooooo
  9. [end]
  10. zzzzzzzz

  11. $ sed -n '/\[begin\]/{:a;n;/\[end\]/!{p;ba}}' input.file
  12. ggggggg
  13. eeeeeeee
  14. uuuuuuuu

  15. ooooooo
復(fù)制代碼

論壇徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亞洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亞冠之柏太陽神
日期:2015-06-25 08:48:212015亞冠之武里南聯(lián)
日期:2015-07-28 09:01:082015亞冠之萊赫維亞
日期:2015-07-28 15:44:172015亞冠之柏斯波利斯
日期:2015-09-06 14:08:52白銀圣斗士
日期:2015-11-25 17:06:2815-16賽季CBA聯(lián)賽之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16賽季CBA聯(lián)賽之遼寧
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16賽季CBA聯(lián)賽之天津
日期:2016-08-16 14:11:01
6 [報告]
發(fā)表于 2014-01-24 14:11 |只看該作者
  1. sed -n '/begin/,/end/{//!p}'
復(fù)制代碼

論壇徽章:
7
亥豬
日期:2013-10-10 17:00:29辰龍
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕節(jié)徽章
日期:2015-08-21 11:06:172015亞冠之柏太陽神
日期:2015-09-25 13:56:42數(shù)據(jù)庫技術(shù)版塊每日發(fā)帖之星
日期:2016-08-06 06:20:00
7 [報告]
發(fā)表于 2014-01-24 14:11 |只看該作者
  1. awk '/begin/{a=1;next}a{b=1}/end/{b=0;exit}b' file
復(fù)制代碼

論壇徽章:
7
亥豬
日期:2013-10-10 17:00:29辰龍
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕節(jié)徽章
日期:2015-08-21 11:06:172015亞冠之柏太陽神
日期:2015-09-25 13:56:42數(shù)據(jù)庫技術(shù)版塊每日發(fā)帖之星
日期:2016-08-06 06:20:00
8 [報告]
發(fā)表于 2014-01-24 14:12 |只看該作者
本帖最后由 li0924 于 2014-01-24 14:14 編輯

今天什么情況,點提交就出來兩。

  1. lottu> awk '/begin/{a=1;next}a{b=1}/end/{b=0;exit}b' lottu18
  2.     ggggggg
  3.     eeeeeeee
  4.     uuuuuuuu

  5.     ooooooo
復(fù)制代碼

論壇徽章:
0
9 [報告]
發(fā)表于 2014-01-24 14:56 |只看該作者
感謝各路大神,我成功把文本拿出來了,大家好給力啊這么快就有了這么多答案,小弟不勝感激非常感動

不過新問題出來了,我想把[begin]和[end]輸入到變量然后傳入sed來提取文本,但是這樣做之后反而把[begin]和[end]之外的文本提取出來了,二者之間的文本卻沒有出來,這個是怎么回事?
以6樓大神代碼為例,代碼如下
  1. c="\[begin\]"
  2. d="\[end\]"
  3. sed -n "/$c/,/$d/{//!p}"
復(fù)制代碼

論壇徽章:
0
10 [報告]
發(fā)表于 2014-01-24 15:26 |只看該作者
回復(fù) 9# roskin


    sed -n '/'"$c"'/,/'"$d"'/{//!p}'
  1. $ cat file
  2. bbbbbbbbbbbbbb
  3. ffffff
  4. [begin]
  5. ggggggg
  6. eeeeeeee
  7. uuuuuuuu

  8. ooooooo
  9. [end]
  10. zzzzzzzz
  11. $ cat file | sed -n '/'"$c"'/,/'"$d"'/{//!p}'
  12. ggggggg
  13. eeeeeeee
  14. uuuuuuuu

  15. ooooooo
復(fù)制代碼
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP