亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 2229 | 回復(fù): 4
打印 上一主題 下一主題

[學(xué)習(xí)分享] 用bash, wget, sed, 在線金山詞霸自制詞典,查讀音和意思 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2013-03-17 02:15 |只看該作者 |倒序?yàn)g覽
本帖最后由 madfrogme 于 2013-03-17 11:51 編輯

用Bash腳本wget, sed 和金山詞霸寫的一個命令行詞典

用法很簡單 ./d memory 則查memory 的讀音和意思

wget是安靜模式,沒有輸出,比如查memory,則會下載memory這個文件

然后cat $1 | col -b | sed 's/[ \t]*//g' > tmp 這一行是去掉所有^M字符,和空格

去掉空格主要是我自己的喜好,方便用正則, 就這幾行,僅供參閱

要是真想看懂下面的正則,最好先看一下下載下來的源文件

不想把它弄得太復(fù)雜,這樣也方便別人刪刪減減,做成自己的口味

看到下面版主的提示也許還可以把例句抽出來什么的會不會很好啊,

不過個人喜好不同,這就給大家自己判斷了


------------------------------------
#!/bin/bash
wget -q http://www.iciba.com/$1

cat $1 | col -b | sed 's/[ \t]*//g' > tmp

sed -n 's/<strong>\[<\/strong><stronglang="EN-US"xml:lang="EN-US">\(.*\)<\/strong><strong>\]<\/strong>/\1/p' tmp

# 下面第一個sed是找到 <spanclass..... 和 </span>之間的內(nèi)容

# 然后傳遞給下一個sed

# 下面的第二個sed的意思是找到<label>這一行之后,進(jìn)而繼續(xù)匹配

# 然后這次匹配是用s# # # 的形式, 把<label> 和</label>都刪掉


sed -nr '/<spanclass="label_list"/,/<\/span>/p' tmp | sed -nr '/<label>/{s#<[/]?label>##g;p}'

rm $1 tmp

---------------------------------------

評分

參與人數(shù) 1可用積分 +10 收起 理由
amarant + 10 很給力!

查看全部評分

論壇徽章:
6
CU大牛徽章
日期:2013-05-20 10:43:41IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-07-29 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-01-27 06:20:00CU大;照
日期:2013-05-20 10:44:16CU大牛徽章
日期:2013-05-20 10:44:0615-16賽季CBA聯(lián)賽之廣東
日期:2018-03-09 11:17:08
2 [報告]
發(fā)表于 2013-03-17 10:10 |只看該作者
sofa, 這個有意思

論壇徽章:
13
15-16賽季CBA聯(lián)賽之同曦
日期:2016-01-28 19:52:032015亞冠之北京國安
日期:2015-10-07 14:28:19NBA常規(guī)賽紀(jì)念章
日期:2015-05-04 22:32:03處女座
日期:2015-01-15 19:45:44卯兔
日期:2014-10-28 16:17:14白羊座
日期:2014-05-24 15:10:46寅虎
日期:2014-05-10 09:50:35白羊座
日期:2014-03-12 20:52:17午馬
日期:2014-03-01 08:37:27射手座
日期:2014-02-19 19:26:54子鼠
日期:2013-11-30 09:03:56獅子座
日期:2013-09-08 08:37:52
3 [報告]
發(fā)表于 2013-03-17 11:27 |只看該作者

論壇徽章:
0
4 [報告]
發(fā)表于 2013-03-17 11:44 |只看該作者
回復(fù) 3# ulovko
哇,這個也很有意思,還能顯示例句了,不過好像dict.cn先天沒有讀音,有點(diǎn)遺憾,我用金山詞霸的主要原因就是可以把讀音抽出來很讓人開心

論壇徽章:
0
5 [報告]
發(fā)表于 2013-03-17 11:46 |只看該作者
回復(fù) 2# craaazy123


    謝了哈
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP