亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
12下一頁
最近訪問板塊 發(fā)新帖
查看: 3600 | 回復(fù): 11
打印 上一主題 下一主題

在線詞典 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2009-08-19 22:03 |只看該作者 |倒序?yàn)g覽
從dict.cn取詞。d.py

  1. #! /usr/bin/python
  2. # -*- coding: utf-8 -*-
  3. import urllib,re,sys

  4. def unquote(q):
  5.         '''在unicode終端下可以顯示音標(biāo)。'''
  6.         return re.sub('&#(\d{1,5});',lambda m:unichr(int(m.group(1))),q).encode('utf8')

  7. if __name__=="__main__":
  8.         if len(sys.argv)==1:
  9.                 print "請(qǐng)輸入單詞"
  10.                 sys.exit(0)
  11.         else:
  12.                 word=sys.argv[1]
  13.         response = urllib.urlopen("http://www.dict.cn/"+word+".htm")
  14.         result=response.read()
  15.         find=re.findall(r'您要查找的是不是',result,re.S)
  16.         if len(find)>=1:
  17.                 print "沒找到"
  18.                 sys.exit(0)
  19.                
  20.         list=re.findall(r"<table><tr>(.+?)添加生詞",result,re.S)
  21.         pronounce=re.findall(r'<span class="pronounce">(.+?)</span>',list[0])
  22.         jies=re.findall(r'<div class="mut_jies"><strong>(.+?)</strong></div>',list[0])
  23.         ol=re.findall(r'<ol class="mut_ol">(.+?)</ol>',list[0],re.S)
  24.         if len(ol)>=1:
  25.                 example=re.findall(r'<li>(.+?)</li>',ol[0],re.S)
  26.         print word,
  27.         if len(pronounce)>=1:
  28.                 print unquote(pronounce[0])  
  29.         print re.sub('<br />','\n',jies[0])
  30.         print
  31.         if len(ol)>=1:
  32.                 for i in range(len(example)):
  33.                         print str(i+1)+'.',re.sub('<.+?>','',example[i]),
  34.                


復(fù)制代碼

[ 本帖最后由 two 于 2009-8-21 11:42 編輯 ]

rrr.GIF (15.75 KB, 下載次數(shù): 41)

rrr.GIF

評(píng)分

參與人數(shù) 1可用積分 +2 收起 理由
smallfish_xy + 2 原創(chuàng)內(nèi)容

查看全部評(píng)分

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2009-08-19 22:08 |只看該作者
顯示音標(biāo):

SHN3IR~U.PNG (56.08 KB, 下載次數(shù): 34)

SHN3IR~U.PNG

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2009-08-20 00:08 |只看該作者
原帖由 two 于 2009-8-19 22:03 發(fā)表
從dict.cn取詞。d.py

#! /usr/bin/python
# -*- coding: utf-8 -*-
import urllib,re,sys

def unquote(q):
        '''在unicode終端下可以顯示音標(biāo)。'''
        return re.sub('&#(\d{1,5});',lambda m:unichr( ...


dict.cn有api的啊。。 何須正則這么麻煩

我在這里扔過一個(gè)qt版本的

http://www.javaeye.com/topic/434185

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2009-08-20 08:36 |只看該作者
哈哈,看到這個(gè)覺得俺以前寫的那個(gè)實(shí)在太囧了。

論壇徽章:
0
5 [報(bào)告]
發(fā)表于 2009-08-20 11:24 |只看該作者
事實(shí)上,dict.cn在自己頁面上的解釋和例句比api調(diào)用返回的多多了

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2009-08-20 12:33 |只看該作者
好!
不過有個(gè)問題想起來,如果網(wǎng)頁用腳本(js)所寫,用正則怎么去處理,如果java腳本是一個(gè)函數(shù),而這個(gè)函數(shù)可能就是下載?——python能否處理java腳本?
——多謝!

論壇徽章:
0
7 [報(bào)告]
發(fā)表于 2009-08-20 13:16 |只看該作者
原帖由 nietsche 于 2009-8-20 12:33 發(fā)表
python能否處理java腳本?
——多謝!


糾正一下,java腳本還是叫做javascript吧。
如果網(wǎng)頁用腳本(js)所寫
能否給個(gè)具體例子?

論壇徽章:
0
8 [報(bào)告]
發(fā)表于 2009-08-20 16:06 |只看該作者

回復(fù) #6 nietsche 的帖子

是不是想解析google的翻譯?

論壇徽章:
0
9 [報(bào)告]
發(fā)表于 2009-08-20 16:09 |只看該作者
哈哈,本著學(xué)習(xí)的態(tài)度改了一下3樓的程序

#!/usr/bin/env python
# coding:utf-8

import urllib
import sys
import traceback
import re
from xml.etree.ElementTree import parse



def lookup(word):

&nbsp;&nbsp;&nbsp;&nbsp;dict_url="http://dict.cn/ws.php?utf8=true&q=%s"
&nbsp;&nbsp;&nbsp;&nbsp;url = dict_url % word
&nbsp;&nbsp;&nbsp;&nbsp;resXML = parse(urllib.urlopen(url)).getroot()
&nbsp;&nbsp;&nbsp;&nbsp;p = resXML.find("pron")
&nbsp;&nbsp;&nbsp;&nbsp;d = resXML.find("def")

&nbsp;&nbsp;&nbsp;&nbsp;if  p == None:
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;word = "[%s]" % word
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;url = dict_url % word
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;suggestion = parse(urllib.urlopen(url)).getroot()
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;referenceWords = ",".join([i.text for i in suggestion.findall("sugg")])
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print "也許您要查找的是:" , referenceWords
&nbsp;&nbsp;&nbsp;&nbsp;else:
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print "音:" ,p.text
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print "含義:" ,d.text
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print resXML.findall("sent")
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;for i,sent in enumerate(resXML.findall("sent")):
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print i,sent[0].text
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print "  " + sent[1].text

if __name__ == "__main__":
&nbsp;&nbsp;&nbsp;&nbsp;while(True):
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;word = raw_input("\n輸入您要查詢的單詞(88是退出):")
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;if word == "88":
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;break
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;elif re.search("^([a-zA-Z]*)$",word)==None:
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print "Does not support C to E"
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;break
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;else:
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;try:
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;lookup(word)
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;except Exception,e:
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;print traceback.format_exc()


[ 本帖最后由 wolfg 于 2009-8-20 17:33 編輯 ]

論壇徽章:
0
10 [報(bào)告]
發(fā)表于 2009-08-20 19:17 |只看該作者
原帖由 fmail 于 2009-8-20 00:08 發(fā)表


dict.cn有api的啊。。 何須正則這么麻煩

我在這里扔過一個(gè)qt版本的

http://www.javaeye.com/topic/434185


真是太囧囧囧囧囧了。
原來有個(gè)接口,還傻乎乎的一個(gè)個(gè)searching。


多謝指點(diǎn)。
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP