- 論壇徽章:
- 0
|
本帖最后由 lnzfm 于 2013-06-04 13:43 編輯
網(wǎng)上很多資料說(shuō)soup設(shè)置gb18030編碼可以解決亂碼問(wèn)題,可是我的代碼仍然出中萬(wàn)能現(xiàn)亂碼,誰(shuí)能幫我分析下原因
# -*- coding: utf-8 -*-
import urllib2
import sys
from BeautifulSoup import BeautifulSoup
req = urllib2.Request("http://www.aizhan.com/siteall/www.ip138.com/")
f = urllib2.urlopen(req)
#content = f.read().decode('UTF-8').encode('GBK') //網(wǎng)頁(yè)抓取內(nèi)容,顯示中文正常
content = f.read()
soup = BeautifulSoup(content,fromEncoding="gb18030") //使用gb18030編碼問(wèn)題仍沒(méi)解決
for gg in soup.findAll('div',{'class':'box_17'})[1]:
print gg
QQ截圖20130604111755.jpg (14.73 KB, 下載次數(shù): 48)
下載附件
2013-06-04 11:20 上傳
|
|