亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 4965 | 回復(fù): 3
打印 上一主題 下一主題

如何用python提取XML中的注釋 [復(fù)制鏈接]

論壇徽章:
2
2015年迎新春徽章
日期:2015-03-04 10:01:44程序設(shè)計版塊每日發(fā)帖之星
日期:2015-06-28 22:20:00
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2015-11-28 11:48 |只看該作者 |倒序瀏覽
XML中的注釋格式都是<! XXXXXX -->
如何用python中的XML模塊把注釋提取出來呢
from xml.dom import minidom as xml 這里面沒找到相關(guān)的方法

論壇徽章:
0
2 [報告]
發(fā)表于 2015-11-28 20:11 |只看該作者
解析HTML/XML目前為止API最方便最好用的是BeautifulSoup,封裝了lxml/html5lib/html庫,對外提供更友好的API接口。

比如搜索所有的注釋
  1. from bs4 import BeautifulSoup, Comment
  2. soup = BeautifulSoup(content, 'lxml')
  3. comments = soup.find_all(text=lambda text : isinstance(text, Comment))
  4. for cm in comments:
  5.     print(cm.string)
復(fù)制代碼

評分

參與人數(shù) 1信譽積分 +10 收起 理由
substr函數(shù) + 10 贊一個!

查看全部評分

論壇徽章:
2
2015年迎新春徽章
日期:2015-03-04 10:01:44程序設(shè)計版塊每日發(fā)帖之星
日期:2015-06-28 22:20:00
3 [報告]
發(fā)表于 2015-11-30 10:32 |只看該作者
找到一個方法:注釋也是一個NODE,可以遍歷node的類型
for child in att[0].childNodes:
    if child.nodeType == Node.COMMENT_NODE:
        print child.data

論壇徽章:
0
4 [報告]
發(fā)表于 2015-12-02 14:24 |只看該作者
借此寶地追問一個問題。
<jvmSettings>
  <initialMemorySize>512</initialMemorySize>
  <maxMemorySize>3072</maxMemorySize>
  <extraArguments>
    <extraArgument>-server</extraArgument>
    <extraArgument>-Djava.awt.headless=true</extraArgument>
    <extraArgument>-Dfile.encoding=UTF-8</extraArgument>
  </extraArguments>
</jvmSettings>
怎么把以上文本追加近xml文件。我追加之后變成了一行。pretty_print選項不生效回復(fù) 2# cdhigh


   
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP