亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: openoffice odt文件解壓成xml文件,項(xiàng)目編號(hào)以及文本的提取問題 [打印本頁]

作者: feiying00917    時(shí)間: 2014-07-02 12:14
標(biāo)題: openoffice odt文件解壓成xml文件,項(xiàng)目編號(hào)以及文本的提取問題
我用openoffice創(chuàng)建的一個(gè)odt文檔,我先解壓成xml文件,可是在content.xml里面找不到項(xiàng)目編號(hào)了,附件里是odt文件和解壓出來的xml文件. 還有如何提取出正文文件,因?yàn)閏ontent.xml只有2行,還有許多格式的標(biāo)記符,比如在content.xml提取出3.6.1 的內(nèi)容"If someone loves a flower, of which just one single blossom grows in all the millions and millions of stars, it is enough to make him happy just to look at the stars. He can say to himself, "Somewhere, my flower is there…"。  求高手幫忙,萬分感謝。!

test1.png (20.49 KB, 下載次數(shù): 18)

test1.png

test2.png (47.44 KB, 下載次數(shù): 19)

test2.png

example.7z

16.62 KB, 下載次數(shù): 1


作者: huang6894    時(shí)間: 2014-07-02 12:26
使用<[^>]/>就是啦
作者: feiying00917    時(shí)間: 2014-07-02 13:33
求Perl代碼回復(fù) 2# huang6894


   
作者: 104359176    時(shí)間: 2014-07-02 21:20
本帖最后由 104359176 于 2014-07-02 21:21 編輯

用Perl 處理 XML 很蛋疼,不如用 Ruby 或 Python 做個(gè)通用的 XML 解析,然后提取指定 tag 的程序。
作者: feiying00917    時(shí)間: 2014-07-03 09:35
只會(huì)Perl的啊回復(fù) 4# 104359176


   
作者: 104359176    時(shí)間: 2014-07-04 08:27
回復(fù) 5# feiying00917


    連 Perl 都能學(xué)會(huì),Ruby 和 Python 更不在話下。




歡迎光臨 Chinaunix (http://72891.cn/) Powered by Discuz! X3.2