无码人妻精品一区二区三区66,午夜精品一区二区三区在线视,试看五分钟做受视频

論壇徽章:: 0

電梯直達(dá)

1樓 [收藏(0)] [報(bào)告]

發(fā)表于 2010-12-29 12:53 |只看該作者 |倒序?yàn)g覽

目前我獲得一個(gè)網(wǎng)頁(yè)的html codes
其中有這么一段

－－－－－－－
－－－－－－－
<div class="getcodeinstructions">
<ol class="listings">
   <li><span class="numberone"></span>
<div>
   <label for="bcode">Click inside the box below and copy all the code.</label><br

－－－－－－－
－－－－－
  我想從這個(gè)html codes中找到上面我貼出來(lái)的代碼中的字符串“getcodeinstruction”“

請(qǐng)問(wèn) 有那個(gè)大蝦能指點(diǎn)下嗎？

（目前我  一次行從這個(gè) 里面讀取1024個(gè)bytes，使用 strstr（buffer，"getcodeinstructions"）來(lái) 定位這個(gè)字符串，

但我覺(jué)得會(huì)出現(xiàn)一中情況匹配不到，舉個(gè)例子就是前面1024個(gè)bytes剛好

包含到getcode 就結(jié)束了，然后在一次讀取1024個(gè)bytes，就包含到“instructions”

這樣我就無(wú)法匹配到我我想要的這個(gè)字符串了，不知道有沒(méi)什么更好的辦法來(lái)定位這個(gè)字符串）

不知道這次問(wèn)題說(shuō)清楚了沒(méi)，清各位賜教

文庫(kù)|博客

使用正則表達(dá)式與lex實(shí)現(xiàn)詞法分析器
C語(yǔ)言的MIPS匯編實(shí)現(xiàn)（四）SWITCH
Requested init /linuxrc failed (error -2).
比較 csv 文件中數(shù)據(jù)差異
LMD ElPack v2019.7新版亮點(diǎn)：Transparent mode全新升級(jí)|附下載

scopengl

白手起家

論壇徽章:: 0

2樓 [報(bào)告]

發(fā)表于 2010-12-29 14:52 |只看該作者

假設(shè)你的字符串長(zhǎng)度為L(zhǎng)en，
1.讀取0~1023，匹配
2.讀取1023-Len~2047-Len，匹配
3.讀取2047-2*Len~3072-2*Len，匹配。
.....

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫(kù)RadonDB知多少？

wanshun1818

白手起家

論壇徽章:: 0

3樓 [報(bào)告]

發(fā)表于 2011-02-28 17:19 |只看該作者

回復(fù) 2# scopengl

恩，這個(gè)方法應(yīng)該可以解決字符串cut的問(wèn)題，我等下在debug一下；

目前我遇到另一個(gè)解析的問(wèn)題，就是比如：

我一次讀 1024 個(gè)bytes；
但是可能 host 發(fā)送過(guò)來(lái)的只有500個(gè)bytes ，甚至讀到0個(gè)bytes（網(wǎng)速灰常差時(shí)），但我確實(shí)這個(gè)網(wǎng)頁(yè)的數(shù)據(jù)還沒(méi)發(fā)送完，只是網(wǎng)速不行
我們暫時(shí)還讀不到數(shù)據(jù)而已，那這個(gè) 時(shí)候我的處理是delay一次，然后再去讀取數(shù)據(jù)；可有個(gè)問(wèn)題時(shí)，我如果delay次數(shù)多了，可能解些時(shí)間就慢了，不知道各位大蝦有沒(méi)什么好的解析html的方法，或有什么參考書，或參考資料推薦下；

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫(kù)RadonDB知多少？

shichuan609

白手起家

論壇徽章:: 0

4樓 [報(bào)告]

發(fā)表于 2011-02-28 17:31 |只看該作者

回復(fù) 3# wanshun1818
跟我之前遇到的問(wèn)題差不多。我是一邊獲取數(shù)據(jù)，一遍解析，后來(lái)同事告訴我這樣很危險(xiǎn)，就先獲取html文件，再用libxml解析。

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫(kù)RadonDB知多少？

wanshun1818

白手起家

論壇徽章:: 0

5樓 [報(bào)告]

發(fā)表于 2011-02-28 17:38 |只看該作者

回復(fù) 4# shichuan609

直接獲取html文件？你的意思是說(shuō)，等所有bytes 都發(fā)送完了，在開始解析，是這個(gè)意思馬？

但是如果你讀完才開始解析，那不是就很慢嗎？（尤其在我們所需要定位的字符串在這個(gè)html 開頭或者中間的時(shí)候）

實(shí)戰(zhàn)分享：從技術(shù)角度談機(jī)器學(xué)習(xí)入門| 【大話IT】RadonDB低門檻向MySQL集群下戰(zhàn)書 | ChinaUnix打賞功能已上線！ | 新一代分布式關(guān)系型數(shù)據(jù)庫(kù)RadonDB知多少？

shichuan609

白手起家

論壇徽章:: 0

6樓 [報(bào)告]

發(fā)表于 2011-02-28 17:45 |只看該作者

回復(fù) 5# wanshun1818
好像還是不一樣啊，我是知道html文件每個(gè)節(jié)點(diǎn)的，只是得到數(shù)據(jù)而已。之前做的時(shí)候，好像跟2樓說(shuō)的差不多，也是用拼接的方法，還算挺復(fù)雜的，不過(guò)后來(lái)也能得到數(shù)據(jù)的。