亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 3241 | 回復(fù): 1
打印 上一主題 下一主題

新浪新聞采集程序 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2015-07-02 09:57 |只看該作者 |倒序?yàn)g覽
[PHP]代碼
  1. <?php
  2.     //error_reporting(0);
  3.     $date=date("Ymd");
  4.     //echo $date;
  5.     $url="http://top.finance.sina.com.cn/ws/GetTopDataList.php?top_type=day&top_cat=all&top_time=".$date."&top_show_num=20&top_order=ASC";
  6.     $doc=file_get_contents($url);
  7.     header("Content-Type:text/html;charset=gb2312");//UNICODE轉(zhuǎn)GB2312
  8.     //echo $doc;
  9.     preg_match_all('/"url":".*l/U',$doc,$article);//獲取文章列表
  10.     $article=current($article);//二維數(shù)組轉(zhuǎn)一維數(shù)組
  11.     //print_r($article);
  12.     $rule="/\"url\":(.*)\"\"/";
  13.     function OnlyUrl($string){
  14.        $string=stripslashes($string);
  15.        $string=str_replace('"url":"',"",$string);
  16.        return $string;
  17.     }
  18.      
  19.     function GetTitle($url){  //獲取文章標(biāo)題
  20.       $doc=file_get_contents($url);
  21.       $rule="/<h1 (.*)<\/h1>/";
  22.       preg_match($rule,$doc,$result);
  23.       echo $result;
  24.     }
  25.     foreach($article as &$value){
  26.         $value=OnlyUrl($value);
  27.     }//提取了URL
  28. ?>
  29. <?php
  30.   function GetTitle($url){  //獲取文章標(biāo)題
  31.     $rule="/<h1 (.*)<\/h1>/";
  32.     preg_match_all($rule,$doc,$result);
  33.     $rule="/>(.*)</";//截掉<h1></h1>
  34.     preg_match($rule,$result[0][1],$title);
  35.     return $title[1];
  36.   }
  37.   function GetContent($url){
  38.     $doc=file_get_contents($url);//打開網(wǎng)頁
  39.   // echo $doc;
  40.     $rule="/publish_helper(.*)publish_helper_end/xs";
  41.     preg_match($rule,$doc,$result);//取出正文部分
  42.     //echo $result[0];
  43.     $rule="/publish_helper(.*)<\/blockquote>/xs";
  44.     preg_match($rule,$result[0],$out);//取出鏈接部分
  45.     //print_r($out);
  46.     $content=str_replace($out[0],"",$result[0]);//提取純文字段的內(nèi)容
  47.     echo $content;
  48.   }
  49. ?>
復(fù)制代碼

論壇徽章:
59
2015七夕節(jié)徽章
日期:2015-08-24 11:17:25ChinaUnix專家徽章
日期:2015-07-20 09:19:30每周論壇發(fā)貼之星
日期:2015-07-20 09:19:42ChinaUnix元老
日期:2015-07-20 11:04:38榮譽(yù)版主
日期:2015-07-20 11:05:19巳蛇
日期:2015-07-20 11:05:26CU十二周年紀(jì)念徽章
日期:2015-07-20 11:05:27IT運(yùn)維版塊每日發(fā)帖之星
日期:2015-07-20 11:05:34操作系統(tǒng)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:36程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:40數(shù)據(jù)庫技術(shù)版塊每日發(fā)帖之星
日期:2015-07-20 11:05:432015年辭舊歲徽章
日期:2015-07-20 11:05:44
2 [報(bào)告]
發(fā)表于 2015-07-10 10:10 |只看該作者
采集哪些新聞啊。
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP