亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊(cè) 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫(kù)
12下一頁(yè)
最近訪問(wèn)板塊 發(fā)新帖
查看: 3171 | 回復(fù): 10
打印 上一主題 下一主題

[文本處理] awk 使用變量 以及更簡(jiǎn)單的方法 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2015-08-14 12:52 |只看該作者 |倒序?yàn)g覽
本帖最后由 Piaomiao139 于 2015-08-14 12:55 編輯

想寫一個(gè)爬網(wǎng)站的腳本
現(xiàn)在的思路是
1).獲取指定網(wǎng)站的類容
2).根據(jù)指定網(wǎng)站獲取隨后網(wǎng)站的類容(也就是這個(gè)網(wǎng)站有多少url 根據(jù)相應(yīng)的url在去爬其他網(wǎng)站)
現(xiàn)在問(wèn)題來(lái)了。
#!/bin/bash
# this function is get url in html

filename=$1
lineinfonumber=
while read 'Line'
do

    if [[ $Line == *[hH]ttp* ]]
    then
   
    lineinfonumber=`echo "$Line"|awk -F '"' '{print NF-1}'`
    ((printline= $lineinfonumber/2))
    printstr=
    for(( i=1;i<=$printline;i++))
    do
       ((printnumber=$i*2))
       printstr=$printstr"$"$printnumber
    done  
    echo $printstr
    printin='$1$2'
    echo "$Line" |awk -F '"' '{print '$printin'}'
    echo "$Line" |awk -F '"' '{print '$printstr'}'
fi
done < $filename

在這:
    echo $printstr
    printin='$1$2'
    echo "$Line" |awk -F '"' '{print '$printin'}'
    echo "$Line" |awk -F '"' '{print '$printstr'}'
的時(shí)候根本無(wú)法使用這個(gè)變量       $printstr 反而直接定義的可以使用 寫了半天了 完全沒(méi)反應(yīng)  
有什么方法?
或者更簡(jiǎn)單的方法?

論壇徽章:
54
2015亞冠之德黑蘭石油
日期:2015-07-07 13:00:1615-16賽季CBA聯(lián)賽之深圳
日期:2016-03-31 09:03:5415-16賽季CBA聯(lián)賽之遼寧
日期:2016-05-09 20:38:15程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-05-12 06:20:0015-16賽季CBA聯(lián)賽之四川
日期:2016-05-13 15:19:4715-16賽季CBA聯(lián)賽之福建
日期:2016-05-15 20:24:34每日論壇發(fā)貼之星
日期:2016-05-16 06:20:0015-16賽季CBA聯(lián)賽之吉林
日期:2016-05-26 11:49:4715-16賽季CBA聯(lián)賽之廣東
日期:2016-05-26 13:49:18極客徽章
日期:2016-12-07 14:05:2315-16賽季CBA聯(lián)賽之廣夏
日期:2016-12-20 17:33:532017金雞報(bào)曉
日期:2017-01-10 15:19:56
2 [報(bào)告]
發(fā)表于 2015-08-14 12:53 |只看該作者
awk -v ....

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2015-08-14 12:53 |只看該作者
用while 是因?yàn)檫要對(duì)每句的文本處理

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2015-08-14 12:54 |只看該作者
回復(fù) 2# haooooaaa


    不是awk -v
是為什么呢?
因?yàn)檫@樣也可以使用變量的你試試哇

論壇徽章:
0
5 [報(bào)告]
發(fā)表于 2015-08-14 12:56 |只看該作者
可以試試  在print的時(shí)候是可以使用變量的
但是 我在這里不可以 就不知道為什么了

論壇徽章:
23
15-16賽季CBA聯(lián)賽之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午馬
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16賽季CBA聯(lián)賽之山東
日期:2017-12-21 16:39:1915-16賽季CBA聯(lián)賽之廣東
日期:2016-01-19 13:33:372015亞冠之山東魯能
日期:2015-10-13 09:39:062015亞冠之西悉尼流浪者
日期:2015-09-21 08:27:57
6 [報(bào)告]
發(fā)表于 2015-08-14 12:59 |只看該作者
回復(fù) 1# Piaomiao139


我這里是可以的:
  1. $ printin='$1$2'
  2. $ echo '1"2"3' | awk -F '"' '{print '$printin'}'
  3. 12
復(fù)制代碼

論壇徽章:
0
7 [報(bào)告]
發(fā)表于 2015-08-14 13:04 |只看該作者
回復(fù) 6# ly5066113


    對(duì)這樣 是可以 但是你之前的是個(gè)變量就不可以了。完全不知道為什么。
Line='<!DOCTYPE html><html><!--STATUS OK--><head><meta http-equiv="X-UA-Compatible" content="IE=Edge" /><meta charset="utf-8" />'
lineinfonumber=`echo "$Line"|awk -F '"' '{print NF-1}'`
    ((printline= $lineinfonumber/2))
    printstr=
    for(( i=1;i<=$printline;i++))
    do
       ((printnumber=$i*2))
       printstr=$printstr"$"$printnumber
    done  
    echo $printstr
    printin=`echo "$printstr"|sed 's/','$//g' `
   
    printin='$1$2'
    echo $printstr
    echo $printin
    echo "$Line" |awk -F '"' '{print '$printin'}'
    echo "$Line" |awk -F '"' '{print '$printstr'}'
這樣你試試哇

論壇徽章:
7
2015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:57:092015小元宵徽章
日期:2015-03-06 15:58:18程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-08-09 06:20:00每日論壇發(fā)貼之星
日期:2015-08-09 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-08-22 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2015-08-27 06:20:00
8 [報(bào)告]
發(fā)表于 2015-08-14 13:16 |只看該作者
本帖最后由 tuyajie 于 2015-08-14 13:21 編輯

  1. [unar@Prod-UNAR-M1 s02_signals.cm_flight.cm_flight]$ a='$1,$2'
  2. [unar@Prod-UNAR-M1 s02_signals.cm_flight.cm_flight]$  echo "1\"2" | awk -F'"' '{OFS=",";print '$a'}'
  3. 1,2
  4. [jay.liu@aliCloud chinaUnix]$ awk --version
  5. GNU Awk 4.0.1
復(fù)制代碼
我解釋不來(lái)了。。。

論壇徽章:
23
15-16賽季CBA聯(lián)賽之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午馬
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辭舊歲徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16賽季CBA聯(lián)賽之山東
日期:2017-12-21 16:39:1915-16賽季CBA聯(lián)賽之廣東
日期:2016-01-19 13:33:372015亞冠之山東魯能
日期:2015-10-13 09:39:062015亞冠之西悉尼流浪者
日期:2015-09-21 08:27:57
9 [報(bào)告]
發(fā)表于 2015-08-14 13:37 |只看該作者
回復(fù) 7# Piaomiao139

沒(méi)發(fā)現(xiàn)什么問(wèn)題,不是很正常么?
  1. $ test.sh
  2. $2$4$6
  3. $2$4$6
  4. $1$2
  5. <!DOCTYPE html><html><!--STATUS OK--><head><meta http-equiv=X-UA-Compatible
  6. X-UA-CompatibleIE=Edgeutf-8
  7. $ cat test.sh
  8. #! /bin/bash
  9. Line='<!DOCTYPE html><html><!--STATUS OK--><head><meta http-equiv="X-UA-Compatible" content="IE=Edge" /><meta charset="utf-8" />'
  10. lineinfonumber=`echo "$Line"|awk -F '"' '{print NF-1}'`
  11.     ((printline= $lineinfonumber/2))
  12.     printstr=
  13.     for(( i=1;i<=$printline;i++))
  14.     do
  15.        ((printnumber=$i*2))
  16.        printstr=$printstr"$"$printnumber
  17.     done  
  18.     echo $printstr
  19.     printin=`echo "$printstr"|sed 's/','$//g' `
  20.    
  21.     printin='$1$2'
  22.     echo $printstr
  23.     echo $printin
  24.     echo "$Line" |awk -F '"' '{print '$printin'}'
  25.     echo "$Line" |awk -F '"' '{print '$printstr'}'
復(fù)制代碼

論壇徽章:
0
10 [報(bào)告]
發(fā)表于 2015-08-14 13:51 |只看該作者
回復(fù) 9# ly5066113


    我的有問(wèn)題 不知道為什么換個(gè)環(huán)境正常。
您需要登錄后才可以回帖 登錄 | 注冊(cè)

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過(guò)ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請(qǐng)注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP