亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 24604147 | 回復: 24604147
打印 上一主題 下一主題

有個文本匹配搜素的問題 求思路 [復制鏈接]

論壇徽章:
0
跳轉到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2015-07-01 18:07 |只看該作者 |倒序瀏覽
本帖最后由 david_95 于 2015-07-01 18:08 編輯

有文本文件內容如下:

        item_package_dimensions: [
            {
                length: {
                    normalized_value: {
                        unit: inches,
                        value: 10.599999989188,
                    },
                    unit: centimeters,
                    value: 26.924,
                },
                width: {
                    normalized_value: {
                        unit: inches,
                        value: 10.49999998929,
                    },
                    unit: centimeters,
                    value: 26.67,
                },

                height: {
                    normalized_value: {
                        unit: inches,
                        value: 1.699999998266,
                    },
                    unit: centimeters,
                    value: 4.318,
                },
                source_customer_id: 120098015,
            },
        ],
        manufacturer: [
            {
                value: "Hasbro Games",
                language_tag: zh_CN,
            },
        ],
        。。。 下面還有很多類似字符串

我想搜索匹配item的相應內容 ,比如我搜“width”,從“:{”開始 ,讀取其下所有的字符串,直到遇到對應的“}”為止
問題:
1 我可以用正則匹配找到第一個 width, 我怎么定位到該行,并從該行開始繼續(xù)讀入
2 我怎么找到對應的結束符 }      
腦子轉不動了,求指點

論壇徽章:
20
卯兔
日期:2015-01-26 22:05:142015亞冠之薩濟拖拉機
日期:2015-09-10 15:15:282015亞冠之阿爾希拉爾
日期:2015-09-25 17:37:53程序設計版塊每日發(fā)帖之星
日期:2015-10-03 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-12-09 06:20:00CU十四周年紀念徽章
日期:2015-12-17 09:07:15程序設計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:34程序設計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:34程序設計版塊每日發(fā)帖之星
日期:2015-12-25 06:20:342015亞冠之廣州富力
日期:2015-08-27 19:29:56每日論壇發(fā)貼之星
日期:2015-08-26 06:20:002015亞冠之阿爾希拉爾
日期:2015-05-18 17:26:27
2 [報告]
發(fā)表于 2015-07-01 21:17 |只看該作者
本帖最后由 songyc_2015 于 2015-07-01 21:22 編輯

回復 1# david_95
  1. perl -lne 'if($flag&&!$kuo){print $str;last}$flag=1 if / +width:/;$kuo++ if $flag&&/{/;$kuo-- if $flag&&/}/;$str.=$_."\n" if $flag' file
復制代碼
  1. $cat test.pl
  2. #!/usr/bin/env perl
  3. use strict;
  4. use warnings;

  5. my $str = "width:";
  6. my ($flag, $kuo, $rs) = (0, 0, "");
  7. while (<ARGV>)
  8. {
  9.         if ($flag and $kuo == 0)
  10.         {
  11.                 print "rs=[$rs]\n";
  12.                 $flag = 0;
  13.                 last;
  14.         }
  15.         $flag = 1 if / +$str/;
  16.         $kuo++ if $flag and /{/;
  17.         $kuo-- if $flag and /}/;
  18.         $rs .= $_ if $flag;
  19. }
  20. $perl test.pl file
復制代碼

求職 : 軟件工程師
論壇徽章:
3
程序設計版塊每日發(fā)帖之星
日期:2015-10-07 06:20:00程序設計版塊每日發(fā)帖之星
日期:2015-12-13 06:20:00程序設計版塊每日發(fā)帖之星
日期:2016-05-05 06:20:00
3 [報告]
發(fā)表于 2015-07-02 11:00 |只看該作者
這似乎是某種數(shù)據(jù)格式

論壇徽章:
46
15-16賽季CBA聯(lián)賽之四川
日期:2018-03-27 11:59:132015年亞洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49雙魚座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亞冠之布里斯班獅吼
日期:2015-07-13 10:44:56
4 [報告]
發(fā)表于 2015-07-02 11:29 |只看該作者
這格式很清晰,寫個解析器很快的。甚至你把所有東西都加上引號(除了已經(jīng)有引號的字符串)再把 : 替換成 , 都能用 eval 了。

論壇徽章:
0
5 [報告]
發(fā)表于 2015-07-02 12:24 |只看該作者
十分感謝,我也想出來一個法子,正在試

論壇徽章:
0
6 [報告]
發(fā)表于 2015-07-02 13:58 |只看該作者
@zhlong8 , 這確實是種數(shù)據(jù)結構,不過有什么好處,我理解的不是很深刻,什么方面體現(xiàn)解析器好寫?能深入指點一下嗎?
我總覺得這個太麻煩,有點像 json ,但是{ [ 一堆,數(shù)據(jù)干嘛弄這么復雜,理解不了。我還不太理解{ 【 有啥子區(qū)別..

論壇徽章:
46
15-16賽季CBA聯(lián)賽之四川
日期:2018-03-27 11:59:132015年亞洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49雙魚座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亞冠之布里斯班獅吼
日期:2015-07-13 10:44:56
7 [報告]
發(fā)表于 2015-07-02 23:07 |只看該作者
回復 6# david_95


    寫這個的時候或許作者還不知道 JSON 語法不完全符合,要不能節(jié)省你很多生命。寫個簡單情況能工作的
  1. use strict;
  2. use warnings;

  3. use Data::Dumper;

  4. my @stack = {};

  5. while (<>) {
  6.     #刪除空白
  7.     s/^\s*//;
  8.     s/[\s,]*$//;
  9.     next if $_ eq '';

  10.     if ($_ eq '{') {
  11.         push @stack, {};
  12.     } elsif ($_ eq '[') {
  13.         push @stack, [];
  14.     } elsif ($_ eq '}' or $_ eq ']') {
  15.         if (ref $stack[-2]) { #上一級是數(shù)組
  16.             push @{$stack[-2]}, $stack[-1];
  17.             pop @stack;
  18.         } else { #上一級是哈希時棧中還保存了key, ref 字符串返回 false
  19.             $stack[-3]->{$stack[-2]} = $stack[-1];
  20.             pop @stack;
  21.             pop @stack;
  22.         }
  23.     } elsif (/(\w+)\s*:\s*"?(.*?)"?$/) {
  24.         if ($2 eq '{') {
  25.             push @stack, $1, {};
  26.         } elsif ($2 eq '[') {
  27.             push @stack, $1, [];
  28.         } else {
  29.             $stack[-1]->{$1} = $2;
  30.         }
  31.     } else {
  32.         die "line: $. '$_'";
  33.     }
  34. }

  35. die "unmatch bracket." if @stack != 1;


  36. $Data::Dumper::Indent = 1;
  37. print Dumper $stack[0];
復制代碼

評分

參與人數(shù) 1信譽積分 +50 收起 理由
L_WC + 50 很給力,長見識了

查看全部評分

論壇徽章:
46
15-16賽季CBA聯(lián)賽之四川
日期:2018-03-27 11:59:132015年亞洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49雙魚座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亞冠之布里斯班獅吼
日期:2015-07-13 10:44:56
8 [報告]
發(fā)表于 2015-07-02 23:30 |只看該作者
27行正則表達式少了個 ^

論壇徽章:
0
9 [報告]
發(fā)表于 2015-07-03 11:21 |只看該作者
謝謝,先收藏研究一下

論壇徽章:
0
10 [報告]
發(fā)表于 2015-07-07 09:54 |只看該作者
本帖最后由 huyang_ 于 2015-07-07 14:17 編輯

動手寫了下,不知道符不符合你的需求,把符合條件的字符串都提取出來了,怎么輸出你就自己決定吧
  1. #!/usr/bin/perl -w
  2. use strict;
  3. use Data::Dumper;
  4. my $str = $ARGV[0];   #獲取想要匹配的字符串,比如width
  5. my $stack = {};
  6. my $n = 0;            #記錄當前讀取文件的行數(shù)
  7. my $left = 0;         #左大括號
  8. my $right = 0;
  9. my $start = 0;
  10. open( FILE,"1.txt" ) ;   #替換為具體的文件路徑
  11. while( <FILE> )
  12. {
  13.         chomp;
  14.   $n++;

  15.   if(/$str:\s*\{/)
  16.   {
  17.     $start = $n;
  18.     $left++;
  19.     $stack->{$start}->{$n} = $_;
  20.     next;
  21.   }

  22.   unless($left == 0)
  23.   {
  24.     if(/([\{}])/)
  25.     {
  26.             if($1 eq '{')
  27.             {
  28.                     $left++;
  29.             }else{
  30.                     $right++;
  31.             }
  32.       if($left == $right)
  33.       {
  34.               $left = 0;
  35.               $right = 0;
  36.       }
  37.       $stack->{$start}->{$n} = $_;
  38.     }else{
  39.       $stack->{$start}->{$n} = $_;
  40.     }
  41.   }
  42. }
  43. close(FILE);
  44. print Dumper($stack);
復制代碼
執(zhí)行腳本的時候需要加上你要搜索的字符串,比如perl  xx.pl width
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP