亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 20306 | 回復(fù): 5
打印 上一主題 下一主題

[文本處理] jq處理文本合并json數(shù)據(jù) [復(fù)制鏈接]

論壇徽章:
1
2015年亞洲杯之巴林
日期:2015-04-02 09:32:18
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2023-08-31 23:16 |只看該作者 |倒序?yàn)g覽
不好意思各位大神,做一次伸手黨
從數(shù)據(jù)庫中導(dǎo)出了如下文本數(shù)據(jù) 1.txt 的內(nèi)容

{"分類A": {"url": "1310222208d125e4b54e0fe2e2.jpg", "link": "123.html", "title": "題目a"}}
{"分類A": {"url": "1310222208ce4207dfc9be676d.jpg", "link": "454.html", "title": "題目b"}}
{"分類B": {"url": "13102222083e5d22e5f198bb64.jpg", "link": "333.html", "title": "題目c"}}
{"分類B": {"url": "1603222322b21be8b598485481.jpg", "link": "653.html", "title": "題目d"}}
{"分類C": {"url": "16032223224da681cbeb817221.jpg", "link": "778.html", "title": "題目e"}}
{"分類C": {"url": "16032223221e21022ca3390f04.jpg", "link": "999.html", "title": "題目f"}}



可以看到1.txt本身不符合json規(guī)范標(biāo)準(zhǔn),但是每一條數(shù)據(jù)都是符合json規(guī)范的,想把“分類X”這個(gè)key進(jìn)行去重復(fù),它的值合并為數(shù)組,用[]包起來,想得到如下符合json規(guī)范標(biāo)準(zhǔn)的數(shù)據(jù):


{
    "分類A": [{
            "url": "1310222208d125e4b54e0fe2e2.jpg",
            "link": "123.html",
            "title": "題目a"
        },
        {
            "url": "1310222208ce4207dfc9be676d.jpg",
            "link": "454.html",
            "title": "題目b"
        }
    ],
    "分類B": [{
            "url": "13102222083e5d22e5f198bb64.jpg",
            "link": "333.html",
            "title": "題目c"
        },
        {
            "url": "1603222322b21be8b598485481.jpg",
            "link": "653.html",
            "title": "題目d"
        }
    ],
    "分類C": [{
            "url": "16032223224da681cbeb817221.jpg",
            "link": "778.html",
            "title": "題目e"
        },
        {
            "url": "16032223221e21022ca3390f04.jpg",
            "link": "999.html",
            "title": "題目f"
        }
    ]
}



用shell或者jq都可以

論壇徽章:
25
程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-05-03 06:20:0015-16賽季CBA聯(lián)賽之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16賽季CBA聯(lián)賽之佛山
日期:2018-08-03 13:19:3315-16賽季CBA聯(lián)賽之山西
日期:2018-08-07 19:46:2315-16賽季CBA聯(lián)賽之廣夏
日期:2018-08-08 19:31:5015-16賽季CBA聯(lián)賽之青島
日期:2018-11-26 15:21:5015-16賽季CBA聯(lián)賽之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16賽季CBA聯(lián)賽之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16賽季CBA聯(lián)賽之八一
日期:2018-07-03 16:56:46
2 [報(bào)告]
發(fā)表于 2023-09-02 16:29 |只看該作者
本帖最后由 wh7211 于 2023-09-06 12:49 編輯

回復(fù) 1# opiopuiopoi


  1. awk -F"[{}]" 'BEGIN{a4="    ";a8="        ";a11="           "}!b[$2]++{if(c){e=c"["d"],";f=f?f"\n"e:e;c=d=""}}{c=a4""$2;d=d?d",{ "$3"}":"{ "$3"}"}END{if(c){e=c"["d"]";f=f?f"\n"e:e;f=gensub(/({|",)/,"\\1\n"a11"","g",f);f=gensub(/(},)/,"\n"a8"\\1\n"a8"","g",f);f=gensub(/(}](,|))/,"\n"a8"\\1","g",f);f=gensub(/(](,|))/,"\n"a4"\\1","g",f);print "{\n"f"\n}"}}' 1
復(fù)制代碼

  1. awk -F"[{ }]+" 'BEGIN{a4="    ";a8="        ";a12="            ";print "{"}!b[$2]++{if(d){print d" ["e"\n"a4"],";d=e=""}}{for(i=3;i<NF;i++){if(i%2==1){$i="\n"a12""$i" "}else if(i==NF-1){$i=$i"\n"a8};c=c?c""$i:$i};d=a4""$2;e=e?e",\n"a8"{"c"}":"{"c"}";c=""}END{if(d){print d" ["e"\n"a4"]\n}"}}' 1
復(fù)制代碼

  1. awk 'BEGIN{print "{"}{match($0,"^{([^{]+)({[^}]+})}$",a);if(!b[a[1]]++&&c){print c"["d"],";c=d=""};c=a[1];d=d?d","a[2]:a[2]}END{if(c){print c"["d"]}"}}' 1|jq '.'
復(fù)制代碼

論壇徽章:
0
3 [報(bào)告]
發(fā)表于 2023-09-04 19:08 來自手機(jī) |只看該作者
提示: 作者被禁止或刪除 內(nèi)容自動屏蔽

論壇徽章:
0
4 [報(bào)告]
發(fā)表于 2023-09-04 19:10 來自手機(jī) |只看該作者
提示: 作者被禁止或刪除 內(nèi)容自動屏蔽

論壇徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亞冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16賽季CBA聯(lián)賽之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
5 [報(bào)告]
發(fā)表于 2023-09-19 10:28 |只看該作者
  1. [root@4893971a45c8 ~]# cat 1.rb
  2. #!/usr/bin/ruby
  3. require 'json'
  4. rs = {}
  5. IO.foreach("1.txt") do |line|
  6.     t = JSON.parse(line)
  7.     t.each do |k,v|
  8.         rs[k] ||= []
  9.         rs[k] << v
  10.     end
  11. end
  12. puts rs.to_json(:indent => "  ", :array_nl => "\n", :object_nl => "\n")
  13. [root@4893971a45c8 ~]# ./1.rb
  14. {
  15.   "分類A":[
  16.     {
  17.       "url":"1310222208d125e4b54e0fe2e2.jpg",
  18.       "link":"123.html",
  19.       "title":"題目a"
  20.     },
  21.     {
  22.       "url":"1310222208ce4207dfc9be676d.jpg",
  23.       "link":"454.html",
  24.       "title":"題目b"
  25.     }
  26.   ],
  27.   "分類B":[
  28.     {
  29.       "url":"13102222083e5d22e5f198bb64.jpg",
  30.       "link":"333.html",
  31.       "title":"題目c"
  32.     },
  33.     {
  34.       "url":"1603222322b21be8b598485481.jpg",
  35.       "link":"653.html",
  36.       "title":"題目d"
  37.     }
  38.   ],
  39.   "分類C":[
  40.     {
  41.       "url":"16032223224da681cbeb817221.jpg",
  42.       "link":"778.html",
  43.       "title":"題目e"
  44.     },
  45.     {
  46.       "url":"16032223221e21022ca3390f04.jpg",
  47.       "link":"999.html",
  48.       "title":"題目f"
  49.     }
  50.   ]
  51. }
復(fù)制代碼

論壇徽章:
0
6 [報(bào)告]
發(fā)表于 2023-10-22 19:10 |只看該作者
本帖最后由 csccyab 于 2023-10-22 19:15 編輯

用 python 寫了這個(gè):
import json
from collections import defaultdict

new_dict = defaultdict(list)

f = open("1.txt", "r")
for line in f:
  first_key = list(json.loads(line).keys())[0]
  new_dict[first_key].append(json.loads(line)[first_key])
print(json.dumps(new_dict, indent=4, ensure_ascii=False))




Output:
$ python3 jsonify.py
{
    "分類A": [
        {
            "url": "1310222208d125e4b54e0fe2e2.jpg",
            "link": "123.html",
            "title": "題目a"
        },
        {
            "url": "1310222208ce4207dfc9be676d.jpg",
            "link": "454.html",
            "title": "題目b"
        }
    ],
    "分類B": [
        {
            "url": "13102222083e5d22e5f198bb64.jpg",
            "link": "333.html",
            "title": "題目c"
        },
        {
            "url": "1603222322b21be8b598485481.jpg",
            "link": "653.html",
            "title": "題目d"
        }
    ],
    "分類C": [
        {
            "url": "16032223224da681cbeb817221.jpg",
            "link": "778.html",
            "title": "題目e"
        },
        {
            "url": "16032223221e21022ca3390f04.jpg",
            "link": "999.html",
            "title": "題目f"
        }
    ]
}

您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP