亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 19157 | 回復: 2
打印 上一主題 下一主題

python pandas讀取CSV問題 [復制鏈接]

論壇徽章:
0
跳轉到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2020-03-15 21:22 |只看該作者 |倒序瀏覽
由于需要對產(chǎn)品測試數(shù)據(jù)進行分析,想到了用Python的pandas進行數(shù)據(jù)分析,數(shù)據(jù)源是csv格式的,想到了用read_csv來讀取dataframe。
但是數(shù)據(jù)源的格式很煩人,上半部分是測試的一些Summary,只有一列內(nèi)容,而測試數(shù)據(jù)是逗號分隔符的標準csv格式如下圖所示:

在pandas讀入csv的時候總是會提示:pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 146, saw 126
感覺應該是兩塊數(shù)據(jù)區(qū)域的分隔符不同導致pandas無法讀取。自己嘗試將兩個數(shù)據(jù)域分成兩個csv文件均可以正常讀取。

但是考慮到要批量處理,人工分數(shù)據(jù)域工作量太大,想通過腳本自動執(zhí)行。
數(shù)據(jù)源中有一個特殊的字符SITE_NUM,初步想法是查找SITE_NUM所在行,
將SITE_NUM所在行前面的數(shù)據(jù)存為一個CSV文件,將SITE_NUM所在行后面的數(shù)據(jù)存為另一個CSV文件,再通過pandas進行處理。

在網(wǎng)上查找了很多方法,都不太好實現(xiàn),想請教一下有什么比較好的處理方法。
最好是python直接處理,因為后續(xù)數(shù)據(jù)分析還想要用python。

附件是數(shù)據(jù)源,謝謝大家~
rawData.zip (152.59 KB, 下載次數(shù): 11)



論壇徽章:
8
2016科比退役紀念章
日期:2018-10-24 08:24:0115-16賽季CBA聯(lián)賽之北控
日期:2019-03-12 14:34:562016科比退役紀念章
日期:2019-04-01 10:33:0915-16賽季CBA聯(lián)賽之山東
日期:2019-04-17 12:46:3215-16賽季CBA聯(lián)賽之廣夏
日期:2019-05-09 16:40:4015-16賽季CBA聯(lián)賽之廣夏
日期:2019-10-10 15:33:4015-16賽季CBA聯(lián)賽之遼寧
日期:2019-10-15 08:37:0615-16賽季CBA聯(lián)賽之北控
日期:2021-03-30 15:53:34
2 [報告]
發(fā)表于 2020-03-16 14:26 |只看該作者
首先源格式因為前半部分存在就不是嚴格的csv,如果用awk或sed先分成兩個csv再處理也可以,不過其實你只需知道真正的數(shù)據(jù)行是哪行開始的,即找到 ”SITE_NUM“ 所在的行號就可以了。
那最直接的就是先文本先讀進來,再找目標行:
  1. with open("1.csv","r") as f:
  2.      for i,line in enumerate(f,start=1):
  3.          if "SITE_NUM" in line:
  4.              print("數(shù)據(jù)開始行號",i)
  5.              break
復制代碼

開始行號知道了,你后面pandas就好處理了吧。

評分

參與人數(shù) 1可用積分 +10 收起 理由
飄絮絮絮丶 + 10 贊一個!

查看全部評分

論壇徽章:
0
3 [報告]
發(fā)表于 2020-03-18 16:29 |只看該作者
回復 2# cfwyy

了解,謝謝~
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP