亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 3500 | 回復(fù): 6
打印 上一主題 下一主題

[文本處理] wc -l統(tǒng)計數(shù)據(jù)和實(shí)際數(shù)據(jù)有誤差?求指導(dǎo) [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2013-11-15 14:13 |只看該作者 |倒序?yàn)g覽
我一個文件使用wc -l統(tǒng)計后結(jié)果不一致

oracle@linux:~/> wc -l 00010.txt
115657 00010.txt

但是實(shí)際我這個00010.txt文件里有115658條記錄
vi 打開這個文件到最后一行,顯示下行號是下面的數(shù)據(jù)

115656 2348101250202
115657 2348101250274
115658 2348101250427
:set nu      


然后又執(zhí)行了下蝦米操作
oracle@linux:~/> vi -b 00010.txt
然后在執(zhí)行了下
set fileencoding=iso-8859-1


115656 2348101250202
115657 2348101250274
115658 2348101250427
:set fileencoding=iso-8859-1


保存退出后再用wc -l統(tǒng)計下這個文件
oracle@linux:~/> wc -l 00010.txt
115658 00010.txt

請教下這個是問什么呢?文件格式問題?還是這個文件要轉(zhuǎn)換成什么BOM之類的。
不太了解請大神們指點(diǎn)下。。

論壇徽章:
32
處女座
日期:2013-11-20 23:41:20雙子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00處女座
日期:2014-07-22 17:30:47獅子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥豬
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58處女座
日期:2014-12-02 09:17:52程序設(shè)計版塊每日發(fā)帖之星
日期:2015-06-16 22:20:002015亞冠之塔什干火車頭
日期:2015-06-20 23:28:22
2 [報告]
發(fā)表于 2013-11-15 14:21 |只看該作者
目測你這個文件是從Windows系統(tǒng)復(fù)制過來的,所以最后一行沒有換行~用dos2unix命令轉(zhuǎn)化一下即可~
然后又執(zhí)行了下蝦米操作
炒菜呢?

論壇徽章:
145
技術(shù)圖書徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11獅子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龍
日期:2014-01-08 15:26:12技術(shù)圖書徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
3 [報告]
發(fā)表于 2013-11-15 14:24 |只看該作者
本帖最后由 jason680 于 2013-11-15 14:25 編輯

回復(fù) 1# gumuzhiyu

It seems some bug in wc when last line didn't have "enter" charactor
you can try awk that didn't have this issue

# echo 123 | wc -l
1

# echo -n 123 | wc -l
0

# echo -n 123 | awk 'END{print NF}'
1

# echo 123 | awk 'END{print NF}'
1

   

論壇徽章:
0
4 [報告]
發(fā)表于 2013-11-15 14:32 |只看該作者
回復(fù) 2# yestreenstars

我dos2unix 了也沒用。。


   

論壇徽章:
32
處女座
日期:2013-11-20 23:41:20雙子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00處女座
日期:2014-07-22 17:30:47獅子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥豬
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58處女座
日期:2014-12-02 09:17:52程序設(shè)計版塊每日發(fā)帖之星
日期:2015-06-16 22:20:002015亞冠之塔什干火車頭
日期:2015-06-20 23:28:22
5 [報告]
發(fā)表于 2013-11-15 14:36 |只看該作者
  1. cat -A 00010.txt | tail
復(fù)制代碼
你運(yùn)行一下這個命令,然后把結(jié)果發(fā)出來看看~

論壇徽章:
0
6 [報告]
發(fā)表于 2013-11-15 14:42 |只看該作者
回復(fù) 5# yestreenstars
我的源文件讓我改過了,然后我又找了個有這個問題的文件執(zhí)行了下你給的命令

20131112033213|0|$
20131112033214|0|$
20131112033216|0|$
20131112033216|0|$
20131112033217|0|oracle@linux:

最后一個沒有$


   

論壇徽章:
32
處女座
日期:2013-11-20 23:41:20雙子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00處女座
日期:2014-07-22 17:30:47獅子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥豬
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58處女座
日期:2014-12-02 09:17:52程序設(shè)計版塊每日發(fā)帖之星
日期:2015-06-16 22:20:002015亞冠之塔什干火車頭
日期:2015-06-20 23:28:22
7 [報告]
發(fā)表于 2013-11-15 15:03 |只看該作者
回復(fù) 6# gumuzhiyu
貌似用了dos2unix結(jié)尾還是少個換行,你手動添加吧~

   
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP