亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 10477 | 回復(fù): 3
打印 上一主題 下一主題

大家說說Cygwin下UTF-8編碼字符顯示 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報告]
發(fā)表于 2010-01-20 15:14 |只看該作者 |倒序?yàn)g覽
cygwin1.dll版本:1.7.1
bash版本:3.2.49(23)

[自己的程序無法顯示UTF-8字符]

我用MinGW gcc 4.4.0編了個簡單程序,printf char[]字符串到stdout,源代碼用不帶BOM的UTF-8保存,用WinHex查看編譯后程序,里面的字符串也是UTF-8的,在cmd或Cygwin bash下運(yùn)行,均按GBK解碼字符,結(jié)果在ASCII之外的字符都是錯誤的。

[Cygwin中的程序能顯示UTF-8字符]

但奇怪的是,我發(fā)現(xiàn)Cygwin自身的一些軟件包都采用UTF-8的環(huán)境,比如:我的程序myapp.exe的UTF-8輸出字符串本來是不能正確顯示的,但如果將程序輸出賦給環(huán)境變量:

VAR=`./myapp.exe`

然后:echo $VAR,這時就能在控制臺顯示正確的UTF-8字符串。
為了驗(yàn)證VAR確實(shí)保存UTF-8字符串,我echo $VAR > out.txt,檢查out.txt也是UTF-8編碼的。

另外:
echo "字符串" > out.txt,out.txt也是UTF-8編碼的。
cat out.txt,當(dāng)out.txt為GBK時不能正確顯示;當(dāng)out.txt為UTF-8時可以正確顯示,并且cat out.txt > out2.txt,out2.txt也是UTF-8編碼的。

[Linux下的UTF-8字符輸出實(shí)驗(yàn)]

為了搞清楚,我將源程序文件原封不動的拷貝到Debian下,Linux gcc 4.3.0編譯,用od查看編譯后程序,里面的字符串也是UTF-8的。程序在gnome-terminal下的bash中執(zhí)行,能夠正確顯示字符串。原先以為這是我將bash環(huán)境的LC_XXX設(shè)置為UTF-8的原因,但是我用export LANG="zh_CN.GBK"后,程序還是能正確顯示字符串,最后發(fā)現(xiàn)是gnome-terminal的字符編碼影響了程序輸出字符串的顯示:如果將gnome-terminal的字符編碼設(shè)為GBK,就則會顯示出錯。

[怎樣在Cygwin下顯示UTF-8字符]

我在Cygwin bash下用export LANG="zh_CN.UTF-8",但還是無法正確顯示自己程序輸出的UTF-8字符,于是我想是不是顯示字符串和bash的locale設(shè)定沒關(guān)系,而和下層的控制臺設(shè)備的活動字符編碼有關(guān)。

對于顯示UTF-8編碼的字符串,大家有什么建議和方法呢?
為什么Cygwin自己的程序,例如:cat、echo,它們輸出的UTF-8字符串就能正確顯示呢?實(shí)際上Cygwin的cat在bash、cmd上都能正確顯示UTF-8字符串。

P.S.

其實(shí)有一個不很好的辦法,讓bash、cmd顯示UTF-8字符串:
先chcp.com 65001將控制臺活動代碼頁改為UTF-8的,然后在控制臺的屬性->字體中選擇合適的字體,就能顯示UTF-8字符,但是可選的字體似乎只有一個:Lucida Console,用這個字體第一次顯示輸出的字符串時,字符串只顯示半截,然后將控制臺窗口遮蔽到其它窗口后,再彈到最前時,整個字符串才顯示出來,這個問題似乎和控制臺呈現(xiàn)字體的圖形操作有關(guān)。

論壇徽章:
0
2 [報告]
發(fā)表于 2010-01-20 16:07 |只看該作者
我也想知道!在cygwin下不能使用中文很郁悶~

論壇徽章:
1
寅虎
日期:2014-11-30 21:25:54
3 [報告]
發(fā)表于 2010-01-20 16:29 |只看該作者

論壇徽章:
0
4 [報告]
發(fā)表于 2010-01-20 18:28 |只看該作者
我剛看了這小伙的筆記,感覺Cygwin自己的包中的程序可以正確顯示UTF-8字符,而我自己編譯的程序就不行,可能是因?yàn)槲矣肕inGW GCC編譯原因,我下了個Cygwin的GCC 4,編譯了同一份代碼,果然如此!結(jié)果可以在cmd、Cygwin bash下正確顯示UTF-8字符了。

總結(jié):

MinGW帶的RT庫,比較native,會原封不動的將字符串?dāng)?shù)組傳給console設(shè)備;而Cygwin帶的RT庫,在程序中要求的是UTF-8編碼的字符串,但傳給console設(shè)備前,會將它轉(zhuǎn)換為native的ANSI編碼——GBK,所以console可以最終顯示正確的字符串。

Cygwin gcc果然比MinGW gcc更像Linux gcc!


所以最終會出現(xiàn)一個很有意思的現(xiàn)象:

我用一份代碼,分別用MinGW gcc和Cygwin gcc編譯,生成2個程序,prog1,prog2,執(zhí)行

prog1 > out1.txt
prog2 > out2.txt

out1.txt 和 out2.txt 字節(jié)內(nèi)容完全一樣,都是UTF-8編碼。但:

prog1(MinGW gcc編譯的)在bash和cmd中顯示結(jié)果錯誤,而prog2(Cygwin gcc編譯的)顯示結(jié)果正確。

我很奇怪,MinGW和Cygwin,它們的RT庫,不都移植自GNU libc么,怎么還有這區(qū)別?

--------------

另外,2樓的同學(xué),你說Cygwin不能使用中文,是指的什么情況下使用中文,我新下的Cygwin環(huán)境,默認(rèn)安裝、配置,中文支持很好啊,起碼bash是這樣的,ls、cat、echo、cd都行,bash下輸入中文,也不需要特殊設(shè)置,Windows自己的輸入法就可以,用搜狗拼音寫個:echo "這是中文",很簡單,也能顯示,重定向到文件,就是按UTF-8保存的。

[ 本帖最后由 silon212 于 2010-1-20 18:35 編輯 ]
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP