- 論壇徽章:
- 0
|
unix下的漢字處理問題
如何把一個(gè)漢字作為一個(gè)字符來處理?在以前,似乎比較麻煩,因?yàn)橐粋(gè)漢字一向是由2個(gè)字符來表示的。比較漢字,往往變成了字符串的比較。
unicode出現(xiàn)之后,情況就好多了,每個(gè)漢字都有唯一的編碼,從此漢字就可以作為單個(gè)字符來對(duì)待了。
stl提供了string類來處理字符串,但是針對(duì)的是單字節(jié)字符串。如果想處理漢字,可以選擇wstring。用法和string完全相同,但是處理的是寬字符。
string到wstring之間的轉(zhuǎn)換,似乎stl沒有提供好的方法,所以還得用c的庫函數(shù)來處理。
以下給出一段代碼,演示在unix下面,處理漢字的方法
/*
FileName: str2wstrdemo.cpp
Compile command:aCC -AA +DD64 -I/opt/aCC/include_std str2wstrdemo.cpp -lstd_v2 -lCsup_v2 -o 1
*/
#include
#include
#include
#include
#include
namespace std {} using namespace std;
int main()
{
int cnt;
wchar_t wcs[100], wc;
string myword="列表內(nèi)容為:";
setlocale(LC_CTYPE, ""); //很重要,沒有這一句,轉(zhuǎn)換會(huì)失敗
mbstowcs(wcs, myword.c_str(), 99);
wstring newword(wcs);
cout<<"string content is:"<<myword.c_str()<< endl;
cout<<"wstring size is:" <<newword.size()<<endl;
return 0;
}
本文來自ChinaUnix博客,如果查看原文請(qǐng)點(diǎn):http://blog.chinaunix.net/u/4353/showart_20025.html |
|