当前位置: 首页 >> 程序设计 >> UNIX编程之汉字处理问题
 

UNIX编程之汉字处理问题

作者:      来源:zz     发表时间:2008-05-06     浏览次数:      字号:    

如何把一个汉字作为一个字符来处理?在以前,似乎比较麻烦,因为一个汉字一向是由2个字符来表示的。比较汉字,往往变成了字符串的比较。
unicode出现之后,情况就好多了,每个汉字都有唯一的编码,从此汉字就可以作为单个字符来对待了。

stl提供了string类来处理字符串,但是针对的是单字节字符串。如果想处理汉字,可以选择wstring。用法和string完全相同,但是处理的是宽字符。
string到wstring之间的转换,似乎stl没有提供好的方法,所以还得用c的库函数来处理。
以下给出一段代码,演示在unix下面,处理汉字的方法

/*

FileName: str2wstrdemo.cpp

Compile command:aCC -AA +DD64 -I/opt/aCC/include_std str2wstrdemo.cpp -lstd_v2 -lCsup_v2  -o 1

*/

#include <iostream>
#include <string>
#include <list>
#include <stdlib.h>
#include <locale.h> 
namespace std {} using namespace std;

int main()
{
  int cnt;
  wchar_t wcs[100], wc;
 
  string myword="列表内容为:";
 
  setlocale(LC_CTYPE, "");  //很重要,没有这一句,转换会失败
 
  mbstowcs(wcs, myword.c_str(), 99);
 
  wstring newword(wcs);
 
  cout<<"string content is:"<<myword.c_str()<< endl; 
  
  cout<<"wstring size is:"  <<newword.size()<<endl;
 

  return 0;
}

责任编辑 webmaster

 
 
 
 
 
评论更多>>
 
 
 
发表
 
姓名: QQ:
性别: MSN:
E-mail: 主页:
评分: 1 2 3 4 5
评论内容:
验证码:
  
  • 请遵守《互联网电子公告服务管理规定》及中华人民共和国其他各项有关法律法规。
  • 严禁发表危害国家安全、损害国家利益、破坏民族团结、破坏国家宗教政策、破坏社会稳定、侮辱、诽谤、教唆、淫秽等内容的评论 。
  • 用户需对自己在使用本站服务过程中的行为承担法律责任(直接或间接导致的)。
  • 本站管理员有权保留或删除评论内容。
  • 评论内容只代表网友个人观点,与本网站立场无关。
  •