C++读写汉字,C++处理中文字符

来源:岁月联盟 编辑:exp 时间:2012-11-13

C++对多语言文本字符的支持,通过宽字符来解决。

只要将输入输出设备绑定到一个本地的locale对象上即可。locale currentlocale("chs");表示中国

其处理方法与原来的单字节字符完全相同。

各种对应关系如下:

cin  wcin

cout wcout

char wchar_t

string wstring

ifstream wifstream

...

使用任何宽字节的流对象之前别忘了绑定到本地的locale对象,这样流对象就可以支持本地字符了。

下面的程序从控制台读取一些句子,并将这些句子分行显示出来

单字节程序可能是下面这样:

[cpp]
#include<iostream>  
#include<string>  
using namespace std; 
int main()  

    string s; 
    char c='.'; 
    while (getline(cin,s,c)) 
    { 
        cout<<s<<endl;       
    } 

#include<iostream>
#include<string>
using namespace std;
int main()
{
 string s;
 char c='.';
 while (getline(cin,s,c))
 {
  cout<<s<<endl;  
 }
}
/

双字节程序可能是下面这样:

[cpp]
#include<locale>  
#include<iostream>  
#include<string>  
using namespace std; 
int main()  

    locale china("chs");//use china character  
    wcin.imbue(china);//use locale object  
    wcout.imbue(china); 
    wstring s; 
    wchar_t wc=L'。';//wide character,wide string may be L"宽字符"  
    while (getline(wcin,s,wc)) 
    { 
        wcout<<s<<endl;  
    } 

#include<locale>
#include<iostream>
#include<string>
using namespace std;
int main()
{
 locale china("chs");//use china character
 wcin.imbue(china);//use locale object
 wcout.imbue(china);
 wstring s;
 wchar_t wc=L'。';//wide character,wide string may be L"宽字符"
 while (getline(wcin,s,wc))
 {
  wcout<<s<<endl; 
 }
}/

getline要求按照分隔符获取,所以最后的字符别忘了是分隔符(这里是中文句号)

中文文本文件的处理可能像下面这样:

[cpp]
void writeToFile(wstring& s,string fileName) 

    wofstream f; 
    f.imbue(locale("chs")); 
    f.open(fileName.c_str(),ios::out ); 
    f.seekp(0,ios::beg); 
    f<<s; 
    f.close(); 
    f.clear(); 

void writeToFile(wstring& s,string fileName)
{
 wofstream f;
 f.imbue(locale("chs"));
 f.open(fileName.c_str(),ios::out );
 f.seekp(0,ios::beg);
 f<<s;
 f.close();
 f.clear();
}