C++ string.substr截取中文字符怎么样

avatar
作者
筋斗云
阅读量:0

C++的string.substr函数是用来截取子字符串的,包括英文字符和中文字符。可以通过指定起始位置和长度来截取指定长度的字符。但需要注意的是,中文字符在C++中是以多个字节表示的,所以在截取中文字符时要确保起始位置和长度是正确的。

如果要截取中文字符,可以先将字符串转换为wstring类型,然后再使用wstringsubstr函数来截取中文字符。示例代码如下:

#include <iostream> #include <string> #include <codecvt>  int main() {     std::string utf8str = "中文字符测试";          std::wstring_convert<std::codecvt_utf8<wchar_t>> converter;     std::wstring utf16str = converter.from_bytes(utf8str);          std::wstring subStr = utf16str.substr(0, 2); // 从第一个字符开始截取2个字符          std::wstring_convert<std::codecvt_utf8<wchar_t>> utf8converter;     std::string result = utf8converter.to_bytes(subStr);          std::cout << "截取的中文字符为:" << result << std::endl;          return 0; } 

在上面的示例代码中,首先将UTF-8编码的字符串转换为UTF-16编码的wstring类型,然后使用substr函数截取中文字符,最后再将截取的中文字符转换回UTF-8编码的字符串输出。通过这种方式可以正确地截取中文字符。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!