阅读量:0
C++的string.substr
函数是用来截取子字符串的,包括英文字符和中文字符。可以通过指定起始位置和长度来截取指定长度的字符。但需要注意的是,中文字符在C++中是以多个字节表示的,所以在截取中文字符时要确保起始位置和长度是正确的。
如果要截取中文字符,可以先将字符串转换为wstring
类型,然后再使用wstring
的substr
函数来截取中文字符。示例代码如下:
#include <iostream> #include <string> #include <codecvt> int main() { std::string utf8str = "中文字符测试"; std::wstring_convert<std::codecvt_utf8<wchar_t>> converter; std::wstring utf16str = converter.from_bytes(utf8str); std::wstring subStr = utf16str.substr(0, 2); // 从第一个字符开始截取2个字符 std::wstring_convert<std::codecvt_utf8<wchar_t>> utf8converter; std::string result = utf8converter.to_bytes(subStr); std::cout << "截取的中文字符为:" << result << std::endl; return 0; }
在上面的示例代码中,首先将UTF-8编码的字符串转换为UTF-16编码的wstring
类型,然后使用substr
函数截取中文字符,最后再将截取的中文字符转换回UTF-8编码的字符串输出。通过这种方式可以正确地截取中文字符。