std::codecvt_utf8_utf16

来自cppreference.com
< cpp‎ | locale

定义于头文件 <codecvt>
template< class Elem,

          unsigned long Maxcode = 0x10ffff,
          std::codecvt_mode Mode = (std::codecvt_mode)0 >

class codecvt_utf8_utf16 : public std::codecvt<Elem, char, std::mbstate_t>;
std::codecvt_utf8_utf16是一个std::codecvt方面,它封装了一个UTF-8编码的字节串和UTF-16编码的字符串之间的转换。如果Elem是一个32 - 位类型,将一个UTF-16代码点存储在每个32位字符的输出序列,这codecvt方面可用于读取和写入UTF-8文件,文本文件和二进制.
原文:
std::codecvt_utf8_utf16 is a std::codecvt facet which encapsulates conversion between a UTF-8 encoded byte string and UTF-16 encoded character string. If Elem is a 32-bit type, one UTF-16 codepoint will be stored in each 32-bit character of the output sequence. This codecvt facet can be used to read and write UTF-8 files, both text and binary.
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。

目录

[编辑] 模板参数

Elem -
无论是char16_tchar32_t,或wchar_t
原文:
either char16_t, char32_t, or wchar_t
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。
Maxcode -
Elem最大的价值,这方面没有读取或写入错误
原文:
the largest value of Elem that this facet will read or write without error
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。
Mode -
恒定的类型std::codecvt_mode
原文:
a constant of type std::codecvt_mode
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。

继承自 std::codecvt

成员类型

成员类型 定义
intern_type internT
extern_type externT
state_type stateT

成员对象

成员名 类型
id [静态] std::locale::id

成员函数

调用 do_out
(std::codecvt 的公开成员函数) [编辑]
调用 do_in
(std::codecvt 的公开成员函数) [编辑]
调用 do_unshift
(std::codecvt 的公开成员函数) [编辑]
调用 do_encoding
(std::codecvt 的公开成员函数) [编辑]
调用 do_always_noconv
(std::codecvt 的公开成员函数) [编辑]
调用 do_length
(std::codecvt 的公开成员函数) [编辑]
调用 do_max_length
(std::codecvt 的公开成员函数) [编辑]

受保护成员函数

[虚]
从 internT 转换字符串为 externT 转换字符串,如在写入文件时
(std::codecvt 的虚受保护成员函数) [编辑]
[虚]
从 externT 转换字符串为 internT ,如在从文件读取时
(std::codecvt 的虚受保护成员函数) [编辑]
为不完整转换生成 externT 字符的终止字符序列
(std::codecvt 的虚受保护成员函数) [编辑]
返回产生一个 internT 字符所需的 externT 字符数,若此值为常数
(std::codecvt 的虚受保护成员函数) [编辑]
测试平面编码是否对所有合法值为恒等转换
(std::codecvt 的虚受保护成员函数) [编辑]
计算转换成给定的 internT 缓冲区会消耗的 externT 字符串长度
(std::codecvt 的虚受保护成员函数) [编辑]
返回能转换成单个 internT 字符的最大 externT 字符数
(std::codecvt 的虚受保护成员函数) [编辑]


继承自 std::codecvt_base

成员类型 定义
enum result { ok, partial, error, noconv }; 无作用域枚举类型
枚举常量 定义
ok 完成转换而无错误
partial 未转换所有源字符
error 遇到非法字符
noconv 不要求转换,输入与输出类型相同

[编辑] 示例

下面的例子演示了如何读取一个UTF -8文件成UTF-16字符串的系统上使用32位wchar_t
原文:
The following example demonstrates reading a UTF-8 file into a UTF-16 string on a system with 32-bit wchar_t
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。

#include <fstream>
#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
int main()
{
    std::ofstream("text.txt") << u8"z\u6c34\U0001d10b";
 
    std::wifstream file1("text.txt");
    file1.imbue(std::locale("en_US.UTF8"));
    std::cout << "Normal read from file (using default UTF-8/UTF-32 codecvt)\n";
    for(wchar_t c; file1 >> c; )
        std::cout << std::hex << std::showbase << c << '\n';
 
    std::wifstream file2("text.txt");
    file2.imbue(std::locale(file2.getloc(), new std::codecvt_utf8_utf16<wchar_t>));
    std::cout << "UTF-16 read from the same file (using codecvt_utf8_utf16)\n";
    for(wchar_t c; file2 >> c; )
        std::cout << std::hex << std::showbase << c << '\n';
}

输出:

Normal read from file (using default UTF-8/UTF-32 codecvt)
0x7a
0x6c34
0x1d10b
UTF-16 read from the same file (using codecvt_utf8_utf16)
0x7a
0x6c34
0xd834
0xdd0b

[编辑] 另请参阅

字符转换 本地环境定义多字节
(UTF-8, GB18030)
UTF-8
UTF-16
UTF-16 mbrtoc16 / c16rtomb(有 C11 的 DR488) codecvt<char16_t, char, mbstate_t>
codecvt_utf8_utf16<char16_t>
codecvt_utf8_utf16<char32_t>
codecvt_utf8_utf16<wchar_t>
N/A
UCS2 c16rtomb(无 C11 的 DR488) codecvt_utf8<char16_t>

codecvt_utf8<wchar_t>(Windows)

codecvt_utf16<char16_t>

codecvt_utf16<wchar_t>(Windows)

UTF-32

mbrtoc32 / c32rtomb

codecvt<char32_t, char, mbstate_t>
codecvt_utf8<char32_t>
codecvt_utf8<wchar_t>(非 Windows)

codecvt_utf16<char32_t>
codecvt_utf16<wchar_t>(非 Windows)

系统宽
UTF-32(非 Windows)
UCS2(Windows)

mbsrtowcs / wcsrtombs
use_facet<codecvt
<wchar_t, char, mbstate_t>>(locale)

No No
在字符编码间转换,包含 UTF-8 、 UTF-16 、 UTF-32 之间
(类模板) [编辑]
(C++11)
(C++17 中弃用)
用于改变标准 codecvt 平面行为的标签
(枚举) [编辑]
(C++11)
(C++17 中弃用)
在 UTF-8 与 UCS2/UCS4 间转换
(类模板) [编辑]
(C++11)
(C++17 中弃用)
在 UTF-16 与 UCS2/UCS4 间转换
(类模板) [编辑]