std::codecvt_utf16

来自cppreference.com
< cpp‎ | locale

定义于头文件 <codecvt>
template< class Elem,

          unsigned long Maxcode = 0x10ffff,
          std::codecvt_mode Mode = (std::codecvt_mode)0 >

class codecvt_utf16 : public std::codecvt<Elem, char, std::mbstate_t>;;
std::codecvt_utf16是一个std::codecvt方面,它封装了一个UTF-16编码的字节串和UCS2或UCS4字符串的(取决于类型Elem)之间的转换。这codecvt方面可用于读取和写入UTF-16文件以二进制模式.
原文:
std::codecvt_utf16 is a std::codecvt facet which encapsulates conversion between a UTF-16 encoded byte string and UCS2 or UCS4 character string (depending on the type of Elem). This codecvt facet can be used to read and write UTF-16 files in binary mode.
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。

目录

[编辑] 模板参数

Elem -
无论是char16_tchar32_t,或wchar_t
原文:
either char16_t, char32_t, or wchar_t
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。
Maxcode -
Elem最大的价值,这方面没有读取或写入错误
原文:
the largest value of Elem that this facet will read or write without error
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。
Mode -
恒定的类型std::codecvt_mode
原文:
a constant of type std::codecvt_mode
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。

继承自 std::codecvt

成员类型

成员类型 定义
intern_type internT
extern_type externT
state_type stateT

成员对象

成员名 类型
id [静态] std::locale::id

成员函数

调用 do_out
(std::codecvt 的公开成员函数) [编辑]
调用 do_in
(std::codecvt 的公开成员函数) [编辑]
调用 do_unshift
(std::codecvt 的公开成员函数) [编辑]
调用 do_encoding
(std::codecvt 的公开成员函数) [编辑]
调用 do_always_noconv
(std::codecvt 的公开成员函数) [编辑]
调用 do_length
(std::codecvt 的公开成员函数) [编辑]
调用 do_max_length
(std::codecvt 的公开成员函数) [编辑]

受保护成员函数

[虚]
从 internT 转换字符串为 externT 转换字符串,如在写入文件时
(std::codecvt 的虚受保护成员函数) [编辑]
[虚]
从 externT 转换字符串为 internT ,如在从文件读取时
(std::codecvt 的虚受保护成员函数) [编辑]
为不完整转换生成 externT 字符的终止字符序列
(std::codecvt 的虚受保护成员函数) [编辑]
返回产生一个 internT 字符所需的 externT 字符数,若此值为常数
(std::codecvt 的虚受保护成员函数) [编辑]
测试平面编码是否对所有合法值为恒等转换
(std::codecvt 的虚受保护成员函数) [编辑]
计算转换成给定的 internT 缓冲区会消耗的 externT 字符串长度
(std::codecvt 的虚受保护成员函数) [编辑]
返回能转换成单个 internT 字符的最大 externT 字符数
(std::codecvt 的虚受保护成员函数) [编辑]


继承自 std::codecvt_base

成员类型 定义
enum result { ok, partial, error, noconv }; 无作用域枚举类型
枚举常量 定义
ok 完成转换而无错误
partial 未转换所有源字符
error 遇到非法字符
noconv 不要求转换,输入与输出类型相同

[编辑] 示例

下面的示例演示解码UTF-16LE文件系统上的32位wchar_t。在16位系统wchar_t的第三个字符,解码失败,因为std::codecvt_utf16<char16_t>产生UCS2,而不是UTF-16
原文:
The following example demonstrates decoding of UTF-16le file on a system with 32-bit wchar_t. On a system with 16-bit wchar_t, decoding of the third character will fail because std::codecvt_utf16<char16_t> produces UCS2, not UTF-16.
文本通过谷歌翻译机器翻译。
你可以帮忙校正和验证翻译。点击此处查看指示。

#include <fstream>
#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
void prepare_file()
{
    // UTF-16le data (if host system is little-endian)
    char16_t utf16le[4] ={0x007a,          // latin small letter 'z' U+007a
                          0x6c34,          // CJK ideograph "water"  U+6c34
                          0xd834, 0xdd0b}; // musical sign segno U+1d10b
    // store in a file
    std::ofstream fout("text.txt");
    fout.write( reinterpret_cast<char*>(utf16le), sizeof utf16le);
}
int main()
{
    prepare_file();
    // open as a byte stream
    std::wifstream fin("text.txt", std::ios::binary);
    // apply facet
    fin.imbue(std::locale(fin.getloc(),
       new std::codecvt_utf16<wchar_t, 0x10ffff, std::little_endian>));
 
    for(wchar_t c; fin.get(c); )
            std::cout << std::showbase << std::hex << c << '\n';
}

输出:

0x7a
0x6c34
0x1d10b

[编辑] 另请参阅

字符转换 本地环境定义多字节
(UTF-8, GB18030)
UTF-8
UTF-16
UTF-16 mbrtoc16 / c16rtomb(有 C11 的 DR488) codecvt<char16_t, char, mbstate_t>
codecvt_utf8_utf16<char16_t>
codecvt_utf8_utf16<char32_t>
codecvt_utf8_utf16<wchar_t>
N/A
UCS2 c16rtomb(无 C11 的 DR488) codecvt_utf8<char16_t>

codecvt_utf8<wchar_t>(Windows)

codecvt_utf16<char16_t>

codecvt_utf16<wchar_t>(Windows)

UTF-32

mbrtoc32 / c32rtomb

codecvt<char32_t, char, mbstate_t>
codecvt_utf8<char32_t>
codecvt_utf8<wchar_t>(非 Windows)

codecvt_utf16<char32_t>
codecvt_utf16<wchar_t>(非 Windows)

系统宽
UTF-32(非 Windows)
UCS2(Windows)

mbsrtowcs / wcsrtombs
use_facet<codecvt
<wchar_t, char, mbstate_t>>(locale)

No No
在字符编码间转换,包含 UTF-8 、 UTF-16 、 UTF-32 之间
(类模板) [编辑]
(C++11)
(C++17 中弃用)
用于改变标准 codecvt 平面行为的标签
(枚举) [编辑]
(C++11)
(C++17 中弃用)
在 UTF-8 与 UCS2/UCS4 间转换
(类模板) [编辑]
(C++11)
(C++17 中弃用)
在 UTF-8 与 UTF-16 间转换
(类模板) [编辑]