std::codecvt::in, std::codecvt::do_in

来自cppreference.com
< cpp‎ | locale‎ | codecvt
定义于头文件 <locale>
public:

result in( StateT& state,
           const ExternT* from,
           const ExternT* from_end,
           const ExternT*& from_next,
           InternT* to,
           InternT* to_end,

           InternT*& to_next ) const;
(1)
protected:

virtual result do_in( StateT& state,
                      const ExternT* from,
                      const ExternT* from_end,
                      const ExternT*& from_next,
                      InternT* to,
                      InternT* to_end,

                      InternT*& to_next ) const;
(2)
1) 公开成员函数,调用最终导出类的成员函数 do_in
2) 若此 codecvt 平面定义一个转换,则翻译来自源范围 [from, from_end) 的外部字符为内部字符,将结果置始于 to 的后继位置。不转换多于 from_end - from 个外部字符,不写入多于 to_end - to 个内部字符。令 from_nextto_next 指向最后成功转换元素的后一位置。

若此 codecvt 平面不定义转换,则不转换字符。设置 to_next 等于 to ,不更改 state ,并返回 std::codecvt_base::noconv

目录

[编辑] 返回值

std::codecvt_base::result 类型值,按以下方式指示成功状况:

ok 转换完成
partial 输出缓冲区的中空间不足,或源缓冲的未期待结尾
error 遇到无法转换的字符
noconv 此平面为非转换,不写入输出

非转换特化 std::codecvt<char, char, std::mbstate_t> 始终返回 std::codecvt_base::noconv

[编辑] 注意

要求 from <= from_end && to <= to_endstate 要么表示初始迁移状态,要么以转换序列中前趋的字符获得。

state 上的效果是有意未指定的。标准平面中,它用于维护像是调用 std::mbsrtowcs 时的状态,从而被更新为反映最后被处理外部字符后的转换状态,但是用户定义平面可以自由地用它维护任何其他状态,例如计量遇到的特殊字符数。

[编辑] 示例

#include <iostream>
#include <string>
#include <locale>
 
int main()
{
    std::locale::global(std::locale("en_US.utf8"));
    auto& f = std::use_facet<std::codecvt<wchar_t, char, std::mbstate_t>>(std::locale());
    std::string external = u8"z\u00df\u6c34\U0001d10b"; // 或 u8"zß水𝄋"
                          // 或 "\x7a\xc3\x9f\xe6\xb0\xb4\xf0\x9d\x84\x8b";
 
    // 注意 wstring_convert 能进行下列内容
    std::mbstate_t mb = std::mbstate_t(); // 初始迁移状态
    std::wstring internal(external.size(), '\0'); 
    const char* from_next;
    wchar_t* to_next;
    f.in(mb, &external[0], &external[external.size()], from_next,
             &internal[0], &internal[internal.size()], to_next);
    // 为简略跳过错误检查
    internal.resize(to_next - &internal[0]);
 
    std::wcout << L"The string in wide encoding: " << internal << '\n';
}

输出:

The string in wide encoding: zß水𝄋

[编辑] 参阅

从关联文件读取
(std::basic_filebuf 的虚受保护成员函数) [编辑]
转换字节字符串为宽字符串
(std::wstring_convert 的公开成员函数) [编辑]
给定状态,转换窄多字节字符串到宽字符串
(函数) [编辑]
[虚]
从 internT 转换字符串为 externT 转换字符串,如在写入文件时
(虚受保护成员函数) [编辑]