mbrlen

来自cppreference.com
< c‎ | string‎ | multibyte
定义于头文件 <wchar.h>
size_t mbrlen( const char* s, size_t n, mbstate_t* ps );
(C95 起)

给定当前转换状态ps,,确定剩余多字节字符的字节单位的大小,多字节字符的首字节为s所指。

此函数等价于对于某个隐藏的mbstate_t类型对象internal调用mbrtowc(NULL, s, n, ps?ps:&internal),除了ps只被求值一次。

目录

[编辑] 参数

s - 指向多字节字符串首元素的指针
n - s中可被检验的字节数限制
ps - 指向保有转换状态的对象的指针

[编辑] 返回值

若接下来的n或更少的字节组成空字符则返回0

返回组成合法多字节字符的字节数(1n之间)。

若编码错误发生则返回(size_t)-1

若接下来的n个字节为可能合法的多字节字符的一部分,但在检验全部n个字节后仍不完整,则返回(size_t)-2

[编辑] 示例

#include <locale.h>
#include <string.h>
#include <stdio.h>
#include <wchar.h>
 
int main(void)
{   
    // 允许mbrlen()工作于UTF-8多字节编码
    setlocale(LC_ALL, "en_US.utf8");
    // UTF-8窄多字节编码
    const char* str = u8"水";
    size_t sz = strlen(str);
 
    mbstate_t mb;
    memset(&mb, 0, sizeof mb);
    int len1 = mbrlen(str, 1, &mb);
    if(len1 == -2) 
        printf("The first 1 byte of %s is an incomplete multibyte char"
               " (mbrlen returns -2)\n", str);
 
    int len2 = mbrlen(str+1, sz-1, &mb);
    printf("The remaining %zu  bytes of %s hold %d bytes of the multibyte"
           " character\n", sz-1, str, len2);
 
    printf("Attempting to call mbrlen() in the middle of %s while in initial"
           " shift state returns %zd\n", str, mbrlen(str+1, sz-1, &mb));
}

输出:

The first 1 byte of 水 is an incomplete multibyte char (mbrlen returns -2)
The remaining 2  bytes of 水 hold 2 bytes of the multibyte character
Attempting to call mbrlen() in the middle of 水 while in initial shift state returns -1

[编辑] 参考

  • C11 standard (ISO/IEC 9899:2011):
  • 7.29.6.3.1 The mbrlen function (p: 442)
  • C99 standard (ISO/IEC 9899:1999):
  • 7.24.6.3.1 The mbrlen function (p: 388)

[编辑] 参阅

给定状态,将下一个多字节字符转换成宽字符
(函数) [edit]
返回下一个多字节字符的字节数
(函数) [edit]
mbrlenC++文档