联合体声明

来自cppreference.com
< cpp‎ | language

联合体是特殊的类类型,它在一个时刻只能保有其一个非静态数据成员

联合体声明的类指定符同 class 或 struct 声明:

union attr class-head-name { member-specification }
attr(C++11) - 任何数量属性的可选序列
class-head-name - 被定义的联合体名称。可选地前附 nested-name-specifier (名称与作用域解析运算符序列,以作用域解析运算符结尾)。可忽略名称,该情况下联合体为无名
member-specification - 访问指定符列表、成员对象及成员函数声明与定义。

联合体能拥有成员函数(包含构造函数和析构函数),但不能有虚函数。

联合体不能有基类且不能用作基类。

联合体不能拥有引用类型的数据成员。

联合体不能含有带非平凡特殊成员函数(复制构造函数复制赋值运算符或析构函数)的非静态数据成员。 (C++11 前)
若联合体含带非平凡特殊成员函数(复制/移动构造函数、复制/移动赋值或析构函数)的数据成员,则联合体中该函数默认为被删除,且需要为程序员所显式定义。

若联合体含有带非平凡默认构造函数的非静态数据成员,则该联合体的默认构造函数默认被删除,除非联合体的变体成员拥有一个默认成员初始化器。

至多一个变体成员能拥有默认成员初始化器

(C++11 起)

正如 struct 声明中一般,联合体的默认成员访问是 public

目录

[编辑] 解释

联合体的大小仅足以保有其最大的数据成员。其他数据成员分配于该最大成员的一部分相同的字节。分配的细节是实现定义的,且从不是最近写入的联合体成员读取是未定义行为。许多编译器作为非标准语言扩展,实现读取联合体不活跃成员的能力。

#include <iostream>
 
union S
{
    std::int32_t n;     // 占用 4 字节
    std::uint16_t s[2]; // 占用 4 字节
    std::uint8_t c;     // 占用 1 字节
};                      // 整个联合体占用 4 字节
 
int main()
{
    S s = {0x12345678}; // 初始化首个成员, s.n 现在是活跃成员
    // 于此点,从 s.s 或 s.c 读取是未定义行为
    std::cout << std::hex << "s.n = " << s.n << '\n';
    s.s[0] = 0x0011; // s.s 现在是活跃成员
    // 在此点,从 n 或 c 读取是 UB 但大多数编译器都对其定义
    std::cout << "s.c is now " << +s.c << '\n' // 11 或 00 ,依赖平台
              << "s.n is now " << s.n << '\n'; // 12340011 或 00115678
}

每个成员分配为如同它是类的仅有成员。

若联合体的成员是类且拥有用户定义的构造函数和析构函数,为切换到该活跃成员,通常需要显式析构函数和布置 new :

#include <iostream>
#include <string>
#include <vector>
 
union S
{
    std::string str;
    std::vector<int> vec;
    ~S() {} // 需要知道哪个成员为活跃,仅在类联合类中可行
};          // 整个联合体占有 max(sizeof(string), sizeof(vector<int>))
 
int main()
{
    S s = {"Hello, world"};
    // 在此点,从 s.vec 读取是未定义行为
    std::cout << "s.str = " << s.str << '\n';
    s.str.~basic_string<char>();
    new (&s.vec) std::vector<int>;
    // 现在, s.vec 是联合体的活跃成员
    s.vec.push_back(10);
    std::cout << s.vec.size() << '\n';
    s.vec.~vector<int>();
}
(C++11 起)

若二个联合体成员为标准布局类型,则在任何编译器上检验其公共子序列都是良好定义的。

[编辑] 成员生存期

联合体成员的生存期始于该成员被设为活跃时。若另一成员先前为活跃,则其生存期终止。

当联合体的活跃成员为 E1 = E2 形式的,使用内建赋值运算符或平凡赋值运算符的赋值表达式所切换时,对于每个 E1 的出现于成员访问和数组下标子表达式中的,不是拥有非平凡或被删除的默认构造函数的类的联合体成员 X ,若 X 的修改在类型别名使用规则下会拥有未定义行为,则在命名的存储隐式创建 X 类型的对象;不进行初始化,且其生存期的开始后序于左右运算数的值计算,先序于赋值。

union A { int x; int y[4]; };
struct B { A a; };
union C { B b; int k; };
int f() {
  C c;               // 不开始任何联合体成员的生存期
  c.b.a.y[3] = 4;    // OK : "c.b.a.y[3]" 指名联合体成员 c.b 与 c.b.a.y;
                     // 这创建对象以保有联合体成员 c.b 和 c.b.a.y
  return c.b.a.y[3]; // OK : c.b.a.y 指代新创建的对象
}
 
struct X { const int a; int b; };
union Y { X x; int k; };
void g() {
  Y y = { { 1, 2 } }; // OK , y.x 为活跃联合体成员 (9.2)
  int n = y.x.a;
  y.k = 4;   // OK :结束 y.x 的生存期, y.k 是联合体的活跃成员
  y.x.b = n; // 未定义行为: y.x.b 在其生存期外被修改,
             // "y.x.b" 指名 y.x ,但 X 的默认构造函数被删除,
             // 故联合体成员 y.x 的生存期不会隐式开始
}

[编辑] 匿名联合体

匿名联合体是不同时定义任何变量(包含联合体类型的对象、引用或指向联合体的指针)的无名联合体定义。

union { member-specification } ;

匿名联合体有更多限制:它们不能有成员函数,不能有静态数据成员,且所有数据成员必须为公开。允许的声明仅有非静态数据成员static_assert 声明 (C++14 起)

匿名联合体的成员被注入外围作用域(而且必须不与声明于其处的其他名称冲突)。

int main()
{
    union
    {
        int a;
        const char* p;
    };
    a = 1;
    p = "Jennifer";
}

命名空间作用域的匿名联合体必须声明为 static ,除非它们出现于无名命名空间。

[编辑] 类联合类

类联合类是至少拥有一个匿名联合体为成员的(非联合)类或联合体。类联合类拥有一组变体成员

  • 其成员匿名联合体的非静态数据成员;
  • 另外,若类联合类是联合体,则为其非匿名联合体的非静态数据成员。

类联合类可用于实现带标签联合体

#include <iostream>
 
// S 拥有一个非静态数据成员( tag ),三个枚举项成员( CHAR 、 INT 、 DOUBLE ),
// 和三个变体成员( c 、 i 、 d )
struct S
{
    enum{CHAR, INT, DOUBLE} tag;
    union
    {
        char c;
        int i;
        double d;
    };
};
 
void print_s(const S& s)
{
    switch(s.tag)
    {
        case S::CHAR: std::cout << s.c << '\n'; break;
        case S::INT: std::cout << s.i << '\n'; break;
        case S::DOUBLE: std::cout << s.d << '\n'; break;
    }
}
 
int main()
{
    S s = {S::CHAR, 'a'};
    print_s(s);
    s.tag = S::INT;
    s.i = 123;
    print_s(s);
}

C++ 标准库包含 std::variant ,它可取代联合体和类联合类的大多数用途。上例可重写为

#include <variant>
#include <iostream>
 
int main()
{
    std::variant<char, int, double> s = 'a';
    std::visit([](auto x){ std::cout << x << '\n';}, s);
    s = 123;
    std::visit([](auto x){ std::cout << x << '\n';}, s);
}
(C++17 起)

[编辑] 缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

DR 应用于 出版时的行为 正确行为
CWG 1940 C++14 匿名联合体仅允许非静态数据成员 亦允许 static_assert

[编辑] 参阅

联合体声明C 文档