代码生成属性

[attributes.codegen]

以下属性用于控制代码生成。

优化提示

[attributes.codegen.hint]

[attributes.codegen.hint.cold-inline]

cold 和 inline 属性提供建议，以某种可能比不使用提示更快的方式生成代码。这些属性只是提示，可能会被忽略。

[attributes.codegen.hint.usage]

这两个属性都可以用于函数。当应用于 trait 中的函数时，它们仅适用于用作 trait 实现的默认函数的该函数，而不适用于所有 trait 实现。这些属性对没有函数体的 trait 函数无效。

`inline` 属性

[attributes.codegen.inline]

[attributes.codegen.inline.intro]

inline 属性 建议将带属性的函数的副本放置在调用者中，而不是生成代码来调用定义该函数的位置的函数。

注意： rustc 编译器会根据内部启发式方法自动内联函数。不正确地内联函数可能会使程序变慢，因此应谨慎使用此属性。

[attributes.codegen.inline.modes]

有三种使用内联属性的方式

#[inline] 建议执行内联扩展。
#[inline(always)] 建议始终应执行内联扩展。
#[inline(never)] 建议永远不应执行内联扩展。

注意：各种形式的 #[inline] 都是提示，语言不要求 将带属性的函数的副本放置在调用者中。

`cold` 属性

[attributes.codegen.cold]

cold 属性 建议带属性的函数不太可能被调用。

`no_builtins` 属性

[attributes.codegen.no_builtins]

no_builtins 属性 可以应用于 crate 级别，以禁用将某些代码模式优化为假定存在的库函数的调用。

`target_feature` 属性

[attributes.codegen.target_feature]

[attributes.codegen.target_feature.intro]

target_feature 属性 可以应用于函数，以启用该函数针对特定平台架构功能的代码生成。它使用带有单个键 enable 的 MetaListNameValueStr 语法，其值是一个逗号分隔的功能名称字符串，用于启用。


#![allow(unused)]
fn main() {
#[cfg(target_feature = "avx2")]
#[target_feature(enable = "avx2")]
unsafe fn foo_avx2() {}
}

[attributes.codegen.target_feature.arch]

每个目标架构都有一组可以启用的功能。为 crate 未编译的目标架构指定功能是错误的。

[attributes.codegen.target_feature.target-ub]

调用使用当前平台不支持的功能编译的函数是未定义行为，除非平台明确声明这是安全的。

[attributes.codegen.target_feature.inline]

标有 target_feature 的函数不会内联到不支持给定功能的上下文中。#[inline(always)] 属性不能与 target_feature 属性一起使用。

可用功能

[attributes.codegen.target_feature.availability]

以下是可用功能名称的列表。

`x86` 或 `x86_64`

[attributes.codegen.target_feature.x86]

在此平台上执行具有不支持的功能的代码是未定义行为。因此，此平台要求 #[target_feature] 仅应用于 unsafe 函数。

功能	隐式启用	描述
`adx`		ADX — 多精度加进位指令扩展
`aes`	`sse2`	AES — 高级加密标准
`avx`	`sse4.2`	AVX — 高级向量扩展
`avx2`	`avx`	AVX2 — 高级向量扩展 2
`bmi1`		BMI1 — 位操作指令集
`bmi2`		BMI2 — 位操作指令集 2
`cmpxchg16b`		`cmpxchg16b` — 原子比较并交换 16 字节（128 位）数据
`f16c`	`avx`	F16C — 16 位浮点转换指令
`fma`	`avx`	FMA3 — 三操作数融合乘加
`fxsr`		`fxsave` 和 `fxrstor` — 保存和恢复 x87 FPU、MMX 技术和 SSE 状态
`lzcnt`		`lzcnt` — 前导零计数
`movbe`		`movbe` — 交换字节后移动数据
`pclmulqdq`	`sse2`	`pclmulqdq` — 打包的无进位乘法四字
`popcnt`		`popcnt` — 设置为 1 的位数计数
`rdrand`		`rdrand` — 读取随机数
`rdseed`		`rdseed` — 读取随机种子
`sha`	`sse2`	SHA — 安全哈希算法
`sse`		SSE — 流式 SIMD 扩展
`sse2`	`sse`	SSE2 — 流式 SIMD 扩展 2
`sse3`	`sse2`	SSE3 — 流式 SIMD 扩展 3
`sse4.1`	`ssse3`	SSE4.1 — 流式 SIMD 扩展 4.1
`sse4.2`	`sse4.1`	SSE4.2 — 流式 SIMD 扩展 4.2
`ssse3`	`sse3`	SSSE3 — 补充流式 SIMD 扩展 3
`xsave`		`xsave` — 保存处理器扩展状态
`xsavec`		`xsavec` — 保存带有压缩的处理器扩展状态
`xsaveopt`		`xsaveopt` — 保存优化的处理器扩展状态
`xsaves`		`xsaves` — 保存处理器扩展状态（监管者）

`aarch64`

[attributes.codegen.target_feature.aarch64]

此平台要求 #[target_feature] 仅应用于 unsafe 函数。

有关这些功能的更多文档，请参阅 ARM 架构参考手册，或 developer.arm.com 上的其他位置。

注意：如果使用以下功能对，则应将它们同时标记为启用或禁用

paca 和 pacg，LLVM 当前将它们实现为一个功能。

功能	隐式启用	功能名称
`aes`	`neon`	FEAT_AES & FEAT_PMULL — 高级 SIMD AES 和 PMULL 指令
`bf16`		FEAT_BF16 — BFloat16 指令
`bti`		FEAT_BTI — 分支目标标识
`crc`		FEAT_CRC — CRC32 校验和指令
`dit`		FEAT_DIT — 数据独立定时指令
`dotprod`		FEAT_DotProd — 高级 SIMD Int8 点积指令
`dpb`		FEAT_DPB — 数据缓存清理到持久点
`dpb2`		FEAT_DPB2 — 数据缓存清理到深度持久点
`f32mm`	`sve`	FEAT_F32MM — SVE 单精度 FP 矩阵乘法指令
`f64mm`	`sve`	FEAT_F64MM — SVE 双精度 FP 矩阵乘法指令
`fcma`	`neon`	FEAT_FCMA — 浮点复数支持
`fhm`	`fp16`	FEAT_FHM — 半精度 FP FMLAL 指令
`flagm`		FEAT_FlagM — 条件标志操作
`fp16`	`neon`	FEAT_FP16 — 半精度 FP 数据处理
`frintts`		FEAT_FRINTTS — 浮点到整数辅助指令
`i8mm`		FEAT_I8MM — Int8 矩阵乘法
`jsconv`	`neon`	FEAT_JSCVT — JavaScript 转换指令
`lse`		FEAT_LSE — 大型系统扩展
`lor`		FEAT_LOR — 有限排序区域扩展
`mte`		FEAT_MTE & FEAT_MTE2 — 内存标记扩展
`neon`		FEAT_FP & FEAT_AdvSIMD — 浮点和高级 SIMD 扩展
`pan`		FEAT_PAN — 特权访问永不扩展
`paca`		FEAT_PAuth — 指针身份验证（地址身份验证）
`pacg`		FEAT_PAuth — 指针身份验证（通用身份验证）
`pmuv3`		FEAT_PMUv3 — 性能监视器扩展 (v3)
`rand`		FEAT_RNG — 随机数生成器
`ras`		FEAT_RAS & FEAT_RASv1p1 — 可靠性、可用性和可维护性扩展
`rcpc`		FEAT_LRCPC — 发布一致性处理器一致性
`rcpc2`	`rcpc`	FEAT_LRCPC2 — 具有立即偏移量的 RcPc
`rdm`		FEAT_RDM — 舍入双精度乘法累加
`sb`		FEAT_SB — 推测屏障
`sha2`	`neon`	FEAT_SHA1 & FEAT_SHA256 — 高级 SIMD SHA 指令
`sha3`	`sha2`	FEAT_SHA512 & FEAT_SHA3 — 高级 SIMD SHA 指令
`sm4`	`neon`	FEAT_SM3 & FEAT_SM4 — 高级 SIMD SM3/4 指令
`spe`		FEAT_SPE — 统计分析扩展
`ssbs`		FEAT_SSBS & FEAT_SSBS2 — 推测存储旁路安全
`sve`	`fp16`	FEAT_SVE — 可伸缩向量扩展
`sve2`	`sve`	FEAT_SVE2 — 可伸缩向量扩展 2
`sve2-aes`	`sve2`, `aes`	FEAT_SVE_AES — SVE AES 指令
`sve2-sm4`	`sve2`, `sm4`	FEAT_SVE_SM4 — SVE SM4 指令
`sve2-sha3`	`sve2`, `sha3`	FEAT_SVE_SHA3 — SVE SHA3 指令
`sve2-bitperm`	`sve2`	FEAT_SVE_BitPerm — SVE 位置换
`tme`		FEAT_TME — 事务内存扩展
`vh`		FEAT_VHE — 虚拟化主机扩展

`riscv32` 或 `riscv64`

[attributes.codegen.target_feature.riscv]

此平台要求 #[target_feature] 仅应用于 unsafe 函数。

有关这些功能的更多文档，请在其各自的规范中查找。许多规范在 RISC-V ISA 手册或 RISC-V GitHub 帐户上托管的另一本手册中进行了描述。

功能	隐式启用	描述
`a`		A — 原子指令
`c`		C — 压缩指令
`m`		M — 整数乘法和除法指令
`zb`	`zba`, `zbc`, `zbs`	Zb — 位操作指令
`zba`		Zba — 地址生成指令
`zbb`		Zbb — 基本位操作
`zbc`		Zbc — 无进位乘法
`zbkb`		Zbkb — 用于密码学的位操作指令
`zbkc`		Zbkc — 用于密码学的无进位乘法
`zbkx`		Zbkx — 交叉开关置换
`zbs`		Zbs — 单比特指令
`zk`	`zkn`, `zkr`, `zks`, `zkt`, `zbkb`, `zbkc`, `zbkx`	Zk — 标量密码学
`zkn`	`zknd`, `zkne`, `zknh`, `zbkb`, `zbkc`, `zkbx`	Zkn — NIST 算法套件扩展
`zknd`		Zknd — NIST 套件：AES 解密
`zkne`		Zkne — NIST 套件：AES 加密
`zknh`		Zknh — NIST 套件：哈希函数指令
`zkr`		Zkr — 熵源扩展
`zks`	`zksed`, `zksh`, `zbkb`, `zbkc`, `zbkx`	Zks — ShangMi 算法套件
`zksed`		Zksed — ShangMi 套件：SM4 块密码指令
`zksh`		Zksh — ShangMi 套件：SM3 哈希函数指令
`zkt`		Zkt — 数据独立执行延迟子集

`wasm32` 或 `wasm64`

[attributes.codegen.target_feature.wasm]

在 Wasm 平台上，#[target_feature] 可以与 safe 和 unsafe 函数一起使用。不可能通过 #[target_feature] 属性导致未定义行为，因为尝试使用 Wasm 引擎不支持的指令将在加载时失败，而不会有以与编译器预期不同的方式解释的风险。

功能	隐式启用	描述
`bulk-memory`		WebAssembly 批量内存操作提案
`extended-const`		WebAssembly 扩展常量表达式提案
`mutable-globals`		WebAssembly 可变全局变量提案
`nontrapping-fptoint`		WebAssembly 非陷入浮点到整数转换提案
`relaxed-simd`	`simd128`	WebAssembly 放松 SIMD 提案
`sign-ext`		WebAssembly 符号扩展运算符提案
`simd128`		WebAssembly simd 提案
`multivalue`		WebAssembly 多值提案
`reference-types`		WebAssembly 引用类型提案
`tail-call`		WebAssembly 尾调用提案

附加信息

[attributes.codegen.target_feature.info]

[attributes.codegen.target_feature.remark-cfg]

请参阅 target_feature 条件编译选项，以根据编译时设置选择性地启用或禁用代码编译。请注意，此选项不受 target_feature 属性的影响，仅受为整个 crate 启用的功能驱动。

[attributes.codegen.target_feature.remark-rt]

请参阅标准库中的 is_x86_feature_detected 或 is_aarch64_feature_detected 宏，以了解这些平台上的运行时功能检测。

注意： rustc 为每个目标和 CPU 启用了一组默认功能。可以使用 -C target-cpu 标志选择 CPU。可以使用 -C target-feature 标志为整个 crate 启用或禁用单个功能。

`track_caller` 属性

[attributes.codegen.track_caller]

[attributes.codegen.track_caller.allowed-positions]

track_caller 属性可以应用于任何具有 "Rust" ABI 的函数，但入口点 fn main 除外。

[attributes.codegen.track_caller.traits]

当应用于 trait 声明中的函数和方法时，该属性适用于所有实现。如果 trait 提供了带有该属性的默认实现，则该属性也适用于覆盖实现。

[attributes.codegen.track_caller.extern]

当应用于 extern 代码块中的函数时，该属性还必须应用于任何链接的实现，否则会导致未定义行为。当应用于提供给 extern 代码块的函数时，extern 代码块中的声明也必须具有该属性，否则会导致未定义行为。

行为

[attributes.codegen.track_caller.behavior]

将该属性应用于函数 f 允许 f 中的代码获取 Location 的提示，该提示指示导致 f 调用的“最顶层”跟踪调用。在观察点，实现的行为就好像它从 f 的帧向上遍历堆栈，以查找未归属函数 outer 的最近帧，并且它返回 outer 中跟踪调用的 Location。


#![allow(unused)]
fn main() {
#[track_caller]
fn f() {
    println!("{}", std::panic::Location::caller());
}
}

注意： core 提供了 core::panic::Location::caller 用于观察调用者位置。它包装了 rustc 实现的 core::intrinsics::caller_location intrinsic。

注意：由于结果 Location 是一个提示，因此实现可能会提前停止其向上遍历堆栈的过程。请参阅限制以了解重要的注意事项。

示例

当 f 由 calls_f 直接调用时，f 中的代码会观察到其在 calls_f 中的调用点


#![allow(unused)]
fn main() {
#[track_caller]
fn f() {
    println!("{}", std::panic::Location::caller());
}
fn calls_f() {
    f(); // <-- f() prints this location
}
}

当 f 由另一个归属函数 g 调用，而 g 又由 calls_g 调用时，f 和 g 中的代码都会观察到 g 在 calls_g 中的调用点


#![allow(unused)]
fn main() {
#[track_caller]
fn f() {
    println!("{}", std::panic::Location::caller());
}
#[track_caller]
fn g() {
    println!("{}", std::panic::Location::caller());
    f();
}

fn calls_g() {
    g(); // <-- g() prints this location twice, once itself and once from f()
}
}

当 g 由另一个归属函数 h 调用，而 h 又由 calls_h 调用时，f、g 和 h 中的所有代码都会观察到 h 在 calls_h 中的调用点


#![allow(unused)]
fn main() {
#[track_caller]
fn f() {
    println!("{}", std::panic::Location::caller());
}
#[track_caller]
fn g() {
    println!("{}", std::panic::Location::caller());
    f();
}
#[track_caller]
fn h() {
    println!("{}", std::panic::Location::caller());
    g();
}

fn calls_h() {
    h(); // <-- prints this location three times, once itself, once from g(), once from f()
}
}

等等。

限制

[attributes.codegen.track_caller.limits]

[attributes.codegen.track_caller.hint]

此信息是一个提示，实现不需要保留它。

[attributes.codegen.track_caller.decay]

特别是，将带有 #[track_caller] 的函数强制转换为函数指针会创建一个 shim，该 shim 对观察者来说似乎是在带属性的函数的定义站点被调用的，从而在虚拟调用中丢失了实际的调用者信息。这种强制转换的一个常见示例是创建 trait 对象，其方法是带属性的。

注意：函数指针的上述 shim 是必要的，因为 rustc 通过将隐式参数附加到函数 ABI 中来在代码生成上下文中实现 track_caller，但这对于间接调用来说是不健全的，因为该参数不是函数类型的一部分，并且给定的函数指针类型可能指向也可能不指向带有该属性的函数。shim 的创建向函数指针的调用者隐藏了隐式参数，从而保持了健全性。

`instruction_set` 属性

[attributes.codegen.instruction_set]

[attributes.codegen.instruction_set.allowed-positions]

instruction_set 属性 可以应用于函数，以控制将为该函数生成的指令集。

[attributes.codegen.instruction_set.behavior]

这允许在支持它的 CPU 架构上的单个程序中混合多个指令集。

[attributes.codegen.instruction_set.syntax]

它使用 MetaListPath 语法，以及由架构系列名称和指令集名称组成的路径。

[attributes.codegen.instruction_set.target-limits]

在不支持 instruction_set 属性的目标上使用它是编译错误。

在 ARM 上

[attributes.codegen.instruction_set.arm]

对于 ARMv4T 和 ARMv5te 架构，支持以下内容

arm::a32 — 将该函数生成为 A32 “ARM” 代码。
arm::t32 — 将该函数生成为 T32 “Thumb” 代码。


#[instruction_set(arm::a32)]
fn foo_arm_code() {}

#[instruction_set(arm::t32)]
fn bar_thumb_code() {}

使用 instruction_set 属性具有以下效果

如果函数的地址作为函数指针被获取，则地址的低位将设置为 0 (arm) 或 1 (thumb)，具体取决于指令集。
函数中的任何内联汇编都必须使用指定的指令集，而不是目标默认指令集。

Rust 参考手册