优化：速度与大小的权衡

每个人都希望他们的程序既超级快又超级小，但通常不可能同时拥有这两个特性。本节讨论了 rustc 提供的不同优化级别，以及它们如何影响程序的执行时间和二进制文件大小。

优化速度

截至 2018-09-18，rustc 支持三个“优化速度”级别：opt-level = 1、2 和 3。当您运行 cargo build --release 时，您正在使用发布配置文件，该配置文件默认为 opt-level = 3。

opt-level = 2 和 3 都以牺牲二进制文件大小为代价来优化速度，但是级别 3 比级别 2 进行更多的向量化和内联。特别是，您会看到在 opt-level 等于或大于 2 时，LLVM 将展开循环。循环展开在 Flash/ROM 方面成本相当高（例如，将此数组清零循环从 26 字节变为 194 字节），但在条件合适的情况下（例如，迭代次数足够大），也可以将执行时间减半。

目前，无法在 opt-level = 2 和 3 中禁用循环展开，因此如果您无法承担其成本，则应优化程序的大小。

优化大小

截至 2018-09-18，rustc 支持两个“优化大小”级别：opt-level = "s" 和 "z"。这些名称继承自 clang/LLVM，并且不太具有描述性，但 "z" 旨在表示它产生的二进制文件比 "s" 更小。

如果您希望发布二进制文件针对大小进行优化，请更改 Cargo.toml 中的 profile.release.opt-level 设置，如下所示。

[profile.release]
# or "z"
opt-level = "s"

这两个优化级别大大降低了 LLVM 的内联阈值，该阈值是一个用于决定是否内联函数的指标。Rust 的原则之一是零成本抽象；这些抽象倾向于使用大量 newtype 和小函数来保存不变量（例如，像 deref、as_ref 这样借用内部值的方法），因此较低的内联阈值可能会使 LLVM 错过优化机会（例如，消除死分支，内联对闭包的调用）。

在优化大小的同时，您可能需要尝试增加内联阈值，以查看这对二进制文件大小是否有任何影响。更改内联阈值的推荐方法是将 -C inline-threshold 标志附加到 .cargo/config.toml 中其他的 rustflags。

# .cargo/config.toml
# this assumes that you are using the cortex-m-quickstart template
[target.'cfg(all(target_arch = "arm", target_os = "none"))']
rustflags = [
  # ..
  "-C", "inline-threshold=123", # +
]

使用什么值？截至 1.29.0，这些是不同优化级别使用的内联阈值

opt-level = 3 使用 275
opt-level = 2 使用 225
opt-level = "s" 使用 75
opt-level = "z" 使用 25

当优化大小时，您应该尝试 225 和 275。

嵌入式 Rust Book

优化：速度与大小的权衡

不进行优化

优化依赖项

优化速度

优化大小