字面量表达式

[expr.literal.syntax]

^语法
LiteralExpression :
      CHAR_LITERAL
   | STRING_LITERAL
   | RAW_STRING_LITERAL
   | BYTE_LITERAL
   | BYTE_STRING_LITERAL
   | RAW_BYTE_STRING_LITERAL
   | C_STRING_LITERAL
   | RAW_C_STRING_LITERAL
   | INTEGER_LITERAL
   | FLOAT_LITERAL
   | true | false

[expr.literal.intro]

一个 字面量表达式 是一个由单个 token 而非 token 序列构成的表达式，它立即直接表示其求值结果的值，而不是通过名称或其他求值规则来引用它。

[expr.literal.const-expr]

字面量是常量表达式的一种形式，因此（主要）在编译时求值。

[expr.literal.literal-token]

前面描述的每种词法字面量形式都可以构成字面量表达式，关键字 true 和 false 也是如此。

#![allow(unused)]
fn main() {
"hello";   // string type
'5';       // character type
5;         // integer type
}

[expr.literal.string-representation]

在下面的描述中，token 的字符串表示是与 Lexer 语法片段中 token 的生成规则匹配的输入字符序列。

注意

此字符串表示不包含紧跟在 U+000D (回车符 CR) 后面的 U+000A (换行符 LF) 字符对：此对字符在此之前已被转换为单个 U+000A (换行符 LF)。

[expr.literal.escape]

转义

[expr.literal.escape.intro]

下面对文本字面量表达式的描述使用了几种形式的转义。

[expr.literal.escape.sequence]

每种转义形式的特征在于：

一个 转义序列：一个字符序列，总是以 U+005C (\) 开头
一个 转义值：单个字符或空字符序列

在下面的转义定义中

一个 八进制数字 是范围 [0-7] 中的任意字符。
一个 十六进制数字 是范围 [0-9]、[a-f] 或 [A-F] 中的任意字符。

[expr.literal.escape.simple]

简单转义

下表第一列中出现的每个字符序列都是一个转义序列。

在每种情况下，转义值是第二列相应条目中给出的字符。

转义序列	转义值
`\0`	U+0000 (空字符 NUL)
`\t`	U+0009 (水平制表符 HT)
`\n`	U+000A (换行符 LF)
`\r`	U+000D (回车符 CR)
`\"`	U+0022 (引号 ")
`\'`	U+0027 (撇号 ')
`\\`	U+005C (反斜杠 \)

[expr.literal.escape.hex-octet]

8 位转义

转义序列由 \x 后跟两个十六进制数字组成。

转义值是其Unicode 标量值等于将转义序列的最后两个字符解释为十六进制整数的结果的字符，就像使用基数 16 调用 u8::from_str_radix 一样。

注意

因此，转义值的Unicode 标量值在 u8 类型的范围内。

[expr.literal.escape.hex-ascii]

7 位转义

转义序列由 \x 后跟一个八进制数字再后跟一个十六进制数字组成。

转义值是其Unicode 标量值等于将转义序列的最后两个字符解释为十六进制整数的结果的字符，就像使用基数 16 调用 u8::from_str_radix 一样。

[expr.literal.escape.unicode]

Unicode 转义

转义序列由 \u{ 后跟一个字符序列组成，序列中的每个字符都是一个十六进制数字或 _，最后以 } 结尾。

转义值是其Unicode 标量值等于将转义序列中包含的十六进制数字解释为十六进制整数的结果的字符，就像使用基数 16 调用 u32::from_str_radix 一样。

注意

CHAR_LITERAL 或 STRING_LITERAL token 的允许形式确保存在这样的字符。

[expr.literal.continuation]

字符串续行转义

转义序列由 \ 后紧跟 U+000A (换行符 LF) 以及在其后的所有空白字符直到下一个非空白字符组成。为此，空白字符包括 U+0009 (水平制表符 HT)、U+000A (换行符 LF)、U+000D (回车符 CR) 和 U+0020 (空格 SPACE)。

转义值是一个空字符序列。

注意

这种转义形式的作用是字符串续行会跳过后面的空白字符，包括额外的换行符。因此 a、b 和 c 是相等的
#![allow(unused)]
fn main() {
let a = "foobar";
let b = "foo\
         bar";
let c = "foo\

     bar";

assert_eq!(a, b);
assert_eq!(b, c);
}
跳过额外的换行符（如示例 c 所示）可能会令人困惑且出乎意料。此行为将来可能会进行调整。在做出决定之前，建议避免依赖行续行跳过多个换行符。有关更多信息，请参阅此议题。

[expr.literal.char]

字符字面量表达式

[expr.literal.char.intro]

字符字面量表达式由单个 CHAR_LITERAL token 组成。

[expr.literal.char.type]

表达式的类型是原始类型 char。

[expr.literal.char.no-suffix]

此 token 不能有后缀。

[expr.literal.char.literal-content]

此 token 的字面量内容是其字符串表示中第一个 U+0027 (') 之后且最后一个 U+0027 (') 之前的字符序列。

[expr.literal.char.represented]

字面量表达式的表示字符根据字面量内容派生如下：

[expr.literal.char.escape]

如果字面量内容是以下形式之一的转义序列，则表示字符是该转义序列的转义值

[expr.literal.char.single]

否则，表示字符是构成字面量内容的单个字符。

[expr.literal.char.result]

表达式的值是与表示字符的Unicode 标量值对应的 char 值。

注意

CHAR_LITERAL token 的允许形式确保这些规则总是产生单个字符。

字符字面量表达式示例

#![allow(unused)]
fn main() {
'R';                               // R
'\'';                              // '
'\x52';                            // R
'\u{00E6}';                        // LATIN SMALL LETTER AE (U+00E6)
}

[expr.literal.string]

字符串字面量表达式

[expr.literal.string.intro]

字符串字面量表达式由单个 STRING_LITERAL 或 RAW_STRING_LITERAL token 组成。

[expr.literal.string.type]

表达式的类型是对原始类型 str 的共享引用（具有 static 生命周期）。也就是说，类型是 &'static str。

[expr.literal.string.no-suffix]

此 token 不能有后缀。

[expr.literal.string.literal-content]

此 token 的字面量内容是其字符串表示中第一个 U+0022 (") 之后且最后一个 U+0022 (") 之前的字符序列。

[expr.literal.string.represented]

字面量表达式的表示字符串是根据字面量内容派生的字符序列，如下所示：

[expr.literal.string.escape]

如果此 token 是 STRING_LITERAL，则字面量内容中出现的以下任意形式的转义序列都会被替换为其转义值。
这些替换按从左到右的顺序进行。例如，token "\\x41" 被转换为字符 \ x 4 1。

[expr.literal.string.raw]

如果此 token 是 RAW_STRING_LITERAL，则表示字符串与字面量内容相同。

[expr.literal.string.result]

表达式的值是对静态分配的 str 的引用，该 str 包含表示字符串的 UTF-8 编码。

字符串字面量表达式示例

#![allow(unused)]
fn main() {
"foo"; r"foo";                     // foo
"\"foo\""; r#""foo""#;             // "foo"

"foo #\"# bar";
r##"foo #"# bar"##;                // foo #"# bar

"\x52"; "R"; r"R";                 // R
"\\x52"; r"\x52";                  // \x52
}

[expr.literal.byte-char]

字节字面量表达式

[expr.literal.byte-char.intro]

字节字面量表达式由单个 BYTE_LITERAL token 组成。

[expr.literal.byte-char.literal]

表达式的类型是原始类型 u8。

[expr.literal.byte-char.no-suffix]

此 token 不能有后缀。

[expr.literal.byte-char.literal-content]

此 token 的字面量内容是其字符串表示中第一个 U+0027 (') 之后且最后一个 U+0027 (') 之前的字符序列。

[expr.literal.byte-char.represented]

字面量表达式的表示字符根据字面量内容派生如下：

[expr.literal.byte-char.escape]

如果字面量内容是以下形式之一的转义序列，则表示字符是该转义序列的转义值
- 简单转义
- 8 位转义

[expr.literal.byte-char.single]

否则，表示字符是构成字面量内容的单个字符。

[expr.literal.byte-char.result]

表达式的值是表示字符的Unicode 标量值。

注意

BYTE_LITERAL token 的允许形式确保这些规则总是产生单个字符，其 Unicode 标量值在 u8 类型的范围内。

字节字面量表达式示例

#![allow(unused)]
fn main() {
b'R';                              // 82
b'\'';                             // 39
b'\x52';                           // 82
b'\xA0';                           // 160
}

[expr.literal.byte-string]

字节字符串字面量表达式

[expr.literal.byte-string.intro]

字节字符串字面量表达式由单个 BYTE_STRING_LITERAL 或 RAW_BYTE_STRING_LITERAL token 组成。

[expr.literal.byte-string.type]

表达式的类型是对元素类型为 u8 的数组的共享引用（具有 static 生命周期）。也就是说，类型是 &'static [u8; N]，其中 N 是下面描述的表示字符串中的字节数。

[expr.literal.byte-string.no-suffix]

此 token 不能有后缀。

[expr.literal.byte-string.literal-content]

此 token 的字面量内容是其字符串表示中第一个 U+0022 (") 之后且最后一个 U+0022 (") 之前的字符序列。

[expr.literal.byte-string.represented]

字面量表达式的表示字符串是根据字面量内容派生的字符序列，如下所示：

[expr.literal.byte-string.escape]

如果此 token 是 BYTE_STRING_LITERAL，则字面量内容中出现的以下任意形式的转义序列都会被替换为其转义值。
这些替换按从左到右的顺序进行。例如，token b"\\x41" 被转换为字符 \ x 4 1。

[expr.literal.byte-string.raw]

如果此 token 是 RAW_BYTE_STRING_LITERAL，则表示字符串与字面量内容相同。

[expr.literal.byte-string.result]

表达式的值是对静态分配的数组的引用，该数组按相同顺序包含表示字符串中字符的Unicode 标量值。

注意

BYTE_STRING_LITERAL 和 RAW_BYTE_STRING_LITERAL token 的允许形式确保这些规则总是产生在 u8 范围内的数组元素值。

字节字符串字面量表达式示例

#![allow(unused)]
fn main() {
b"foo"; br"foo";                     // foo
b"\"foo\""; br#""foo""#;             // "foo"

b"foo #\"# bar";
br##"foo #"# bar"##;                 // foo #"# bar

b"\x52"; b"R"; br"R";                // R
b"\\x52"; br"\x52";                  // \x52
}

[expr.literal.c-string]

C 字符串字面量表达式

[expr.literal.c-string.intro]

C 字符串字面量表达式由单个 C_STRING_LITERAL 或 RAW_C_STRING_LITERAL token 组成。

[expr.literal.c-string.type]

表达式的类型是对标准库类型 CStr 的共享引用（具有 static 生命周期）。也就是说，类型是 &'static core::ffi::CStr。

[expr.literal.c-string.no-suffix]

此 token 不能有后缀。

[expr.literal.c-string.literal-content]

此 token 的字面量内容是其字符串表示中第一个 " 之后且最后一个 " 之前的字符序列。

[expr.literal.c-string.represented]

字面量表达式的表示字节是根据字面量内容派生的字节序列，如下所示：

[expr.literal.c-string.escape]

如果此 token 是 C_STRING_LITERAL，则字面量内容被视为一系列项，每个项要么是除 \ 以外的单个 Unicode 字符，要么是转义。这些项序列被转换为字节序列，如下所示：
- 每个单个 Unicode 字符贡献其 UTF-8 表示。
- 每个简单转义贡献其转义值的Unicode 标量值。
- 每个8 位转义贡献一个字节，其中包含其转义值的Unicode 标量值。
- 每个Unicode 转义贡献其转义值的 UTF-8 表示。
- 每个字符串续行转义不贡献任何字节。

[expr.literal.c-string.raw]

如果此 token 是 RAW_C_STRING_LITERAL，则表示字节是字面量内容的 UTF-8 编码。

注意

C_STRING_LITERAL 和 RAW_C_STRING_LITERAL token 的允许形式确保表示字节中永远不包含 null 字节。

[expr.literal.c-string.result]

表达式的值是对静态分配的 CStr 的引用，其字节数组包含表示字节后跟一个 null 字节。

C 字符串字面量表达式示例

#![allow(unused)]
fn main() {
c"foo"; cr"foo";                     // foo
c"\"foo\""; cr#""foo""#;             // "foo"

c"foo #\"# bar";
cr##"foo #"# bar"##;                 // foo #"# bar

c"\x52"; c"R"; cr"R";                // R
c"\\x52"; cr"\x52";                  // \x52

c"æ";                                // LATIN SMALL LETTER AE (U+00E6)
c"\u{00E6}";                         // LATIN SMALL LETTER AE (U+00E6)
c"\xC3\xA6";                         // LATIN SMALL LETTER AE (U+00E6)

c"\xE6".to_bytes();                  // [230]
c"\u{00E6}".to_bytes();              // [195, 166]
}

[expr.literal.int]

整数字面量表达式

[expr.literal.int.intro]

整数字面量表达式由单个 INTEGER_LITERAL token 组成。

[expr.literal.int.suffix]

如果此 token 有后缀，则该后缀必须是以下原始整数类型之一的名称：u8, i8, u16, i16, u32, i32, u64, i64, u128, i128, usize 或 isize，并且表达式具有该类型。

[expr.literal.int.infer]

如果此 token 没有后缀，则表达式的类型由类型推断确定

[expr.literal.int.inference-unique-type]

如果可以从周围的程序上下文中唯一确定整数类型，则表达式具有该类型。

[expr.literal.int.inference-default]

如果程序上下文对类型约束不足，则默认类型为有符号 32 位整数 i32。

[expr.literal.int.inference-error]

如果程序上下文对类型约束过多，则被视为静态类型错误。

整数字面量表达式示例

#![allow(unused)]
fn main() {
123;                               // type i32
123i32;                            // type i32
123u32;                            // type u32
123_u32;                           // type u32
let a: u64 = 123;                  // type u64

0xff;                              // type i32
0xff_u8;                           // type u8

0o70;                              // type i32
0o70_i16;                          // type i16

0b1111_1111_1001_0000;             // type i32
0b1111_1111_1001_0000i64;          // type i64

0usize;                            // type usize
}

[expr.literal.int.representation]

表达式的值根据 token 的字符串表示按以下方式确定：

[expr.literal.int.radix]

通过检查字符串的前两个字符来选择整数基数，如下所示：
- 0b 表示基数 2
- 0o 表示基数 8
- 0x 表示基数 16
- 否则基数为 10。

[expr.literal.int.radix-prefix-stripped]

如果基数不是 10，则从字符串中删除前两个字符。

[expr.literal.int.type-suffix-stripped]

从字符串中删除任何后缀。

[expr.literal.int.separators-stripped]

从字符串中删除任何下划线。

[expr.literal.int.u128-value]

将字符串转换为 u128 值，就像使用选定的基数调用 u128::from_str_radix 一样。如果该值不适合 u128，则会产生编译器错误。

[expr.literal.int.cast]

通过数值转换将 u128 值转换为表达式的类型。

注意

如果字面量的值不适合表达式的类型，最终的转换会截断该值。 rustc 包含一个名为 overflowing_literals 的Lint 检查（默认为 deny），它会拒绝发生这种情况的表达式。

注意

例如，-1i8 是将负号运算符应用于字面量表达式 1i8 的结果，而不是单个整数字面量表达式。有关表示有符号类型的最小（最负）值的信息，请参阅溢出。

[expr.literal.float]

浮点数字面量表达式

[expr.literal.float.intro]

浮点数字面量表达式有两种形式：

单个 FLOAT_LITERAL token
单个具有后缀且无基数指示符的 INTEGER_LITERAL token

[expr.literal.float.suffix]

如果此 token 有后缀，则该后缀必须是以下原始浮点类型之一的名称：f32 或 f64，并且表达式具有该类型。

[expr.literal.float.infer]

如果此 token 没有后缀，则表达式的类型由类型推断确定

[expr.literal.float.inference-unique-type]

如果可以从周围的程序上下文中唯一确定浮点类型，则表达式具有该类型。

[expr.literal.float.inference-default]

如果程序上下文对类型约束不足，则默认类型为 f64。

[expr.literal.float.inference-error]

如果程序上下文对类型约束过多，则被视为静态类型错误。

浮点数字面量表达式示例

#![allow(unused)]
fn main() {
123.0f64;        // type f64
0.1f64;          // type f64
0.1f32;          // type f32
12E+99_f64;      // type f64
5f32;            // type f32
let x: f64 = 2.; // type f64
}

[expr.literal.float.result]

表达式的值根据 token 的字符串表示按以下方式确定：

[expr.literal.float.type-suffix-stripped]

从字符串中删除任何后缀。

[expr.literal.float.separators-stripped]

从字符串中删除任何下划线。

[expr.literal.float.value]

将字符串转换为表达式的类型，就像调用 f32::from_str 或 f64::from_str 一样。

注意

例如，-1.0 是将负号运算符应用于字面量表达式 1.0 的结果，而不是单个浮点数字面量表达式。

注意

inf 和 NaN 不是字面量 token。可以使用常量 f32::INFINITY、f64::INFINITY、f32::NAN 和 f64::NAN 来代替字面量表达式。在 rustc 中，一个大到被评估为无穷大的字面量会触发 overflowing_literals Lint 检查。

[expr.literal.bool]

布尔字面量表达式

[expr.literal.bool.intro]

布尔字面量表达式由关键字 true 或 false 之一组成。

[expr.literal.bool.result]

表达式的类型是原始布尔类型，其值为：

如果关键字是 true 则为 true
如果关键字是 false 则为 false

Rust 参考手册