使用 Vector 存储值列表
我们要介绍的第一个集合类型是 Vec<T>
,也被称为 vector(向量)。Vector 允许你在一个单独的数据结构中存储多个值,并将所有值在内存中彼此相邻地排列。Vector 只能存储相同类型的值。当你有一个项目列表时,它们非常有用,例如文件中的文本行或购物车中商品的价格。
创建新的 Vector
要创建一个新的空 vector,我们调用 Vec::new
函数,如列表 8-1 所示。
i32
类型的值请注意,我们在这里添加了一个类型注解。因为我们没有向这个 vector 中插入任何值,Rust 不知道我们打算存储什么类型的元素。这是一个重点。Vector 是使用泛型实现的;我们将在第 10 章介绍如何将泛型用于你自己的类型。现在,请记住标准库提供的 Vec<T>
类型可以保存任何类型。当我们创建一个 vector 来保存特定类型时,我们可以将类型指定在尖括号内。在列表 8-1 中,我们告诉 Rust v
中的 Vec<T>
将保存 i32
类型的元素。
更常见的情况是,你将使用初始值创建 Vec<T>
,而 Rust 会推断出你要存储的值的类型,因此你很少需要进行这种类型注解。Rust 方便地提供了 vec!
宏,它将创建一个新的 vector 来保存你给定的值。列表 8-2 创建了一个新的 Vec<i32>
,其中包含值 1
、2
和 3
。整数类型是 i32
,因为这是默认的整数类型,正如我们在第 3 章的 “数据类型”章节中讨论的那样。
因为我们给定了初始的 i32
值,Rust 可以推断出 v
的类型是 Vec<i32>
,因此类型注解不是必需的。接下来,我们将看看如何修改 vector。
更新 Vector
要创建一个 vector 然后向其添加元素,我们可以使用 push
方法,如列表 8-3 所示。
push
方法向 vector 添加值与任何变量一样,如果我们想要能够更改其值,我们需要使用 mut
关键字使其可变,正如在第 3 章中讨论的那样。我们放入其中的数字都是 i32
类型,Rust 从数据中推断出这一点,因此我们不需要 Vec<i32>
注解。
读取 Vector 的元素
有两种方法可以引用存储在 vector 中的值:通过索引或使用 get
方法。在下面的示例中,为了额外的清晰度,我们注解了从这些函数返回的值的类型。
列表 8-4 展示了访问 vector 中值的两种方法,使用索引语法和使用 get
方法。
get
方法访问 vector 中的项请注意这里的一些细节。我们使用索引值 2
来获取第三个元素,因为 vector 的索引从零开始编号。使用 &
和 []
会为我们提供对索引值处元素的引用。当我们使用 get
方法并将索引作为参数传递时,我们会得到一个 Option<&T>
,我们可以将其与 match
一起使用。
Rust 提供了这两种引用元素的方法,以便你可以选择当尝试使用超出现有元素范围的索引值时程序如何表现。例如,让我们看看当我们有一个包含五个元素的 vector,然后尝试使用每种技术访问索引为 100 的元素时会发生什么,如列表 8-5 所示。
当我们运行这段代码时,第一个 []
方法将导致程序 panic,因为它引用了一个不存在的元素。当你希望程序在尝试访问超出 vector 末尾的元素时崩溃,最好使用此方法。
当 get
方法传递的索引超出 vector 范围时,它会返回 None
而不会 panic。如果访问超出 vector 范围的元素可能在正常情况下偶尔发生,你将使用此方法。然后你的代码将具有处理 Some(&element)
或 None
的逻辑,正如在第 6 章中讨论的那样。例如,索引可能来自某人输入的数字。如果他们不小心输入了一个过大的数字,并且程序得到了 None
值,你可以告诉用户当前 vector 中有多少项,并给他们另一次机会输入有效值。这将比由于拼写错误而使程序崩溃更用户友好!
当程序具有有效引用时,借用检查器会强制执行所有权和借用规则(在第 4 章中介绍),以确保此引用和对 vector 内容的任何其他引用保持有效。回想一下规则,该规则声明你不能在同一作用域中同时拥有可变和不可变引用。该规则适用于列表 8-6,我们在其中持有对 vector 中第一个元素的不可变引用,并尝试在末尾添加一个元素。如果我们还尝试在函数稍后引用该元素,则此程序将无法工作。
编译此代码将导致此错误
$ cargo run
Compiling collections v0.1.0 (file:///projects/collections)
error[E0502]: cannot borrow `v` as mutable because it is also borrowed as immutable
--> src/main.rs:6:5
|
4 | let first = &v[0];
| - immutable borrow occurs here
5 |
6 | v.push(6);
| ^^^^^^^^^ mutable borrow occurs here
7 |
8 | println!("The first element is: {first}");
| ------- immutable borrow later used here
For more information about this error, try `rustc --explain E0502`.
error: could not compile `collections` (bin "collections") due to 1 previous error
列表 8-6 中的代码看起来应该可以工作:为什么对第一个元素的引用应该关心 vector 末尾的变化?此错误是由于 vector 的工作方式:因为 vector 将值彼此相邻地放置在内存中,所以向 vector 末尾添加新元素可能需要分配新内存并将旧元素复制到新空间,如果 vector 当前存储的位置没有足够的空间将所有元素彼此相邻地放置。在这种情况下,对第一个元素的引用将指向已释放的内存。借用规则阻止程序陷入那种情况。
注意:有关 Vec<T>
类型的实现细节的更多信息,请参见 “The Rustonomicon”。
迭代 Vector 中的值
要依次访问 vector 中的每个元素,我们将迭代所有元素,而不是使用索引一次访问一个。列表 8-7 展示了如何使用 for
循环来获取对 i32
值 vector 中每个元素的不可变引用并打印它们。
for
循环迭代元素来打印 vector 中的每个元素我们还可以迭代可变 vector 中每个元素的可变引用,以便对所有元素进行更改。列表 8-8 中的 for
循环将向每个元素添加 50
。
要更改可变引用指向的值,我们必须使用 *
解引用运算符来获取 i
中的值,然后才能使用 +=
运算符。我们将在 “使用解引用运算符跟随指针到值”的第 15 章章节中详细讨论解引用运算符。
迭代 vector,无论是不可变地还是可变地,都是安全的,因为借用检查器的规则。如果我们尝试在列表 8-7 和列表 8-8 的 for
循环体中插入或删除项,我们将得到类似于我们在列表 8-6 中的代码中得到的编译器错误。for
循环持有的对 vector 的引用阻止了对整个 vector 的同时修改。
使用枚举存储多种类型
Vector 只能存储相同类型的值。这可能很不方便;肯定存在需要存储不同类型项目列表的用例。幸运的是,枚举的变体是在相同的枚举类型下定义的,因此当我们需要一种类型来表示不同类型的元素时,我们可以定义和使用枚举!
例如,假设我们想从电子表格中的一行获取值,其中该行中的某些列包含整数,一些浮点数,还有一些字符串。我们可以定义一个枚举,其变体将保存不同的值类型,并且所有枚举变体都将被视为相同的类型:枚举的类型。然后我们可以创建一个 vector 来保存该枚举,从而最终保存不同的类型。我们在列表 8-9 中演示了这一点。
enum
以在一个 vector 中存储不同类型的值Rust 需要在编译时知道 vector 中将包含哪些类型,以便它确切地知道在堆上需要多少内存来存储每个元素。我们也必须明确允许在此 vector 中使用哪些类型。如果 Rust 允许 vector 保存任何类型,则可能会有一种或多种类型导致对 vector 元素执行的操作出错。使用枚举加上 match
表达式意味着 Rust 将在编译时确保处理每种可能的情况,正如在第 6 章中讨论的那样。
如果你不知道程序在运行时将获得哪些类型的详尽集合来存储在 vector 中,则枚举技术将不起作用。相反,你可以使用 trait 对象,我们将在第 18 章中介绍它。
现在我们已经讨论了一些使用 vector 的最常见方法,请务必查看 API 文档以了解标准库在 Vec<T>
上定义的许多有用的方法。例如,除了 push
之外,pop
方法还会删除并返回最后一个元素。
Drop Vector 会 Drop 其元素
像任何其他 struct
一样,vector 在超出作用域时会被释放,如列表 8-10 中所注释的那样。
当 vector 被 drop 时,它的所有内容也会被 drop,这意味着它保存的整数将被清理干净。借用检查器确保对 vector 内容的任何引用仅在 vector 本身有效时使用。
让我们继续下一个集合类型:String
!