理解 Rust 中的 String 分配机制

在 Rust 中，哪怕是一行再普通不过的代码，也可能暗藏玄机。这次我们就来剖析这样一句看似简单的代码：

let s = "hello world".to_string();

这行代码触发了 只读数据段（.rodata）、堆（heap） 和 栈（stack） 三个内存区域的联动。我们将一步步解析这背后发生的事情，并最终弄清楚为什么一个字符串变量要占用 3 个 word（24 字节）。

一、从这行代码开始

我们先看代码：

let s = "hello world".to_string();

你可能以为这里只是创建了一个字符串对象，实则触发了一连串复杂的内存操作。

二、程序中的三大内存区域

1. .rodata（只读数据段）

存储内容：程序中所有不可变的字符串常量（比如 "hello world"）
特点：编译时就确定，加载程序时直接映射进内存，不可修改
举例："hello world" 编译后会保存在 .rodata 里，是只读的静态内存

2. 堆（Heap）

存储内容：运行时动态分配的内存
特点：需要手动管理（Rust 用所有权系统保障安全）
在这里：.to_string() 会在堆上开辟一块新空间，把 "hello world" 拷贝进来

3. 栈（Stack）

存储内容：函数里的局部变量和结构体字段（固定大小）
在这里：变量 s 是个 String，它是一个结构体，保存在栈上，记录了堆那块内存的三个关键信息

三、什么是一个 word？

在 64 位系统 中，一个 word = 8 字节
Rust 中很多基础类型如指针、usize 等都是一个 word 大小
一个 String 包含 3 个字段：指针 + 长度 + 容量 → 共 3 个 word = 24 字节

四、Rust 中 String 的结构

Rust 的 String 实际上是下面这个结构：

struct String {ptr: *const u8,    // 指向堆上的字符串数据len: usize,        // 当前字符串的长度capacity: usize,   // 分配的总内存容量
}

举个例子，如果你用 .to_string() 创建了 "hello world"，那么：

ptr → 指向堆上的字符串数据
len = 11（hello world 一共 11 个字符）
capacity = 11（刚好分配了 11 字节）

五、这行代码到底做了什么？

来回顾这句代码：

let s = "hello world".to_string();

执行过程：

"hello world" 是字符串字面量，编译阶段进入 .rodata
.to_string() 时：
- 在堆上申请 11 字节
- 把 .rodata 中的数据逐字节拷贝过去
在栈上创建一个 String 结构体（变量 s）：
- 存储堆地址（ptr）
- 长度（len = 11）
- 容量（capacity = 11）

📦 三个 word 分别是什么？

字段	类型	意义
`ptr`	`*const u8`	指向堆上数据的地址
`len`	`usize`	表示字符串当前长度
`capacity`	`usize`	表示堆中已分配的空间容量

六、用代码验证 String 的大小

可以用 std::mem::size_of::<String>() 来验证：

use std::mem::size_of;fn main() {println!("Size of String: {}", size_of::<String>());
}

输出为：

Size of String: 24

七、可视化内存布局

.rodata（只读段）：
+----------------+
| "hello world"  | ← 编译时写入，可读不可改堆：
+-----------------------------------+
| 'h' 'e' 'l' 'l' 'o' ' ' 'w' 'o' 'r' 'l' 'd' |
^
|__ s.ptr 指向这里，len = 11，cap = 11栈：
+------------------------------+
| ptr（指向堆）               |
| len = 11                    |
| capacity = 11               |
+------------------------------+

八、延伸思考与解答

❓1. 如果改用 `let s = "hello world";` 会发生什么？

这是 &'static str，不是 String：

"hello world" 仍然在 .rodata 段
s 是对该段的引用，不会复制也不会在堆上分配内存
s 的类型是 &'static str，本质上就是一个指针和长度的组合，占 16 字节（2 个 word）

👉 更高效，但不可变。

❓2. 为什么还要用 `.to_string()`，不直接用 `&str`？

&str 是只读的，不能修改
.to_string() 创建一个 可变字符串，你可以 .push()、.insert() 等
在需要修改字符串内容时，必须使用 String

❓3. 如果字符串很长或频繁修改，是否性能差？

如果你不断修改字符串，比如 .push_str()，可能会多次触发重新分配（扩容）
最好使用 .with_capacity() 预先分配内存，避免多次扩容

例如：

let mut s = String::with_capacity(100);
s.push_str("hello");

❓4. `Vec<T>` 和 `String` 内部结构一样吗？

几乎一样！

String 就是 Vec<u8> 的封装
二者都有指针、长度、容量
所以你可以通过 .into_bytes() 把 String 转成 Vec<u8>，而 .from_utf8() 可以反转回来

九、总结

这一行代码表面上只是创建了一个字符串，但它背后涉及了：

.rodata 存储静态常量
堆上拷贝数据（可变性）
栈上维护指针、长度、容量

它完美体现了 Rust 的内存模型：安全、高效、结构清晰。

理解 Rust 中的 String 分配机制

一、从这行代码开始

二、程序中的三大内存区域

1. .rodata（只读数据段）

2. 堆（Heap）

3. 栈（Stack）

三、什么是一个 word？

四、Rust 中 String 的结构

五、这行代码到底做了什么？

📦 三个 word 分别是什么？

六、用代码验证 String 的大小

七、可视化内存布局

八、延伸思考与解答

❓1. 如果改用 `let s = "hello world";` 会发生什么？

❓2. 为什么还要用 `.to_string()`，不直接用 `&str`？

❓3. 如果字符串很长或频繁修改，是否性能差？

❓4. `Vec<T>` 和 `String` 内部结构一样吗？

九、总结

相关资讯

热文排行

最新新闻

推荐新闻

热搜词

理解 Rust 中的 String 分配机制

一、从这行代码开始

二、程序中的三大内存区域

1. .rodata（只读数据段）

2. 堆（Heap）

3. 栈（Stack）

三、什么是一个 word？

四、Rust 中 String 的结构

五、这行代码到底做了什么？

📦 三个 word 分别是什么？

六、用代码验证 String 的大小

七、可视化内存布局

八、延伸思考与解答

❓1. 如果改用 let s = "hello world"; 会发生什么？

❓2. 为什么还要用 .to_string()，不直接用 &str？

❓3. 如果字符串很长或频繁修改，是否性能差？

❓4. Vec<T> 和 String 内部结构一样吗？

九、总结

相关资讯

热文排行

最新新闻

推荐新闻

热搜词

❓1. 如果改用 `let s = "hello world";` 会发生什么？

❓2. 为什么还要用 `.to_string()`，不直接用 `&str`？

❓4. `Vec<T>` 和 `String` 内部结构一样吗？