C++中的std::make_shared为什么比直接new更好？(减少内存分配次数)_技术教程

std::make_shared 能减少内存分配次数，因为它将控制块和对象数据合并到一次堆分配中，而直接 new 再构造 shared_ptr 会触发两次独立分配。

因为 std::make_shared 把控制块（control block）和对象数据分配在同一块连续内存里，而直接用 new 构造再传给 std::shared_ptr 构造函数时，控制块和对象是两次独立的堆分配。

控制块里存引用计数、弱引用计数、删除器等元数据；对象本身是用户数据。两次分配不仅慢，还增加缓存不友好性和碎片化风险。

这种写法看似直观，但隐含两次堆分配：

std::shared_ptr ptr(new std::string("hello")); // ❌ 两次分配

即使编译器做了某些优化（如 NRVO 或分配器内联），标准不保证合并；且无法避免控制块中存储的“指向对象的指针”带来的间接访问。

make_shared 不是万能替代方案，以下情况它无法工作或会出问题：

T 的构造函数是私有的，且 make_shared 无法访问（它不参与友元声明，也不像 shared_ptr 构造函数那样可被显式授权）
需要自定义删除器（如文件句柄、GPU 内存释放）——make_shared 固定使用 delete，必须用 shared_ptr(new T, my_deleter)
类重载了 operator new 且逻辑依赖于单独分配对象（例如按类型分页管理），make_shared 绕过该重载，改用全局或类模板内的分配逻辑
对象大小极大（如百 MB 数组），而控制块很小，合并分配可能导致大块内存无法复用（尤其在小对象频繁分配场景下）

可通过重载全局 operator new 或使用 malloc_hook（glibc）粗略验证。更可靠的是查看生成的汇编或用 valgrind --tool=massif 观察堆快照：

auto a = std::make_shared(42);        // 1 次 malloc（约 32–48 字节，含控制块）  
auto b = std::shared_ptr(new int(42)); // 2 次 malloc（1 次给 int，1 次给控制块）

实际大小取决于标准库实现：libstdc++ 控制块通常 16 字节（不含虚表指针），libc++ 是 24 字节；加上对齐填充和 int 本身，make_shared 一般只触发一次 32 或 48 字节分配。

真正复杂的地方在于：当 T 是带非平凡构造函数的大结构体，且你又需要自定义销毁逻辑时，就不得不放弃 make_shared ——这时候减少分配次数的目标就得让位于资源管理正确性。

C++中的std::make_shared为什么比直接new更好？(减少内存分配次数)