这篇文章是对 Linux 内存相关问题的集合,工作中会有很大的帮助。关注公号的朋友应该知道之前我写过从核心态到使用者态 Linux 内存管理相关的基础文章,在阅读前最好浏览下,连结如下:
CPU是如何访问内存的?
实体地址和虚拟地址的分布
Linux核心内存管理算法Buddy和Slab
Linux使用者态程序的内存管理
linux 内存是后台开发人员,需要深入了解的计算机资源。合理的使用内存,有助于提升机器的效能和稳定性。本文主要介绍 linux 内存组织结构和页面布局,内存碎片产生原因和优化算法,linux 核心几种内存管理的方法,内存使用场景以及内存使用的那些坑。从内存的原理和结构,到内存的算法优化,再到使用场景,去探寻内存管理的机制和奥秘。
一、走进 linux 内存
1、内存是什么?1)内存又称主存,是 CPU 能直接定址的储存空间,由半导体器件制成
2)内存的特点是存取速率快
2、内存的作用
1)暂时存放 cpu 的运算资料
2)硬盘等外部储存器交换的资料
3)保障 cpu 计算的稳定性和高效能
二、 linux 内存地址空间
1、linux 内存地址空间 Linux 内存管理全貌2、内存地址——使用者态&核心态
使用者态:Ring3 运行于使用者态的程式码则要受到处理器的诸多
核心态:Ring0 在处理器的储存保护中,核心态
使用者态切换到核心态的 3 种方式:系统呼叫、异常、外设中断
区别:每个程序都有完全属于自己的,独立的,不被干扰的内存空间;使用者态的程式就不能随意操作核心地址空间,具有一定的安全保护作用;核心态执行绪共享核心地址空间;
3、内存地址——MMU 地址转换
MMU 是一种硬件电路,它包含两个部件,一个是分段部件,一个是分页部件
分段机制把一个逻辑地址转换为线性地址
分页机制把一个线性地址转换为实体地址
4、内存地址——分段机制
1) 段选择符
为了方便快速检索段选择符,处理器提供了 6 个分段暂存器来快取段选择符,它们是: cs,ss,ds,es,fs 和 gs
段的基地址(Base Address):线上性地址空间中段的起始地址
段的界限(Limit):在虚拟地址空间中,段内可以使用的最大偏移量
2) 分段实现
逻辑地址的段暂存器中的值提供段描述符,然后从段描述符中得到段基址和段界限,然后加上逻辑地址的偏移量,就得到了线性地址
5、内存地址——分页机制(32 位)
分页机制是在分段机制之后进行的,它进一步将线性地址转换为实体地址
10 位页目录,10 位页表项, 12 位页偏移地址
单页的大小为 4KB
6、使用者态地址空间
TEXT:程式码段可执行程式码、字串字面值、只读变数
DATA:资料段,对映程式中已经初始化的全域性变数
BSS 段:存放程式中未初始化的全域性变数
HEAP:执行时的堆,在程式执行中使用 malloc 申请的内存区域
MMAP:共享库及匿名档案的对映区域
STACK:使用者程序栈
7、核心态地址空间
直接对映区:线性空间中从 3G 开始最大 896M 的区间,为直接内存对映区
动态内存对映区:该区域由核心函式 vmalloc 来分配
永久内存对映区:该区域可访问高阶内存
固定对映区:该区域和 4G 的顶端只有 4k 的隔离带,其每个地址项都服务于特定的用途,如: ACPI_BASE 等
8、程序内存空间
使用者程序通常情况只能访问使用者空间的虚拟地址,不能访问核心空间虚拟地址
核心空间是由核心负责对映,不会跟着程序变化;核心空间地址有自己对应的页表,使用者程序各自有不同额页表
三、 Linux 内存分配算法
内存管理算法——对讨厌自己管理内存的人来说是天赐的礼物1、内存碎片
1) 基本原理
产生原因:内存分配较小,并且分配的这些小的内存生存周期又较长,反复申请后将产生内存碎片的出现
优点:提高分配速度,便于内存管理,防止内存泄露
缺点:大量的内存碎片会使系统缓慢,内存使用率低,浪费大
2) 如何避免内存碎片
少用动态内存分配的函式(尽量使用栈空间)
分配内存和释放的内存尽量在同一个函式中
尽量一次性申请较大的内存,而不要反复申请小内存
尽可能申请大块的 2 的指数幂大小的内存空间
外部碎片避免——伙伴系统算法
内部碎片避免——slab 算法
自己进行内存管理工作,设计内存池
2、伙伴系统算法——组织结构
1) 概念
为核心提供了一种用于分配一组连续的页而建立的一种高效的分配策略,并有效的解决了外碎片问题
分配的内存区是以页框为基本单位的
2) 外部碎片
外部碎片指的是还没有被分配出去(不属于任何程序),但由于太小了无法分配给申请内存空间的新程序的内存空闲区域3) 组织结构
把所有的空闲页分组为 11 个块连结串列,每个块连结串列分别包含大小为 1,2,4,8,16,32,64,128,256,512 和 1024 个连续页框的页块。最大可以申请 1024 个连续页,对应 4MB 大小的连续内存
3、伙伴系统算法——申请和回收
1) 申请算法
申请 2^i 个页块储存空间,如果 2^i 对应的块连结串列有空闲页块,则分配给应用
如果没有空闲页块,则查询 2^(i 1) 对应的块连结串列是否有空闲页块,如果有,则分配 2^i 块连结串列节点给应用,另外 2^i 块连结串列节点插入到 2^i 对应的块连结串列中
如果 2^(i 1) 块连结串列中没有空闲页块,则重复步骤 2,直到找到有空闲页块的块连结串列
如果仍然没有,则返回内存分配失败
2) 回收算法
释放 2^i 个页块储存空间,查询 2^i 个页块对应的块连结串列,是否有与其实体地址是连续的页块,如果没有,则无需合并
如果有,则合并成 2^(i 1)的页块,以此类推,继续查询下一级块连结,直到不能合并为止
3) 条件
两个块具有相同的大小
它们的实体地址是连续的
页块大小相同
4、如何分配 4M 以上内存?
1) 为何限制大块内存分配
分配的内存越大, 失败的可能性越大
大块内存使用场景少
2) 核心中获取 4M 以上大内存的方法
修改 MAX_ORDER, 重新编译核心
核心启动选型传递"mem="引数, 如"mem=80M,预留部分内存;然后通过
request_mem_region 和 ioremap_nocache 将预留的内存对映到模组中。需要修改核心启动引数, 无需重新编译核心. 但这种方法不支援 x86 架构, 只支援 ARM, PowerPC 等非 x86 架构
在 start_kernel 中 mem_init 函式之前呼叫 alloc_boot_mem 函式预分配大块内存, 需要重新编译核心
vmalloc 函式,核心程式码使用它来分配在虚拟内存中连续但在实体内存中不一定连续的内存
5、伙伴系统——反碎片机制
1) 不可移动页
这些页在内存中有固定的位置,不能够移动,也不可回收
核心程式码段,资料段,核心 kmalloc 出来的内存,核心执行绪占用的内存等
2) 可回收页
这些页不能移动,但可以删除。核心在回收页占据了太多的内存时或者内存短缺时进行页面回收3) 可移动页
这些页可以任意移动,使用者空间应用程序使用的页都属于该类别。它们是通过页表对映的
当它们移动到新的位置,页表项也会相应的更新
6、slab 算法——基本原理
1) 基本概念
Linux 所使用的 slab 分配器的基础是 Jeff Bonwick 为 SunOS 操作系统首次引入的一种算法
它的基本思想是将核心中经常使用的物件放到快取内存中,并且由系统保持为初始的可利用状态。比如程序描述符,核心中会频繁对此资料进行申请和释放
2) 内部碎片
已经被分配出去的的内存空间大于请求所需的内存空间3) 基本目标
减少伙伴算法在分配小块连续内存时所产生的内部碎片
将频繁使用的物件快取起来,减少分配、初始化和释放物件的时间开销
通过着色技术调整物件以更好的使用硬件快取内存
7、slab 分配器的结构
由于物件是从 slab 中分配和释放的,因此单个 slab 可以在 slab 列表之间进行移动
slabs_empty 列表中的 slab 是进行回收(reaping)的主要备选物件
slab 还支援通用物件的初始化,从而避免了为同一目而对一个物件重复进行初始化
8、slab 快取内存
1) 普通快取内存
slab 分配器所提供的小块连续内存的分配是通过通用快取内存实现的
通用快取内存所提供的物件具有几何分布的大小,范围为 32 到 131072 字节。
核心中提供了 kmalloc 和 kfree 两个界面分别进行内存的申请和释放
2) 专用快取内存
核心为专用快取内存的申请和释放提供了一套完整的界面,根据所传入的引数为具体的物件分配 slab 快取
kmem_cache_create 用于对一个指定的物件建立快取内存。它从 cache_cache 普通快取内存中为新的专有快取分配一个快取内存描述符,并把这个描述符插入到快取内存描述符形成的 cache_chain 连结串列中
kmem_cache_alloc 在其引数所指定的快取内存中分配一个 slab。相反, kmem_cache_free 在其引数所指定的快取内存中释放一个 slab
9、核心态内存池
1) 基本原理
先申请分配一定数量的、大小相等(一般情况下) 的内存块留作备用
当有新的内存需求时,就从内存池中分出一部分内存块,若内存块不够再继续申请新的内存
这样做的一个显著优点是尽量避免了内存碎片,使得内存分配效率得到提升
2) 核心 API
mempool_create 建立内存池物件
mempool_alloc 分配函式获得该物件
mempool_free 释放一个物件
mempool_destroy 销毁内存池
10、使用者态内存池
1) C++ 例项
11、DMA 内存
1) 什么是 DMA
直接内存访问是一种硬件机制,它允许外围装置和主内存之间直接传输它们的 I/O 资料,而不需要系统处理器的参与2) DMA 控制器的功能
能向 CPU 发出系统保持(HOLD)讯号,提出总线接管请求
当 CPU 发出允许接管讯号后,负责对总线的控制,进入 DMA 方式
能对储存器定址及能修改地址指标,实现对内存的读写操作
能决定本次 DMA 传送的字节数,判断 DMA 传送是否结束
发出 DMA 结束讯号,使 CPU 恢复正常工作状态
2) DMA 讯号
DREQ:DMA 请求讯号。是外设向 DMA 控制器提出要求,DMA 操作的申请讯号
DACK:DMA 响应讯号。是 DMA 控制器向提出 DMA 请求的外设表示已收到请求和正进行处理的讯号
HRQ:DMA 控制器向 CPU 发出的讯号,要求接管总线的请求讯号。
HLDA:CPU 向 DMA 控制器发出的讯号,允许接管总线的应答讯号:
四、 内存使用场景
out of memory 的时代过去了吗?no,内存再充足也不可任性使用。1、内存的使用场景
page 管理
slab(kmalloc、内存池)
使用者态内存使用(malloc、relloc 档案对映、共享内存)
程式的内存 map(栈、堆、code、data)
核心和使用者态的资料传递(copy_from_user、copy_to_user)
内存对映(硬件暂存器、保留内存)
DMA 内存
2、使用者态内存分配函式
alloca 是向栈申请内存,因此无需释放
malloc 所分配的内存空间未被初始化,使用 malloc 函式的程式开始时(内存空间还没有被重新分配) 能正常执行,但经过一段时间后(内存空间已被重新分配) 可能会出现问题
calloc 会将所分配的内存空间中的每一位都初始化为零
realloc 扩充套件现有内存空间大小
a) 如果当前连续内存块足够 realloc 的话,只是将 p 所指向的空间扩大,并返回 p 的指标地址。这个时候 q 和 p 指向的地址是一样的
b) 如果当前连续内存块不够长度,再找一个足够长的地方,分配一块新的内存,q,并将 p 指向的内容 copy 到 q,返回 q。并将 p 所指向的内存空间删除
3、核心态内存分配函式
函式分配原理最大内存其他_get_free_pages直接对页框进行操作4MB适用于分配较大量的连续实体内存kmem_cache_alloc基于 slab 机制实现128KB适合需要频繁申请释放相同大小内存块时使用kmalloc基于 kmem_cache_alloc 实现128KB最常见的分配方式,需要小于页框大小的内存时可以使用vmalloc建立非连续实体内存到虚拟地址的对映物理不连续,适合需要大内存,但是对地址连续性没有要求的场合dma_alloc_coherent基于_alloc_pages 实现4MB适用于 DMA 操作ioremap实现已知实体地址到虚拟地址的对映适用于实体地址已知的场合,如装置驱动alloc_bootmem在启动 kernel 时,预留一段内存,核心看不见小于实体内存大小,内存管理要求较高
4、malloc 申请内存
呼叫 malloc 函式时,它沿 free_chuck_list 连线表寻找一个大到足以满足使用者请求所需要的内存块
free_chuck_list 连线表的主要工作是维护一个空闲的堆空间缓冲区连结串列
如果空间缓冲区连结串列没有找到对应的节点,需要通过系统呼叫 sys_brk 延伸程序的栈空间
5、缺页异常
通过 get_free_pages 申请一个或多个物理页面
换算 addr 在程序 pdg 对映中所在的 pte 地址
将 addr 对应的 pte 设定为物理页面的首地址
系统呼叫:Brk—申请内存小于等于 128kb,do_map—申请内存大于 128kb
6、使用者程序访问内存分析
使用者态程序独占虚拟地址空间,两个程序的虚拟地址可相同
在访问使用者态虚拟地址空间时,如果没有对映实体地址,通过系统呼叫发出缺页异常
缺页异常陷入核心,分配实体地址空间,与使用者态虚拟地址建立对映
7、共享内存
1) 原理
它允许多个不相关的程序去访问同一部分逻辑内存
两个执行中的程序之间传输资料,共享内存将是一种效率极高的解决方案
两个执行中的程序共享资料,是程序间通讯的高效方法,可有效减少资料拷贝的次数
2) shm 界面
shmget 建立共享内存
shmat 启动对该共享内存的访问,并把共享内存连线到当前程序的地址空间
shmdt 将共享内存从当前程序中分离
五、 内存使用那些坑
1、C 内存泄露在类的建构函式和解构函式中没有匹配地呼叫 new 和 delete 函式
没有正确地清除巢状的物件指标
没有将基类的解构函式定义为虚拟函式
当基类的指标指向子类物件时,如果基类的解构函式不是 virtual,那么子类的解构函式将不会被呼叫,子类的资源没有得到正确释放,因此造成内存泄露
缺少拷贝建构函式,按值传递会呼叫(拷贝)建构函式,引用传递不会呼叫
指向物件的指标阵列不等同于物件阵列,阵列中存放的是指向物件的指标,不仅要释放每个物件的空间,还要释放每个指标的空间
缺少过载赋值运算子,也是逐个成员拷贝的方式复制物件,如果这个类的大小是可变的,那么结果就是造成内存泄露
2、C 野指标
指标变数没有初始化
指标被 free 或 delete 后,没有设定为
指标操作超越了变数的作用范围,比如返回指向栈内存的指标就是野指标
访问空指标(需要做空判断)
sizeof 无法获取阵列的大小
试图修改常量,如:char p="1234";p=\'1\';
3、C 资源访问冲突
多执行绪共享变数没有用 valotile 修饰
多执行绪访问全域性变数未加锁
全域性变数仅对单程序有效
多程序写共享内存资料,未做同步处理
mmap 内存对映,多程序不安全
4、STL 迭代器失效
被删除的迭代器失效
新增元素(insert/push_back 等)、删除元素导致顺序容器迭代器失效
错误示例:删除当前迭代器,迭代器会失效
正确示例:迭代器 erase 时,需储存下一个迭代器
5、C++ 11 智慧指标
auto_ptr 替换为 unique_ptr
使用 make_shared 初始化一个 shared_ptr
weak_ptr 智慧指标助手(1)原理分析:
(2)资料结构:
(3)使用方法:a. lock 获取所管理的物件的强引用指标 b. expired 检测所管理的物件是否已经释放 c. get 访问智慧指标物件
6、C++ 11 更小更快更安全
std::atomic 原子资料型别 多执行绪安全
std::array 定长阵列开销比 array 小和 std::vector 不同的是 array 的长度是固定的,不能动态拓展
std::vector vector 瘦身 shrink_to_fit:将 capacity 减少为于 size 相同的大小
td::forward_list
forward_list 是单链表(std::list 是双链表),只需要顺序遍历的场合,forward_list 能更加节省内存,插入和删除的效能高于 list
std::unordered_map、std::unordered_set用 hash 实现的无序的容器,插入、删除和查询的时间复杂度都是 O(1),在不关注容器内元素顺序的场合,使用 unordered 的容器能获得更高的效能六、 如何检视内存
系统中内存使用情况:/proc/meminfo
程序的内存使用情况:/proc/28040/status
查询内存总使用率:free
查询程序 cpu 和内存使用占比:top
虚拟内存统计:vmstat
程序消耗内存占比和排序:ps aux –sort -rss
释放系统内存快取:/proc/sys/vm/drop_caches
To free pagecache, use echo 1 > /proc/sys/vm/drop_caches
To free dentries and inodes, use echo 2 > /proc/sys/vm/drop_caches
To free pagecache, dentries and inodes, use echo 3 >/proc/sys/vm/drop_caches
新增极客助手微信,加入技术交流群
好看、留言、转发!