1、第七章第七章 内核中的同步内核中的同步临界区和竞争状态内核同步措施并发控制第1页,共27页。什么是临界区(critical regions)?就是访问和操作共享数据的代码段,这段代码必须被原子地执行 什么是竞争状态?多个内核任务同时访问同一临界区 什么是同步?避免并发和防止竞争状态称为同步同步(synchronization)临界区和竞争状态临界区和竞争状态第2页,共27页。考虑一个非常简单的共享资源的例子:一个全局整型变量和一个简单的临界区,其中的操作仅仅是将整型变量的值增加1:i+该操作可以转化成下面三条机器指令序列:(1)得到当前变量i的值并拷贝到一个寄存器中(2)将寄存器中的值加1(3
2、)把i的新值写回到内存中 临界区举例临界区举例 第3页,共27页。内核任务内核任务1 1 内核任务内核任务2 2获得i(1)-增加 i(1-2)-写回 i(2)-获得 i(2)增加 i(2-3)写回 i(3)临界区举例临界区举例 内核任务内核任务1 1 内核任务内核任务2 2获得 i(1)-获得 i(1)增加 i(1-2)-增加 i(1-2)写回 i(2)-写回 i(2)可能的实际执行结果:期望的结果第4页,共27页。v 当共享资源是一个复杂的数据结构时,竞争状态往往会使该数据结构遭到破坏。v 对于这种情况,锁机制可以避免竞争状态正如门锁和门一样,门后的房间可想象成一个临界区。v 在一个指定时
3、间内,房间里只能有个一个内核任务存在,当一个任务进入房间后,它会锁住身后的房门;当它结束对共享数据的操作后,就会走出房间,打开门锁。如果另一个任务在房门上锁时来了,那么它就必须等待房间内的任务出来并打开门锁后,才能进入房间。共享队列和加锁共享队列和加锁 第5页,共27页。任何要访问队列的代码首先都需要占住相应的锁,这样该锁就能阻止来自其它内核任务的并发访问:任务任务 1 1 试图锁定队列 成功:获得锁 访问队列 为队列解除锁 任务任务2 2 试图锁定队列失败:等待 等待 等待 成功:获得锁 访问队列 为队列解除锁共享队列和加锁共享队列和加锁 第6页,共27页。v 找出哪些数据需要保护是关键所在
4、v 内核任务的局部数据仅仅被它本身访问,显然不需要保护v 如果数据只会被特定的进程访问,也不需加锁 v 大多数内核数据结构都需要加锁大多数内核数据结构都需要加锁:若有其它内核任务可以访问这些数据,那么就给这些数据加上某种形式的锁;若任何其它东西能看到它,那么就要锁住它 确定保护对象确定保护对象 第7页,共27页。v 死锁产生的条件:有一个或多个并发执行的内核任务和一个或多个资源,每个任务都在等待其中的一个资源,但所有的资源都已经被占用。所有任务都在相互等待,但它们永远不会释放已经占有的资源,于是任何任务都无法继续v 典型的死锁:v 四路交通堵塞v 自死锁:一个执行任务试图去获得一个自己已经持有
5、的锁 死死 锁锁 第8页,共27页。v 加锁的顺序是关键。使用嵌套的锁时必须保证以相同的顺序获取锁,这样可以阻止致命拥抱类型的死锁v 防止发生饥饿 v 不要重复请求同一个锁。v 越复杂的加锁方案越有可能造成死锁,因此设计应力求简单 死锁的避免死锁的避免 第9页,共27页。v 中断中断几乎可以在任何时刻异步发生,也可能随时打断正在执行的代码。v 内核抢占若内核具有抢占性,内核中的任务就可能会被另一任务抢占v 睡眠及与用户空间的同步在内核执行的进程可能会睡眠,这将唤醒调度程序,导致调度一个新的用户进程执行v 对称多处理两个或多个处理器可以同时执行代码 并发执行的原因并发执行的原因 第10页,共27
6、页。v 为了避免并发,防止竞争。内核提供了一组同步方法来提供对共享数据的保护v 原子操作原子操作v 自旋锁自旋锁v 信号量信号量 内核同步措施内核同步措施 第11页,共27页。v 原子操作可以保证指令以原子的方式原子的方式 被执行 v 两个原子操作绝对不可能并发地访问同一个变量 v Linux内核提供了一个专门的atomic_t类型(一个24位原子访问计数器)和一些专门的函数,这些函数作用于atomic_t类型的变量 原子操作原子操作 第12页,共27页。v 自旋锁是专为防止多处理器并发而引入的一种锁,它在内核中大量应用于中断处理等部分,而对于单处理器来说,可简单采用关闭中断的方式防止中断处理
7、程序的并发执行 v 自旋锁最多只能被一个内核任务持有,若一个内核任务试图请求一个已被持有的自旋锁,那么这个任务就会一直进行忙循环,也就是旋转,等待锁重新可用 自旋锁自旋锁 第13页,共27页。v 设计自旋锁的初衷是在短期间内进行轻量级的锁定。一个被持有的自旋锁使得请求它的任务在等待锁重新可用期间进行自旋,所以自旋锁不应该被持有时间过长v 自旋锁在内核中主要用来防止多处理器中并发访问临界区,防止内核抢占造成的竞争 v 自旋锁不允许任务睡眠,持有自旋锁的任务睡眠会造成自死锁,因此自旋锁能够在中断上下文中使用自旋锁自旋锁 第14页,共27页。v Linux中的信号量是一种睡眠锁。若有一个任务试图获得
8、一个已被持有的信号量时,信号量会将其推入等待队列,然后让其睡眠。这时处理器获得自由而去执行其它代码。当持有信号量的进程将信号量释放后,在等待队列中的一个任务将被唤醒,从而便可以获得这个信号量v 信号量具有睡眠特性,适用于锁会被长时间持有的情况,只能在进程上下文中使用信号量信号量 第15页,共27页。信号量的使用信号量的定义struct semaphore atomic_t count;int sleepers;wait_queue_head_t wait;static DECLARE_MUTEX(mr_sem);*声明并初始化互斥信号量*/if(down_interruptible(&mr_s
9、em)/*信号被接收,信号量还未获取*/*临界区*/up(&mr_sem);信号量信号量 第16页,共27页。信号量与自旋锁的比较信号量与自旋锁的比较 需求 建议的加锁方法 低开销加锁 优先使用自旋锁 短期锁定 优先使用自旋锁 长期加锁 优先使用信号量 中断上下文中加锁 使用自旋锁 持有锁时需要睡眠、调度 使用信号量 第17页,共27页。v 假设存在这样一个的内核共享资源链表。另外我们构造一个内核多任务访问链表的场景:内核线程向链表加入新节点;内核定时器定时删除接点;系统调用销毁链表。v 上面三种内核任务并发执行时,有可能会破坏链表数据的完整性,所以我们必须对链表进行同步访问保护,以确保数据一
10、致性。并发控制实例并发控制实例 第18页,共27页。v系统调用系统调用:是用户程序通过门机制来进入内核执行的内核例程,它运行在内核态,处于进程上下文中,可以认为是代表用户进程的内核任务 v 内核线程:内核线程:内核线程可以理解成在内核中运行的特殊进程,它有自己的“进程上下”,v定时器任务队列:定时器任务队列:任务队列属于下半部,主要有调度队列、定时器队列和及时队列等三种任务队列 内核任务及其之间的并发关系 第19页,共27页。系统调用和内核线程可能和各种内核任务并发执行,除了中断(定时器任务队列属于软中断范畴)抢占它产生并发外,它们还有可能自发性地主动睡眠(比如在一些阻塞性的操作中),于是放弃
11、处理器,从而重新调度其它任务,所以系统调用和内核线程除与定时器任务队列发生竞争,也会与其他(包括自己)系统调用与内核线程发生竞争。内核任务及其之间的并发关系 第20页,共27页。主要的共享资源是链表(mine),操作它的内核任务有三个:一是100个内核线程(sharelist),它们负责从表头将新节点(struct my_struct)插入链表。二是定时器任务(qt_task),它负责每个时钟节拍时从链表头删除一个节点。三是系统调用share_exit,它负责销毁链表并卸载模块。实现机制实现机制 第21页,共27页。v内核线程内核线程sharelist:v该函数是作为内核线程由keventd调
12、度执行的,作用是向链表中加入新节点 vstart_kthread:v该函数用来构建内核线程Sharelist的封装函数kthread_launcher,并启动它 v kthread_launcher:v该函数作用仅仅是通过kernel_thread方法启动内核线程sharelist 实现机制实现机制 第22页,共27页。v qt_task:v 该函数删除链表节点,作为定时器任务运行 v share_init:v 该函数是我们的模块注册函数,也是通过它启动定时器任务和内核线程 v share_exit:v 这是模块注销函数,负责销毁链表 实现机制实现机制 第23页,共27页。share_exit
13、sharelist 链表qt_taskkeventstart_kthread进程上下文中断上下文进程上下文downup上锁添加节点删除节点第24页,共27页。v 链表是内核开发中的常见数据组织形式,为了方便开发和统一结构,内核提供了一套接口来操作链表,我们用到的接口其主要功能为:v LIST_HEAD:声明链表结构v list_add():添加节点到链表v list_del():删除节点v list_entry():遍历链表v 任务队列结构为 struct tq_structv kill_proc,该函数在模块注销时被调用,其主要作用有两个:第一杀死我们生成的内核线程;第二告诉keventd回收相关子线程,以免产生“残疾”子线程序关键代码解释关键代码解释 第25页,共27页。v 对该模块的实际操作步骤如下:v Make 编译模块v Insmod sharelist.o 加载模块v Rmmod sharelist 卸载模块v Dmesg 观察结果一步一步一步一步 第26页,共27页。http:/ 提供了一个内核共享链表同步访问的例子,帮助大家提供了一个内核共享链表同步访问的例子,帮助大家理解内核编程中的同步问题。理解内核编程中的同步问题。下载其代码进行调试下载其代码进行调试第27页,共27页。