




已阅读5页,还剩75页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
嵌入式操作系统,xlanchen2007.6.12 Spring 2007 Suzhou, Jiangsu, China,xlanchen2007.6.12,Embedded Operating Systems,2,昨天课程内容回顾,Linux内核分析的一些基础知识 堆栈 用户态/内核态 虚拟内存 内存寻址,xlanchen2007.6.12,Embedded Operating Systems,3,今天课程内容概述,Linux中的进程管理 进程描述符 进程切换 进程的创建和删除 进程调度,进程,xlanchen2007.6.12 Spring 2007 Suzhou, Jiangsu, China,xlanchen2007.6.12,Embedded Operating Systems,5,主要内容,进程描述符 进程切换 进程的创建和删除 进程调度,xlanchen2007.6.12,Embedded Operating Systems,6,进程的概念,进程是执行程序的一个实例 进程和程序的区别 几个进程可以并发的执行一个程序 一个进程可以顺序的执行几个程序,xlanchen2007.6.12,Embedded Operating Systems,7,进程描述符,为了管理进程,内核必须对每个进程进行清晰的描述。 进程描述符提供了内核所需了解的进程信息 include/linux/sched.h struct task_struct 数据结构很庞大,xlanchen2007.6.12,Embedded Operating Systems,8,xlanchen2007.6.12,Embedded Operating Systems,9,Linux进程的状态,可运行状态(TASK_RUNNING) 可中断的等待状态(TASK_INTERRUPTIBLE) 不可中断的等待状态(TASK_UNINTERRUPTIBLE) 暂停状态(TASK_STOPPED) 僵死状态(TASK_ZOMBIE),xlanchen2007.6.12,Embedded Operating Systems,10,进程状态转换图,xlanchen2007.6.12,Embedded Operating Systems,11,标识一个进程,使用进程描述符地址 进程和进程描述符之间有非常严格的一一对应关系,使得用32位进程描述符地址标识进程非常方便 使用PID (Process ID,PID) 每个进程的PID都存放在进程描述符的pid域中,xlanchen2007.6.12,Embedded Operating Systems,12,进程描述符和进程的内核堆栈,Linux为每个进程分配一个8KB大小的内存区域,用于存放该进程两个不同的数据结构: 进程描述符 进程的内核堆栈 进程处于内核态时使用 不同于用户态堆栈 内核控制路径所用的堆栈 很少,因此对栈和描述符 来说,8KB足够了,xlanchen2007.6.12,Embedded Operating Systems,13,Task_union,C语言允许用如下的一个union结构来方便的表示这样的一个混合体 进程描述符的分配/回收/访问,=2048,xlanchen2007.6.12,Embedded Operating Systems,14,current宏进程描述符,从刚才看到的进程描述符和内核态堆栈之间的配对,内核可以很容易的从esp寄存器的值获得当前在CPU上运行的进程的描述符指针 因为这个内存区是8KB=213大小,内核必须做的就是让esp有13位的有效位,以获得进程描述符的基地址 这个工作由current宏来完成,8191=8192-1=0x2000-1=0x1fff 取反:0xffffe000(最后13位为0),xlanchen2007.6.12,Embedded Operating Systems,15,Current宏的使用,Current宏可以看成当前进程的进程描述符指针,在内核中直接使用 比如current-pid返回在CPU上正在执行的进程的PID,xlanchen2007.6.12,Embedded Operating Systems,16,进程链表,为了对给定类型的进程(比如所有在可运行状态下的进程)进行有效的搜索,内核维护了几个进程链表 所有进程链表,在进程描述符中:,xlanchen2007.6.12,Embedded Operating Systems,17,SET_LINKS和REMOVE_LINKS宏用来分别在进程链表中插入和删除一个进程描述符。,xlanchen2007.6.12,Embedded Operating Systems,18,for_each_task宏扫描整个进程链表,xlanchen2007.6.12,Embedded Operating Systems,19,TASK_RUNNING状态的进程链表,当内核调度程序寻址一个新的进程在cpu上运行时,必须只考虑可运行进程,因为扫描整个进程链表效率很低 引入了可运行状态的双向循环链表,也叫运行队列 进程描述符使用 用来实现运行队列,xlanchen2007.6.12,Embedded Operating Systems,20,对可运行队列的一些操作函数,增加/删除一个可运行进程,可运行队列的长度,可运行进程的个数,唤醒一个进程,使一个进程可运行,xlanchen2007.6.12,Embedded Operating Systems,21,pidhash表及链接表,在一些情况下,内核必须能从进程的PID得出对应的进程描述符指针。例如kill系统调用 为了加速查找,引入了pidhash散列表 用pid_hashfn宏把PID转换成表的索引,xlanchen2007.6.12,Embedded Operating Systems,22,pidhash表及链接表,xlanchen2007.6.12,Embedded Operating Systems,23,进程之间的亲属关系,程序创建的进程具有父子关系,在编程时往往需要引用这样的父子关系。进程描述符中有几个域用来表示这样的关系,xlanchen2007.6.12,Embedded Operating Systems,24,等待队列,当要把除了TASK_RUNNING状态之外的进程组织在一起时,linux使用了等待队列 TASK_STOPPED和TASK_ZOMBIE不在专门的链表中 TASK_INTERRUPTIBLE和TASK_UNINTERRUPTIBLE状态的进程再分成很多类,每一类对应一个特定的事件。在这种情况下,进程状态提供的信息满足不了快速检索,因此,内核引进了另外的进程链表,叫做等待队列 等待队列在内核中有很多用途,尤其是对中断处理、进程同步和定时用处很大,xlanchen2007.6.12,Embedded Operating Systems,25,等待队列使得进程可以在事件上的条件等待,并且当等待的条件为真时,由内核唤醒它们 等待队列由循环链表实现 在等待队列上内核实现了一些操作函数 Add_wait_queue remove_wait_queue,xlanchen2007.6.12,Embedded Operating Systems,26,等待队列的链表,xlanchen2007.6.12,Embedded Operating Systems,27,进程等待,等待一个特定事件的进程能调用下面几个函数中的任一个 sleep_on sleep_on_timeout interruptible_sleep_on interruptible_sleep_on_timeout 进程等待由需要等待的进程自己进行(调用),xlanchen2007.6.12,Embedded Operating Systems,28,sleep_on,xlanchen2007.6.12,Embedded Operating Systems,29,进程的唤醒,利用wake_up或者wake_up_interruptible等一系列的宏,都让插入等待队列中的进程进入TASK_RUNNING状态,xlanchen2007.6.12,Embedded Operating Systems,30,进程切换(process switching),为了控制进程的执行,内核必须有能力挂起正在CPU上执行的进程,并恢复以前挂起的某个进程的执行,这叫做进程切换,任务切换,上下文切换,xlanchen2007.6.12,Embedded Operating Systems,31,进程上下文,包含了进程执行需要的所有信息 用户地址空间 包括程序代码,数据,用户堆栈等 控制信息 进程描述符,内核堆栈等 硬件上下文,xlanchen2007.6.12,Embedded Operating Systems,32,硬件上下文,尽管每个进程可以有自己的地址空间,但所有的进程只能共享CPU的寄存器。 因此,在恢复一个进程执行之前,内核必须确保每个寄存器装入了挂起进程时的值。这样才能正确的恢复一个进程的执行 硬件上下文: 进程恢复执行前必须装入寄存器的一组数据 包括通用寄存器的值以及一些系统寄存器 通用寄存器如eax,ebx等 系统寄存器如eip,esp,cr3等等,xlanchen2007.6.12,Embedded Operating Systems,33,在linux中 一个进程的硬件上下文主要保存在thread_struct中 其他信息放在内核态堆栈中,xlanchen2007.6.12,Embedded Operating Systems,34,thread_struct,xlanchen2007.6.12,Embedded Operating Systems,35,上下文切换,switch_to宏执行进程切换,schedule()函数调用这个宏一调度一个新的进程在CPU上运行 演示:在schedule()中找到调用switch_to宏的位置 switch_to利用了prev和next两个参数: prev:指向当前进程 next:指向被调度的进程,xlanchen2007.6.12,Embedded Operating Systems,36,当前进程仍然是prev 这个push操作针对的是 当前进程的堆栈,保存esi,edi,ebp,保存esp到%0中,嵌入式汇编中 用这种方法表 示输入、输出 参数,可以从 0开始编号,%0是什么?,保存esp到当前进程的上下文中,从next的上下文中取出堆栈的位置,将其作为当前堆栈,堆栈被切换,在prev进程的上下文中设置返回地址,返回到下面标号为1处,从next进程的上下文中取得该进程的返回地址,放入堆栈中,调用_switch_to函数,xlanchen2007.6.12,Embedded Operating Systems,37,进程切换的关键语句,堆栈的切换 从此,内核对next的内核态堆栈操作,因此,这条指令执行从prev到next真正的上下文切换,因为进程描述符和内核态堆栈紧密联系在一起,改变内核态堆栈就意味改变当前进程,xlanchen2007.6.12,Embedded Operating Systems,38,什么时候next进程真正开始执行呢? call=保存返回地址+跳转到target处执行 ret=从堆栈上获得返回地址,并跳转到该返回地址处执行 ?当_switch_to正常返回时,发生了什么事情?,xlanchen2007.6.12,Embedded Operating Systems,39,标号为1的执行代码处,一个进程被正常切换出时,保存的eip总是标号为1的那个位置 当这个进程再次被调度运行时,恢复在堆栈上的返回地址总是这个1 1: popl %ebp popl %edi popl %esi,xlanchen2007.6.12,Embedded Operating Systems,40,_switch_to,_switch_to用来处理其他上下文的切换 此时,使用的堆栈是next进程的堆栈,这个堆栈上没有_switch_to需要的参数prev和next 怎么传参呢? 演示:找到_switch_to的函数定义和函数声明 找到FASTCALL的定义,xlanchen2007.6.12,Embedded Operating Systems,41,_switch_to的关键操作,unlazy_fpu() 处理数学协处理器 保存和恢复fs、gs 等等,xlanchen2007.6.12,Embedded Operating Systems,42,?哪里切换了进程的地址空间,xlanchen2007.6.12,Embedded Operating Systems,43,进程的创建,许多进程可以并发的运行同一程序,这些进程共享内存中程序正文的单一副本,但每个进程有自己的单独的数据和堆栈区 一个进程可以在任何时刻可以执行新的程序,并且在它的生命周期中可以运行几个程序 又如,只要用户输入一条命令,shell进程就创建一个新进程,xlanchen2007.6.12,Embedded Operating Systems,44,Linux提供了几个系统调用来创建和终止进程,以及执行新程序 Fork,vfork和clone系统调用创建新进程 exec系统调用执行一个新程序 exit系统调用终止进程(进程也可以因收到信号而终止),xlanchen2007.6.12,Embedded Operating Systems,45,fork,fork系统调用创建一个新进程 调用fork的进程称为父进程 新进程是子进程 子进程几乎就是父进程的完全复制。它的地址空间是父进程的复制,一开始也是运行同一程序。 fork系统调用为父子进程返回不同的值,xlanchen2007.6.12,Embedded Operating Systems,46,exec,很多情况下,子进程从fork返回后很多会调用exec来开始执行新的程序 这种情况下,子进程根本不需要读或者修改父进程拥有的所有资源。 所以fork中地址空间的复制依赖于Copy On Write技术,降低fork的开销,xlanchen2007.6.12,Embedded Operating Systems,47,写时复制技术,写时复制技术允许父子进程能读相同的物理页。 只要两者有一个进程试图写一个物理页,内核就把这个页的内容拷贝到一个新的物理页,并把这个新的物理页分配给正在写的进程,xlanchen2007.6.12,Embedded Operating Systems,48,使用fork和exec的例子,If (result = fork() = 0) /* 子进程代码 */ if (execve(“new_program”,)0) perror(“execve failed”); exit(1); else if (result0) perror(“fork failed”) /* result=子进程的pid,父进程将会从这里继续执行*/ ,xlanchen2007.6.12,Embedded Operating Systems,49,分开这两个系统调用是有好处的 比如服务器可以fork许多进程执行同一个程序 有时程序只是简单的exec,执行一个新程序 在fork和exec之间,子进程可以有选择的执行一系列操作以确保程序以所希望的状态运行 重定向输入输出 关闭不需要的打开文件 改变UID或是进程组 重置信号处理程序 若单一的系统调用试图完成所有这些功能将是笨重而低效的 现有的fork-exec框架灵活性更强 清晰,模块化强,xlanchen2007.6.12,Embedded Operating Systems,50,do_fork,不论是fork,vfork还是clone,在内核中最终都调用了do_fork,xlanchen2007.6.12,Embedded Operating Systems,51,xlanchen2007.6.12,Embedded Operating Systems,52,阅读do_fork,了解大致程序流程 ?子进程从哪里开始执行,它的返回值是什么?,xlanchen2007.6.12,Embedded Operating Systems,53,注意:childregs指针指向哪里,eax寄存器用作返回值,这里强制为0,在上下文中,设置用户态堆栈指针,设置内核态堆栈指针,被调度后,执行入口 强制从ret_from_fork返 回用户态,此后,由于子进程处于调度队列上,因此在合适的时候会被调度, 调度时根据这里设置的上下文返回 用户态,xlanchen2007.6.12,Embedded Operating Systems,54,子进程的内核态堆栈,进程描述符,子进程的8K union,esp,返回值eax被强制写0,用户态堆栈esp的值,用户态下eip的值,子进程恢复到用户态时需要的上下文,eip,esp,子进程的硬件上下文,ret_from_fork,低地址,高地址,xlanchen2007.6.12,Embedded Operating Systems,55,子进程的执行,fork后,子进程处于可运行状态,由调度器决定何时把CPU交给这个子进程 进程切换后因为eip指向ret_from_fork,所以CPU立刻跳转到ret_from_fork()去执行。 接着这个函数调用ret_from_sys_call(),此函数用存放在栈中的值装载所有寄存器,并强迫CPU返回用户态,xlanchen2007.6.12,Embedded Operating Systems,56,内核线程,系统把一些重要的任务委托给周期性执行的进程 刷新磁盘高速缓存 交换出不用的页框 维护网络链接等待 内核线程与普通进程的差别 每个内核线程执行一个单独指定的内核函数 只运行在内核态 只使用大于PAGE_OFFSET的线性地址空间,xlanchen2007.6.12,Embedded Operating Systems,57,线程和进程的比较,Linux内核中没有线程的概念 没有针对所谓线程的调度策略 没有数据结构用来表示一个线程 一般线程的概念在linux中只是表现为一组共享资源的进程(每个这样的进程都有自己的进程描述符) 在其他系统中(比如windows) 线程是实实在在的一种运行抽象,提供了比进程更轻更快的调度单元 在linux中“线程”仅仅是表示多个进程共享资源的一种说法,xlanchen2007.6.12,Embedded Operating Systems,58,创建内核线程,Kerenl_thread()创建一个内核线程,并且只能由另一个内核线程来执行这个调用,xlanchen2007.6.12,Embedded Operating Systems,59,进程树,进程0 进程1 ,xlanchen2007.6.12,Embedded Operating Systems,60,进程0,所有进程的祖先叫做进程0 在系统初始化阶段由start_kernel()函数从无到有手工创建的一个内核线程 存放在init_task_union变量中的一个进程描述符和一个内核态堆栈(回忆一下启动时,堆栈的初始化) 用INIT_MM, INIT_MMAP, INIT_FS, INIT_FILES, INIT_SIGNALS宏初始化进程描述符的各个对应域 页全局目录,swapper_pg_dir变量 进程0最后的初始化工作创建init内核线程,此后运行cpu_idle,成为idle进程,xlanchen2007.6.12,Embedded Operating Systems,61,进程1,又称为init进程 由进程0在start_kernel调用rest_init创建 init进程PID为1,当调度程序选择到init进程时,init进程开始执行init()函数,xlanchen2007.6.12,Embedded Operating Systems,62,init() 为常规内核任务初始化一些必要的内核线程,如: kflushd 刷新脏缓冲区中的内容到磁盘以归还内存 kswapd 执行内存回收功能的线程 最后init()函数调用execve()系统调用装入可执行程序init。从此,init内核线程变成一个普通的进程。但init进程从不终止,因为它创建和监控操作系统外层的所有进程的活动,xlanchen2007.6.12,Embedded Operating Systems,63,撤销进程,进程终止 进程终止的一般方式是exit()系统调用。 这个系统调用可能由编程者明确的在代码中插入 另外,在控制流到达主过程C中的main()函数的最后一条语句时,执行exit()系统调用 内核可以强迫进程终止 当进程接收到一个不能处理或忽视的信号时 当在内核态产生一个不可恢复的CPU异常而内核此时正代表该进程在运行,xlanchen2007.6.12,Embedded Operating Systems,64,撤销进程,进程终止使用exit系统调用 删除进程 在父进程调用wait()类系统调用检查子进程是否合法终止以后,就可以删除这个进程,xlanchen2007.6.12,Embedded Operating Systems,65,演示进程的创建 ps可以显示系统中的进程 试一下:ps aux,xlanchen2007.6.12,Embedded Operating Systems,66,进程调度,调度策略 调度算法,xlanchen2007.6.12,Embedded Operating Systems,67,调度策略(scheduling policy),决定什么时候以怎样的方式选择一个新进程运行的一组规则 Linux的调度基于分时技术 允许多个进程“并发”运行 CPU的时间被划分成“片”,给每个可运行进程分配一片 在单处理器上,任何时刻只能运行一个进程,当一个并发执行的进程时间片用完时(到期)还没有终止,就可以进行进程切换 分时依赖于时钟中断,对进程透明,xlanchen2007.6.12,Embedded Operating Systems,68,Linux的进程根据优先级排队 根据特定的算法计算出进程的优先级,用一个值表示 这个值表示把进程如何适当的分配给CPU Linux中进程的优先级是动态的 调度程序会根据进程的行为周期性的调整进程的优先级 较长时间未分配到CPU的进程,通常 已经在CPU上运行了较长时间的进程,通常,xlanchen2007.6.12,Embedded Operating Systems,69,进程的分类,第一种分类: I/O-bound 频繁的进行I/O 通常会花费很多时间等待I/O操作的完成 CPU-bound 计算密集型 需要大量的CPU时间进行运算,xlanchen2007.6.12,Embedded Operating Systems,70,第二种分类 交互式进程(interactive process) 需要经常与用户交互,因此要花很多时间等待用户输入操作 响应时间要快,平均延迟要低于50150ms 典型的交互式程序:shell、文本编辑程序、图形应用程序等,xlanchen2007.6.12,Embedded Operating Systems,71,批处理进程(batch process) 不必与用户交互,通常在后台运行 不必很快响应 典型的批处理程序:编译程序、科学计算 实时进程(real-time process) 有实时需求,不应被低优先级的进程阻塞 响应时间要短 典型的实时进程:视频/音频、机械控制等,xlanchen2007.6.12,Embedded Operating Systems,72,与调度相关的系统调用,nice getpriority/setpriority sched_getscheduler/sched_setscheduler sched_getparam/sched_setparam sched_yield sched_get_priority_min/sched_get_priority_max sched_rr_get_interval,xlanchen2007.6.12,Embedded Operating Systems,73,时间片的选择,时间片的长短对系统性能非常关键,它既不能太长也不能太短 太短: 频繁的切换会造成系统开销过大 假如切换时间为1ms,时间片设置为1ms,那就没空执行进程了,xlanchen2007.6.12,Embedded Operat
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大学助教培训心得体会范文
- 高校教师师德师风建设意见学习心得体会
- 小学一年级运动健康教育计划
- 城市建设工程服务安全措施
- 金融服务拟投入主要物资计划
- 学校师德师风培训实施计划
- 七年级信息化劳动技术教学计划他
- 2025儿童口腔护理专项计划
- 高一下学期年级部课外辅导计划
- 手工制作兴趣小组时尚设计活动计划
- 新校区搬迁活动方案
- 2025年威海市中考数学试卷真题(含答案解析)
- 2025至2030中国绿色建筑材料行业发展趋势分析与未来投资战略咨询研究报告
- 国家开放大学机考答案4人力资源管理2025-06-21
- 病理生物安全管理制度
- 系统性红斑狼疮护理要点讲课件
- 急性呼吸衰竭教学
- 土地执法知识课件
- 信息分级分类管理制度
- 2022包头轻工职业技术学院招聘笔试真题含答案详解
- 毕业设计(论文)-自动展开晒衣架设计
评论
0/150
提交评论