深入理解进程

现代计算机体系结构

冯·诺依曼结构

要了解进程的概念得先从计算机的体系结构说起,首先了解一些世界上用得最多的计算机体系结构:冯·诺依曼结构(还有其他的计算机体系结构:如哈佛结构)

mark

冯·诺曼结构处理器具有以下几个特点:必须有一个存储器;必须有一个控制器;必须有一个运算器,用于完成算术运算和逻辑运算;必须有输入和输出设备,用于进行人机通信

存储设备对比

mark

上图从容量、传输速度、价格上来作比较,可以看出来为什么我们平时见到的计算机为什么硬盘几百G甚至几个T,而内存却只有8G或者16G,内存的IO速度是非常快的,跟硬盘的IO速度是 数量级 的差距,和内存相比寄存器就更快了,也是数量级的差距,于是出现了缓存,现在(2018/09/27)都是三级缓存,也就几M的大小,每次CPU在执行一些指令的时候会将需要的数据放在缓存中,其实就相当于是一个过渡元件!

操作系统的定位

mark

操作系统本质上就是一款软件,一款搞管理的软件,操作系统管理软件、管理硬件,为了安全操作系统不会让用户直接操作硬件,而是对外提供一套接口:也就是我们常用的系统调用接口

什么是进程

早期的内存比较小,但是伴随着应用程序(可以理解为安装包)越来越大,现在的计算机至少都是500M内存,连500M的都很少见了。为什么应用程序越大需要的内存也越大?这与冯·诺依曼计算机体系结构有关:

首先我们都学过C语言,C程序也是一个文件,既然是文件那就是在磁盘上放着的,磁盘并不属于冯诺依曼结构中的一部分,磁盘属于外部设备,这一点需要注意,因为在冯诺依曼计算机体系中只有运算器、控制器、存储器、输入输出设备,运算器和控制器集成在CPU中,存储器实际上是内存,这也就意味着没有硬盘计算机也是可以正常工作的: 《网吧电脑为什么没有硬盘 那没硬盘的电脑怎么运行?》

mark

可以看出计算机在执行任务的时候,都是把应用程序加载到内存中,CPU会去内存中取数据、取指令然后才执行,这也就是为什么网吧的电脑没有硬盘也可以正常使用,只要在开机的时候把操作系统加载到内存中(操作系统也是一个软件),然后要执行某个游戏的时候再次请求服务器将游戏也加载到内存中即可! 通过上面的论述我们得出一个初步结论:一个应用程序想要被CPU执行必须要先加载到内存,这个被加载到内存的程序就叫做一个进程

操作系统怎么维护进程

当你在听音乐的时候同时也可以编辑文档,还可以挂着TIM,很显然不止一个程序在执行,既然执行一个应用程序需要把它加载到内存中,那么当前肯定不止一个进程,每个程序一旦加载到内存中就是一个进程,那么这么多的进程如何维护呢?

PCB

PCB的全称是:Processing Control Block,翻译过来叫做进程控制块 操作系统是根据PCB来对并发执行的进程进行控制和管理的。 PCB存放着操作系统用于描述进程情况及控制进程运行所需的全部信息,PCB本质上就是一个结构体,这个结构体里面封装了描述进程的全部信息,它使一个在多道程序环境下不能独立运行的程序成为一个能独立运行的基本单位或一个能与其他进程并发执行的进程。所以这就叫做: 并发 那么什么是并行呢?并行指的是多核CPU同时执行多个任务,可见并发并不是真的同时执行,并行才是真的同时执行! 如果仅仅是把程序的代码和数据拷贝到内存中毫无意义,操作系统是无法管理好这个进程的,于是出现了PCB,进程之间是相互独立的,每个进程都对应一个PCB! 在Linux下描述进程的结构体叫做task_struct,接下来看看它的源码 地址是:https://elixir.bootlin.com/linux/latest/source/include/linux/sched.h 描述task_struct的位置在第593行(2019/09/27)

源码有点长,操作系统想要管理好这么多的进程必须把控进程的每一个信息,所以这就和学校管理学生一样,学号、地址、电话、身份证号….信息量很大的情况下必须封装成一个结构体来管理! 我们选择部分主要的内容看一下:

结构体成员 作用
标识符 描述本进程的唯标一符,用来区别其他进程
状态 任务状态,退出代码,退出信号等。
优先级 相对于其他进程的优先级
程序计数器 程序中即将被执的下一条指令的地址
内存指针 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针
上下文数据 进程执行时处理器的寄存器中的数据
I/O状态信息 包括显式的I/O请求,分配给进程的I/O设备和被进程使用的文件列表
记账信息 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等
其他信息

所有运在系统的进程都以 task_struct 链表的形式存在内核里。 进程的信息可以通过 /proc 系统 件夹查看。要获取PID为400的进程信息,你需要查看 / proc/400 这个件夹。 多数进程信息同样可以使 top和ps这些户集具来获取

获取进程ID与父进程ID

1#include <unistd.h>
2#include <stdio.h>
3
4int main() {
5        printf("pid=%d ppid=%d\n", getpid(), getppid());
6        return 0;
7}

初识fork

man 2 fork之后:fork() creates a new process by duplicating the calling process. The new process is referred to as the child process. The calling process is referred to as the parent process. The child process and the parent process run in separate memory spaces. At the time of fork() both memory spaces have the same content. Memory writes, file mappings (mmap(2)), and unmappings (munmap(2)) performed by one of the processes do not affect the other.

综合上面的意思来讲就是fork函数是用来开辟子进程的,fork() 函数正常的话对父进程返回子进程的id,对子进程返回0,返回-1则表示开辟子进程失败,所以一般使用if的结构开辟子进程:

 1#include <unistd.h>
 2#include <stdio.h>
 3#include <error.h>
 4
 5int main()
 6{
 7        int id = 0;
 8        //获取当前进程的进程ID和父进程
 9        printf("pid:%d ppid=%d\n",getpid(),getppid());
10
11        //开辟子进程
12        id = fork();
13        if(id < 0){
14                perror("fork failed\n");
15                return -1;
16        }else if( id == 0)
17                printf("Child,id = %d, ppid = %d\n", getpid(), getppid());
18        else{
19                printf("Parent,id = %d, ppid = %d\n",getpid(), getppid());
20        }
21        return 0;
22}

mark

很显然,子进程的ppid与父进程的id是一致的,那么父进程的ppid又是谁呢? 是Bash,记得开始学习Linux的时候老师讲过shell就是外壳程序,而Linux下面的shell就是叫做Bash,也就是命令行解释器,每当我们用Bash执行一条指令的时候,Bash就会开启一个子进程去完成需要被执行的指令!

进程状态

Linux内核源代码的解释:为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态,在Linux内核里,进程有时候也叫做任务。 下面的状态在kernel源代码里定义:

 1/*
 2* The task state array is a strange "bitmap" of reasons to sleep. Thus "running" is zero, and 
 3*  you can test for combinations of others with simple bit tests.
 4*/
 5static const char * const task_state_array[] = {
 6"R (running)", /* 0 */
 7"S (sleeping)", /* 1 */
 8"D (disk sleep)", /* 2 */
 9"T (stopped)", /* 4 */
10"t (tracing stop)", /* 8 */
11"X (dead)", /* 16 */
12"Z (zombie)", /* 32 */
13};

进程状态说明

  • R运行状态(running) 并不意味着进程一定在运行行中,它表明进程要么是在运行中要么在运行队列里里,这个其实不难理解,因为对于单核CPU而言每个单位时间里只能运行一个进程,为了看似表面上同时执行多个任务,CPU会在多个进程之间来回切换,速度非常快以至于我们是察觉不到CPU的切换,也就造成了我们误以为在同时运行多个任务的假象!
  • S睡眠状态(sleeping) 意味着进程在等待事件完成(这里里的睡眠有时候也叫做可中断睡眠(interruptible sleep),也就是说可以随时被唤醒,或者被杀死都有可能!
  • D磁盘休眠状态(Disk sleep) 有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束,如果IO一直没有结束这个进程是无法结束的!处在这种状态的进程不接受外来的任何信号,就算使用kill -9也不可以杀掉,如果长时间未响应就说明IO出了问题!比如说我开了8个进程同时访问一个IO,访问的时候势必会加锁来保护资源,那么,当一个进程正在访问的时候,其他进程如果在等待锁,那么就会进入disk sleep,当你执行kill,它不会立即响应,当锁满足条件的时候才可能响应信号。
  • T停止止状态(stopped) 可以通过发送 SIGSTOP 信号给进程来停止止(T)进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行。
  • X死亡状态(dead) 这个状态只是一个返回状态,你不会在任务列表里看到这个状态

修改进程状态

通过kill -l命令查看可以发送的信号:

mark

比如我们经常使用的kill -9 pid就是向ID为pid的进程发送9号信号,9号信号对应的是SIGKILL

Z(zombie)-僵尸进程

僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程(使用用wait()系统调用用,后面讲)没有读取到子进程退出的返回代码时就会产生僵死(尸)进程 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。 所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态 模拟僵尸进程:

mark

接下来我们写一个shell脚本来监视这两个进程的情况

1while :; do ps aux|grep test.out|grep -v grep;
2sleep 1; echo "#######################";done

mark

可以看到父进程还没有结束的时候子进程却死掉了,子进程在死掉的时候由于PCB是不会释放的,这样就没有进程来回收这个子进程,最终导致的结果就是内存泄漏! 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父父进程如果一直不读取,那子进程就一直处于Z状态?是的! 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话说,Z状态一直不退出,PCB一直都要维护?是的! 那一个父进程创建了很多子进程,就是不回收,是不是就会造成内存资源的浪费?是的! 因为数据结构对象本身身就要占用用内存,想想C中定义一个结构体变量(对象),是要在内存的某个位置进行行开辟空间!

孤儿进程

接下来说说孤儿进程,顾名思义孤儿进程就是没有父进程的进程,如果父进程比子进程先退出,那么这个子进程就是孤儿进程了,下面使用代码模拟一下孤儿进程:

 1#include <stdio.h>
 2#include <stdlib.h>
 3#include <unistd.h>
 4#include <sys/types.h>
 5
 6int main(int argc, char *argv[])
 7{
 8	int pid = fork();
 9	if(pid < 0){
10		perror("fork failed...");
11		return -1;
12	}else if(pid == 0){
13		printf("child[%d], my parentid[%d]..\n", getpid(), getppid());
14		sleep(5);
15		printf("child[%d], my parentid[%d]..\n", getpid(), getppid());
16	}
17	else{
18		printf("parent[%d]...\n", getpid());
19		sleep(2);
20		exit(0);	
21	}
22    return 0;
23}

mark

由图中可以看出,子进程还没有退出但是父进程已经退出了,于是子进程的ID变成了2915,2915号进程是/lib/systemd/systemd --user,但是远程链接的结果却是:

mark

其实Ubuntu自带的终端是个桌面软件,如果不在图形界面下运行就变成了1!

进程优先级

优先级概述

cpu资源分配的先后顺序,就是指进程的优先权(priority)。 优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用用,可以改善系统性能。还可以把进程运行行到指定的CPU上,这样一一来,把不重要的进程安排到某个CPU,可以大大大大改善系统整体性能

mark

PRI and NI

PRI也还是比比较好理解的,即进程的优先级,或者通俗点说就是程序被CPU执行的先后顺序,此值越小进程的优先级别越高高,那NI呢?就是我们所要说的nice值了,其表示进程可被执行的优先级的修正数值,PRI值越小越快被执行,那么加入nice值后,将会使得PRI变为PRI(new)=PRI(old)+nice 这样,当nice值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行 所以,调整进程优先级,在Linux下,就是调整进程nice值,nice其取值范围是-20至19,一共40个级别!

修改进程优先级的命令

  • 启动进程前调整: nice(开始执行程序就指定nice值:)

    1nice -n -5 ./test.out
    
  • 调整已存在进程的nice: renice

1renice -5 -p 5200  //PID为5200的进程nice设为-5
  • 使用top命令更改已存在进程的nice 进入top后按r->输入进程PID->输入nice值

  • 其他概念

  • 竞争性: 系统进程数目众多,而而CPU资源只有少量,甚至至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级

  • 独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰

  • 并行: 多个进程在多个CPU下分别同时运行,这称之为并行

环境变量

环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数 如:我们在编写C/C++代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性!

常见的环境变量

PATH: 指定命令的搜索路径 HOME: 指定用户的主工作目录(即用用户登陆到Linux系统中时,默认的目录) HISTSIZE: 指保存历史命令记录的条数 SHELL: 当前Shell,它的值通常是/bin/bash

和环境变量有关的命令

  1. echo: 显示某个环境变量值

  2. export: 设置一个新的环境变量

  3. env: 显示所有环境变量

  4. unset: 清除环境变量

  5. set: 显示本地定义的shell

    环境变量的组织形式

mark

每个程序都会收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以’\0’结尾的环境字符串

通过代码获取环境变量

mark

程序地址空间

先看这样一段代码:

 1#include <stdio.h>
 2#include <stdlib.h>
 3#include <unistd.h>
 4#include <sys/types.h>
 5
 6int g_val = 0;
 7int main(int argc, char *argv[]){
 8	pid_t id = fork();
 9	if(id < 0){
10		perror("fork failed");
11		return 0;
12	}	
13	else if(id == 0){
14		g_val = 100;
15		printf("child[%d],val[%d],address[%p]\n", getpid(), g_val, &g_val);
16	}else{
17		sleep(3);
18		printf("parent[%d],val[%d],address[%p]\n", getpid(), g_val, &g_val);
19	}
20	
21	sleep(1);
22	return 0;
23}

mark

全局变量g_val 在内存中很显然有两份,这个不难理解,父进程和子进程都有自己的一份变量,所以即使子进程修改了g_val 也是不会影响到父进程中的g_val,但是为什么打印出来的地址是一样的?这就引出来程序地址空间的概念: 由此可见打印出的地址都是虚拟地址,是操作系统将这写虚拟地址转化为了实际的物理地址!

进程地址空间

其实说程序地址空间是不准确的,应该叫做进程地址空间 早期的内存管理机制:

mark

  • 要运行一个程序,会把这些程序全都装入内存,当计算机同时运行多个程序时,必须保证这些程序用到的内存总量要小于计算机实际物理内存的大
  • 进程地址空间不隔离。由于程序都是直接访问物理内存,所以恶意程序可以随意修改别的进程的内存数据,以达到破坏的目的
  • 内存使用效率低。在A和B都运行的情况下,如果用户又运行了程序C,而程序C需要15M大小的内存才能运行,而此时系统只剩下4M的空间可供使用,所以此时系统必须在已运行的程序中选择一个将该程序的数据暂时拷贝到硬盘上,释放出部分空间来供程序C使用,然后再将程序C的数据全部装入内存中运行
  • 程序运行的地址不确定。当内存中的剩余空间可以满足程序C的要求后,操作系统会在剩余空间中随机分配一段连续的20M大小的空间给程序C使用,因为是随机分配的,所以程序运行的地址是不确定的,这种情况下,程序的起始地址都是物理地址,而物理地址都是在加载之后才能确定。

分页&虚拟地址空间

mark

其实从图中可以看出:虚拟地址空间只不过是操作系统建立了页表,把虚拟地址和实际物理内存建立了联系而已!

进程调度算法

既然操作系统中有那么多的进程,那CPU应该先调用哪一个呢?这就涉及到进程的调度算法,这里看Linux2.6内核为研究对象:

mark

一个 CPU 拥有一个 runqueue 如果有多个 CPU 就要考虑进程个数的负载均衡(优先级)问题 普通优先级: 100 ~ 139 (我们都是普通的优先级,想想 nice 值的取值范围 实时优先级:这个可以不用关心

活动队列

  • 时间片还没有结束的所有进程都按照优先级放在该队列
  • n_active :总共有多少个运行状态的进程
  • queue [ 140] :一个元素就是一个进程队列,相同优先级的进程按照FIFO 规则进行排队调度,所以,数组下标就是优先级!
  • 从该结构中,选择一个最合适的进程,过程是怎么的呢?
    1. 从 0 下表开始遍历queue[140 ]
    2. 找到第一个非空队列,该队列必定为优先级最高的队列
    3. 拿到选中队列的第一个进程,开始运行,调度完成!
    4. 遍历 queue [ 1 40 ]时间复杂度是常数!但还是太低效了!
  • bitmaP [ 5 ] :一共 1 40 个优先级,一共 1 40 个进程队列,为了提高查找非空队列的效率,就可以用 5 * 32 个比特位表示队列是否为空,这样,便可以大大提高查找效率!

过期队列

  • 过期队列和活动队列结构一模一样
  • 过期队列上放置的进程都是时间片耗尽的进程
  • 当活动队列上的进程都被处理完毕之后,对过期队列的进程进行时间片重新计算

active指针expired

  • active 指针永远指向活动队列

  • expired 指针永远指向过期队列可是活动队列上的进程会越来越少,过期队列上的进程会越来越多,因为进程时间片到期时一直都存在的。

  • 没关系,在合适的时候,只要能够交换 active 指针和 expired 指针的内容,就相当于有具有了一批新的活动进程!

    常见的进程调度算法

  • 时间片轮转调度算法(RR):给每个进程固定的执行时间,根据进程到达的先后顺序让进程在单位时间片内执行,执行完成后便调度下一个进程执行,时间片轮转调度不考虑进程等待时间和执行时间,属于抢占式调度。优点是兼顾长短作业;缺点是平均等待时间较长,上下文切换较费时。适用于分时系统。

  • 先来先服务调度算法(FCFS):根据进程到达的先后顺序执行进程,不考虑等待时间和执行时间,会产生饥饿现象。属于非抢占式调度,优点是公平,实现简单;缺点是不利于短作业。

  • 优先级调度算法(HPF):在进程等待队列中选择优先级最高的来执行。

  • 多级反馈队列调度算法:将时间片轮转与优先级调度相结合,把进程按优先级分成不同的队列,先按优先级调度,优先级相同的,按时间片轮转。优点是兼顾长短作业,有较好的响应时间,可行性强,适用于各种作业环境。

  • 高响应比优先调度算法:根据“响应比=(进程执行时间+进程等待时间)/ 进程执行时间”这个公式得到的响应比来进行调度。高响应比优先算法在等待时间相同的情况下,作业执行的时间越短,响应比越高,满足段任务优先,同时响应比会随着等待时间增加而变大,优先级会提高,能够避免饥饿现象。优点是兼顾长短作业,缺点是计算响应比开销大,适用于批处理系统。

    参考资料

  • 《Linux的进程优先级 NI 和 PR》

  • 《进程调度算法》

  • 《五种进程调度算法的总结》

  • 《https://www.jianshu.com/p/3bb1cdd44ef0》