欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 财经 > 金融 > Linux系统之----进程的概念

Linux系统之----进程的概念

2025/4/23 10:33:35 来源:https://blog.csdn.net/2401_85878549/article/details/147340576  浏览:    关键词:Linux系统之----进程的概念

1.进程

1.1基本概念

课本概念 :进程是程序的一个执行实例,是正在执行的程序。当程序被执行时,系统会为其创建一个进程,包含程序代码、数据以及运行时所需的资源。

内核观点 :进程是担当分配系统资源(CPU 时间、内存)的实体。操作系统内核通过进程来管理和调度系统资源,确保每个进程都能合理地使用 CPU、内存等硬件资源。

1.2 描述进程-PCB 

1.2.1 基本概念

进程控制块(PCB) :进程的信息被存放在一个名为进程控制块的数据结构中,它是进程属性的集合,就好比一个档案袋,里面装着进程的各种信息,比如进程的状态、优先级、内存分配情况等。

Linux 中的 PCB(task_struct :在 Linux 操作系统下,PCB 是通过 task_struct 这个结构体来实现的。

1.2.2 task_struct 相关内容

task_struct 的定义task_struct 是 Linux 内核中定义的一个复杂的数据结构,包含在内核源代码的 include/linux/sched.h 文件中。它是内核用来表示和管理进程的核心数据结构,包含进程的各种信息,如进程标识符、状态、内存管理信息、I/O 信息、调度参数等。

task_struct 的作用 :用于在 Linux 中描述进程的结构体,它承载着进程相关的各类信息,是内核管理和调度进程的关键依据。

存储位置task_struct 是 Linux 内核的一种数据结构,会被装载到 RAM(内存)里,这样内核可以快速地访问和修改进程的信息,以实现对进程的有效管理,比如进程的创建、切换、销毁等操作都依赖于对 task_struct 的操作。

 1.2.3 内容分类

1)标示符

作用 :用于唯一标识一个进程,区分系统中的不同进程。

具体信息 :通常包括进程 ID(PID)、父进程 ID(PPID)等信息。

2)状态

作用 :反映进程当前的执行状态,以及进程退出时的相关信息。

具体信息 :包括进程是处于运行态、就绪态、等待态等,还有进程的退出代码(用于表示进程正常结束或异常终止的原因)、退出信号(用于通知其他进程该进程已结束)等。

3)优先级

作用 :决定进程调度的优先顺序,优先级高的进程更容易获得 CPU 资源进行执行。

具体信息 :包括动态优先级和静态优先级,不同的进程调度算法会根据优先级来安排进程的执行顺序。

4)程序计数器

作用 :指示处理器当前正在执行的指令位置,控制程序的执行流程。

具体信息 :指向进程在程序中即将被执行的下一条指令的内存地址,当进程被调度执行时,处理器根据程序计数器的值来获取并执行相应的指令。

5)内存指针

作用 :描述进程在内存中的布局和内存资源的使用情况,以及与其他进程共享内存的区域

具体信息 :包括指向进程的程序代码段、数据段、堆、栈等内存区域的指针。还有指向与其他进程共享的内存块的指针,用于实现进程间通信(IPC)和共享资源等功能。

6)上下文数据

作用 :保存进程执行时处理器的寄存器状态,用于在进程切换时恢复进程的执行环境。

具体信息 :包括处理器的各种寄存器(如通用寄存器、控制寄存器、状态寄存器等)的值,当进程被中断或切换时,系统会保存当前的上下文数据,以便在该进程再次被调度执行时能够恢复到之前的状态继续执行。

7)I/O 状态信息

作用 :记录进程的 I/O 操作相关信息,方便系统进行 I/O 管理和调度。

具体信息 :包括进程已发出的 I/O 请求、分配给进程的 I/O 设备(如磁盘、网络设备等)以及进程打开和使用的文件列表等。

8)记账信息

作用 :用于记录进程的资源使用情况,可用于系统资源管理和计费等目的。

具体信息 :包括进程使用的处理器时间总和(如用户态和内核态的 CPU 时间)、使用的时钟数总和、时间限制(如超时时间)、记账号等。

9)其他信息

作用 :包含一些其他与进程相关的信息,这些信息可能因不同的内核版本或特定的系统配置而有所不同。

具体信息 :例如进程的创建时间、所属的用户和组、安全上下文信息(在支持安全模块的系统中)等。

1.3 进程的查看

1.3.1   PID与PPID

1) PID(Process ID)
  1. 定义

    • PID 是操作系统分配给每个进程的唯一标识符,用于区分系统中的不同进程,是进程存在的标志。

  2. 作用

    • 唯一标识进程 :在 Linux 系统中,每个进程都有一个唯一的 PID,通过 PID 可以准确地识别和操作特定的进程。

    • 进程管理 :系统和用户可以根据 PID 对进程进行管理,如发送信号、终止进程、获取进程信息等。

    • 资源分配 :操作系统利用 PID 来管理进程的资源分配,如内存、CPU 时间等。

  3. 范围

    • 在 Linux 系统中,PID 是一个正整数。传统的 PID 范围是 1 到 32768,但具体范围可能因系统配置而有所不同。可以通过查看 /proc/sys/kernel/pid_max 文件来确定系统中 PID 的最大值。

2) PPID(Parent Process ID)
  1. 定义

    • PPID 是创建该进程的父进程的 ID。每个进程(除了 init 进程)都有一个父进程,PPID 用于标识这个父进程。

  2. 作用

    • 父子进程关系 :PPID 建立了进程之间的父子关系,有助于理解进程的层次结构和来源。例如,通过查看 PPID 可以知道某个进程是由哪个父进程启动的。

    • 进程管理 :在进程管理中,父进程可以利用 PPID 来管理和控制其子进程,如等待子进程结束、获取子进程状态等。

    • 孤儿进程处理 :当父进程终止时,其子进程将成为孤儿进程。系统会将孤儿进程的 PPID 改为 1,由 init 进程(PID 为 1)收养这些孤儿进程,确保它们能够正常结束 

3) 创建子进程的方式

在 Linux 系统中,父进程通过 fork() 系统调用创建子进程。

fork() 的功能是创建一个与父进程几乎完全相同的子进程。子进程会复制父进程的地址空间、环境变量、打开的文件等。

1.3. 2 查看进程的可执行文件

1)使用 /proc 文件系统

/proc 文件系统提供了关于进程的信息,每个进程在 /proc 中有一个以 PID 命名的目录。可以使用 ls -l /proc/<PID>/exe 查看进程对应的可执行文件的链接。 

2)示例:

假设有一个名为 myprocess 的进程,其 PID 为 1234,可以使用以下命令查看其可执行文件:

ls -l /proc/1234/exe

输出可能如下:

lrwxrwxrwx 1 root root 0 Mar 31 20:03 /proc/1234/exe -> /home/user/bin/myprocess

这表明进程 1234 的可执行文件位于 /home/user/bin/myprocess

1.3.3 查看进程及父进程

使用 getpid 和 getppid 函数

  • 功能

  • getpid 函数返回当前进程的 ID(PID)。

  • getppid 函数返回当前进程的父进程 ID(PPID)。

 函数原型:

#include <sys/types.h>
#include <unistd.h>pid_t getpid(void);
pid_t getppid(void);

 应用:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>int main() {pid_t pid = getpid();    // 获取当前进程的 PIDpid_t ppid = getppid();  // 获取当前进程的 PPIDprintf("Current process ID: %d\n", pid);printf("Parent process ID: %d\n", ppid);return 0;
}

 最后附上老师板书:

1.3.4 fork

 1) 基本概念

fork 的作用是创建一个新进程,这个新进程称为子进程,而调用 fork 的进程称为父进程。子进程是父进程的副本,它继承了父进程的几乎所有资源和状态。

2)工作原理

复制父进程资源

fork 被调用时,操作系统会创建一个新进程,并将父进程的代码段、数据段、堆、栈等资源复制到子进程中。子进程在创建时几乎与父进程完全相同,包括代码、变量、文件描述符、环境变量等。但是,子进程有自己独立的进程标识符(PID),并且它与父进程是两个独立的进程实体

写时拷贝

现代操作系统通常采用“写时复制”技术来优化 fork 的性能。在 fork 调用时,操作系统并不会立即复制父进程的所有资源,而是将父进程的资源标记为“共享”。只有当父进程或子进程对这些资源进行写操作时,操作系统才会真正复制被修改的部分资源,从而避免了不必要的复制操作,节省了时间和内存。

3) 返回值

fork 的返回值用于区分父进程和子进程

在父进程中

fork 返回子进程的进程标识符(PID),这是一个正整数。父进程可以通过这个 PID 来监控子进程的状态,例如使用 waitwaitpid 等系统调用等待子进程结束。

在子进程中

fork 返回 0。子进程可以通过返回值为 0 来判断自己是子进程,并执行相应的逻辑。

出错时

如果 fork 调用失败(例如系统资源不足或超出进程限制),它会返回 -1,并设置错误码 errno

 4)代码示例
#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>int main() 
{pid_t pid = fork(); // 调用 fork 创建子进程if (pid < 0) {// fork 失败perror("fork failed");return 1;}else if (pid == 0) {// 子进程printf("I am the child process, my PID is %d\n", getpid());} else {// 父进程printf("I am the parent process, my PID is %d, my child's PID is %d\n", getpid(), pid);            wait(NULL); // 等待子进程结束}return 0;
}

假设父进程的 PID 是 1234,子进程的 PID 是 1235,程序的输出可能是:

 也许此时会有人疑惑,为什么if和else都进去了??难道是程序出错了吗?还是说我们碰到了编程领域的量子力学了??实际上,这里是多线程编程,可以同时都进的。

 5)代码详解

fork 调用后,程序会分为两部分继续执行:一部分在父进程中运行,另一部分在子进程中运行。因此,ifelse 语句分别对应父进程和子进程的逻辑。

当程序执行到 pid_t pid = fork(); 时,操作系统会创建一个子进程。在调用 fork 之前,父进程和子进程是同一个进程,共享相同的代码和数据。调用 fork 之后,程序会分为两部分继续执行:父进程和子进程。

在父进程中,fork 返回子进程的进程标识符(PID),这是一个正整数。因此,pid > 0,程序会进入 else 分支。

在子进程中,fork 返回 0。因此,pid == 0,程序会进入 else if 分支。

实际上,ifelse 并不是同时进入的,而是分别在父进程和子进程中执行不同的分支。

父进程 执行 else 分支。子进程 执行 else if 分支。

从程序的整体运行角度来看,ifelse 的逻辑分别在两个不同的进程中执行,因此看起来像是“都进去了”,但实际上它们是在不同的上下文中运行的

有一点值得注意的是:当我们创建出子进程后,父子两个进程,谁先运行不确定,具体由OS的调度原则来确定。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词