目录
前言:
一,基础概念的说明
二,信号量的认识
三,信号量的函数接口
前言:
信号量可以按照不同的方式分为几大类,下面要说明的信号量是System V信号量。由于信号量的运用流行的是与网络代码方面结合,所以这里只先说明信号量的原理和细节问题,让大家对信号量具有充分了解,具体代码实现和运用后面网络部分会展开说明。
一,基础概念的说明
说明信号量原理之前,这里我们先要明白几种重要的概念。
1,临界资源:在Linux中,临界资源是一个重要的概念,它指的是一次仅允许一个进程(或线程)使用的共享资源。这些资源可能是硬件资源(如打印机、磁带机等),也可能是软件资源(如全局变量、数组、缓冲区、消息队列等)。由于临界资源的这种特性,访问这些资源的代码段需要被特别保护,以防止数据冲突和不一致性。
2,临界区:访问临界资源的代码叫做临界区。临界资源往往需要被保护起来,而所谓保护临界资源的本质,就是程序员保护临界区。
3,原子性:原子性操作指的是在执行过程中不可分割,即该操作要么全部执行,要么完全不执行,中间不会被其他线程或进程的操作打断。这种特性确保了数据的一致性和完整性,避免了并发执行时可能出现的竞态条件。
二,信号量的认识
认识信号量前,我们要明白,资源访问时往往需要进程同步和临界资源的互斥访问,倘若同一时间内,各个进程的执行流却只会访问这块公共资源的一部分,那么这种情况下对一整个公共资源直接访问的效率就会比较低(同一时间只允许一种执行流对其操作)。信号量提供了一种机制,它将一整块公共资源划分成了一个个小资源,每个小块资源可允许一个进程(或线程)执行流进来,即并发访问。这种情况下,只需处理两个问题即可:1,限制进来的进程数。2,合理分配共享资源。
信号量本质是一个计数器,是一个描述临界资源数量的计数器。进程访问临界资源必然是通过临界区来访问的,而在临界区中,首先做的是要成功申请信号量,也就是预定资源,当运用完毕时,信号量也就要释放了,以供其它进程使用,即保护临界资源(保护临界区)。其实说白了,信号量就是对公共资源进行预定的机制。
注意:信号量初始值是1时表示一种特殊情况。初始值为1意味着资源池仅包含一个资源,即一个整体,不能被分割,表示在任意时刻,只有一个进程或线程可以访问该资源,用于控制对单个资源的访问。这是一种互斥锁的特例,用于保护临界区,确保在任意时刻只有一个执行线程可以访问该区域。
信号量虽然是一种计数器,但是在多进程下,一个整数是不能实现信号量的效果,它只是实现信号量机制的基础元素之一。信号量机制通常涉及对一个或多个整数值的操作,以及与之相关的同步原语,以确保多进程之间的正确同步和互斥。更何况,一个全局整数无法在进程间共享,即便是父子进程,因为要发生写时拷贝,一个进程修改后另一个进程根本无法感知。
下面来谈谈信号量的申请与释放。信号量也属于共享资源,信号量的申请(也称为P操作或等待操作)和释放(也称为V操作或信号操作)必须是原子的,如果信号量的操作不是原子的,就可能发生竞态条件(竞态条件是指两个或多个线程或进程在访问共享资源时,由于执行顺序的交错导致最终结果取决于线程或进程的执行速度,这种结果是不确定的)而出错,比如:信号量的正确性依赖于每次只有一个线程或进程能成功地对信号量执行P操作或V操作,如果这些操作不是原子的,就可能发生多个线程或进程同时进入临界区访问或修改信号量的值,导致资源被不当地访问或修改,进而引发数据不一致或其他问题。
总的来说,信号量的设计是一种用于控制多个进程或线程对共享资源访问的同步机制,如果其操作不是原子的,就可能造成资源分配的不一致或冲突等一系列问题。
三,信号量的函数接口
多线程或多进程中,信号量的运用往往不止一个,因此,System V信号量设计的函数通常是涉及信号量集和信号量数组进行操作的(信号量集是一个或多个信号量的集合,系统中允许我们一次申请多个信号量,它们可以一起被管理,这里要说明的是一次申请多个信号量和信号量是多少是两个完全不同的概念),主要函数包括:semget()、semctl()、semop()。其中,semget函数的使用与共享内存中shmget函数使用类似,semctl()函数的使用与共享内存中shmctl函数使用类似,可以通过下面说明对比观察。
1,semget():创建一个新的信号量集或访问一个已存在的信号量集。
头文件:
#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>格式:
int semget(key_t key, int nsems, int semflg);参数说明:
key
:唯一标识一个信号量集的关键字(如同创建共享内存shmget的第一个参数key,一般情况下也是通过fork函数创建的)。如果key
的值为IPC_PRIVATE,则会创建一个新的、只对当前进程可见的信号量集。
nsems
:指定信号量集中信号量的数量。创建新信号量集时,这个值必须大于0。如果访问已存在的信号量集,这个值应该被设置为0。
semflg
:是权限和标志位的组合(如同创建共享内存shmget的第三个参数shmflg)。这个参数可以是0(表示只有当前进程的用户可以访问信号量集)、IPC_CREAT(表示如果信号量集不存在则创建它)、IPC_EXCL(与IPC_CREAT一起使用,即IPC_CREAT | IPC_EXCL,表示如果信号量集已存在则失败),以及可能的其他权限标志(如
0666
用于设置权限)。返回值:
成功时返回一个非负整数,即信号量集的标识符;失败时返回-1,并设置相应错误码。
2,semctl():对信号量集执行各种控制操作,如初始化信号量、获取信号量值等。
删除信号量在代码层中通常使用semctl()函数。系统指令中,删除信号量的命令是使用ipcrm的-s选项,使用方法跟删除共享内存的一摸一样,这里不再说明。
头文件:
#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>格式:
int semctl(int semid, int semnum, int cmd, ...);
参数说明:
semid:
信号量集的标识符,由semget()
函数返回。
semnum:
信号量集中的信号量编号(信号量的编号从 0 开始,此编号表示对信号量集的指定信号量进行操作,实际上就是数组的下标)。
cmd:
表示要执行的命令,比如GETVAL
(获取信号量的值)、SETVAL
(设置信号量的值,仅用于信号量集初始化时)、IPC_RMID
(删除整个信号量集)等。
...
:一个可选参数,其类型和含义取决于cmd
参数的值。这里先不做过多说明,后面运用时会详细解释。返回值:
大多数控制操作(如
SETVAL
、GETVAL
等)成功时返回0;失败返回-1,并设置错误码。
3,semop():用于对信号量集中的信号量执行 P/V 操作。
头文件:
#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>格式:
int semop(int semid, struct sembuf *sops, size_t nsops);
参数说明:
semid:信号量集的标识符。由
semget()
系统调用返回。sops:指向
sembuf
结构数组的指针(该参数是一个结构体数组名),sembuf
结构指定对信号量集中的单个信号量执行的操作。sembuf
结构是信号量操作的基本单位,该结构体是由程序员自己设置的,但无论怎样设置,里面至少包含以下成员:struct sembuf {
unsigned short sem_num; /* 信号量集中的信号量编号(从0开始) */
short sem_op; /* 要执行的操作。设置-1表示P操作;1表示V操作 */
short sem_flg; /* 操作的标志,通常设置为0或SEM_UNDO
(目前先只设置为0)*/
};nsops:
sops
数组中sembuf
结构的数量,表示对sops中第几个信号量进行的操作(从0开始)。返回值:
成功时返回0;失败时返回-1,并设置相应的错误码。
有关信号量的操作暂时先说明这么多,后面具体代码操作会在网络代码部分具体实现。这里先学习下理论即可。