Linux多线程编程问题.doc_第1页
Linux多线程编程问题.doc_第2页
Linux多线程编程问题.doc_第3页
Linux多线程编程问题.doc_第4页
Linux多线程编程问题.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Linux 多线程编程问题1 重入问题传统的UNIX没有太多考虑线程问题,库函数里过多使用了全局和静态数据,导致严重的线程重入问题。1.1 D_REENTRANT /-pthread和errno的重入问题。所先UNIX的系统调用被设计为出错返回-1,把错误码放在errno中(更简单而直接的方法应该是程序直接返回错误码,或者通过几个参数指针来返回)。由于线程共享所有的数据区,而errno是一个全局的变量,这里产生了最糟糕的线程重入问题。比如:do bytes = recv(netfd, recvbuf, buflen, 0); while (bytes != -1 & errno != EINTR);在上面的处理recv被信号打断的程序里。如果这时连接被关闭,此时errno应该不等于EINTR,如果别的线程正好设置errno为EINTR,这时程序就可能进入死循环。其它的错误码处理也可能进入不可预测的分支。在线程需求刚开始时,很多方面技术和标准(TLS)还不够成熟,所以在为了解决这个重入问题引入了一个解决方案,把errno定义为一个宏:extern int *_errno_location (void);#define errno (*_errno_location()在上面的方案里,访问errno之前先调用_errno_location()函数,线程库提供这个函数,不同线程返回各自errno的地址,从而解决这个重入问题。在编译时加-D_REENTRANT就是启用上面的宏,避免errno重入。另外-D_REENTRANT还影响一些stdio的函数。在较高版本的gcc里,有很多嵌入函数的优化,比如把printf(“Hellon”);优化为puts(“hellon”);之类的,有些优化在多线程下有问题。所以gcc引入了 pthread 参数,这个参数出了-D_REENTRANT外,还校正一些针对多线程的优化。因为宏是编译时确定的,所以没有加-D_REENTRANT编译的程序和库都有errno重入问题,原则上都不能在线程环境下使用。不过在一般实现上主线程是直接使用全局errno变量的,也就是 _errno_location()返回值为全局&errno,所以那些没加-D_REENTRANT编译的库可以在主线程里使用。这里仅限于主线程,有其它且只有一个固定子线程使用也不行,因为子线程使用的errno地址不是全局errno变量地址。对于一个纯算法的库,不涉及到errno和stdio等等,有时不加_REENTRANT也是安全的,比如一个纯粹的加密/解谜函数库。比较简单的判断一个库是否有errno问题是看看这个库是使用了errno还是_errno_location():readelf -s libxxx.so | grep errno另外一个和errno类似的变量是DNS解析里用到的h_errno变量,这个变量的重入和处理与errno一样。这个h_errno用于gethostbyXX这个系列的函数。1.2 库函数重入早期很多unix函数设计成返回静态buffer。这些函数都是不能重入的。识别这些函数有几个简单的规则:1.2.1 stdio函数是可以重入的。这是因为stdio函数入口都会调用flockfile()锁定FILE。另外stdio也提供不锁定(非重入)的函数,这些函数以_unlock结尾,具体参见man unlocked_stdio。利用这些特性可以做到多个stdio的互斥操作。如:flockfile(fp);fwrite_unlocked(rec1, reclen1, 1, fp);fwrite_unlocked(rec2, reclen2, 1, fp);funlockfile(fp);1.2.2 返回动态分配数据的函数,这些一般是可以重入的。这些函数的特点是返回的指针需要显式释放,用free或者配对的释放函数。如:getaddrinfo /freeaddrinfomalloc/strdup/calloc/freefopen/fdopen/popen/fcloseget_current_dir_name/freeasprintf/vasprintf/freegetline/getdelim/freeregcomp/regfree1.2.3 函数返回一个和输入参数无关的数据,而且不需要free的大部分情况下是不可重入的。如gmtime, ntoa, gethostbyname1.2.4 函数依赖一个全局数据,在多次或者多个函数间维护状态的函数是不可重入的。如getpwent, rand1.2.5 带有_r变体的函数都是不可重入的。这些函数大部分是上面两类的。这些变体函数是可重入的代替版本。可以用下面命令查看glibc有多少这种函数:readelf -s /lib/libc.so.6 | grep _r这些函数名有很大一部分是getXXbyYY, getXXid, getXXent, getXXnam1.2.6 rand,lrand48系列随机数不可重入的原因在于这些函数使用一个全局的状态,并且都有相应的_r变体。重入这些非线程安全的函数不会有稳定性问题,不过会导致随机数不随机(可预测)。在要求比较严格的随机数应用里,建议用/dev/random和/dev/urandom,这两个设备的不同在于前者读出的数据理论上是绝对随机的,在系统无法提供足够随机数据时读会阻塞。后者只是提供尽量随即的数据,随机度不够时用算法生成伪随机数来代替,所以不会阻塞。1.2.7 不可重入函数处理。对大部分不可重入函数可以使用对应的_r变体。有些函数可能没有对应_r变体,可以选用类似功能的函数替换。如:inet_ntoa inet_ntopctime strftime, asctime, localtime_r+sprintfgethostbyname, getservbyname getaddrinfo1.2.8 用其它代码/逻辑替换不可重入代码1.2.9 有些库有两个版本,带和不带_r/_mt/th等后缀的,多线程一般用带后缀的版本的库。1.3 应用程序的线程安全1.3.1 全局量/共享资源互斥访问1.3.2 相关数据原子操作1.3.3 操作顺序2 互斥逻辑同步逻辑不仅仅是多线程程序的问题,在多进程环境里也经常使用。同步逻辑有很多种,其中最常用的就是互斥逻辑,也就是锁。由于历史原因,LINUX下产生了好多锁定API,下面列个简单的表格:Fcntl文件锁Flock文件锁SYSV semaphoreMutexrwlock类别读写锁读写锁信号量互斥锁读写锁对象进程/文件/范围句柄信号值内存内存非竞争开销高高中很低低竞争开销高高中很高/linuxthread较低/NPTL很高/linuxthread低/NPTL资源消耗句柄句柄信号ID24 byte内存32 byte内存进程支持支持支持不支持/linuxthread支持/NPTL不支持/linuxthread支持/NPTL线程支持(2.4)不支持(2.6)支持支持支持支持Crash解锁是是需要UNDO否否2.1 Fcntl文件锁2.1.1 支持偏移量。也就是可以用一个文件模拟许多互斥锁。2.1.2 进程锁非线程锁。也就是线程之间无法互斥。老的2.4 kernel没有支持这个POSIX标准,所以可以跨线程使用。2.1.3 相关句柄关闭导致文件解锁。这个锁是按进程+文件定位的,也就是同一进程打开多次文件使用相同的锁定关系。即使只关闭其中一个句柄导致解锁。在2.4 kernel下也有这个问题,任何线程关闭对应文件句柄,不是导致该线程解锁,而是导致所有线程解锁。2.1.4 逻辑死锁检测。2.2 Flock文件锁2.2.1 按句柄锁定2.2.2 进程的句柄继承2.3 SYSV semaphore2.3.1 信号量。2.3.2 性能比文件锁要好。2.3.3 可以同时对多个信号量进行复合操作2.3.4 /proc/sys/kernel/sem: SEMMSL SEMMNS SEMOPM SEMMNI2.3.4.1 SEMMSL, 每个信号量ID里的最大信号量数2.3.4.2 SEMMNS, 系统总信量灯数,小于SEMMSL x SEMMNI2.3.4.3 SEMOPM, 每次semop最大操作个数2.3.4.4 SEMMNI, 信号量ID数2.3.5 高版kernel有等待超时机制#include #include #ifndef SEMTIMEDOP#define SEMTIMEDOP 4#endifstatic inlineint semtimedop(int semid, struct sembuf *sops, unsigned nsops, struct timespec *timeout) return syscall(_NR_ipc, SEMTIMEDOP, semid, nsops, 0, sops, timeout);2.4 Mutex和rwlock2.4.1 在非竞争下性能最好2.4.2 NPTL使用futex实现,竞争条件下性能也不错。Linuxthread在竞争时由管理线程仲裁,开销较大。2.4.3 无crash自动解锁机制2.4.4 有等待超时机制2.5 内存原子操作2.5.1 内存原子操作是多CPU系统里最基本的互斥操作。所有的其它逻辑都是建立这之上的。2.5.2 整数操作,操作书为一个int类型。有些非x86的CPU只支持到24位值。#include atomic_t value;int v;v=atomic_read(&value);atomic_set(&value, v);atomic_add(v, &value);atomic_sub(v, &value);atomic_sub_and_test(v, &value); /*返回结果是否为0*/atomic_inc(&value);atomic_dec(&value);atomic_dec_and_test(&value); /*返回结果是否为0*/atomic_inc_and_test(&value); /*返回结果是否为0*/atomic_set_mask(mask, &value);atomic_clear_mask(mask, &value);2.5.3 bitmap位图操作#include void * bitmap;int nr;set_bit(nr, bitmap); /* OR */clear_bit(nr, bitmap); /* AND */change_bit(nr, bitmap); /* XOR */test_bit(nr, bitmap);test_and_set_bit(nr, bitmap); /* 返回旧值 */test_and_clear_bit(nr, bitmap); /* 返回旧值 */test_and_change_bit(nr, bitmap); /* 返回新值 */这些函数前面可以加两个下划线_表示非原子操作。非原子位图操作最好用 FD_SET, FD_CLR, FD_ISSET。2.6 Tag文件,用tag文件可以实现简单的trylock/unlock重入逻辑。char *tagfile;open(tagfile, O_RDWR|O_CREAT|O_EXCL, 0666); /* trylock */unlink(tagfile); /* unlock */daemon里经常使用这种tag文件,并且在文件里记录自己的pid。在该pid文件存在时,还可以进一步检查里面的pid是否还在运行。2.7 Stdio。2.8 Futex直接使用futex需要2.6 kernel支持。在有些特殊情况下可以考虑用futex代替mutex。2.8.1 内存考虑,mutex需要占24字节,而futex只需4个字节。2.8.2 简单的等待唤醒逻辑2.8.3 Futex可以转为文件句柄,并在上面poll唤醒事件2.9 海量稀疏锁也就是需要上万个锁的情形,而且大部分事件只有少数上锁。以上各种锁中:2.9.1 Flock锁需要大量文件,显然不合适。2.9.2 fcntl文件锁可以用大量偏移量模拟大量锁,使用上非常方便。问题是在2.6 的kernel + 线程应用上无法使用。Fcntl文件锁在核心是在核心维护一张被锁定的区域表,锁定关系通过修改该表来实现。这导致2.9.2.1 修改该表的所有操作互斥的,也就是不同偏移量的lock和unlock操作无法并行处理。2.9.2.2 修改锁定范围表的操作也较复杂,CPU开销也大些。2.9.2.3 内存等等开销在于锁定表。也就是取决于同时锁定的数目,和总的锁数目无关。2.9.3 SYSV信号量SYS的信号量缺省设置比较小。要作为海量锁要求需要修改系统配置。2.9.3.1 内存需求与锁数目成正比,大量锁的情况下核心大约需要8字节/锁。2.9.3.2 性能和速度都比文件锁要好。2.9.3.3 不能使用UNDO,没有crash自动解锁功能。2.9.4 Mutex2.9.4.1 内存消耗巨大2.9.4.2 非竞争条件小性能最好2.9.4.3 非NPTL下无法跨进程使用2.9.4.4 无crash自动解锁2.9.5 Futex和mutex比内存消耗小写,只有4字节/锁。只是要求2.6的kerne

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论