对于服务器环境上的灾难测试场景,我们正在寻找一种简单的方法来使进程陷入 D(不间断睡眠)状态。
有什么简单的方法吗?最好有一个 C 示例代码:)
编辑- 第一个答案是半正确的,因为该进程显示处于 D 状态,但它仍然接收信号并且可以被杀死
答案1
从https://blogs.oracle.com/ksplice/entry/disown_zombie_children_and_the
一个进程被放入一个不间断的睡眠 (STAT D)
当它需要等待某事时(通常是 I/O)并且不应在等待时处理信号。这意味着你不能kill
这样做,因为 Kill 所做的只是向其发送信号。在现实世界中,如果您拔掉 NFS 服务器的电源,而其他计算机已开放网络连接,则可能会发生这种情况。
我们可以利用vfork
系统调用来创建自己的有限持续时间的不间断进程。vfork
类似于fork
,只不过地址空间不会从父级复制到子级,因为预期exec
会抛出复制的数据。当您vfork
父母等待时,对我们来说很方便不间断地(通过wait_on_completion
)孩子的exec
或exit
:
jesstess@aja:~$ cat uninterruptible.c
int main() {
vfork();
sleep(60);
return 0;
}
jesstess@aja:~$ gcc -o uninterruptible uninterruptible.c
jesstess@aja:~$ echo $$
13291
jesstess@aja:~$ ./uninterruptible
and in another shell:
jesstess@aja:~$ ps -o ppid,pid,stat,cmd $(pgrep -f uninterruptible)
13291 1972 D+ ./uninterruptible
1972 1973 S+ ./uninterruptible
我们看到子进程 ( PID 1973, PPID 1972
) 处于可中断睡眠状态,而父进程 ( PID 1972, PPID 13291
-- shell) 处于不可中断睡眠状态,同时等待子进程 60 秒。
该脚本的一个巧妙(恶作剧?)的事情是,处于不间断睡眠状态的进程会影响机器的平均负载。因此,您可以运行此脚本 100 次,暂时将机器的平均负载提高 100,如uptime
.
答案2
我遇到了同样的问题,并通过创建一个卡在 D 状态的内核模块来解决它。
由于我没有任何模块经验,所以我从这个图例发现一些修改埃勒某个地方。
结果是 /dev/memory 上的一个设备在读取时卡住,但可以在其上写入唤醒(它需要两次写入,我不知道为什么,但我不在乎)。
只需使用它:
# make
# make mknod
# make install
# cat /dev/memory # this gets blocked
要解除阻止,请从另一个终端:
# echo -n a > /dev/memory
# echo -n a > /dev/memory
生成文件:
obj-m += memory.o
all:
make -C /lib/modules/$(shell uname -r)/build M=$(PWD) modules
clean:
make -C /lib/modules/$(shell uname -r)/build M=$(PWD) clean
install:
sudo insmod memory.ko
uninstall:
sudo rmmod memory
mknod:
sudo mknod /dev/memory c 60 0
sudo chmod 666 /dev/memory
memory.c的代码:
/* Necessary includes for device drivers */
#include <linux/init.h>
#include <linux/module.h>
#include <linux/kernel.h> /* printk() */
#include <linux/slab.h> /* kmalloc() */
#include <linux/fs.h> /* everything... */
#include <linux/errno.h> /* error codes */
#include <linux/types.h> /* size_t */
#include <linux/proc_fs.h>
#include <linux/fcntl.h> /* O_ACCMODE */
#include <asm/uaccess.h> /* copy_from/to_user */
#include <linux/sched.h>
MODULE_LICENSE("Dual BSD/GPL");
/* Declaration of memory.c functions */
int memory_open(struct inode *inode, struct file *filp);
int memory_release(struct inode *inode, struct file *filp);
ssize_t memory_read(struct file *filp, char *buf, size_t count, loff_t *f_pos);
ssize_t memory_write(struct file *filp, char *buf, size_t count, loff_t *f_pos);
void memory_exit(void);
int memory_init(void);
/* Structure that declares the usual file */
/* access functions */
ssize_t memory_write( struct file *filp, char *buf, size_t count, loff_t *f_pos);
ssize_t memory_read(struct file *filp, char *buf, size_t count, loff_t *f_pos);
int memory_open(struct inode *inode, struct file *filp);
int memory_release(struct inode *inode, struct file *filp);
struct file_operations memory_fops = {
.read = memory_read,
.write = memory_write,
.open = memory_open,
.release = memory_release
};
/* Declaration of the init and exit functions */
module_init(memory_init);
module_exit(memory_exit);
/* Global variables of the driver */
/* Major number */
int memory_major = 60;
/* Buffer to store data */
char *memory_buffer;
int memory_init(void) {
int result;
/* Registering device */
result = register_chrdev(memory_major, "memory", &memory_fops);
if (result < 0) {
printk(
"<1>memory: cannot obtain major number %d\n", memory_major);
return result;
}
/* Allocating memory for the buffer */
memory_buffer = kmalloc(1, GFP_KERNEL);
if (!memory_buffer) {
result = -ENOMEM;
goto fail;
}
memset(memory_buffer, 0, 1);
printk("<1>Inserting memory module\n");
return 0;
fail:
memory_exit();
return result;
}
void memory_exit(void) {
/* Freeing the major number */
unregister_chrdev(memory_major, "memory");
/* Freeing buffer memory */
if (memory_buffer) {
kfree(memory_buffer);
}
printk("<1>Removing memory module\n");
}
int memory_open(struct inode *inode, struct file *filp) {
/* Success */
return 0;
}
int memory_release(struct inode *inode, struct file *filp) {
/* Success */
return 0;
}
static DECLARE_WAIT_QUEUE_HEAD(wq);
static volatile int flag = 0;
ssize_t memory_read(struct file *filp, char *buf,
size_t count, loff_t *f_pos) {
printk("<1>going to sleep\n");
flag = 0;
//wait_event_interruptible(wq, flag != 0);
wait_event(wq, flag != 0);
printk("<1>Reading from memory module\n");
/* Transfering data to user space */
copy_to_user(buf,memory_buffer,1);
/* Changing reading position as best suits */
if (*f_pos == 0) {
*f_pos+=1;
return 1;
} else {
return 0;
}
}
ssize_t memory_write( struct file *filp, char *buf,
size_t count, loff_t *f_pos) {
char *tmp;
printk("<1>wake someone up\n");
flag = 1;
//wake_up_interruptible(&wq);
wake_up(&wq);
printk("<1>Writting to memory module\n");
tmp=buf+count-1;
copy_from_user(memory_buffer,tmp,1);
return 1;
}
答案3
基本上,你不能。阅读这篇文章,标题为:TASK_KILLABLE:Linux 中的新进程状态。
摘抄Linux® 内核 2.6.25 引入了一种新的进程状态,用于使进程进入睡眠状态,称为 TASK_KILLABLE,它提供了高效但可能无法终止的 TASK_UNINTERRUPTIBLE 和易于唤醒但更安全的 TASK_INTERRUPTIBLE 的替代方案。
此 SO 问答题为:什么是不可中断的进程?也解释了它。
我在这本非常有趣的书中发现了这一点,书名为:Linux 编程接口:Linux 和 UNIX 系统编程手册。