模拟D状态下不可杀死的进程

模拟D状态下不可杀死的进程

对于服务器环境上的灾难测试场景,我们正在寻找一种简单的方法来使进程陷入 D(不间断睡眠)状态。

有什么简单的方法吗?最好有一个 C 示例代码:)

编辑- 第一个答案是半正确的,因为该进程显示处于 D 状态,但它仍然接收信号并且可以被杀死

答案1

https://blogs.oracle.com/ksplice/entry/disown_zombie_children_and_the

一个进程被放入一个不间断的睡眠 (STAT D)当它需要等待某事时(通常是 I/O)并且不应在等待时处理信号。这意味着你不能kill这样做,因为 Kill 所做的只是向其发送信号。在现实世界中,如果您拔掉 NFS 服务器的电源,而其他计算机已开放网络连接,则可能会发生这种情况。

我们可以利用vfork系统调用来创建自己的有限持续时间的不间断进程。vfork类似于fork,只不过地址空间不会从父级复制到子级,因为预期exec会抛出复制的数据。当您vfork父母等待时,对我们来说很方便不间断地(通过wait_on_completion)孩子的execexit

jesstess@aja:~$ cat uninterruptible.c 
int main() {
    vfork();
    sleep(60);
    return 0;
}
jesstess@aja:~$ gcc -o uninterruptible uninterruptible.c
jesstess@aja:~$ echo $$
13291
jesstess@aja:~$ ./uninterruptible
and in another shell:

jesstess@aja:~$ ps -o ppid,pid,stat,cmd $(pgrep -f uninterruptible)

13291  1972 D+   ./uninterruptible
 1972  1973 S+   ./uninterruptible

我们看到子进程 ( PID 1973, PPID 1972) 处于可中断睡眠状态,而父进程 ( PID 1972, PPID 13291-- shell) 处于不可中断睡眠状态,同时等待子进程 60 秒。

该脚本的一个巧妙(恶作剧?)的事​​情是,处于不间断睡眠状态的进程会影响机器的平均负载。因此,您可以运行此脚本 100 次,暂时将机器的平均负载提高 100,如uptime.

答案2

我遇到了同样的问题,并通过创建一个卡在 D 状态的内核模块来解决它。

由于我没有任何模块经验,所以我从这个图例发现一些修改埃勒某个地方

结果是 /dev/memory 上的一个设备在读取时卡住,但可以在其上写入唤醒(它需要两次写入,我不知道为什么,但我不在乎)。

只需使用它:

# make
# make mknod
# make install
# cat /dev/memory   # this gets blocked

要解除阻止,请从另一个终端:

# echo -n a > /dev/memory
# echo -n a > /dev/memory

生成文件:

obj-m += memory.o

all:
    make -C /lib/modules/$(shell uname -r)/build M=$(PWD) modules

clean:
    make -C /lib/modules/$(shell uname -r)/build M=$(PWD) clean

install:
    sudo insmod memory.ko

uninstall:
    sudo rmmod memory

mknod:
    sudo mknod /dev/memory c 60 0
    sudo chmod 666 /dev/memory

memory.c的代码:

/* Necessary includes for device drivers */
#include <linux/init.h>
#include <linux/module.h>
#include <linux/kernel.h> /* printk() */
#include <linux/slab.h> /* kmalloc() */
#include <linux/fs.h> /* everything... */
#include <linux/errno.h> /* error codes */
#include <linux/types.h> /* size_t */
#include <linux/proc_fs.h>
#include <linux/fcntl.h> /* O_ACCMODE */
#include <asm/uaccess.h> /* copy_from/to_user */
#include <linux/sched.h>

MODULE_LICENSE("Dual BSD/GPL");

/* Declaration of memory.c functions */
int memory_open(struct inode *inode, struct file *filp);
int memory_release(struct inode *inode, struct file *filp);
ssize_t memory_read(struct file *filp, char *buf, size_t count, loff_t *f_pos);
ssize_t memory_write(struct file *filp, char *buf, size_t count, loff_t *f_pos);
void memory_exit(void);
int memory_init(void);

/* Structure that declares the usual file */
/* access functions */
ssize_t memory_write( struct file *filp, char *buf, size_t count, loff_t *f_pos);
ssize_t memory_read(struct file *filp, char *buf, size_t count, loff_t *f_pos);
int memory_open(struct inode *inode, struct file *filp);
int memory_release(struct inode *inode, struct file *filp);
struct file_operations memory_fops = {
    .read = memory_read,
    .write = memory_write,
    .open = memory_open,
    .release = memory_release
};

/* Declaration of the init and exit functions */
module_init(memory_init);
module_exit(memory_exit);

/* Global variables of the driver */
/* Major number */
int memory_major = 60;
/* Buffer to store data */
char *memory_buffer;

int memory_init(void) {
    int result;

    /* Registering device */
    result = register_chrdev(memory_major, "memory", &memory_fops);
    if (result < 0) {
        printk(
                "<1>memory: cannot obtain major number %d\n", memory_major);
        return result;
    }

    /* Allocating memory for the buffer */
    memory_buffer = kmalloc(1, GFP_KERNEL); 
    if (!memory_buffer) { 
        result = -ENOMEM;
        goto fail; 
    } 
    memset(memory_buffer, 0, 1);

    printk("<1>Inserting memory module\n"); 
    return 0;

fail: 
    memory_exit(); 
    return result;
}

void memory_exit(void) {
    /* Freeing the major number */
    unregister_chrdev(memory_major, "memory");

    /* Freeing buffer memory */
    if (memory_buffer) {
        kfree(memory_buffer);
    }

    printk("<1>Removing memory module\n");

}

int memory_open(struct inode *inode, struct file *filp) {

    /* Success */
    return 0;
}

int memory_release(struct inode *inode, struct file *filp) {

    /* Success */
    return 0;
}
static DECLARE_WAIT_QUEUE_HEAD(wq);
static volatile int flag = 0;

ssize_t memory_read(struct file *filp, char *buf, 
        size_t count, loff_t *f_pos) { 

    printk("<1>going to sleep\n");
    flag = 0;
    //wait_event_interruptible(wq, flag != 0);
    wait_event(wq, flag != 0);

    printk("<1>Reading from memory module\n");
    /* Transfering data to user space */ 
    copy_to_user(buf,memory_buffer,1);

    /* Changing reading position as best suits */ 
    if (*f_pos == 0) { 
        *f_pos+=1; 
        return 1; 
    } else { 
        return 0; 
    }
}

ssize_t memory_write( struct file *filp, char *buf,
        size_t count, loff_t *f_pos) {

    char *tmp;

    printk("<1>wake someone up\n");
    flag = 1;
    //wake_up_interruptible(&wq);
    wake_up(&wq);

    printk("<1>Writting to memory module\n");
    tmp=buf+count-1;
    copy_from_user(memory_buffer,tmp,1);
    return 1;
}

答案3

基本上,你不能。阅读这篇文章,标题为:TASK_KILLABLE:Linux 中的新进程状态

摘抄

Linux® 内核 2.6.25 引入了一种新的进程状态,用于使进程进入睡眠状态,称为 TASK_KILLABLE,它提供了高效但可能无法终止的 TASK_UNINTERRUPTIBLE 和易于唤醒但更安全的 TASK_INTERRUPTIBLE 的替代方案。

此 SO 问答题为:什么是不可中断的进程?也解释了它。

我在这本非常有趣的书中发现了这一点,书名为:Linux 编程接口:Linux 和 UNIX 系统编程手册

相关内容