Linux 内核 - 系统调用实现 - 页表浏览

Linux 内核 - 系统调用实现 - 页表浏览

我正在尝试学习一些有关 Linux 内核的知识,我遇到了一种练习,要求在 4.15.0+ Linux 内核上实现两个系统调用,目的是从进程的页表中读取页面。目标是第一个系统调用计算页面数量,第二个系统调用检索一个位图,用 1 指示内存中存在且处于只读模式的所有页面。

在网上做了一些研究后,这就是我得出的结论:

struct task_struct {
   ....
    struct list_head pg_list;
    unsigned long count;
}

#include <linux/kernel.h>
#include <linux/list.h>
#include <linux/slab.h>
#include <linux/uaccess.h>
#include <linux/sched.h>
#include <linux/sched/signal.h>
#include <linux/string.h>
#include <linux/mm.h>

struct page_list{
    size_t num_page;
    struct list_head list;
};


asmlinkage long sys_get(const char *proc_name const size_t name_len){
    char p_name[name_len+1];
    struct task_struct *task;
    struct vm_area_struct *vma = NULL;
    unsigned long vpage;
    unsigned long count = 0;
        
    if (copy_from_user(p_name, proc_name, name_len)) return -EFAULT;
    p_name[name_len] = '\0';
    
    for_each_process(task){
        if(strcmp(task->comm, p_name) == 0) {
            INIT_LIST_HEAD(&task->pg_list);

            if (task->mm && task->mm->mmap) {
                for (vma = task->mm->mmap; vma; vma = vma->vm_next) {
                    for (vpage = vma->vm_start; vpage < vma->vm_end; vpage += PAGE_SIZE) {
                        
                        pgd_t *pgd = pgd_offset(task->mm, vpage);
                        if (pgd_none(*pgd) || pgd_bad(*pgd)) continue;

                        p4d_t *p4d = p4d_offset(pgd, vpage);
                        if (p4d_none(*p4d) || p4d_bad(*p4d)) continue;

                        pud_t *pud = pud_offset(p4d, vpage);
                        if (pud_none(*pud) || pud_bad(*pud)) continue;

                        pmd_t *pmd = pmd_offset(pud, vpage);
                        if (pmd_none(*pmd) || pmd_bad(*pmd)) continue;

                        pte_t *pte = pte_offset_map(pmd, vpage);

                        if (pte_present(*pte) && !pte_write(*pte)) {
                            struct page_list *el = kmalloc(sizeof(*el), GFP_KERNEL);
                            if (!el) return -ENOMEM;
                            el->num_page = count;
                            list_add(&el->list, &our_task->pg_list);
                        }
                        count++;
                    }
                }
            }
        }
    }
    return count;
}

asmlinkage long sys_get(char *bitmap, const char *proc_name, const size_t name_len){    
    struct list_head *i;
    struct list_head *n;
    struct page_list *el;
    struct task_struct *task;
    char p_name[name_len+1];
        
    if (copy_from_user(p_name, proc_name, name_len)) return -EFAULT;
    p_name[name_len] = '\0';
       
    if (bitmap == NULL) {
        return -ENOENT;
    }
    
    for_each_process(task){
        if(strcmp(task->comm, p_name) == 0){
            list_for_each_safe(i, n, &task->pg_list){
                el = list_entry(i ,struct page_list, list);
                bitmap[el->num_page] = 1;
                list_del(i);
                kfree(el);
            }
            kfree(&task->pg_list);
        }
    }
    return 0;
}

这不能按预期工作,有时会导致内核恐慌,原因我不太明白。这是我第一次使用内核代码...我有几个具体问题是:这是遍历与进程对应的所有页面的有效方法吗?我用来查找只读当前页面的宏是否正确(x86-仅限 32 拱门)。将我的结果写入 char *bitmap 的正确方法是什么,因为它来自用户空间,只是访问它是错误的。最后,内核恐慌来自我处理内存的方式,但我不确定我做错了什么。任何反馈将不胜感激!

相关内容