我试图通过读取程序头来定位 libc 程序段在程序内存中的位置。
在 Centos 6 上,当我对 libc.so.6 文件使用 readelf 时,VirtAddr 包含在进程内存中加载程序段的正确地址:
[user@centos6 src]$ readelf -l /lib64/libc.so.6 --wide
Elf file type is DYN (Shared object file)
Entry point 0x3032c1ee30
There are 10 program headers, starting at offset 64
Program Headers:
Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align
PHDR 0x000040 0x0000003032c00040 0x0000003032c00040 0x000230 0x000230 R E 0x8
INTERP 0x15aab0 0x0000003032d5aab0 0x0000003032d5aab0 0x00001c 0x00001c R 0x10
[Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
LOAD 0x000000 0x0000003032c00000 0x0000003032c00000 0x18a00c 0x18a00c R E 0x200000
LOAD 0x18a700 0x0000003032f8a700 0x0000003032f8a700 0x004f58 0x009228 RW 0x200000
DYNAMIC 0x18db40 0x0000003032f8db40 0x0000003032f8db40 0x0001f0 0x0001f0 RW 0x8
NOTE 0x000270 0x0000003032c00270 0x0000003032c00270 0x000044 0x000044 R 0x4
TLS 0x18a700 0x0000003032f8a700 0x0000003032f8a700 0x000010 0x000068 R 0x8
GNU_EH_FRAME 0x15aacc 0x0000003032d5aacc 0x0000003032d5aacc 0x0065ec 0x0065ec R 0x4
GNU_STACK 0x000000 0x0000000000000000 0x0000000000000000 0x000000 0x000000 RW 0x8
GNU_RELRO 0x18a700 0x0000003032f8a700 0x0000003032f8a700 0x003900 0x003900 R 0x1
因此在本例中,DYNAMIC 段位于 0x0000003032f8db40
但在 Centos 7 上,VirtAddr 包含一个偏移量,我必须将 libc 基地址添加到该偏移量中才能找到该段在内存中的位置:
[user@centos7 src]$ readelf -l /usr/lib64/libc.so.6 --wide
Elf file type is DYN (Shared object file)
Entry point 0x22660
There are 10 program headers, starting at offset 64
Program Headers:
Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align
PHDR 0x000040 0x0000000000000040 0x0000000000000040 0x000230 0x000230 R E 0x8
INTERP 0x18eb00 0x000000000018eb00 0x000000000018eb00 0x00001c 0x00001c R 0x10
[Requesting program interpreter: /lib64/ld-linux-x86-64.so.2]
LOAD 0x000000 0x0000000000000000 0x0000000000000000 0x1c3170 0x1c3170 R E 0x200000
LOAD 0x1c36f0 0x00000000003c36f0 0x00000000003c36f0 0x0051b0 0x009b10 RW 0x200000
DYNAMIC 0x1c6b60 0x00000000003c6b60 0x00000000003c6b60 0x0001f0 0x0001f0 RW 0x8
NOTE 0x000270 0x0000000000000270 0x0000000000000270 0x000044 0x000044 R 0x4
TLS 0x1c36f0 0x00000000003c36f0 0x00000000003c36f0 0x000010 0x0000a0 R 0x10
GNU_EH_FRAME 0x18eb1c 0x000000000018eb1c 0x000000000018eb1c 0x006aec 0x006aec R 0x4
GNU_STACK 0x000000 0x0000000000000000 0x0000000000000000 0x000000 0x000000 RW 0x10
GNU_RELRO 0x1c36f0 0x00000000003c36f0 0x00000000003c36f0 0x003910 0x003910 R 0x1
在这种情况下,动态段将位于 0x00000000003c6b60 + libc 基地址。
我猜测这可能是由于 Centos 7 上的 ASLR 导致 libc 库每次加载到不同的地址。在 Centos 6 上,libc 似乎总是加载到相同的地址。
有没有办法仅通过读取ELF头来确定我是否需要将libc基地址添加到VirtAddr中以获取程序段在内存中的实际位置?
答案1
我想我已经明白了,您需要检查所有 PT_LOAD 段并找到 p_vaddr 最低的段(我将其称为 lower_pt_load)。
然后计算出内存位置:libc_base + segment.p_addr - lowest_pt_load.p_vaddr
Centos 6 中发生的情况是,lowest_pt_load 等于 libc 基地址,导致它们相互抵消。
来源:https://docs.oracle.com/cd/E19683-01/816-1386/6m7qcoblk/index.html#chapter6-83432
基地址
可执行文件和共享目标文件具有基地址,它是与程序目标文件的内存映像关联的最低虚拟地址。基地址的一种用途是在动态链接期间重新定位程序的内存映像。
可执行文件或共享对象文件的基地址是在执行期间根据三个值计算得出的:内存加载地址、最大页面大小以及程序可加载段的最低虚拟地址。程序头中的虚拟地址可能不代表程序内存映像的实际虚拟地址。请参阅“程序加载(特定于处理器)”。
要计算基地址,您需要确定与 PT_LOAD 段的最低 p_vaddr 值关联的内存地址。然后,通过将内存地址截断为最接近的最大页面大小的倍数来获取基地址。根据加载到内存中的文件类型,内存地址可能与 p_vaddr 值不匹配。