测量 C/汇编程序的精确时钟周期

测量 C/汇编程序的精确时钟周期

我需要测量执行程序所需的确切时钟周期数。我已经使用了clock()函数,但它的值取决于系统参数。我不知道如何使用 gdb 测量时钟周期。还有其他工具可以用于此目的吗?谢谢。

答案1

您可以使用性能用于分析程序执行的性能计数器。基本上你这样做

perf stat your_executable your_options

这里是一些简单的例子,以及这里是一篇更详细的文章。

请记住,在现代 CPU 上,用于执行某些操作的时钟周期会根据缓存使用情况、内部调度/重新排序等而有所不同。因此,如果您想发现分析瓶颈,请使用为perf您提供的其他选项。

答案2

Linuxperf_event_open系统调用config = PERF_COUNT_HW_CPU_CYCLES

如果您可以修改程序的源代码,则可以使用此系统调用。它还可以仅测量程序感兴趣的给定区域的结果。

更多详情请参见:https://stackoverflow.com/questions/13772567/how-to-get-the-cpu-cycle-count-in-x86-64-from-c/64898073#64898073

perf_event_open.c

#define _GNU_SOURCE
#include <asm/unistd.h>
#include <linux/perf_event.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/ioctl.h>
#include <unistd.h>

#include <inttypes.h>
#include <sys/types.h>

static long
perf_event_open(struct perf_event_attr *hw_event, pid_t pid,
                int cpu, int group_fd, unsigned long flags)
{
    int ret;

    ret = syscall(__NR_perf_event_open, hw_event, pid, cpu,
                    group_fd, flags);
    return ret;
}

int
main(int argc, char **argv)
{
    struct perf_event_attr pe;
    long long count;
    int fd;

    uint64_t n;
    if (argc > 1) {
        n = strtoll(argv[1], NULL, 0);
    } else {
        n = 10000;
    }

    memset(&pe, 0, sizeof(struct perf_event_attr));
    pe.type = PERF_TYPE_HARDWARE;
    pe.size = sizeof(struct perf_event_attr);
    pe.config = PERF_COUNT_HW_CPU_CYCLES;
    pe.disabled = 1;
    pe.exclude_kernel = 1;
    // Don't count hypervisor events.
    pe.exclude_hv = 1;

    fd = perf_event_open(&pe, 0, -1, -1, 0);
    if (fd == -1) {
        fprintf(stderr, "Error opening leader %llx\n", pe.config);
        exit(EXIT_FAILURE);
    }

    ioctl(fd, PERF_EVENT_IOC_RESET, 0);
    ioctl(fd, PERF_EVENT_IOC_ENABLE, 0);

    /* Loop n times, should be good enough for -O0. */
    __asm__ (
        "1:;\n"
        "sub $1, %[n];\n"
        "jne 1b;\n"
        : [n] "+r" (n)
        :
        :
    );

    ioctl(fd, PERF_EVENT_IOC_DISABLE, 0);
    read(fd, &count, sizeof(long long));

    printf("%lld\n", count);

    close(fd);
}

相关内容