多色和多条形分组图表

多色和多条形分组图表

我有一个 Python 脚本,可以自动生成绘制条形图的 LaTeX 代码。生成的代码示例如下:

\documentclass[border=10pt]{standalone}
\usepackage{pgfplots}
\pgfplotsset{width=7cm,compat=1.8}
\usepackage{pgfplotstable}
\renewcommand*{\familydefault}{\sfdefault}
\usepackage{sfmath}
\begin{document}
\begin{tikzpicture}
  \centering
  \begin{axis}[
        ybar, axis on top,
        title={Performance charts},
        height=8cm, width=15.5cm,
        bar width=1.5cm,
        ymajorgrids, tick align=inside,
        major grid style={draw=white},
        enlarge y limits={value=.1,upper},
        ymin=0, ymax=0.01,
        axis x line*=bottom,
        axis y line*=right,
        y axis line style={opacity=0},
        tickwidth=0pt,
        enlarge x limits=true,
        legend style={
            at={(0.5,-0.2)},
            anchor=north,
            legend columns=-1,
            /tikz/every even column/.append style={column sep=0.5cm}
        },
        ylabel={Time (seconds)},
        symbolic x coords={
           10,
           20,
       },
       xtick=data,
       nodes near coords={
        \pgfmathprintnumber[precision=3]{\pgfplotspointmeta}
       }
    ]
    \addplot+[ybar, fill=blue!50] plot coordinates {
      (10, 0.001223850250244141)
      (20, 0.001497483253479004)
    };
    \addplot+[ybar, fill=blue!25] plot coordinates {
      (10, 0.00045402050018310557)
      (20, 0.001987481117248536)
    };
    \addplot+[ybar, fill=red!50] plot coordinates {
      (10, 0.0008006999999999999)
      (20, 0.0010588)
    };
    \addplot+[ybar, fill=red!25] plot coordinates {
      (10, 0.0002661999999999997)
      (20, 0.0012075)
    };
    \legend{Real Time (Loading), Real-Time (Querying), CPU Time (Loading), CPU Time (Querying)}
  \end{axis}
\end{tikzpicture}
\end{document}

它生成了以下图表:当前情节

但是,我希望两个实时条形图能够堆叠在一起。与 CPU 时间相同。这样每个 x 坐标都有两个条形图。生成此 latex 代码的 Python 代码是:

def generate_latex_files(data, env_name, output_dir: Path) -> None:
    for key, values in data.items():
        if key[0] == env_name:
            # Sort values by graph size
            values.sort(key=lambda x: x[0])

            # Calculate maximum value for ymax
            max_value = max(sum(val['loading'] + val['querying']) for _, val in values) * 1.1

            file_name = f'{key[1]}_{key[2]}.tex'
            full_file_name = output_dir / env_name / file_name
            full_file_name.parent.mkdir(exist_ok=True, parents=True)
            with open(full_file_name, 'w') as f:
                f.write('\\documentclass[border=10pt]{standalone}\n')
                f.write('\\usepackage{pgfplots}\n')
                f.write('\\pgfplotsset{width=7cm,compat=1.8}\n')
                f.write('\\usepackage{pgfplotstable}\n')
                f.write('\\renewcommand*{\\familydefault}{\\sfdefault}\n')
                f.write('\\usepackage{sfmath}\n')
                f.write('\\begin{document}\n')
                f.write('\\begin{tikzpicture}\n')
                f.write('  \\centering\n')
                f.write('  \\begin{axis}[\n')
                f.write('        ybar, axis on top,\n')
                f.write(f'        title={{Performance charts}},\n')
                f.write('        height=8cm, width=15.5cm,\n')
                f.write('        bar width=1.5cm,\n')
                f.write('        ymajorgrids, tick align=inside,\n')
                f.write('        major grid style={draw=white},\n')
                f.write('        enlarge y limits={value=.1,upper},\n')
                f.write(f'        ymin=0, ymax={max_value:.2f},\n')
                f.write('        axis x line*=bottom,\n')
                f.write('        axis y line*=right,\n')
                f.write('        y axis line style={opacity=0},\n')
                f.write('        tickwidth=0pt,\n')
                f.write('        enlarge x limits=true,\n')
                f.write('        legend style={\n')
                f.write('            at={(0.5,-0.2)},\n')
                f.write('            anchor=north,\n')
                f.write('            legend columns=-1,\n')
                f.write('            /tikz/every even column/.append style={column sep=0.5cm}\n')
                f.write('        },\n')
                f.write('        ylabel={Time (seconds)},\n')
                f.write('        symbolic x coords={\n')
                for value in values:
                    f.write(f'           {value[0]},\n')
                f.write('       },\n')
                f.write('       xtick=data,\n')
                f.write('       nodes near coords={\n')
                f.write('        \\pgfmathprintnumber[precision=3]{\\pgfplotspointmeta}\n')
                f.write('       }\n')
                f.write('    ]\n')

                # Real time plots
                f.write('    \\addplot+[ybar, fill=blue!50] plot coordinates {\n')
                for value in values:
                    f.write(f'      ({value[0]}, {value[1]["loading"][0]})\n')
                f.write('    };\n')
                f.write('    \\addplot+[ybar, fill=blue!25] plot coordinates {\n')
                for value in values:
                    f.write(f'      ({value[0]}, {value[1]["querying"][0]})\n')
                f.write('    };\n')

                # CPU time plots
                f.write('    \\addplot+[ybar, fill=red!50] plot coordinates {\n')
                for value in values:
                    f.write(f'      ({value[0]}, {value[1]["loading"][1]})\n')
                f.write('    };\n')
                f.write('    \\addplot+[ybar, fill=red!25] plot coordinates {\n')
                for value in values:
                    f.write(f'      ({value[0]}, {value[1]["querying"][1]})\n')
                f.write('    };\n')

                f.write('    \\legend{Real-Time (Loading), Real-Time (Querying), CPU Time (Loading), CPU Time (Querying)}\n')
                f.write('  \\end{axis}\n')
                f.write('\\end{tikzpicture}\n')
                f.write('\\end{document}\n')

正在处理的数据具有以下结构:

{
   (<env_name>, <graph_type>, <mode>): [(<graph_size>, {'loading': (<real_time>, <cpu_time>), 'querying': (<real_time>, <cpu_time>)}),...]
}

有什么方法可以实现这个吗?我只能用一个条形图来堆叠所有时间。

更新:我希望实时数据堆叠(在底部加载,在顶部查询)。这同样适用于 CPU 时间,如该草图所示。

所需地块的草图

答案1

将两个堆叠的条形图并排放置似乎需要一些努力。例如Jake 的解决方案或者汤姆·邦巴迪尔

因此,除非您愿意花费精力和时间进行调试,否则我建议只需从同一数据源绘制两个图表。对于那些感兴趣的人来说,这个概念的改变至少遵循了发明原则的模式:少做一点,多复印一份。

一些评论。

数据文件

我假设数据结构如下:

 \begin{filecontents}{data2.dat}
 time  lrt lct  qrt qct
 10     5   4   3   3
 20     7   5   4   3
 30     4   7   5   2
 \end{filecontents}

这里的数据仅包含在 .tex 文件中,而您只需data3.dat在目录中拥有 etc 并加载该文件,见下文。

我假设前两列应该放在一起,就像最后两列一样。如果错了,只需更改y=下面的分配即可。

\添加图

逐列绘图,例如此处第二列名为lrt。将文件名替换为您的文件名。告诉程序,数据包含标题。

    \addplot table[header=true,x=time,y=lrt]{data2.dat};% i.e. your data file

仅供演示,如果您的标题包含逗号,请将所有内容放在 内{ }。需要两个条形语句。添加有用的标签。图例条目只是假的:使用更好的名称。

   \begin{axis}[
        title={Real-time data, Load},   
        ybar stacked,
        stack plots=y,
        xmin=0, xmax=50,
        xlabel=time (s),
        ylabel=percent,
        legend entries={lrt, lct},% replace by better names
    ]

建议改进

  • 将数据文件名称移到 中\newcommand,替换\addplots 中的 ,以便在一个地方进行更改
  • 更改两个图的配色方案(参见手册)
  • 移动图例,例如在外面(参见手册)
  • 根据需要调整图表的宽度和高度
  • article如果适合你,将它们放入一个类或类似类中;独立版只会创建 2 个图像(参见其手册)
  • 在 ctan 上查找手册,例如通过搜索引擎中的搜索词ctan pgfplots
  • 确保时间间隔不变,以避免数据可视化错误

结果

\documentclass[10pt,border=3mm,tikz]{standalone}
\usepackage{pgfplots}

\begin{document}
 % ~~~ pretending you have said file in your directory
 %     assuming lrt= load real timeetc.
 %     assuming, this is your data structure

 \begin{filecontents}{data2.dat}
 time  lrt lct  qrt qct
 10     5   4   3   3
 20     7   5   4   3
 30     4   7   5   2
 \end{filecontents}

 % ~~~ Concept: Draw two diagrams
 \begin{tikzpicture}    % LOAD
   \begin{axis}[
        title={Real-time data, Load},   
        ybar stacked,
        stack plots=y,
        xmin=0, xmax=50,
        xlabel=time (s),
        ylabel=percent,
        legend entries={lrt, lct},% replace by better names
    ]
    \addplot table[header=true,x=time,y=lrt]{data2.dat};% i.e. your data file
    \addplot table[header=true,x=time,y=lct]{data2.dat};    
   \end{axis}
 \end{tikzpicture}
 
 % ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 \begin{tikzpicture}    % CPU
   \begin{axis}[
        title={Real-time data, CPU},    
        ybar stacked,
        stack plots=y,
        xmin=0, xmax=50,
        xlabel=time (s),
        ylabel=percent,
        legend entries={qrt,qct},
    ]
    \addplot table[header=true,x=time,y=qrt]{data2.dat};
    \addplot table[header=true,x=time,y=qct]{data2.dat};
    
   \end{axis}
 \end{tikzpicture}

\end{document}

答案2

MS-SPO 答案指出我杰克的解决方案用于生成此乳胶代码:

\documentclass[border=10pt]{standalone}
\usepackage{pgfplots}
\pgfplotsset{compat=1.18}
\makeatletter
\newcommand\resetstackedplots{
   \pgfplots@stacked@isfirstplottrue
   \addplot [forget plot,draw=none] coordinates{(10,0) (20,0)};
}
\begin{document}
\begin{tikzpicture}
\begin{axis}[
   ybar stacked,
   title={Performance charts},
   height=0.019\textheight, width=1.5\textwidth,
   bar width=0.8cm,
   ymajorgrids, tick align=inside,
   major grid style={draw=gray!20},
   xtick=data,
   ymin=0,
   axis x line*=bottom,
   axis y line*=left,
   enlarge x limits=0.4,
   legend entries={
       Real Time (Loading),
       Real Time (Querying),
       CPU Time (Loading),
       CPU Time (Querying),
   },
   legend style={
       at={(0.5,-0.2)},
       anchor=north,
       legend columns=-1,
   },
   ylabel={Time (seconds)},
   xlabel={Graph Size},
   symbolic x coords={
           10,
           20,
       },
]
\addplot +[bar shift=-.5cm] coordinates {
    (10, 0.001223850250244141)
    (20, 0.001497483253479004)
};
\addplot +[bar shift=-.5cm] coordinates {
    (10, 0.00045402050018310557)
    (20, 0.001987481117248536)
};
\resetstackedplots
\addplot +[bar shift=.5cm] coordinates {
    (10, 0.0008006999999999999)
    (20, 0.0010588)
};
\addplot +[bar shift=.5cm] coordinates {
    (10, 0.0002661999999999997)
    (20, 0.0012075)
};
\end{axis}
\end{tikzpicture}
\end{document}

代码生成了以下图表:

图表

它是由此动态生成的Python 函数

相关内容