我对 的使用有疑问TikZ
。我有五组大数据集(15000 个点),我想用它们TikZ
来绘制数据,但显然内存量不够。有人能给我一些建议,告诉我如何解决这个问题吗?我试过使用epslatex
但gnuplot
问题是,我更喜欢使用,TikZ
因为这样我就不用担心字体等了。
答案1
首先,如果你绘制了 15,000 个点,人们不得不思考你到底想要可视化什么。由于点太多,图形的“信号”或“点”可能会被所有“噪音”淹没。
您是否考虑过对数据应用某种统计分析,以便识别和强调趋势?例如,此图(使用ggplot2) 使用六边形分箱来可视化包含 53,940 个观测值的数据集,其方式比散点图有效得多:
我想使用 tikz 来绘制我的数据,但显然内存不够。
如果您必须绘制大型数据集,请不要使用 pdfTeX 或 XeTeX 作为排版引擎。请使用能够动态分配内存的较新的 LuaTeX 引擎。
LuaTeX 可以处理包含 15,000 个元素的散点图,不会出现内存问题,但排版该图需要大约半分钟的时间。如果采用这种方式,请将图形保存在外部.tex
文件中,并包含.pdf
图像以缩短主文档的编译时间。