如何在没有 LaTeX 源的情况下将 LaTeX 生成的 PDF 论文上传到 arXiv

如何在没有 LaTeX 源的情况下将 LaTeX 生成的 PDF 论文上传到 arXiv

arXiv 非常智能,可以检测你的 PDF 是否由 LaTeX 生成。如果是,arXiv 会要求提供 PDF 的来源,而不是 PDF 文件本身。这真的很烦人,也很不方便。

我询问一种欺骗 arXiv 的方法,避免 PDF 被检测为由 LaTeX 生成(即使它们确实是由 LaTeX 生成的)。

我尝试过这个:http://www.hrstc.org/node/62:“从 word 创建一个 pdf,然后简单地插入文章中的页面,并删除 word 的页面”。

但它没有起作用。

答案1

更新2018-11-26:根据 Andrew MacFie 的评论,这种方法不再有效:arXiv 专门为此设置了检查。我不知道他们是否解决了根本问题。我不知道这种解决方案的变体是否有效。


强烈建议将源代码上传到 arXiv 以供存档。一旦文档本身公开,我想不出不公开源代码的理由。话虽如此,如果 arXiv 自己的编译器没有您使用的软件包的最新版本,那么可以有理由避免使用它,例如,上传整体在您的文档中使用 TikZ/PGF 似乎有点多余。(NB:对于 TikZ/PGF 来说,这个external库在这里有很大帮助。)

在您的提交中附上文章的 PDF 副本(文件名略作修改),并在文档顶部放置以下内容(经过适当编辑):

\documentclass[a4paper]{article}
\pdfoutput=1
\usepackage{hyperref}
\hypersetup{
  pdfinfo={
    Title={Your Title Here},
    Author={Your Name Here},
    Subject={If you want to put something here, do so},
    Keywords={Add some keywords if you feel so inclined}
  }
}
\usepackage{pdfpages}

\begin{document}
\includepdf[pages=1-last]{the_real_article.pdf}
\end{document}

<rest of source code goes here>

我认为,为了遵守精神arXiv,因为你正在使东西普遍可用,那么如果你正在这样做,那么你应该付出额外的努力并包含一些类似于与其版本一起使用的软件包列表,以便下载源代码的人知道他们需要什么才能编译它。

我可以证明这一做法在过去是有效的。

答案2

解决方案很简单。使用一些 PDF 查看器/编辑器打开 PDF。例如使用 Foxit Reader。然后使用虚拟打印机(例如 Foxit PDF 打印机)打印文件。PDF 的打印版本将基于图像。但是,为了提高质量,您可以选择更高的分辨率,例如 300 dpi。打印的 PDF 文件可以轻松上传到 arXiv.org。

答案3

由于其他几种方法均不起作用(例如,通过 hyperref 或 PDF 编辑器重置 PDF 制作器元数据,或者尝试通过 Web 浏览器或 Google Drive 进行打印为 PDF 破解),这里有一个简单的方法,对我在 2019 年 11 月有用。虽然它特定于命令行用户,但这也意味着它可以作为文档构建过程的一部分方便地自动化。

只需使用 将您的 PDF 处理为 Postscript pdf2ps,然后再使用 处理回来ps2pdf

pdf2ps mydoc.pdf
ps2pdf mydoc.ps

就是这样。

这似乎重置得足够多,以至于 arXiv 无法检测到文档的 TeX 来源,但我没有看到对输出有任何重大损害。特别是我想以这种形式上传一份特殊文档——不是论文,但对 arXiv 社区感兴趣——其中我使用自定义字体和 XeLaTeX,这些字体在 PDF/PS/PDF 往返中得到保留。

下面是一个示例 Makefile,用于自动执行此操作以及其余的构建操作(用于简单的 2 次传递、独立的 XeLaTeX 编译):

.PHONY = all clean
BASENAME = mydoc

all: $(BASENAME).pdf $(BASENAME)-arxiv.pdf

clean:
    rm -f $(BASENAME).pdf $(BASENAME).aux $(BASENAME).log $(BASENAME).out $(BASENAME)-arxiv.*

$(BASENAME).pdf: $(BASENAME).tex
    xelatex $< && xelatex $<

$(BASENAME)-arxiv.pdf: $(BASENAME).pdf
    cp $< $@ && pdf2ps $@ && ps2pdf $(@:.pdf=.ps) && rm *.ps

不用说——我希望——这是为了在特殊情况下使用,真的想要/需要 arXiv 的 AutoTeX 处理不支持的功能。

如果可以提供未经编译的源代码就好了,但我尝试将.tex文件包含在anc辅助材料子目录中,这导致了处理错误,因为目前“请注意,辅助文件目前不支持 PDF 提交。”https://arxiv.org/help/ancillary_files。当您阅读本文时,此问题可能已得到修复。

答案4

2021 年 11 月:arXiv 在以下情况下接受了我使用 xelatex 生成的 PDF:

exiftool -all:all= -overwrite_original FILE.pdf

从:https://stackoverflow.com/questions/60738960/remove-pdf-metadata-removing-complete-pdf-metadata

相关内容