在 help.ubuntu.com 上删除不需要的单个语言文件

在 help.ubuntu.com 上删除不需要的单个语言文件

Ubuntu 桌面帮助文档和 Ubuntu 服务器指南发布在帮助中心网站上有大约 60 种语言的版本(尽管许多翻译非常不完整)。文档编译工作流程有些浪费,因为它会为每个文件制作特定的语言版本,即使它们对于所有语言都是相同的。例如:

doug@s15:~/docs-trunk/z/html/ubuntu-docs$ ls -l *yelp-note-warning*
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.am
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.ar
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.ast
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.az
...
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.ur
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.uz
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.zh-CN
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.zh-HK
-rw-r--r-- 1 doug doug 1088 Mar 13 23:55 yelp-note-warning.png.zh-TW

对于这样的文件,只需有一个名为的文件就足够了yelp-note-warning.png

为了完整起见,我们无法仅创建一个文件的示例:

doug@s15:~/docs-trunk/z/html/ubuntu-docs$ ls -l figures/unity-workspace-intro*
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.am
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.ar
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.ast
...
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.da
-rw-r--r-- 1 doug doug 64335 Mar 13 23:55 figures/unity-workspace-intro.png.de
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.el
...
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.id
-rw-r--r-- 1 doug doug 47152 Mar 13 23:55 figures/unity-workspace-intro.png.it
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.ja
...
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.zh-HK
-rw-r--r-- 1 doug doug 48077 Mar 13 23:55 figures/unity-workspace-intro.png.zh-TW

我的问题是:我们如何识别所有文件是否相同,如果是,如何用一个没有特定语言后缀的文件替换它们?

伪代码:

For all files, including sub-folders{
   If all language specific versions of the file are identical{
      Replace the language specific versions with one non-language specific version.
   }
}

目前,我们只关注桌面帮助文档,但如果解决了某些问题,我们也会为服务器指南做同样的事情。

如果可能(并且是首选),可以在 Makefile 中完成此操作。或者作为独立脚本(我认为可以从 Makefile 中调用)。我担心编写 c 程序,因为并非所有 Ubuntu 文档团队成员都是 c 程序员,这会导致以后出现潜在的维护问题。
可以设想(但不是要求)将新代码(如上面的伪代码)添加到 Makefile 安装部分的最后:

# Installs all HTML files to a single multilingual directory for subsequent copying to
# the web server document structure (e.g. to run with Apache and MultiViews enabled)
install:
        rm -Rf "$(INSTALLDIR)"/*; \
        mkdir -p "$(INSTALLDIR)"; \
        cp -R "$(HTMLDESTDIR)/"* "$(INSTALLDIR)"; \
        for lc in C $(help_linguas); do \
                lang=`echo $$lc | $(SED) -e 's/[@_]/-/'`; \
                if test "$$lang" = "C"; then lang=en; fi; \
                if test "$$lang" = "gl"; then lang=gl-GL; fi; \
                if test "$$lang" = "ms"; then lang=ms-MS; fi; \
                if test "$$lang" = "pl"; then lang=pl-PL; fi; \
                cp -af "$(INSTALLDIR)/$$lang"/*.css "$(INSTALLDIR)"; \
                rm -Rf "$(INSTALLDIR)/$$lang"/*.css ; \
                find "$(INSTALLDIR)/$$lang" -type f -exec mv {} {}.$$lang \; ; \
                cp -af "$(INSTALLDIR)/$$lang"/* "$(INSTALLDIR)"; \
                rm -Rf "$(INSTALLDIR)/$$lang" ; \
        done
        ... new code, per this question, goes here ...

编辑:Gunnar 的解决方案很棒,但仍然有其他文件是多余的。例如所有 .js 文件,以及主目录中的一些 .png 文件。

编辑:Gunnar 修改后的解决方案解决了所有问题,仅 17.04 桌面文档网页就减少了 3326 个文件。

参考:
html 编译 Makefile(见install末尾部分。)
整个项目代码
构建过程
网站 .htaccess 文件。Gunnar 的回答依赖于语言回退。

答案1

我尝试修复它:

http://bazaar.launchpad.net/~ubuntu-core-doc/ubuntu-docs/trunk/revision/607?compare_revid=605

它保留 .en 扩展名,并依赖 .htaccess 文件作为后备。
第一次尝试总是得到没有语言扩展名的 .png 文件版本,无论实际请求的语言是什么,第二次尝试将 .png.en 作为通用文件扩展名,并依赖网站 .htaccess 文件 LanguagePriority fallabck 指令在没有特定于所需语言的文件的情况下提供该文件。
示例:

-rw-rw-r-- 1 doug doug  64335 Mar 14 19:50 unity-workspace-intro.png.de
-rw-r--r-- 1 doug doug  48077 Mar 14 19:50 unity-workspace-intro.png.en
-rw-rw-r-- 1 doug doug  47152 Mar 14 19:50 unity-workspace-intro.png.it

德语将获得 .png.de 文件,意大利语将获得 .png.it 文件,任何其他语言请求将获得 .png.en 文件。

相关内容