我正在建立一个数据集具有长字符串和标签的排序,其中一些将用于调查研究(实际上是 q 排序)。
该数据集需要:
- 具有合理的可读性
- 使用源代码控制 (git)
- 容纳长字符串(句子或提示)
- 允许良好的排版(最好通过 LaTeX)
- 机器可读,以便稍后输入到基于网络的问卷中
- 容易分类
- 与 R 配合使用以便进行后续分析
我还需要将其中一些字段(实际上是长字符串)整齐地打印在小卡片上,自然而然,LaTeX 将是我为此目的选择的排版软件。
.csv
– 可以轻松导入到 LaTeX – 但似乎是不可能的,因为字符串太长,因此 git 差异很丑陋。
所以我最近(通过 Jekyll)遇到了YAML
,它可能正好能起到作用。
导入的一个好方法是什么选择可以将一个或多个.yml
字段添加到 LaTeX 表中吗?我想到:
- Pandoc 通过其 LaTeX 模板
- 这方便的 haskell 工具
- (理想情况下)CTAN 上有一些现有的包?(似乎列表没有帮助)
我可能也完全过度思考整个问题并感谢任何建议。
也许只需将其制作成 LaTeX 表并稍后再考虑其余部分?
(胚胎)数据集如下所示:
---
ID: 1
Tags:
- saving
- normative
English:
A good tax should encourage people to save for the future.
---
ID: 2
Tags:
- tax
English:
People should be taxed on what they spend.
...