我的第一个文件有 1099 列
#rnaseq/SNPID hg19Location Gene TCGA-BH-A0C0-01A TCGA-A2-A3XY-01A TCGA-XX-A89A-01A TCGA-B6-A0I2-01A TCGA-LL-A6FP-01A TCGA-EW-
rnaseq - ?|100133144 7.8666 9.6884 22.3240 1.8760 2.0161 7.8383 5.3991 0.0857 4.5513 15.4363 15.0035 4.3578 0.6809 2.5364 12.4086 11.5839
我想要比较的列从第 3 列开始
TCGA-BH-A0C0-01A TCGA-A2-A3XY-01A TCGA-XX-A89A-01A TCGA-B6-A0I2-01A TCGA-LL-A6FP-01A TCGA-EW-
第二个文件有 1119 列
[1]#SNPID hg19Location Gene AlleleA AlleleB dbSNP nSample TCGA-AC-A3TN-01A-11D-A227-01 TCGA-V7-A7HQ-01A-11D-A33D-01 TCGA-BH-A18R-01A-
[2]SNP_A-1780270 chr7:78599583:- MAGI2|ENSG00000187391.13 C G rs987435 2236 1_0.002700 1_0.006000 1_0.000300
我想要比较的列从第 8 列开始
TCGA-AC-A3TN-01A-11D-A227-01 TCGA-V7-A7HQ-01A-11D-A33D-01 TCGA-BH-A18R-01A-
这样我想将第一个文件中的列名称与第二个文件中的列名称相匹配,以便第二个文件仅具有与第一个文件相同的列名称
所以基本上我希望两个文件中具有相同的列名
答案1
您只想对一个文件执行此操作吗?另外,列是否由标准的东西(例如制表符或逗号)分隔?如果这些都是真的,最简单的方法可能是在 LibreOffice Calc 中打开文件,将分隔符设置为任何内容(例如制表符),然后将所需的列从一个文件复制到另一个文件。如果使用 LibreOffice 打开文件时没有要求您设置分隔符,请将文件重命名为.csv
first.