gmail 撰写时添加了不可见的额外字符

gmail 撰写时添加了不可见的额外字符

我有此代码,可在 Chrome 浏览器窗口中按预期运行。这是 Amazon Web Services 在 Athena 中创建表的语句。

CREATE EXTERNAL TABLE IF NOT EXISTS default.sh_code (
  `shcode` string,
  `mob` bigint,
  `c_id` int,
  `o_series` int,
  `c_at` timestamp,
  `archive` int 
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
  'field.delim' = '\t'
) LOCATION 's3://testme16234/short_unique_codes/'
TBLPROPERTIES ('has_encrypted_data'='false');

如果我将代码复制粘贴到 gmail 撰写窗口中,则很难恢复相同的代码。我可以从 gmail 窗口复制粘贴回 AWS 窗口,但执行时出现错误。当我将代码粘贴到 gmail 撰写窗口中时,文本中是否会添加一些额外的代码?

答案1

如果我保存来自 gmail 撰写窗口的文本,它将被保存为 utf-8,而来自 AWS 选项卡的文本将被保存为 ASCII。我需要将文件从 utf 转换为 ascii,以便在 AWS 中再次使用它。

# file t1.tt
t1.tt: UTF-8 Unicode text

# iconv -f UTF-8 -t ASCII//TRANSLIT//IGNORE t1.tt > t1.tt.txt

# cat t1.tt.txt

相关内容