我们的内联网上有一个页面,它只是plain/text
编码的UTF-8
,并且包含插入数据库的脚本。问题是,当我将此页面下载到带有wget
或 的文件中时curl
,我下载的文件具有 UTF-8 编码,但特殊字符(捷克语字符)损坏。
那么问题可能出在哪里呢?我可以将其转换为 CP-1250 编码,这样可以正常工作(我也尝试了 ISO8859-2,但也不起作用),但我不能通过 SQL*Plus 使用它进行数据库插入,因为我们的数据库是用 UTF-8 编码的。
非常感谢你的回答
答案1
HTTP 协议以 US_ASCII 进行通信。
因此,纯文本内容不能是 UTF-8:它必须如果包含非 ASCII UTF-8 字符,则进行编码。