使用 wget 下载的文件编码错误

使用 wget 下载的文件编码错误

我们的内联网上有一个页面,它只是plain/text编码的UTF-8,并且包含插入数据库的脚本。问题是,当我将此页面下载到带有wget或 的文件中时curl,我下载的文件具有 UTF-8 编码,但特殊字符(捷克语字符)损坏。

那么问题可能出在哪里呢?我可以将其转换为 CP-1250 编码,这样可以正常工作(我也尝试了 ISO8859-2,但也不起作用),但我不能通过 SQL*Plus 使用它进行数据库插入,因为我们的数据库是用 UTF-8 编码的。

非常感谢你的回答

答案1

HTTP 协议以 US_ASCII 进行通信。

因此,纯文本内容不能是 UTF-8:它必须如果包含非 ASCII UTF-8 字符,则进行编码。

相关内容