如何检测文本的字符编码

如何检测文本的字符编码

我有一个 mySQL 数据库,其中包含 HTML 页面无法正确显示的重音字符。

问题是我不信任数据库报告的表的编码,因为整个内容是从另一台出现故障的服务器迁移的。

我尝试将字符转换为多种编码,但我的问题是识别源字符编码。

我从数据库中复制了一段文本。

这是应该显示的短语

Fóton é uma ferramenta 多种摄像机、多种类型的 CAEmitterLayer 和粒子发射器...

这就是它的显示方式

F×ton à uma ferramenta multi-camadas, multi-nñvel para criar emissores do tipo CAEmitterLayer e partículas...

正如我所看到的,这种情况正在发生:

  • ó 显示为 ×
  • ú 显示为 æ
  • â 显示为 ĸ
  • é 显示为 à
  • á 显示为 á

是否可以通过查看文本来识别编码?

答案1

为了简单的文本,您可以使用以下工具:

  • enca,
  • file

他们猜测并可以验证文本的编码。

对于 MySQL,您可以仅使用简单的 SQL 请求,如下所示:[1],[2]。

相关内容