我有一个包含多种 ISO 编码的阿拉伯文件;以 ISO-8859-6 编码的字符和以 ISO-8859-1 编码的一些字符(因为它们在 ISO-8859-6 中没有等效字符)。我想将整个文件转换为utf-8。因此,我尝试做的是将整个文件使用 转换为 ISO-8859-1 iconv -f ISO-8859-1 -t ISO-8859-1 fileip>fileop
,然后使用 .txt 转换为 utf-8 iconv -f ISO-8859-1 -t UTF-8 fileop>finalfile
。然而,结果仍然不是 UTF-8 编码的阿拉伯字符,而只是奇怪的字符。有没有办法统一编码,然后得到UTF-8格式?如果不是,我如何在不使用 sed 的情况下删除 ISO-8859-1,因为它不适用于我的 utf-8 系统。
具有多种 ISO 编码的文件
相关内容
- 将 Windows 10 替换为 Ubuntu 后如何避免看到 GRUB 菜单(Ubuntu 是唯一安装的操作系统)[重复]
- CRON-第 25 至 36 周的第 1 至 5 天执行
- BIG-IP Edge Client 更新失败 - 有什么方法可以知道原因吗?
- Virtualbox Windows XP VM 未获得分配的 IP,而是获得主机 IP [关闭]
- Debian 11 蓝牙 sap 驱动程序初始化失败
- 如何轻松 ssh 到同一网络上的不同主机
- `rpcinfo` 是否列出了 RPC 服务的端口号?
- 为什么即使我在 Fedora 35 上正确设置了 uri 配置,NetworkManger 仍会弹出 nmcheck.org?
- Ubuntu 商店 snap 更新失败 [关闭]
- 如何检查音乐文件是否失真?