character-encoding

小写 i 显示为大写 i
character-encoding

小写 i 显示为大写 i

这现在真让我抓狂了。 我访问的一些网站总是将字母 i 显示为大写字母 I。即使它位于单词中间。见示例: 在 Windows 10 计算机上使用 Chrome 和 Edge (IE) 时都会发生这种情况 在 Azure 上托管的虚拟机也会发生同样的情况。 在 Windows 7 电脑和我的 Android 平板电脑上正确显示。 我不记得有其他网站有这样的功能,但这个来自http://www.entrepreneur.com/ ...

Admin

默认 PowerShell 发射的是 UTF-8 而不是 UTF-16?
character-encoding

默认 PowerShell 发射的是 UTF-8 而不是 UTF-16?

默认情况下,Windows 中的 PowerShell 似乎输出 UTF-16(例如,如果我执行简单的echo hello > hi.txt,则hi.txt最终结果为 UTF-16)。我知道我可以通过执行 来强制将其强制为所需的文本编码echo hello | out-file -encoding utf8 hi.txt,但我希望在使用重定向运算符时这只是默认设置。有什么办法可以实现吗? ...

Admin

Linux系统中的字符编码
character-encoding

Linux系统中的字符编码

我有一个网页,它的字符集是 8859-9,它是在 Windows 中使用字符编码 ascii 准备的。从 ftp 访问,我在 ubuntu 中通过 gedit 打开它,然后土耳其字符发生了变化,例如 (土耳其语 ı 变成了 ý)。我该怎么做才能避免这种愚蠢的事情? ...

Admin

文本文件是否存储其编码方法以供以后解码?
character-encoding

文本文件是否存储其编码方法以供以后解码?

我想知道某些文本文件是否将其编码方法与文本内容一起存储以供以后解码? 或者文本查看器的工作是猜测给定文本文件的编码方法,而猜测可能并不总是正确的?如果是,文本查看器如何猜测呢? ...

Admin

Windows 中支持中文,已安装语言包,但某些应用程序仍显示乱码
character-encoding

Windows 中支持中文,已安装语言包,但某些应用程序仍显示乱码

我使用的是 Windows 7 Ultimate,并且安装了繁体中文和简体中文语言包。现在很多软件都可以使用中文文本,我也可以使用中文输入法。 然而有些应用程序似乎仍然无法工作: 有人知道我在这里遗漏了什么吗? (截图中的应用程序只是一个例子,还有很多) ...

Admin

UTF-8 解码器无法解码编码的字符串
character-encoding

UTF-8 解码器无法解码编码的字符串

我有一些我认为是 UTF-8 的编码值。现在我真的不知道它是否是 UTF-8,因为其他在线工具和解码 UTF-8 的步骤不起作用,但可用的开源工具是唯一对我有用的工具。实际的纯文本将使用韩语。 现在的问题是,该工具无法处理超过 100 个单词或更大的字符串,而且即使处理大约 50-60 个单词也需要很长时间。由于该工具是开源的,如果可能的话,我想在本地系统上运行该工具,这样也许我可以更快地工作或不受字符限制。 工具链接:-https://software.hixie.ch/utilities/cgi/unicode-decoder/utf8-decoder ...

Admin

记事本将 txt 文件内容显示为奇怪的符号
character-encoding

记事本将 txt 文件内容显示为奇怪的符号

我正在使用类似这样的方法将整数值从 kotlin (kotlin Int 类型)写入文件 var1BufferedWriter?.write(String.format("%d\n", intvar ) ) var2BufferedWriter?.write(String.format("%08x\n", intvar ) ) var1上面的内容被写入textfile.txt和。两者都保存在安卓手机 SD 卡内存中。当我将它们复制到 Windows PC 并在记事本中打开时,textfile.txt 看起来像这样var2textfile_he...

Admin

VIM 使用了错误的编码 - 但仅限于状态消息
character-encoding

VIM 使用了错误的编码 - 但仅限于状态消息

我在 ArchLinux 设置中遇到了一个奇怪的问题。Vim 使用正确的编码来读取/显示文件,但这些状态消息(显示当前模式或报告缓冲区写入文件的时间)对(匈牙利)消息使用了错误的编码。 我尝试设置 termencoding=utf-8,但问题并未解决。编码已正确设置为 utf-8。MATE 终端也是 UTF-8,我的语言环境也是 UTF-8: LANG=hu_HU.UTF-8 LC_CTYPE="hu_HU.UTF-8" LC_NUMERIC="hu_HU.UTF-8" LC_TIME="hu_HU.UTF-8" LC_COLLATE="hu_HU.UTF-...

Admin

Grep 在 ISO-8859-1 编码文件中搜索文本
character-encoding

Grep 在 ISO-8859-1 编码文件中搜索文本

我正在尝试使用它grep从 ISO-8859-1 编码文件中搜索文本模式:单词列表 当我执行搜索时,所有匹配项都会返回,但重音字符会被删除。例如,如果我想搜索所有以 结尾的单词-ese: $ LC_ALL=pt_PT.ISO-8859-1 grep -a ese\$ wordsList 结果有 58 个匹配项。其中一个匹配项是单词hipótese,但打印出来时显示为hiptese(缺少ó字符)。如何防止grep输出删除重音字符? ...

Admin

如何识别文件编码?
character-encoding

如何识别文件编码?

我正在尝试找出文本文件的编码。我尝试了很多常用方法(使用 Notepad++),但到目前为止都失败了。 一些提示:该文件最初是一个 Eudora mbx 文件,主要包含法语内容。它大约可以追溯到 1998 年,可能来自 MacOS 版本的 Eudora。非 ASCII 编码为单字节: 0x82 是 0x87 是 0xc1 是 ç 0xc8 是 0xcb 是è 0xcd 是 ê 换行符编码为 0x0d 0x0a。 我可以搜索/替换它们全部,但是...... 编辑:回答评论中的问题: file--mime-encoding报告unknown-8bit,...

Admin

ffmpeg 在 utf-8 字幕上的字符之间打印未知字形
character-encoding

ffmpeg 在 utf-8 字幕上的字符之间打印未知字形

FFmpeg 正在打印两个字符之间的未知字形,但奇怪的是,它并没有替换字体中不存在的字符,而只是打印了一个新的未知字形,我不明白为什么。 x=src.mkv y=src.srt format=mkv out=out mkdir $out speak=ffmpeg finished params="-preset fast -crf 25" ffmpeg -i "$x" -to 00:15:35 $params -vf "subtitles=$y" $out/1.$format ; espeak "$speak" srt 文件采用 utf-8 编码。但我尝...

Admin

如何更改 Excel 字符集?
character-encoding

如何更改 Excel 字符集?

我有一个自动生成的 CSV 文件,其中包含重音字符。使用 Notepad++ 打开文件时,这些字符显示正常。但是,重音字符在 Excel 中显示混乱(例如é出现为é,è作为A, ETC。) 如何更改 Excel 的 (*) 字符集以使其正确显示字符?正确的字符集是什么(可能是 Unicode UTF-8)? 编辑:这是一个自动生成的文件,因此每次手动执行导入过程都会很麻烦如何在Excel中打开CSV文件时设置字符编码?。我更需要在 Excel 中一次性设置一个设置。 (*) 在我的 Win10 办公电脑上,使用 Office 365 中的 Excel。 ...

Admin

ssh 会话中的字符编码错误 – 但并非所有连接都如此
character-encoding

ssh 会话中的字符编码错误 – 但并非所有连接都如此

通过 SSH 连接到我的(Ubuntu)服务器时遇到一个奇怪的问题。 如果我从 Gentoo 盒子连接,一切都很好。所有变音符号等都可以工作,我可以输入“ÄÖÜ”等等。 如果我从 Artix 机器上执行相同操作,则在 shell 中输入变音符号不会产生任何结果,而在 vim 会话中输入它们则会导致乱码输出(例如,“�~D�~V�~”是“ÄÖÜ”的输出)。 两台机器都运行 KDE 并使用 OpenRC,并且都以相同的方式配置了区域设置: /etc/locale.gen包含de_DE.UTF-8 UTF-8,区域设置也设置为此,并且在两台机器上,我得到以下输出(...

Admin

如何在Windows系统中读取Linux文本文件?
character-encoding

如何在Windows系统中读取Linux文本文件?

例如,我运行命令top并将其存储到 Linux 中的文件中,然后在 Windows 中打开该文件,其中包含一些乱码。以下是在 Notepad++ 中查看的文件: Notepad++ 中转换为 UTF-8 的选项不起作用。 我如何在 Windows 中读取该文件?我尝试使用,dos2unix但它不起作用并给出错误: dos2unix:在第 1 行发现二进制符号 0x1B 编辑:尝试该sed 's/\x1b\[[0-9;]*[a-zA-Z]//g' file.txt命令会给出预期的输出,但仅限于终端 ...

Admin