character-encoding

ffmpeg 在 utf-8 字幕上的字符之间打印未知字形
character-encoding

ffmpeg 在 utf-8 字幕上的字符之间打印未知字形

FFmpeg 正在打印两个字符之间的未知字形,但奇怪的是,它并没有替换字体中不存在的字符,而只是打印了一个新的未知字形,我不明白为什么。 x=src.mkv y=src.srt format=mkv out=out mkdir $out speak=ffmpeg finished params="-preset fast -crf 25" ffmpeg -i "$x" -to 00:15:35 $params -vf "subtitles=$y" $out/1.$format ; espeak "$speak" srt 文件采用 utf-8 编码。但我尝...

Admin

如何更改 Excel 字符集?
character-encoding

如何更改 Excel 字符集?

我有一个自动生成的 CSV 文件,其中包含重音字符。使用 Notepad++ 打开文件时,这些字符显示正常。但是,重音字符在 Excel 中显示混乱(例如é出现为é,è作为A, ETC。) 如何更改 Excel 的 (*) 字符集以使其正确显示字符?正确的字符集是什么(可能是 Unicode UTF-8)? 编辑:这是一个自动生成的文件,因此每次手动执行导入过程都会很麻烦如何在Excel中打开CSV文件时设置字符编码?。我更需要在 Excel 中一次性设置一个设置。 (*) 在我的 Win10 办公电脑上,使用 Office 365 中的 Excel。 ...

Admin

ssh 会话中的字符编码错误 – 但并非所有连接都如此
character-encoding

ssh 会话中的字符编码错误 – 但并非所有连接都如此

通过 SSH 连接到我的(Ubuntu)服务器时遇到一个奇怪的问题。 如果我从 Gentoo 盒子连接,一切都很好。所有变音符号等都可以工作,我可以输入“ÄÖÜ”等等。 如果我从 Artix 机器上执行相同操作,则在 shell 中输入变音符号不会产生任何结果,而在 vim 会话中输入它们则会导致乱码输出(例如,“�~D�~V�~”是“ÄÖÜ”的输出)。 两台机器都运行 KDE 并使用 OpenRC,并且都以相同的方式配置了区域设置: /etc/locale.gen包含de_DE.UTF-8 UTF-8,区域设置也设置为此,并且在两台机器上,我得到以下输出(...

Admin

如何在Windows系统中读取Linux文本文件?
character-encoding

如何在Windows系统中读取Linux文本文件?

例如,我运行命令top并将其存储到 Linux 中的文件中,然后在 Windows 中打开该文件,其中包含一些乱码。以下是在 Notepad++ 中查看的文件: Notepad++ 中转换为 UTF-8 的选项不起作用。 我如何在 Windows 中读取该文件?我尝试使用,dos2unix但它不起作用并给出错误: dos2unix:在第 1 行发现二进制符号 0x1B 编辑:尝试该sed 's/\x1b\[[0-9;]*[a-zA-Z]//g' file.txt命令会给出预期的输出,但仅限于终端 ...

Admin

批处理程序是否支持任何 ascii 字符,或者是否有办法使用其他工具创建编码器和解码器程序?
character-encoding

批处理程序是否支持任何 ascii 字符,或者是否有办法使用其他工具创建编码器和解码器程序?

我用 adrianvdh 编写了批量编码器和解码器,并自定义了一些文本字符串输入,但是解码器不起作用,因为我在里面放了特殊符号。 这是编码器的字符串 @echo off setlocal ENABLEEXTENSIONS ENABLEDELAYEDEXPANSION title Encrypt Taro color 4 :mainmenu set savefile=on ::set Encrypt=Nothing (set CHAR[A]=Ἁ) & (set CHAR[B]=Ằ) & (set CHAR[C]=Å) & (set C...

Admin

AWK:“无效的正则表达式:无效的排序字符”——如何使其有效?
character-encoding

AWK:“无效的正则表达式:无效的排序字符”——如何使其有效?

我有一个必须处理数百万条记录的 awk 脚本,但我需要删除任何包含多字节字符的记录。 在我工作的环境中,以下简化的 shell 序列完全满足我的要求: firstval=$'\x1c' lastval=$'\xFF' regex="[^${firstval}-${lastval}]" awk -v REGEX="${regex}" '{if ($0 !~ REGEX){print $0}}' myfile 但是,在我的笔记本电脑上,我得到了致命错误:“无效的正则表达式:无效的排序字符:/[^-�]/” 这感觉像是语言环境问题,并且已验证我的机器和它工作的...

Admin

如何在终端中使用ISO8859-9编码?
character-encoding

如何在终端中使用ISO8859-9编码?

我使用文本编辑器通过编码 ISO8859-9 创建了一个包含“ırmak”的文件。然后,我尝试在终端中使用“cat”命令打印内容。但我做不到。我使用命令 export LC_ALL=tr_TR.ISO8859-9 export LANG=tr_TR.ISO8859-9 cat text.txt 执行完这些命令后终端打印: �rmak 笔记:命令 echo ırmak 终端打印: ırmak ...

Admin

将不正确显示的韩语文件转换为 utf-8 - 字符显示 Çѱ¹Ÿî
character-encoding

将不正确显示的韩语文件转换为 utf-8 - 字符显示 Çѱ¹Ÿî

经过长时间的搜索后,我正要问这个问题,所以决定回答我自己的问题...... 我下载了 zip 存档中的 .smi 文件中的韩语字幕。当我解压它时,韩语字符无法正确显示。以下是示例行: .KRCC { 名称:Çѱ¹Ÿî; 语言:ko-KR; SAMIType:CC; } 所以我想知道如何解压缩这个档案以显示正确的字符编码。 ...

Admin

恢复损坏的 UTF-8 文件
character-encoding

恢复损坏的 UTF-8 文件

我的电脑坏了之后,我设法在重新安装 Windows 之前备份了相关文件。 现在,我正在恢复这些文件并设置系统,我注意到某些文件在备份中已损坏,我想知道您是否知道如何恢复其原始内容。 例如,下图显示了损坏的文件的一部分(在记事本中打开)。我确实(部分)知道内容是什么:第一行是<?php。 您认为有办法恢复这些文件吗? 我有一些编程经验,所以如果我需要编写脚本,我很乐意去做,但我想我需要一张转换图。 ...

Admin

重定向 Python 脚本的 Windows 控制台输出而不引发 UnicodeEncodeError
character-encoding

重定向 Python 脚本的 Windows 控制台输出而不引发 UnicodeEncodeError

我有一个名为的 Python 脚本scratch_1.py,为了回答这个问题,可以将其简化为: s = "∞" print(s) 如果我在 Windows 控制台中运行该脚本,我会得到预期的输出: python scratch_1.py 输出: ∞ 但是,如果我尝试将 Windows 控制台的输出重定向到文件,则会引发错误: python scratch_1.py > temp.txt 输出: Traceback (most recent call last): File "C:\Users\Wok\AppData\Roaming\Jet...

Admin

如何将系统的默认编码设置为 UTF-16?
character-encoding

如何将系统的默认编码设置为 UTF-16?

我的日常活动涉及使用英语、法语、西班牙语,当我保存网页或其他文件的个人副本时,这些语言的全部字符范围都会出现在文件名和文件内容中。 当我出于各种目的(清理虚假字符、统计报告、归档审查)对文件名进行分区扫描(使用 find)时,我收到以下报告: Invalid multibyte data detected. There may be a mismatch between your data and your locale. 以下是实际报告该情况的几行: Fri 18 Nov 2022 06:51:33 PM EST Creating sorted lis...

Admin

我的文本文件中充满了问号。如何才能使其可读?
character-encoding

我的文本文件中充满了问号。如何才能使其可读?

当我打开一个文本文件时Visual Studio 代码,文本中包含很多问号,而我原本希望看到瑞典字母,例如 å、ä、ö: ^点击放大 向右下方(在状态栏中VS 代码),我注意到上面写着UTF-8。 这和我面临的问题有关系吗? 我怎样才能使所有这些字母正确显示? 附注:当我以普通方式打开同一个文件时 Windows 记事本,文本显示正确: 在这种情况下,状态栏显示的不是 UTF-8,而是美国国家标准在右下角。 但在 VS Code 中,即使我点击UTF-8,然后 使用编码重新打开,我找不到任何名为 ANSI 的编码。 如果你想用我使用的确切文件重现这...

Admin

在 Linux Mint 中安装 .iso 映像时文件名编码不正确
character-encoding

在 Linux Mint 中安装 .iso 映像时文件名编码不正确

我正在尝试安装一些 ISO 文件,但遇到文件名编码问题。有问题的 .iso 文件在这里:https://archive.org/download/cpcfan-200510b/200510B.iso 挂载命令和错误的文件名: $ sudo mount 200510B.iso /tmp/cd mount: /tmp/cd: WARNING: device write-protected, mounted read-only. $ ls /tmp/cd/ ''$'\311\361\326\333''6'$'\272\305' entertainment ...

Admin

如何恢复非常古老的电子邮件中的阿拉伯语文本
character-encoding

如何恢复非常古老的电子邮件中的阿拉伯语文本

我有一个旧的雅虎邮箱帐户,里面有自 2006 年以来用阿拉伯语编写的非常古老的电子邮件,但这些电子邮件的编码看起来非常奇怪,如下所示: Óæì Ø *Ý æÚæÏß ßáÇã Ý * ßáÇã. ÇÍÈß ÊÕæÑ ÈÑÛã ÇáÍæÇÌÒ ÈÑÛã ÇáÇãÇä * ÇáæÓÇÚ ÇáÚæÇÌÒ. ÇÑ *Ïß ÊÕæÑ æÇÝÊÍ äæÇÝÐ *Ì * ÇáÝÌÑ ÈÇßÑ ãäæÑ æäÇÌÒ 我相信这些电子邮件可能是用 Windows-1256 编码编写的。我不知道如何以正确的阿拉伯语编码恢复它们。 我尝试粘贴文本Kate并以 cp 1256 编码...

Admin

Windows 版 Git 的 cat.exe 如何处理字符集编码?
character-encoding

Windows 版 Git 的 cat.exe 如何处理字符集编码?

我正在测试 Windows 终端 (cmd.exe) 与字符集编码相关的行为。我有一些采用多种编码(Win1252、CP437、UTF-8 等)的测试文件,其中包含西班牙语文本:“ qué tal” 我在 Windows 10 机器上打开 CMD.exe 终端,使用默认的 CP 437 代码页(我在终端窗口属性中检查了这一点)。事实上,该type命令给出了预期的输出:仅对 CP-437 正确 C:\temp > type testfile-cp437.txt qué tal (OK) C:\temp > type testf...

Admin