在线和本地在 UTF-8 和 1255 之间进行转换?

在线和本地在 UTF-8 和 1255 之间进行转换?

我有这个 HTML 文件

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML DIR="RTL" LANG="HE">
<HEAD>
<META http-equiv="Content-Type" content="text/html; charset=Windows-1255">
</HEAD>
<BODY>
  <H1>úåøä</H1>
<H1>úåøä ðáéàéí åëúåáéí</H1>
</BODY>
</HTML>

它在记事本中以 ANSI 格式保存。在浏览器中打开时,它可以正常显示一些希伯来字符。

请注意,Chrome 也可以处理 UTF-8,并且也可以将其复制到 Ms Word 2010 中。

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<HTML DIR="RTL" LANG="HE">
<HEAD>
<meta http-equiv="content-type" content="text/html;charset=UTF-8">
</HEAD>
<BODY>
<H1>תורה נביאים וכתובים</H1>
</BODY>
</HTML>

但以下讨论涉及从 Windows-1255 复制/粘贴。

在 Chrome 中复制到剪贴板
在此处输入图片描述

粘贴到 ms word 2010
保留源格式图片

我可以使用我的网络浏览器将 Windows-1255 转换为 unicode(例如 UTF-8)。

例如,使用 HTML。Chrome 会转换

úåøä ---> תורה
úåøä ðáéàéí åëúåáéí --> תורה נביאים וכתובים

但是我怎样才能转换成另一种方式呢?

例如,假设我有一个用记事本编写的文件

它有

תורה  
תורה נביאים וכתובים

我可能会将其保存为 UTF-8,或者根本不保存。我可以将其保留为无标题文件。

我如何将其转换为

úåøä   
úåøä ðáéàéí åëúåáéí  

如果我找到一个写有希伯来语的网页,然后在 chrome 中查看源代码,我会看到希伯来语,然后我保存它,它就会出现在 Windows-1255 中。就像 http://www.mechon-mamre.org/i/t/t0.htm 这是因为文件本身存储在 Windows-1255 中,如果保存它并在记事本中打开它,就会看到它。

如果我将希伯来字符复制到文件中并将其保存为 utf-8,它会显示在 Chrome 中,但我不知道如何将其转换为 windows-1255。

我甚至不知道如何让记事本将希伯来字符保存为 windows-1255

答案1

对于在线我不知道。我只知道拉丁语->希伯来语,通过制作 HTML 页面!

在本地,人们可以很容易地使用好的文本编辑器进行这两种方式。

对于本地,转储记事本以完成此任务,因为虽然它支持 UTF-8 和 unicode 字符(包括希伯来语字符),但它不会在 Windows-1255(希伯来语)中编码,因此当您尝试将 unicode 保存为“ascii”时,它不会使用 Windows 1255(希伯来语)。只是 1252 或 iso 8859-1,它无法正确执行,因为 1252 中不存在希伯来语字符。

您看到的奇怪的拉丁字符是 1255(希伯来语),但误读为 1252 - 您可以这样做,但您无法将希伯来语保存为 1252,因为记事本不知道或不计算要使用哪些拉丁字符。它只是说您会丢失一些字符,如果您尝试保存它们,它不会保存,当您在它没有正确保存后读取它们时,您会得到问号或方块。所以别再用记事本保存希伯来语字符了

使用支持 Windows-1255(希伯来语 ascii)的文本编辑器。它在 editpad pro(非免费)中有效。但 notepad++ 或 babelpad 可能也能轻松完成此操作(尽管目前这些程序都不能很好地将它们粘贴到 ms word 中。epp 您复制希伯来语时会粘贴拉丁字符,notepad++ 和 babelpad 您粘贴到 word 中时不会出现“保留源格式”选项),但您可以将希伯来语放入 html 页面(如问题中的 utf-8 页面),然后将其从 chrome 复制到 ms word 中。

打开 editpad pro,单击转换..文本编码.. windows 1255

将记事本中的希伯来字符复制/粘贴到 editpad pro 中。

保存文件。

而且你可以双向进行。

úåøä ----转换为 Windows 1255(也应以 1255 形式打开)获取希伯来语。然后转换回 1252(也应以 1252 形式打开)(西欧)

答案2

您可以使用图标iconv -f utf8 -t windows-1255

相关内容