我刚刚在 Google Chrome 中打开了磁盘上的本地 HTML 文件。Chrome 检测到了该文件的语言并询问我是否要翻译它。
该文档没有lang
属性。它包含一些匈牙利语文本,Chrome 提供匈牙利语翻译。
这是一个可使 Chrome 提供翻译对话框的小文件:
<!DOCTYPE html>
<html>
<body>
Tudományegyetem
</body>
</html>
我觉得这很奇怪。Chrome 会将我的本地文件发送给 Google 进行语言检测吗?
编辑好的,现在我们有一个真正精简的文件。我删除了“Eötvös Loránd”(一个匈牙利名字),只保留了一个匈牙利单词,意思是“大学“。现在页面上只有一个重音字符,即“á”——统一码 U+00E1(我在本地使用 UTF-8)。这个字符不是匈牙利语独有的;它是用于多种语言。Chrome 仍可检测匈牙利语。
答案1
通常可以通过检查 HTML 属性来确定 HTML 页面语言lang
。您可以在此处找到更多信息:在 HTML 中声明语言
例如,在 Google CHROME 中右键单击页面并选择View Page Source
。在打开的 HTML 页面中查找类似以下内容的内容<html lang="en"
:在我的情况下是英语。如果没有指定语言,则使用默认语言英语。
因此,不需要发送文件到服务器来确定语言。