检测所有属于不同语言的单词

检测所有属于不同语言的单词

我有一篇很长的西班牙语技术文章。文章中有很多英文单词,因为这些术语通常不会被翻译。我想把它们都变成草书,因为这是西班牙语语法的要求。

因此,第一步是找到它们。有没有办法找到文本中属于英语词典的所有单词?此外,有些单词在两种语言中都是通用的,并且经常出现在文本中(例如“a”),因此该方法需要一种忽略某些单词出现的方法。

不幸的是,并不是所有的西班牙语单词都被标记为错误,要么是因为这个单词在西班牙语中是被接受的,要么是因为我把它添加到了本地词典中,这样它就不会被视为拼写错误,所以我无法通过“拼写检查”找到所有的单词。

答案1

是的,这是你可以做的。很大程度上取决于文档的结构和元数据,因此你可能会得到非凡或平庸的结果。

事实上,我并不经常使用这个功能,所以我可能不知道提高性能的方法。

  1. 打开高级查找窗口(位于主页选项卡上功能区右侧)

  2. 单击格式按钮(左下角)

  3. 点击语言

    • 选择您选择的语言
    • 点击确定

  4. 在高级查找窗口中,选中“使用通配符”框

    • 使用单个星号作为搜索词 (shift 8 = *)
    • 试一试——你可能会立即获得成功,但如果没有成功也不要放弃

  5. 单击功能区审阅选项卡中的语言

    • 点击语言偏好
    • 确认您所需的语言已安装。
    • 点击确定

  6. 再次单击功能区中的语言

    • 点击设置校对语言
    • 如果活动则选择相反项
    • 确保已启用“自动检测语言”
    • 点击确定

  7. 返回高级查找窗口

    • 确保您的选项已恢复
    • 尝试再次查找

“此外,有些词在两种语言中都很常见,并且经常出现在文本中(例如“a”),因此该方法需要一种忽略某些词出现的方式。”

这将是一个问题。尤其是那些有着悠久混合历史的语言。你可以采用一些策略来解决这个问题——其中一种是破坏性的,所以确保您使用的是副本而不是原件!

祝你好运!

相关内容