我有一个 HTML 文件,但通过 Index Server 处理时遇到了问题。以下是相关文本。
(B) $10,800 per linear mile for
(C) $40,000 per linear mile for any
我的问题与美元金额有关。
- 如果我搜索 800,它会找到文档
- 如果我搜索 $10,它会找到以下文档
- 如果我搜索 $40,它会找到以下文件
- 如果我搜索 $10,800、10,800、$40,000 或 40,000,无论我是否用双引号将文本括起来,它都找不到该文档。
我以为可能是逗号的问题,但我可以在索引服务器存储库中找到包含 40,000 个文档的其他文档,并且它会找到它。我删除了目录并重新索引了整个数据结构,但无济于事。
有任何想法吗?
答案1
我终于明白了(大约两天后):
有问题的文本前面有一系列不间断空格 (& nbsp;)。我将最后一个空格替换为物理空格并重新索引 - 我猜索引服务不够智能,无法忽略这些空格或将它们视为空格!