在对 solr 查询结果进行分页时,什么可能导致唯一字段重复?

在对 solr 查询结果进行分页时,什么可能导致唯一字段重复?

我正在将 solr 1.3 安装从旧服务器移至新服务器。遗憾的是,客户端无法升级,因为他们无法重新索引。

新安装运行良好,但分页时按特定字段排序的查询会为每一页返回重复记录。对旧服务器运行的相同查询(两者都使用相同的索引数据)不会出现这种情况。

查询是:

http://{solr_host}:8080/surveys_solr_search_prod/select
    ?indent=on&version=2.2
    &q=survey_resource_id%3A1304129+AND+company_id%3A51&fq=
    &start=0
    &rows=200"\
    &fl=*%2Cscore&qt=standard&wt=standard&explainOther=&hl.fl=
    &sort=survey_user_date_added%20asc"

两者都在 tomcat6 上运行。旧服务器运行 IBM jvm 1.5,新服务器运行 openjdk 7。

架构位于这里

观察结果:

  • 如果删除排序,则重复项不会出现在具有不同“开始”值的多个调用中。
  • 如果将排序改为按另一个字段(suid)排序,则不会显示重复项。
  • 问题查询按日期字段排序,问题结果的日期应该放在结果末尾,但它显示在第一页和之后的每一页中。问题日期:2015-05-07T20:49:08.5Z,第一页上的下一个最新日期:2009-01-12T00:09:59.5Z。第二页上的第一个日期:2009-01-12T00:10:07.5Z

有任何想法吗?

相关内容