apache-solr

solr 查询使用默认架构将匹配的文本返回到正则表达式
apache-solr

solr 查询使用默认架构将匹配的文本返回到正则表达式

我想在一组 Microsoft Word 文档、PDF 和 jpg、gif 等图像文件中搜索 Solr 中的服务器名称。服务器名称由正则表达式 (regex) 给出 INFP[a-zA-z0-9]{3,9} TRKP[a-zA-z0-9]{3,9} PLCP[a-zA-z0-9]{3,9} SQRP[a-zA-z0-9]{3,9} .... 问题 我想获取文档中与正则表达式匹配的文本。例如 INFPWSV01、PLCPLDB01 我已使用默认模式通过 Solr/Tikka/Tesseract 对文件进行索引。 我用过高亮搜索工具 hl 勾选了 hl.use...

Admin

Solr 中的 Apache Nutch 索引错误
apache-solr

Solr 中的 Apache Nutch 索引错误

Indexing 1000/1000 documents Deleting 0 documents Indexing 1000/1000 documents Deleting 0 documents Indexing job did not succeed, job status:FAILED, reason: NA Indexer: java.lang.RuntimeException: Indexing job did not succeed, job status:FAILED, reason: NA at org.apache.nutch.i...

Admin

在 docker 容器上运行的 Solr 使用 localhost,但不使用容器 IP
apache-solr

在 docker 容器上运行的 Solr 使用 localhost,但不使用容器 IP

我已经使用过官方CentOS 7 映像来自 Docker Hub 并创建了一个运行Solr 8.4.1版本。我能够启动并运行 Solr,没有任何问题。我担心的是,Solr 管理 UI 加载时本地主机网址(http://本地主机:7574/solr/)但不具有为容器分配的 IP(http://172.18.0.6:7574/solr/)。 /etc/hosts容器中的文件如下所示。 [solr@solrtwo solr-8.4.1]$ cat /etc/hosts 127.0.0.1 localhost ::1 localhost ip6-localh...

Admin

Solr 查询与另一个术语紧密相关且经常使用的术语
apache-solr

Solr 查询与另一个术语紧密相关且经常使用的术语

我们正在尝试寻找在给定术语附近最常出现的术语(实际上是单词)。 当使用像这样的分面时: 看起来我们正在获得在旁边?q=myfield:tree&facet=on&facet.query=tree&facet.field=myfield出现的最常见单词的计数。myfieldtree 问题: 不过,我们想子-facette 查询,包括距离对于每个术语(或平均距离)。 -fieldmyfield被存储、标记化,termvectors 被存储并且偏移量和位置与 termvector 一起存储。 ...

Admin