将 Solr 索引存储在 NFS 挂载上
将 Solr 索引文件存储在 NFS 挂载上是否存在任何性能考虑/缺点? ...
我的 Ubuntu 运行的是 LAMP(Linux、Apache、MySQL 和 PHP)服务器。为了提供更好的搜索功能,我的一个朋友建议安装“Apache Lucene”。 在阅读相关内容时,我了解到“Apache Lucene”需要 tomcat 和 java 才能运行。请告诉我是否可行,或者是否有其他更好的 LAMP 堆栈替代方案。 我正在寻找一些经过验证的解决方案。 ...
我曾尝试在 Ubuntu 14.04 上使用 apt 安装 elasticsearch 包,但是当我运行时sudo service elasticsearch status,我得到以下输出: * elasticsearch is not running 我尝试运行sudo service elasticsearch start,并且它声称可以正常启动。 但是/var/log/elasticsearch中没有记录任何日志。 我尝试运行sudo /usr/share/elasticsearch/bin/elasticsearch,并得到以下输出: ...
我对性能有疑虑,希望得到最适合的建议Multi Core?Multi Instance(with different port) 我的情况如下: 目前我正在运行具有多个核心的 Solr,并且它运行正常。只有一个问题,有时它会抛出“处理方面字段时堆内存不足”,之后我必须重新启动 solr。(为了最大限度地减少重新启动次数,我使用高内存启动 Solr:java -Xms1000M -Xmx8000M -jar start.jar) 我有一个亚马逊 EC2 实例,它有 8core-2.8GHtz/15GB Ram 和优化的硬盘。 我有许多数据库表(大约 1...
据我了解,索引(或数据)存储在 /var/lib/elasticsearch 默认情况下,此文件夹包含nodes和文件夹0,1这些文件夹的总大小为376M。 日志存储在 /var/log/elasticsearch -rw-r--r-- 1 elasticsearch elasticsearch 1.4G Dec 17 23:59 elasticsearch.log.2014-12-17 -rw-r--r-- 1 elasticsearch elasticsearch 1.5G Dec 18 19:35 elasticsearch.log.201...
我有一个CentOS 6.5我安装的服务器Elasticsearch 1.3.2。 我的elasticsearch.yml配置文件是对 elasticsearch 默认配置文件的最小修改。删除所有注释行后,它看起来像这样: cluster.name: xxx-kibana node: name: "xxx" master: true data: true index.number_of_shards: 5 index.number_of_replicas: 1 path: logs: /log/elasticsea...
我已经将 ownCloud 升级到 6 (刚刚释放) 在 CentOS 6.4 上 (x86_64) 服务器通过yum update(没有其他变化),升级失败,owncloud.log文件中出现以下信息:http://codepad.org/wRRGNk22 有谁能解决这个问题吗? 我试过了: 删除表 截断表格 ...
我想创建一个 ebs 卷(Amazon EC2 云计算)来存储我的 lucene 索引。 最佳文件系统是什么(使用命令 mkfs -t 时?)?我知道 xfs 通常用于 mysql,但 lucene 索引也是如此吗? 谢谢。 ...
我们在 Windows 2008 Server 上使用 Omnifind 进行站点搜索,当一个网站迁移到另一台服务器(同一个域名,另一个 IP(DNS 更新已超过 24 小时前,Omnifind 服务器知道新 IP))后,Omnifind 继续搜索旧 IP,这意味着它已将名称解析缓存在某处。 但是哪里? Omnifind 使用 Apache Lucene 技术,所以也许有人对此有所了解,可以作为提示? 重新启动服务或服务器不会改变该行为。 ...
searchterm:foo 应该匹配foo并且foobar searchterm:"foo" 应仅匹配foo 到目前为止,我尝试了 LuceneSearch 和 SphinxSearch,但我无法让它们中的任何一个像 google 那样运行。foo只会匹配foo,并且foo*会匹配foo和foobar。 ...
有实施/运行 Lucene.NET 解决方案经验的人能否推荐一下实时环境的粗略系统规格。它是处理器、内存还是磁盘密集型的?它是否只使用单个处理器,因此拥有一个带有多处理器/核心的盒子不会带来太多好处,等等? 这是针对未开发项目,因此没有相关的现有系统作为使用依据。预计我们要索引的数据将包含 200K 个文档(客户),并包含姓名、联系方式和几个地址等标准内容 - 因此每条记录不会太大。 有帮助的是,我们需要在真正有机会创建任何测试解决方案之前开始我们的硬件建议 - 并且当前存在的硬件会使任何测试难以比较/得出结论。 ...
我的网站的页面数量已超出 Google 自定义搜索的页面数量限制,因此很多结果在我们的网站搜索中都找不到。 我一直在阅读有关 Lucene、Nutch、Solr 等的文章,我想知道我是否需要在一台服务器上运行这些程序,该服务器还运行网站(在 nginx 上)和我们的 mysql 服务器。我们有 2 GB 的 RAM。 我将非常感激任何有关迁移到新站点搜索的建议。 ...