分类: 开源搜索引擎

全文搜索服务器 Solr—csv格式索引数据导入篇

在上文全文搜索服务器 Solr—xml格式索引数据导入篇中我们提到使用xml文件的方式导入索引,速度会有所提升,达到1w个/s。但是同时也提到了xml文档的缺陷,文件格式的要求比较高。 本文中,推荐使用csv的方式来建立索 …

全文搜索服务器 Solr—xml格式索引数据导入篇

xml 是最常用的数据索引格式,不仅可以索引数据,还可以对文档与字段进行增强,从而改变它们的重要程度。 下面就是具体的实现方式: schema.xml的字段配置部分如下: <field name=”id” type=”string” stored=”tru …

全文搜索服务器 Solr—连接mysql建索引性能测试篇

全量索引: 序号 数据数目 时间 处理速度 索引文件 日志文件 1 318113 39s 8157/s 49M 74M 2 638673 82s 7789/s 111M 147M 3 959627 123s 7802/s 169M 221M 4 1278618 165s 7749/s 228M 294M 5 1600811 206s 7771/s …

全文搜索服务器 Solr—连接mysql建增量索引篇

全文索引服务器 Solr—连接mysql建全量索引篇一文中已经详细的介绍了solr怎么通过连接mysql的表,建索引。 本文主要是介绍solr怎么通过连接mysql的表,建增量的索引。 1. 修改conf目录下的data-config.xml文件,内容 …

全文搜索服务器 Solr—连接mysql建全量索引篇

1.要求 将数据库中的数据直接创建到Solr索引中去。先做全部索引。 2.环境 Solr4.7.1版本,Tomcat7.0.53版本,mysql5,已经配置好Tomcat与Solr的集成,包括中文分词等。 3.实现步骤 3.1 编辑solrconfig.xml文件,在合 …

全文搜索服务器 Solr—中文分词篇

前提是已经在Tomcat 7.0.53下面配置好solr 4.7.1,详情参考:全文搜索服务器 Solr—安装篇 注意:Solr4.7.1需要IKanalyzer 2012 FF以上版本。我下载的是IK Analyer 2012-FF hotfix 1 1.下载IKAnalyzer包 下载地址:ht …

全文搜索服务器 Solr—安装篇

一、环境准备: 系统环境: Ubuntu10.10 Tomcat 7.0.53 jdk-7u51 solr-4.7.1 首先将软件包上传到/tmp目录下 1、  jdk安装 [root@svn-server/]#cd /tmp/ [root@svn-server/]#tar zxvf jdk-7u51-linux-i586.tar.gz [ro …

全文搜索服务器 Solr—简介

Apache Solr (读音: SOLer) 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成, …