编写代码（15分钟）_广州|网站建设|网页设计|网站设计|

0 Comments

编写代码（15分钟）

发布于：2013-01-17 | 作者：广州网站建设 | 已聚集：人围观

搜索引擎的基础在于对全文索引库的管理，在Lucene中，通过IndexWriter来写入索引库。伪代码如下：

1．创建IndexWriter，准备写索引；

2．遍历要索引的路径；

3．优化索引。

下面是主要的实现代码：

public void go() throws Exception {
long start = System.currentTimeMillis();
if (verbose) {
System.out.println("Creating index in: " + indexDir);
//创建索引目录或者建立增量索引
if (incremental) System.out.println("- using incremental mode");
}
Index = new IndexWriter(new File(indexDir), new StandardAnalyzer(),
!incremental);//打开或创建索引库，indexDir是索引存放的路径
File dir = new File(sSourceDir);//待索引的文件存放的路径
indexDir(dir);//索引路径
index.optimize();//索引优化
index.close();//关闭索引库
if(verbose)
System.out.println("index complete in :"+(System. currentTime Millis() - start)/1000);
}

下面这段代码把文件内容加到索引库：

完整的代码可以在本书附带的光盘中找到。

运行以后，一般会生成以下三个索引文件：

_0.cfs

segments.gen

segments_2

其中任何索引库都会包括的一个文件是：segments.gen。可以通过判断一个路径下是否包括这个文件来判断一个路径下是否已经存在Lucene索引。

标签：