西蒙.海耶 是哪里人:有关Lucene一些读者常问的

来源:百度文库 编辑:九乡新闻网 时间:2024/05/03 12:28:25
1. Lucene如何为数据库建索引 问这个问题的读者应该还没有搞懂Lucene到底能干嘛。Lucene本身不能为任何格式的物理文件或数据库建索,它只能为Document类型建索。你要做的就是把物理文件中的各种信息提取出来做成数据源放在一个Document中,然后让Lucene为其建立索引。 数据库也是一样的,首先把数据库的信息提取出来,然后再次建立索引。不过数据库本身也带有FullTextSearch的功能,所以要权衡一下这样做是不是有必要。不过数据库建的索引好像是基于B树的。。。或者是其它的啥,效率应该不如Lucene的高。 2. Lucene如何为WORD或EXCEL或PDF建索引 WORD&EXCEL: POIPDF:PDFBOX OR XPDFBOX 3. 有读者有问题,可以发邮件到qqunlimited@gmail.com交流。如果是一些比较宽范的问题,比如有的读者问我“怎么用Lucene开发一个搜索引擎网站”。。。我也不知道该如何才能回答。。。这种问题就不要问我了。。。我得写上几万字也不一定解答的了。。如果是讨论一些源代码级别的算法问题,举双手欢迎,呵呵。 4. Lucene2已经出了,这和书中Lucene1.4.3的API有很大不同,希望大家研究一下可以自行解决,解决不了可以发邮件,呵呵。新书中把大量API的变化都讲了。。。