`

lucene入门代码五(在搜索结果中使用高亮)

阅读更多
1.本代码需要的jar包有:
lucene-core-3.0.0.jar
lucene-analyzers-3.0.0.jar
lucene-highlighter-3.0.0.jar

代码如下:
package com.yale.lucene;


import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.SimpleAnalyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.SimpleSpanFragmenter;
import org.apache.lucene.search.highlight.TokenSources;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;
/**
 * 
 * 为了简单起见,创建内存目录,存放索引,然后在contents高亮搜索关键字
 *
 */
public class HighlightAtSearchResult
{
	private static final String text =
			"In this section we'll show you how to make the simplest " +
			"programmatic query, searching for a single term, and then " +
			"we'll see how to use QueryParser to accept textual queries. " +
			"In the sections that follow, we’ll take this simple example " +
			"further by detailing all the query types built into Lucene. " +
			"We begin with the simplest search of all: searching for all " +
			"documents that contain a single term.";
	public static void main(String[] args) throws Exception
	{
		//创建索引
		RAMDirectory dir = new RAMDirectory();
		IndexWriter writer = new IndexWriter(dir,new StandardAnalyzer(
				Version.LUCENE_30), IndexWriter.MaxFieldLength.UNLIMITED);
		Document doc = new Document();
		doc.add(new Field("title","highlight matches in search results",Field.Store.NO,Field.Index.NOT_ANALYZED_NO_NORMS));
		doc.add(new Field("contents",text,Field.Store.YES,Field.Index.ANALYZED));
		writer.addDocument(doc);
		IndexReader reader = writer.getReader();
		//查询索引
		IndexSearcher searcher = new IndexSearcher(reader);
		TermQuery query = new TermQuery(new Term("contents", "term"));
		TopDocs hits = searcher.search(query,10);
		QueryScorer scorer = new QueryScorer(query, "contents");
		Highlighter highlighter = new Highlighter(scorer);
		highlighter.setTextFragmenter(new SimpleSpanFragmenter(scorer));
		Analyzer analyzer = new SimpleAnalyzer();
		for(ScoreDoc sd :hits.scoreDocs){
			Document docs = searcher.doc(sd.doc);
			String contents = docs.get("contents");
			TokenStream tokens = TokenSources.getAnyTokenStream(searcher.getIndexReader(),sd.doc,"contents",analyzer);
			String fragment =
					highlighter.getBestFragments(tokens, contents,3,"...");
					System.out.println(fragment);
		}
		reader.close();
		searcher.close();
		writer.close();
		
	}
}

分享到:
评论

相关推荐

    luceneDemo(完整代码)

    luceneDemo(完整代码) lucene入门 基础类的运用、高亮器的实现、相关度排序

    傻瓜索引搜索v1.1[含全部源代码]

    傻瓜索引搜索系统v1.1的全部源代码。 基于Lucene.Net。主要目的就是包装Lucene.Net 使其应用简单化。 包括两个范例web一个,控制台一个。 没有高亮显示这个部分。所以想要的话还要再开发。 是 ...

    JAVA上百实例源码以及开源项目源代码

    得到RSA密钥对,产生Signature对象,对用私钥对信息(info)签名,用指定算法产生签名对象,用私钥初始化签名对象,将待签名的数据传送给签名对象(须在初始化之后),用公钥验证签名结果,使用公钥初始化签名对象,用于...

    Java EE常用框架.xmind

    Lucene是根据关健字来搜索的文本搜索工具(全文搜索引擎),只能在某个网站内部搜索文本内容,不能跨网站搜索 全文搜索引擎是在硬盘上的搜索,比传统Mysql数据库是要快的 比传统SQL多的功能:查询的结果有...

    JAVA上百实例源码以及开源项目

    得到RSA密钥对,产生Signature对象,对用私钥对信息(info)签名,用指定算法产生签名对象,用私钥初始化签名对象,将待签名的数据传送给签名对象(须在初始化之后),用公钥验证签名结果,使用公钥初始化签名对象,用于...

    java开源包8

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包10

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    ElasticSearch7.x入门到案例实战教程

    设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。 ElasticSearch应用场景维基百科,类似百度百科,全文检索,高亮,搜索推荐The Guardian(国外新闻网站),类似搜狐新闻,用户行为日志(点击...

    java开源包1

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包11

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包2

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包3

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包6

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包5

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包4

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包7

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包9

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    java开源包101

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

    Java资源包01

    使用该标记库,利用 Google 为你的网站提供网站查询,并且可以直接在你的网页里面显示搜查的结果。 github-java-api github-java-api 是 Github 网站 API 的 Java 语言版本。 java缓存工具 SimpleCache ...

Global site tag (gtag.js) - Google Analytics