引言
Lucene6.0于2016年4月8日发布,要求最低Java版本是Java 8。
相信大多数公司的数据库都需要采用分库分表等一些策略,而对于某些特定的业务需求,分别从不同的库不同的表中去检索特定的数据显得比较繁琐,而Lucene正好可以解决某些特殊需求,对于不同库不同表中的数据先建立全量索引,然后将需要检索的数据写入某个单独的表中,供其它业务需求方查询,以后的每天只需要做增量索引并写入数据表即可。
鉴于最近一直在做Lucene相关方面的工作,而本人一向又比较喜欢使用最新发布的版本,而网络上这类资源极少,故将一些要点及示例整理出来,本文主要从实战角度来介绍Lucene 6.0的使用,不涉及过多原理方面的东西,但是对于一些核
继续阅读 »
文/Robin
本站推广
币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。
币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872
邀请码: 11190872
| 日期 | 作者 | 文档概要 | 版本 | 更新历史 |
|:------------|:---------------|:-----|:-----|:-----|:-----|
| 2017/03/01 | robin | MySQL binlog 物理回溯最佳实战 | v1.0 | 文档初稿 |
| 2017/03/02 | robin | MySQ
继续阅读 »
索引备份的几个关键问题
最简单的备份方式是关闭IndexWriter,然后逐一拷贝索引文件,但是如果索引比较大,那么这种备份操作会持续较长时间,而在备份期间,程序无法对索引文件进行修改,很多搜索程序是不能接受索引操作期间如此长时间停顿的
那么不关闭IndexWriter又如何呢?这样也不行,因为在拷贝索引期间,如果索引文件发生变化,会导致备份的索引文件损坏
另外一个问题就是如果原索引文件损坏的话,再备份它也毫无意义,所以一定要备份的是最后一次成功commit之后的索引文件
每次在备份之前,如果程序将要覆盖上一个备份,需要先删除备份中未出现在当前快照中的文件,因为这些文件已经不会被当前索引引用了;如果每次都更改备份路径的话,那么就直
继续阅读 »
Analyzer简介
在Lucene的org.apache.lucene.analysis模块中提供了顶层的抽象类Analyzer,Analyzer主要是用来构建TokenStreams,如果想实现自定义的Analyzer,必须覆写createComponents(String)方法,并定义自己的TokenStreamComponents。
为什么要有Analyzer呢?对于Lucene而言,不管是索引还是检索,都是针对纯文本而言,对于纯文本的来源可以是PDF,Word,Excel,PPT,HTML等,Lucene对此并不关心,只要保证传递给Lucene的是纯文本即可。
而通常情况下,对于大量的文本,用户在检索的时候不可能全部
继续阅读 »
写在前面
本系列是综合了自己在学习spark过程中的理解记录 + 对参考文章中的一些理解 + 个人实践spark过程中的一些心得而来。写这样一个系列仅仅是为了梳理个人学习spark的笔记记录,所以一切以能够理解为主,没有必要的细节就不会记录了,而且文中有时候会出现英文原版文档,只要不影响理解,都不翻译了。若想深入了解,最好阅读参考文章和官方文档。
继续阅读 »
Lucene的主要搜索API
一个简单的搜索应用主要包括索引和搜索两部分,在Lucene中,IndexSearcher类是用于对索引中文档进行搜索的核心类,它有几个重载的搜索方法,可以使用最常用的方法对特定的项进行搜索,一个项由一个字符串类型的域值和对应的域名构成。现将搜索相关API汇总如下
| 类 | 目的 |
| ------------ | ------------ |
| IndexSearcher | 搜索索引的核心类。所有搜索都通过IndexSearcher进行,它们会调用该类中重载的search方法 |
| Query及其子类 | 封装某种查询类型的具体子类。Query实例将被传递给IndexSearcher
继续阅读 »
8月上胖记
感觉“胖”这个字不错,半个月。
技术博文
八月的第一周写了一个软件测试的系列博文。从概念写到实战,当写到实战部分的单元测试时,卡克了。原因是之前的博文只是把以往学过的东西做了一个汇总,而实战部分才是这几天学习的总结。单元测试确实是有很多问题等待解决,这几天一直在寻找一个快速进行单元测试的方法。其实能想到解决方案也通俗,要么自动化生成单测代码,要么用更合适的语言,快速书写单测的用例。第一种方案,我找了一些工具,但发现各自有各自的问题。于是转战第二种方案,倒是发现了一些不错的工具。
继续阅读 »
SSM框架学习:初探
Note:参阅书籍《Spring 3.x企业应用开发实战》
一、Spring
定义
Spring 是分层的 Java SE/EE 应用一站式的轻量级开源框架,以 IoC(Inverse of Control 反转控制) 和 AOP(Aspect Oriented Programming 面向切面编程)为内核,提供了 展现层:Spring MVC 和 持久层:Spring JDBC 以及 业务层:事务管理 等众多的企业级应用技术。
继续阅读 »
文/Robin
本站推广
币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。
币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872
邀请码: 11190872
本文已参与 ExinOne 定投有奖征文。
前言
笔者很少公开发表投资相关的文章,一是笔者在投资这条路上踩了很多坑,成绩不佳;二是火候未到,在笔者未可知领域公开发表文章,恐怕迎来笑话。此文素材来源于笔者长时间的实战和积累,希望对读者有所帮助。
定投
定投是个投资学名词,更专业的叫法叫做「平均成本法」。平均成本法具体讲解的是什么内容呢?笔者从维基百科摘录
继续阅读 »