2016-05-20 Eric Wang
引言 Lucene6.0于2016年4月8日发布,要求最低Java版本是Java 8。 相信大多数公司的数据库都需要采用分库分表等一些策略,而对于某些特定的业务需求,分别从不同的库不同的表中去检索特定的数据显得比较繁琐,而Lucene正好可以解决某些特殊需求,对于不同库不同表中的数据先建立全量索引,然后将需要检索的数据写入某个单独的表中,供其它业务需求方查询,以后的每天只需要做增量索引并写入数据表即可。 鉴于最近一直在做Lucene相关方面的工作,而本人一向又比较喜欢使用最新发布的版本,而网络上这类资源极少,故将一些要点及示例整理出来,本文主要从实战角度来介绍Lucene 6.0的使用,不涉及过多原理方面的东西,但是对于一些核 继续阅读 »
2017-03-15 Robin Wen
文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 | 日期 | 作者 | 文档概要 | 版本 | 更新历史 | |:------------|:---------------|:-----|:-----|:-----|:-----| | 2017/03/01 | robin | MySQL binlog 物理回溯最佳实战 | v1.0 | 文档初稿 | | 2017/03/02 | robin | MySQ 继续阅读 »
2016-06-24 Eric Wang
索引备份的几个关键问题 最简单的备份方式是关闭IndexWriter,然后逐一拷贝索引文件,但是如果索引比较大,那么这种备份操作会持续较长时间,而在备份期间,程序无法对索引文件进行修改,很多搜索程序是不能接受索引操作期间如此长时间停顿的 那么不关闭IndexWriter又如何呢?这样也不行,因为在拷贝索引期间,如果索引文件发生变化,会导致备份的索引文件损坏 另外一个问题就是如果原索引文件损坏的话,再备份它也毫无意义,所以一定要备份的是最后一次成功commit之后的索引文件 每次在备份之前,如果程序将要覆盖上一个备份,需要先删除备份中未出现在当前快照中的文件,因为这些文件已经不会被当前索引引用了;如果每次都更改备份路径的话,那么就直 继续阅读 »
2016-02-21 demon7452
2016-05-23 Eric Wang
Analyzer简介 在Lucene的org.apache.lucene.analysis模块中提供了顶层的抽象类Analyzer,Analyzer主要是用来构建TokenStreams,如果想实现自定义的Analyzer,必须覆写createComponents(String)方法,并定义自己的TokenStreamComponents。 为什么要有Analyzer呢?对于Lucene而言,不管是索引还是检索,都是针对纯文本而言,对于纯文本的来源可以是PDF,Word,Excel,PPT,HTML等,Lucene对此并不关心,只要保证传递给Lucene的是纯文本即可。 而通常情况下,对于大量的文本,用户在检索的时候不可能全部 继续阅读 »
2016-04-01 litaotao
写在前面 本系列是综合了自己在学习spark过程中的理解记录 + 对参考文章中的一些理解 + 个人实践spark过程中的一些心得而来。写这样一个系列仅仅是为了梳理个人学习spark的笔记记录,所以一切以能够理解为主,没有必要的细节就不会记录了,而且文中有时候会出现英文原版文档,只要不影响理解,都不翻译了。若想深入了解,最好阅读参考文章和官方文档。 继续阅读 »
2016-05-24 Eric Wang
Lucene的主要搜索API 一个简单的搜索应用主要包括索引和搜索两部分,在Lucene中,IndexSearcher类是用于对索引中文档进行搜索的核心类,它有几个重载的搜索方法,可以使用最常用的方法对特定的项进行搜索,一个项由一个字符串类型的域值和对应的域名构成。现将搜索相关API汇总如下 | 类 | 目的 | | ------------ | ------------ | | IndexSearcher | 搜索索引的核心类。所有搜索都通过IndexSearcher进行,它们会调用该类中重载的search方法 | | Query及其子类 | 封装某种查询类型的具体子类。Query实例将被传递给IndexSearcher 继续阅读 »
2014-08-15 walter lee
8月上胖记 感觉“胖”这个字不错,半个月。 技术博文 八月的第一周写了一个软件测试的系列博文。从概念写到实战,当写到实战部分的单元测试时,卡克了。原因是之前的博文只是把以往学过的东西做了一个汇总,而实战部分才是这几天学习的总结。单元测试确实是有很多问题等待解决,这几天一直在寻找一个快速进行单元测试的方法。其实能想到解决方案也通俗,要么自动化生成单测代码,要么用更合适的语言,快速书写单测的用例。第一种方案,我找了一些工具,但发现各自有各自的问题。于是转战第二种方案,倒是发现了一些不错的工具。 继续阅读 »
2016-03-03 demon7452
SSM框架学习:初探 Note:参阅书籍《Spring 3.x企业应用开发实战》 一、Spring 定义 Spring 是分层的 Java SE/EE 应用一站式的轻量级开源框架,以 IoC(Inverse of Control 反转控制) 和 AOP(Aspect Oriented Programming 面向切面编程)为内核,提供了 展现层:Spring MVC 和 持久层:Spring JDBC 以及 业务层:事务管理 等众多的企业级应用技术。 继续阅读 »
2019-01-29 Robin Wen
文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 本文已参与 ExinOne 定投有奖征文。 前言 笔者很少公开发表投资相关的文章,一是笔者在投资这条路上踩了很多坑,成绩不佳;二是火候未到,在笔者未可知领域公开发表文章,恐怕迎来笑话。此文素材来源于笔者长时间的实战和积累,希望对读者有所帮助。 定投 定投是个投资学名词,更专业的叫法叫做「平均成本法」。平均成本法具体讲解的是什么内容呢?笔者从维基百科摘录 继续阅读 »