2017-03-15 Robin Wen
文/温国兵 | 日期 | 作者 | 文档概要 | 版本 | 更新历史 | |:------------|:---------------|:-----|:-----|:-----|:-----| | 2017/03/01 | 温国兵 | MySQL binlog 物理回溯最佳实战 | v1.0 | 文档初稿 | | 2017/03/02 | 温国兵 | MySQL binlog 物理回溯最佳实战 | v1.1 | 修改结论 | 0x00 目录 Table of Contents {:toc} 0x01 前言 在平时的迁移或者其他维护场景中,我们需要利用备份的物理 binlog 做回溯。本篇文章根据真实案例进行讲解,如何 继续阅读 »
2016-05-20 Eric Wang
引言 Lucene6.0于2016年4月8日发布,要求最低Java版本是Java 8。 相信大多数公司的数据库都需要采用分库分表等一些策略,而对于某些特定的业务需求,分别从不同的库不同的表中去检索特定的数据显得比较繁琐,而Lucene正好可以解决某些特殊需求,对于不同库不同表中的数据先建立全量索引,然后将需要检索的数据写入某个单独的表中,供其它业务需求方查询,以后的每天只需要做增量索引并写入数据表即可。 鉴于最近一直在做Lucene相关方面的工作,而本人一向又比较喜欢使用最新发布的版本,而网络上这类资源极少,故将一些要点及示例整理出来,本文主要从实战角度来介绍Lucene 6.0的使用,不涉及过多原理方面的东西,但是对于一些核 继续阅读 »
2017-09-14 hqweay
表严肃官方网站 过了一遍《javascript DOM 编程艺术》,准备做一下书尾的实战项目,却发现难以入手。其实这个小项目只需要非常基础的html,css知识。我自认为之前也算是有所准备,但果然还是高看自己了。该书默认读者已经有一定的布局经验,我虽然已经跟着大表哥的博客布局走过一遍,但是上次只是在边看边誊抄代码。做了笔记,也只是零零散散的,没有条理。现在去看的话是完全不知道当时都记了什么.....(甚至已经找不到记在哪了...) 继续阅读 »
2016-05-24 Eric Wang
Lucene的主要搜索API 一个简单的搜索应用主要包括索引和搜索两部分,在Lucene中,IndexSearcher类是用于对索引中文档进行搜索的核心类,它有几个重载的搜索方法,可以使用最常用的方法对特定的项进行搜索,一个项由一个字符串类型的域值和对应的域名构成。现将搜索相关API汇总如下 | 类 | 目的 | | ------------ | ------------ | | IndexSearcher | 搜索索引的核心类。所有搜索都通过IndexSearcher进行,它们会调用该类中重载的search方法 | | Query及其子类 | 封装某种查询类型的具体子类。Query实例将被传递给IndexSearcher 继续阅读 »
2016-06-24 Eric Wang
索引备份的几个关键问题 最简单的备份方式是关闭IndexWriter,然后逐一拷贝索引文件,但是如果索引比较大,那么这种备份操作会持续较长时间,而在备份期间,程序无法对索引文件进行修改,很多搜索程序是不能接受索引操作期间如此长时间停顿的 那么不关闭IndexWriter又如何呢?这样也不行,因为在拷贝索引期间,如果索引文件发生变化,会导致备份的索引文件损坏 另外一个问题就是如果原索引文件损坏的话,再备份它也毫无意义,所以一定要备份的是最后一次成功commit之后的索引文件 每次在备份之前,如果程序将要覆盖上一个备份,需要先删除备份中未出现在当前快照中的文件,因为这些文件已经不会被当前索引引用了;如果每次都更改备份路径的话,那么就直 继续阅读 »
2016-02-21 demon7452
2016-05-23 Eric Wang
Analyzer简介 在Lucene的org.apache.lucene.analysis模块中提供了顶层的抽象类Analyzer,Analyzer主要是用来构建TokenStreams,如果想实现自定义的Analyzer,必须覆写createComponents(String)方法,并定义自己的TokenStreamComponents。 为什么要有Analyzer呢?对于Lucene而言,不管是索引还是检索,都是针对纯文本而言,对于纯文本的来源可以是PDF,Word,Excel,PPT,HTML等,Lucene对此并不关心,只要保证传递给Lucene的是纯文本即可。 而通常情况下,对于大量的文本,用户在检索的时候不可能全部 继续阅读 »
2016-04-01 litaotao
写在前面 本系列是综合了自己在学习spark过程中的理解记录 + 对参考文章中的一些理解 + 个人实践spark过程中的一些心得而来。写这样一个系列仅仅是为了梳理个人学习spark的笔记记录,所以一切以能够理解为主,没有必要的细节就不会记录了,而且文中有时候会出现英文原版文档,只要不影响理解,都不翻译了。若想深入了解,最好阅读参考文章和官方文档。 继续阅读 »
2014-08-15 walter lee
8月上胖记 感觉“胖”这个字不错,半个月。 技术博文 八月的第一周写了一个软件测试的系列博文。从概念写到实战,当写到实战部分的单元测试时,卡克了。原因是之前的博文只是把以往学过的东西做了一个汇总,而实战部分才是这几天学习的总结。单元测试确实是有很多问题等待解决,这几天一直在寻找一个快速进行单元测试的方法。其实能想到解决方案也通俗,要么自动化生成单测代码,要么用更合适的语言,快速书写单测的用例。第一种方案,我找了一些工具,但发现各自有各自的问题。于是转战第二种方案,倒是发现了一些不错的工具。 继续阅读 »
2015-01-15 Robin Wen
目录 Table of Contents {:toc} 文/温国兵 一 引子 在生产环境中,删除一个大文件,比如一个数十 G 或者上百 G 的文件是很耗时的。 本文介绍一个快速 DROP TABLE 的方法。使用本文提供的方法,不管该表数据量、占用空间有多大,都可以快速的删除。 二 演示 下面做一个演示。 2.1 环境 首先说明环境: 环境 bash mysql> SHOW VARIABLES LIKE '%version%'; +-------------------------+------------------------------+ | Variable_name | Value 继续阅读 »