2017-11-15 Eric Wang
抛出问题 在 RDBMS 中,我们可以使用 GROUP BY 来对检索的数据进行分组,同样地,想要在 Lucene 中实现分组要如何做呢?首先思考如下几个问题 - Lucene 是如何实现分组的? - 用来分组的字段(域)或者说 Field 如何添加? - 组的大小如何设置? - 组内大小如何设置? - 如何实现组的分页? - 如果结果集超过了组内大小,可以通过分页解决,那么如果结果集超过了组大小的上限,如何解决? - 如何实现单类别分组,即类似SQL中的 GROUP BY A - 如何实现多类别分组,即类似SQL中的 GROUP BY A, B 从 SQL 的 GROUP BY 说起 如果分组后面只有一个字段,如 GROUP 继续阅读 »
2015-08-01 Lim Geng
分组 非捕获分组 在正则表达式中遇到小括号就可以认为是一个分组,比如/(a)bcda\1/,(a)就是一个分组,\1代表第一个分组。这种分组可以成为 捕获分组。 var reg = /(a)bcd\1/ console.log(reg.test('abcdef')) // false console.log(reg.test('abcdaef')) // true \1是个占位符,意思是这里的内容匹配的和第一个分组的一样,比如/(xyz)bcd\1/实际上就等同于/(xyz)bcdxyz/, 与其相对的就是非捕获分组,比如/(?:a)bcda/,(?:a)就是非捕获分组,不能通过\1引用 var reg = /(?:a 继续阅读 »
2016-05-06 浩阳
content {:toc} 由正则表达式如何匹配相同字符出发,讲讲正则表达式中的选择、分组和引用。 问题 在外刊君读者群中看到有人提出这样的一个需求: 把字符串切成连续相同字符的正则怎么写?比如abbcccdddd切成a,bb,ccc,dddd 之前我对正则表达式也是略有研究,想尝试一下。其实我对正则表达式的学习基本完全来源于犀牛书的第10章,真正看懂这一章,我觉得操作正则表达式应该不在话下。 继续阅读 »
2016-04-11 Roger
《TCP/IP详解卷一》读书笔记 第一章 概述 1.2 分层 TCP/IP 通常被认为是一个四层协议系统: 链路层,通常包括操作系统中的设备驱动程序和计算机中对应的网络接口卡 网络层,包括 IP 协议 , ICMP 协议 , IGMP 协议 运输层,包括 TCP , UDP . TCP 为两台主机提供高可靠性的数据通信,包含把应用层交给她的数据分成合适的小块交给网络层,确认接收到的分组,设置发送最后确认分组的超时时钟等。 UDP 则为应用层提供非常简单的服务,他只是把称作数据报的分组从一台主机发送到另一台主机,但并不保证该数据报能达到另一端。 应用层负责处理特定的应用程序细节。基本都包含以下应用: Telnet 远程登录 F 继续阅读 »
2015-03-06 Lanffy
简介 tcpdump是一个用于截取网络分组,并输出分组内容的工具,简单说就是数据包抓包工具。tcpdump凭借强大的功能和灵活的截取策略,使其成为Linux系统下用于网络分析和问题排查的首选工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤,并提供and、or、not等逻辑语句来帮助你去掉无用的信息。 继续阅读 »
2015-01-17 walter lee
初识ODPS算法 ODPS机器学习算法非常丰富,从功能角度可以划分为以下几大类: 基本的统计、分析和处理 基本统计包括直方图、协方差、连续变量分组统计、交叉表、排行榜等;统计分析包括对应分析、主成分分析(Principal Component Analysis, PCA);数据处理包括数据过滤、采样、归一、合并、分箱等。 继续阅读 »
2018-01-10 Vaniot
PS入门 1.好习惯 1.永远不破坏原始素材(复制图层ctrl+j) 2.图层管理(图层分组ctrl+g) 3.保存PSD文件 4.尽量不使用快捷键 2.图层的概念 ps中的所有操作均发生在图层上,将多个图层叠加可将每个图层上的图像叠加,上层覆盖下层内容生成一张新图。 魔法棒:通过算法将相近的颜色转换为选区, 图层蒙版:使用图层蒙版将不显示的部分(黑色区域)遮住 3.钢笔工具 继续阅读 »
2016-04-10 Renfei Yu
Push推送对比研究分析 [TOC] 个推 一.主要功能及特点 个推不仅能提供云端到客户端的推送服务,也可以提供从客户端上传至云端的服务,即推送消息链路支持上下行双向通道,开发者与客户端之间互动更便利。 多个APP合并一条长连接,共享链路,省电省流量。 SDK接口丰富,可定制推送模式和通知栏提示样式,也支持增量更新。 通过根据用户属性的分析建立不同标签,也可以进行A/B分组测试,从而进行精细化运营。 保持与服务器的长连接,以便消息能够即时推送到达客户端 继续阅读 »
2015-06-20 Zhang zhengzheng
相信大多数人都有过关于CSS的痛苦经历,从我加入公司到现在,不到两年的时间里,听到最多CSS相关的讨论就是‘很难调’。所以我也一直在探究这其中有怎样的问题,为什么很多人觉得CSS很难写,如何才能让其他人更优雅的写CSS。在Code Review的时候,我渐渐的发现了问题所在,其实很多人已经掌握了丰富的CSS知识,但却不知道如何分组属性写成class。最后只好在需要改变样式的元素上随意起个名字做class然后把所有要写的属性丢进这个class里,如果优先级不够,再把前面的选择器都加上。结果就是CSS代码不断堆积,重复和冗余不断增多,维护也变得举步维艰。 继续阅读 »