2014-03-01 Robin Wen
文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 周六,仍然在奔波。昨天一家公司已经联系我,今天要去面试,职位是BI数据分析工程师。 昨天下午忙活了半天,在网上找了很多关于BI的资料,一边啃,一边感叹到这个不算新却在国内刚起步的技术太博大高深了,好多知识都不知所云。在知乎上看到一个关于BI的问题还不错,对BI有了基本的认识。拿到回答得票最高的那个人的QQ号,晚上问了几个问题,这才算心里有点底了。可是,面试的这家 继续阅读 »
2016-09-24 Robin Wen
文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 Table of Contents {:toc} 0x00 背景 A 业务日增 1500W 数据,采用 MySQL 分区存储。该分区表按照时间分区,每天一个分区。随着时间的推移,单表数据越来越多,占用空间越来越大,由此带来如下的不便:第一,单机磁盘容量有限,需要定期清理历史数据;第二,MySQL 对子查询、复杂查询支持不友好,在庞大的数据量下性能急剧下降,导致前 继续阅读 »
2015-02-09 walter lee
1.简介 infobright是一个基于MySQL的数据仓库系统,内部是没有索引,采用的Knowledge Grid来组织数据。基本特征如下: 查询性能高:百万、千万、亿级记录数条件下,同等的SELECT查询语句,速度比MyISAM、InnoDB等普通的MySQL存储引擎快5~60倍  存储数据量大:TB级数据大小,几十亿条记录  高压缩比:理论上是40:1,在我们的项目中为10:1,极大地节省了存储空间  基于列存储:无需要物化视图、复杂的数据分区策略、索引  适合复杂的分析性SQL查询:SUM, COUNT, AVG, GROUP BY 没有特殊的数据仓库摸(比如星形模型、雪花模型)要求 和众多的BI套件相容,比如Penta 继续阅读 »
2014-10-26 Xie Jingyi
题目 涵涵有两盒火柴,每盒装有 n 根火柴,每根火柴都有一个高度。现在将每盒中的火柴各自排成一列,同一列火柴的高度互不相同,两列火柴之间的距离定义为:$\sum_{i=1}^{n}{(a_i-b_i)^2}$ ,其中 ai表示第一列火柴中第 i 个火柴的高度,bi表示第二列火柴中第 i 个火柴的高度。 每列火柴中相邻两根火柴的位置都可以交换,请你通过交换使得两列火柴之间的距离最小。请问得到这个最小的距离,最少需要交换多少次?如果这个数字太大,请输出这个最小交换次数对 99,999,997 取模的结果。 分析 这真是一道好题——断断续续想了几天才完全AC。 事实上,由排序不等式可知: 当$a_i, b_i$从小到大排序时,距离 继续阅读 »
2020-10-02 Robin Wen
文/Robin 2020 年 10 月 2 日,美国司法部和美国商品期货交易委员会(CFTC)分别对加密货币衍生品交易所 BitMEX 的创始人及高管发起刑事和民事指控,称该交易所创始人及高管串谋违反美国《银行保密法》(由美国司法部发起的刑事指控)、运营未注册的交易平台(由 CFTC 发起的民事指控)、涉及违反 KYC 和反洗钱相关的监管法规(由 CFTC 发起的民事指控)。指控涉及 BitMEX 相关的五个公司实体以及四名所有者 Arthur Hayes (联合创始人兼 CEO)、Benjamin Delo (联合创始人)、Samuel Reed (CTO)以及业务发展负责人 Gregory Dwyer。美国司法部披露,Bi 继续阅读 »