2014-03-14 Kun Ren
Oftentimes, we obtain a long or a wide table from a certain data source, and it may be the only format we can get. For example, some financial databases provide daily tick data for all stocks in a financial market. The data table may be arranged in a long format like this: 继续阅读 »
2016-03-22 craneyuan
声明 本文转载自:The Bloom of Youth|锦瑟华年 Hexo 博客系统的核心支持生成目录(Table of Contents),但其默认的主题 Landscape 并不支持目录的显示。我们只需对 Landscape 的主题文件稍作修改并添加一点目录的 CSS 就可以在文章前面显示友好的目录了。 修改 Landscape 主题的 ejs 文件 我们首先要编辑文章显示页面的模板,也就是 themes/landscape/layout/_partial/article.ejs 文件。为了将目录生成在正文之前,我们首先在这个文件中找到,并在这一行之前加入如下代码: javascript Table of Conte 继续阅读 »
2015-01-15 Robin Wen
目录 Table of Contents {:toc} 文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 一 引子 在生产环境中,删除一个大文件,比如一个数十 G 或者上百 G 的文件是很耗时的。 本文介绍一个快速 DROP TABLE 的方法。使用本文提供的方法,不管该表数据量、占用空间有多大,都可以快速的删除。 二 演示 下面做一个演示。 2.1 环境 首先说明环境: 环境 bash mys 继续阅读 »
2014-04-26 Robin Wen
目录 Table of Contents {:toc} 文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 SQL Server快速导入数据,可以尝试的方法如下:CTE、OpenRowSet/OpenDataSource、BULK INSERT、bcp、Shell。 下面依次介绍这几种办法。 1.CTE 首先,我们看看什么是CTE。公用表表达式(Common Table Expression)是SQL SE 继续阅读 »
2016-09-24 Robin Wen
文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 Table of Contents {:toc} 0x00 背景 A 业务日增 1500W 数据,采用 MySQL 分区存储。该分区表按照时间分区,每天一个分区。随着时间的推移,单表数据越来越多,占用空间越来越大,由此带来如下的不便:第一,单机磁盘容量有限,需要定期清理历史数据;第二,MySQL 对子查询、复杂查询支持不友好,在庞大的数据量下性能急剧下降,导致前 继续阅读 »
2015-02-17 张炎泼
There is a hash table: It has b buckets. It has n keys stored in it. We assume that the hash function distributes keys uniformly. A bucket can contain more than 1 keys. 继续阅读 »
2014-06-26 Kun Ren
In recent years, non-relational data have attracted more and more attentions. Roughly speaking, all datasets that are hard to put into a rectangular table with rows and columns are non-relational datasets. 继续阅读 »
2018-03-30 MoreFreeze
Table of Contents {:toc} 最近遇到了一些函数式编程的概念,心想我用 Python 的 map reduce 不就是在函数式编程嘛, 但看了半天仍然一头雾水,什么是 UnitBox?flatMap 和 map 差在哪里?于是先学了阮老师的[函数式编程入门教程][1], 唉哟喂,和我原来想的还不一样,Python 这些操作虽然算是函数式编程,但要系统地理解为什么能这样, 还得从头说起。 继续阅读 »
2017-04-29 Robin Wen
文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 0x00 目录 Table of Contents {:toc} 日期 | 作者 | 文档概要 | 版本 | 更新历史 ------- | -------- | -------- | -------- | -------- 2017/04/20 | robin | Greenplum 扩容测试报告 | v1.0 | 文档初稿 2017/04/ 继续阅读 »
2015-07-12 Robin Wen
目录 Table of Contents {:toc} 文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 一 引子 很久没写技术文章了,打算最近几周把最近遇到的故障总结下。这篇文章分享周四遇到的故障。 另外,最近有创作欲望,只等时间宽裕。 二 起因 周四一整天,研发反应某台数据库僵死,后面的会话要么连接不上,要么要花费大量的时间返回结果,哪怕是一个简单的查询。 三 处理 首先去监控平台查看服务器以及 继续阅读 »