2016-04-10 Borg
如何评估一个回归模型 loss function 首先定义loss function,即预测错误带来的损失,通常使用y-yhat的绝对值或者平方。但不绝对,比如在预测放假时如果估值过高,则可能完全卖不出去,带来的损失更大,因此可以定义loss function使估值过高带来的loss比估值过低带来的loss更大。 继续阅读 »
2016-04-02 Borg
对于以下这样的数据应该如何用回归模型来预测呢? r x 继续阅读 »
2019-08-16 Lanffy
最近在工作中需要用Python做大量的数据分析,在这些数据中,很大一部分都是中文。在处理过程中,中文编码处理花了一些时间。这里做一个记录。 首先是在Python脚本内的中文编码处理,这个网络上有很多教程和解决方案了,这里不再赘述。推荐参考: 继续阅读 »
2016-04-28 Borg
安装Ubuntu之后做的几件事: 对的,我换电脑了!换了个8G内存宏碁的笔记本,这样就能搞得起某些数据分析的算法了。 买来新电脑第一件事当然是装系统啦,但是装完系统后好多软件需要重新安装。虽然说Ubuntu可以直接导出软件源和已安装软件列表,但是发现自己好多软件就不是用apt-get安装的。所以在此记录下本次装系统所做修改,以备不时之需。 首先是Ubuntu版本的选择,现在Ubuntu已经有了16.04版本,就选了最新的。但是,一定要选麒麟版本!第一次觉得之前碰到些错误信息是中文的不方便谷歌,所以没选麒麟,结果中文输入法装的真的很麻烦!本来想装搜狗的中文输入法的,结果各种依赖关系不满足,而且有些还找不到软件源。。。总之各种麻烦 继续阅读 »
2014-03-01 Robin Wen
文/Robin 本站推广 币安是全球领先的数字货币交易平台,提供比特币、以太坊、BNB 以及 USDT 交易。 币安注册: https://accounts.binancezh.pro/cn/register/?ref=11190872 邀请码: 11190872 周六,仍然在奔波。昨天一家公司已经联系我,今天要去面试,职位是BI数据分析工程师。 昨天下午忙活了半天,在网上找了很多关于BI的资料,一边啃,一边感叹到这个不算新却在国内刚起步的技术太博大高深了,好多知识都不知所云。在知乎上看到一个关于BI的问题还不错,对BI有了基本的认识。拿到回答得票最高的那个人的QQ号,晚上问了几个问题,这才算心里有点底了。可是,面试的这家 继续阅读 »
2020-08-15 Robin Wen
文/Robin 2020 年 8 月 1 日,Ethereum Classic 官方在推特上发布消息表示正在进行网络维护,希望包括交易所、矿池等服务提供商暂时停止 ETC 存款,以进一步检查网络问题。网络维护,实际上是遇到了「区块链重组」。 2020 年 8 月 4 日,加密数据分析公司 Bitquery 针对「ETC 遭受 51% 攻击」事件发布调查报告。报告显示:8 月 1 日 0:30 至 8 月 2 日 11:30 的 12 个小时内,ETC 遭受 51% 攻击,攻击由 0x75d1e 开头的矿工发起,该矿工悄悄产出了 3500 多个区块(从 10904146 到 10907740)。整个攻击的成本是多少呢?17.5 继续阅读 »
2015-02-07 walter lee
简介 Dremel 是Google 的“交互式”数据分析系统。可以组建成规模上千的集群,处理PB级别的数据。MapReduce处理一个数据,需要分钟级的时间。作为MapReduce的发起人,Google开发了Dremel将处理时间缩短到秒级,作为MapReduce的有力补充。Dremel作为Google BigQuery的report引擎,获得了很大的成功。最近Apache计划推出Dremel的开源实现Drill,将Dremel的技术又推到了浪尖上。 继续阅读 »