2015-01-01 walter lee
sql
在几千条记录里,存在着些相同的记录,如何能用SQL语句,删除掉重复的呢? 1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断 select * from people where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1) 2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录 继续阅读 »
2020-11-15 ruki
xrepo is a cross-platform C/C++ package manager based on Xmake. Github Official Document It is based on the runtime provided by xmake, but it is a complete and independent package management program. Compared with package managers such as vcpkg/homebrew, xrepo can provide C/C++ packages for more platforms and architec 继续阅读 »
2017-08-25 Lanffy
PHP
在记MAC OS X 编译安装PHP7.0.16 中遇到的异常情况一文中,介绍了编译PHP7源码安装PHP的方式,其中的第四个步骤,命令如下: 继续阅读 »
2016-06-28 Alex Sun
一、引言 最早接触爬虫,是发现了一个叫做『豆瓣妹子』的网站,写了一个简单的程序可以批量下载图片。后来陆陆续续抓取过豆瓣电影,Google+,facejoking等网站。毕设的选题也是抓取新浪微博,然后分析博文的传播情况。最近一直对知乎的数据感兴趣,于是开发了Node模块zhihu-api,用于简化数据的抓取。 通常来说,所谓的爬虫,无非是通过程序来发送HTTP请求。因此理论上来说,所有浏览器能访问到的内容,都是可以通过爬虫来进行抓取的。 一般而言,我们所感兴趣的信息,只是页面中的某一部分数据,例如:某个标签的文本、链接地址、图片地址等。有些网站会提供开放的API(往往也会有很多限制),这时只需要直接请求该API,就可以拿到比较 继续阅读 »
2016-03-01 walter lee
在时间序列中,我们需要基于该时间序列当前已有的数据来预测其在之后的走势,三次指数平滑(Triple/Three Order Exponential Smoothing,Holt-Winters)算法可以很好的进行时间序列的预测。 继续阅读 »
2014-04-21 W.Y.
HTTP cookies,通常称之为“cookie”,已经存在很长时间了,但是仍然没有被充分理解。首要问题是存在许多误解,认为 cookie 是后门程序或病毒,却忽视了其工作原理。第二个问题是,对于 cookie 的操作缺少统一的接口。尽管存在这些问题,cookie 仍旧在 Web 开发中扮演者重要的角色,以至于如果没有出现相应的代替品就消失的话,我们许多喜欢的 Web 应用将变的不可用。 cookie 的起源 早期的 Web 应用面临的最大问题之一就是如何维持状态。简言之,服务器无法知道两个请求是否来自于同一个浏览器。当时,最简单的办法就是在请求的页面中插入一个 token,然后在下次请求时将这个 token 返回至服务器。这 继续阅读 »
2020-09-12 jude
除了 warning 还有别的意外惊喜! 继续阅读 »
2018-11-13 biezhi
How To Become A Hacker Eric Steven Raymond, Thyrsus Enterprises{:target="_blank"}, < esr@thyrsus.com > 继续阅读 »
2018-01-18 KasperDeng
Zabbix JMX 官方文档: https://www.zabbix.com/documentation/3.4/manual/config/items/itemtypes/jmx_monitoring 注意点 对于JMX, Zabbix server需要向Zabbix Java Gateway查询,而不是Zabbix Agent。 Java gateway 跟被监控应用的JMX management api的调用应该是畅通无阻的,网络上不应该被防火墙阻塞。如果JMX需要认证的话,是要能通过的。如果只是用在非生产环境,也可以取消认证。 ~~~java java \ -Dcom.sun.management.jmxremote 继续阅读 »
2017-09-10 Alex Sun
1. 过拟合 在线性回归和逻辑回归中,容易出现过拟合的情况,即训练模型可以很好地适用于训练集,得到代价函数 $$ J(\theta)≈0 $$,但是这样的模型并无法泛化,对于测试数据,会偏差很大。 在样本特征数多,而样本数少的情况下,很容易发生过拟合。解决过拟合的方法: 继续阅读 »