那些年,我们被人窃取过的博客

2016-06-26 Piasy 更多博文 » 博客 » GitHub »

MISC

原文链接 http://blog.piasy.com/2016/06/26/copyright/
注:以下为加速网络访问所做的原文缓存,经过重新格式化,可能存在格式方面的问题,或偶有遗漏信息,请以原文为准。


很早之前就在博客统计中发现了来自各色奇怪网站的流量,而且之前也遇见过搜索引擎搜自己的博客,结果是各种奇怪的网站排在前面。之前也没在意,反正分了我的流量,我也没啥损失,加了原文链接的还能导点流量过来。今天再次想到了其中之一的“推酷网”,便尝试再搜了一下,看看到底有多少这样的无良网站恶意侵权,不试不知道,一试吓一跳。

搜索引擎

我以一篇博客的标题“深入理解 RecyclerView 系列之一:ItemDecoration”为关键字,在 Google、百度、必应进行搜索。

还是 Google 最给力:

search_google.png

必应倒还能搜出来,而且结果还挺整齐:

search_bing.png

百度我就不说啥了,不过没搜出广告我也还挺欣慰的:

search_baidu.png

出于无聊的心态,我就点开了搜出来的结果,发现其中大部分都是经过备案的网站,那我在工业和信息化部ICP/IP地址/域名信息备案管理系统{:target="_blank"}就查一下备案信息咯。

窃贼之一:推酷网{:target="_blank"}

有原文链接,有广告,格式基本可以看。

thief_tuicool.png

owner_of_thief_tuicool.png

窃贼之二:内存溢出{:target="_blank"}

没有原文链接,有作者名字,没有广告,格式勉强可以看。

thief_outofmemory.png

owner_of_thief_outofmemory.png

窃贼之三:Code Cloud{:target="_blank"}

没有任何原作信息,垃圾广告一大堆,格式勉强可以看。

thief_codecloud.png

owner_of_thief_codecloud.png

有趣的是,这个网站所有者还有一个微博,每次扒别人一篇文章,还会发一篇微博公告一下(当然没有原作说明){:target="_blank"},不过粉丝不多:微博 ilizhike{:target="_blank"}。

窃贼之四:清屏网{:target="_blank"}

没有任何原作信息,广告位还没租出去,格式基本不能看。

thief_qingpingshan.png

owner_of_thief_qingpingshan.png

窃贼之五:第七城市{:target="_blank"}

没有任何原作信息,满屏垃圾广告,格式完全不能看。

thief_th7.png

owner_of_thief_th7.png

窃贼之六:阳和移动开发{:target="_blank"}

没有任何原作信息,满屏垃圾广告,格式基本不能看。

thief_mobile_open.png

owner_of_thief_mobile_open.png

窃贼之七:码迷{:target="_blank"}

没有任何原作信息,满屏垃圾广告,格式基本不能看。

thief_mamicode.png

owner_of_thief_mamicode.png

窃贼之八:电脑玩物{:target="_blank"}

没有任何原作信息,有广告,格式基本能看。

thief_07net01.png

owner_of_thief_07net01.png

窃贼之九:壹读{:target="_blank"}

原文信息写的是开发者头条,满屏垃圾广告,格式基本不能看。

thief_read01.png

遗憾的是,这个从这个网站起,就都没有备案信息了 :(

窃贼之十一:cnblogs 安卓MAN{:target="_blank"}

没有任何原作信息,格式基本能看。

thief_cnblogs_amen.png

窃贼之十二:oschina 丁佳辉{:target="_blank"}

原文信息写的是 cnblogs 安卓MAN,格式基本能看。

thief_oschina_ding.png

(暂)完

好了,也就不费更多工夫再多查了,大部分窃取全文的都是有直接流量收益的。

推酷 这样的站点,要是学学 开发者头条,只引用链接,其实也还是不错的,如果只是为了分析内容,抓取只做分析用也是极好的,还能省不少存储空间呢不是?

至于在博客平台上进行窃取的,其实很早很早以前我也干过全文转载的事儿,不过我好歹还是加了原文链接呀,其实之所以全文转载,主要是怕只记原文链接将来哪天就访问不到了。不过那也是学生时代干的蠢事了。

其实我也不想怎么着,就是百无聊赖,扒一扒这些网站背后都是什么人,按理说知道备案信息之后,是能找到真人的不是?