网站文章又被人爬取发布了,得好好防爬虫了

Share

今天无聊的看日志,发现几个很没素养的网站用爬虫爬我网站,最恶心的是这些网站还有排名,如下图:

网站文章又被人爬取发布了,得好好防爬虫了

下面几个网站都是典型的爬虫网站,天天广撒网,贴出来,它们大量的去抓别人网站的文章,然后发布到自己网站上,更没素养的是,网站上没有给出联系方式,好把侵权的内容删掉。

也反映了百度之前的打击重复网站内容的算法就是个狗屁,一个形式而已,算法跟谷歌比,一个是爹,一个是儿子。也许百度是这样觉得–天天更新算法,就显得自己高级了?也不学学谷歌的实务进取的精神,天天搞这些没用的,谷歌虽然也有这类情况,但是比百度要好的多,百度前10名竟然有6个是抄袭我的,当然里面也有内容是我之前借鉴别人的,但是排版和内容也有很多是我自己写的,但是抄袭我的网站内容一模一样,连图片排版都懒得换,你敢信?大家仔细观察,会发现谷歌每次更新算法,那效果都是立竿见影的,个人觉得这才是产品的进步。

所以有条件的站长可以设计防爬虫的工作,因为这些你终究是要做的,只能靠自己了,别指望百度了,百度一心只想赚钱,不会提高他搜索引擎的技术的。站点可以设立防盗链,防爬虫,最大限度限制爬虫的泛滥。最可气的是你拿这些爬虫网站没办法,妈的…..

    版权声明:

     本网站的所有文字、图片资料,【未注明转载的】均由作者亲自整理创作,任何媒体、网站或个人未经本人同意和授权不得复制、转载、转贴或以其他方式复制发布/发表,请尊重我的劳动成果,侵权必究,谢谢。