zoukankan      html  css  js  c++  java
  • 博文被爬是一种什么样的体验?

    前几天看到有人发自己的博客被一些不明资质的网站爬取的,当时也没太在意,毕竟觉得自己一个OIer,有什么好被爬的。
    然后直到今天,无聊把自己的博客园链接在百度搜索了一下,想看下有没有被搜索引擎收录,然后就给了我一个惊喜:

    当时还以为是自己的博客被引擎收录了,但是仔细一看之后

    尼玛为什么网址是什么mamicode???
    我用的不是博客园吗???
    进去一看,
    才明白,就是通过关键词找到我的博客然后爬取过去的。
    再看看旁边的所谓分享档案:

    这个网站每天爬取的博文达到了四五百篇之多!
    后来稍微问了一下同机房的人,发现他们的博客也被诸如下列网站爬取过博客:
    码迷,布布扣,码农教程,甚至知乎上自称“十年老码农”的某些用户!
    面对这样的情况我很生气,这样的网站不就是在未经许可的情况爬取我的博文吗?

    好在我的每篇博客下面都写了这样的版权声明,接下来将会和博客园官方反映。
    update:

    博客园还是态度很好awa,很快就删除了这篇被爬的博文。
    (以下突然神经)
    但是,

    能删这一篇,其他的呢?

    我的能够发现并删除解决,其他人的呢?

    这需要所有人对这种情况的抵制!

    抵制不良行为,需要全博客园的人一起行动!

    另外,要不也去试试你们自己的博客有没有被爬?(手动滑稽)

  • 相关阅读:
    iframe操作
    常用插件整理
    js原生的url操作函数,及使用方法。(附:下边还有jquery对url里的中文解码函数)
    espcms自定义表单邮件字段
    网页百度地图API相关资料
    css3 transition的各种ease效果
    点击按钮后延迟跳转
    js判断checkbox状态,处理表单提交事件
    js禁止网页使用右键
    jquery对url中的中文解码
  • 原文地址:https://www.cnblogs.com/moyujiang/p/11256346.html
Copyright © 2011-2022 走看看