zoukankan      html  css  js  c++  java
  • 刷(增加)网站或博客文章访问量

      背景:好朋友的公益性网站临时有个访问量需求,让方式越简单越好。

      方法:(注:以下内容均为研究过程中发现的该需求相关内容整理,均可百度查询到,没啥技术含量 )

        1、部分浏览器自带工具中的网页自动刷新功能。优点是简单直接用,缺点是占用内存较大。如QQ浏览器打开特定网页后-右上角菜单-工具-自动刷新(如下图),可设置刷新间隔的时间。间隔时间设置多少比较好呢?至少等页面加载完毕后,或更长时间间隔。可同时开多个页面同时刷新,最多能开几个看电脑性能。360安全浏览器也有这功能,使用方式相同,但内存优化相比不太行,经简单实验对比发现还是QQ浏览器占用内存相对较少,对比数据如下:

          浏览器菜单-工具-自动刷新页面,一个页面间隔5秒刷新一次:

          QQ浏览器,版本号10.7(4341),内核版本Chromium70.0.3538.25/IE11.356.18362.0
            百度搜索首页(未登陆),占用内存170M~190M;
            哔哩哔哩首页(未登陆),占用内存230M~280M;若开两个页面刷新占用内存280M~320M。
          360安全浏览器,版本号12.2.1920.0,内核版本78.0.3904.108
            百度搜索首页(未登陆),占用内存220M~240M;
            哔哩哔哩首页(未登陆),占用内存320M~340M;若开两个页面刷新占用内存390M~410M。

          还有:手机QQ浏览器也有这功能,设置不熄屏,插上电,也能一直刷。

        2、浏览器网页自动刷新插件。优点是相较于程序脚本简单些,缺点还是占用内存较大且需自己安装扩展插件。以谷歌浏览器为案例,在谷歌扩展商店中(chrome.google.com需FQ)中搜索关键字“auto refresh”或“网页自动刷新”找一个免费且下载次数较多的用就行。这里我测试使用的是一个叫“标签自动刷新”或“tab-auto-refresh”的扩展程序,https://chrome.google.com/webstore/detail/tab-auto-refresh/oomoeacogjkolheacgdkkkhbjipaomkn 需FQ且可能链接会失效,131kb,添加该扩展程序后打开网页点击该插件选择刷新间隔时间就好了,插件挺好用(如下图)。内存占用情况简单测试如下:

          谷歌浏览器,版本号89.0.4389.82(正式版本)(64 位)
            百度搜索首页(未登陆),占用内存80M~90M;
            哔哩哔哩首页(未登陆),占用内存190M~220M;若开两个页面刷新占用内存270M~300M。

        3、脚本程序。用node.js或Python或其他合适的语言都可以,做爬虫或模拟发包浏览器访问过程。优点:占用内存少且快速可大批量。以Python模拟浏览器访问为例,该方式也最简单,代码量少。

          用Python该方法经简单测试3个哔哩哔哩首页(未登陆)间隔70秒自动访问,占用内存27M~30M。该方式本来是原作者 yzy_1996 用来提升CSDN博客文章阅读量的,现在对CSDN已经失效了!且原作者也不再更新,大家在使用之前先测试下 对应你的网站 需求是否有效,若检测机制较严格可能也没效果。Python代码参考如下:(小白提醒:电脑要安装有Python才能运行哈,下载地址https://www.python.org/getit/)

    # 该程序原本实现刷CSDN网页访问量,当访问被拒绝或者遇到其他异常时会自动重启,无限刷,现对CSDN已失效。
    # 当时经过测试发现大概间隔70秒访问一下,访问量才会增加1,现对CSDN已失效。
    # 只需要修改或添加url的链接就可以了(测试用的原作者CSDN文章链接)
    import requests
    import time
    url = ['https://blog.csdn.net/yzy_1996/article/details/81951189',
           'https://blog.csdn.net/yzy_1996/article/details/85318705',
           'https://blog.csdn.net/yzy_1996/article/details/86992770']
    # 浏览器User-Agent 
    headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.5959.400 SLBrowser/10.0.3544.400'}   
    count = 0
    countUrl = len(url)
    # 访问次数设置
    for i in range(1,1000):
        if count < 10000:
            try:  # 正常运行
                for i in range(countUrl):
                    response = requests.get(url[i], headers=headers)
                    if response.status_code == 200:
                        count = count + 1
                        print('Success ' + str(count), 'times')    
                time.sleep(70) # 访问间隔时间秒
            except Exception:  # 异常
                print('Failed and Retry')
                time.sleep(60) # 异常重启时间秒

          若没啥效果,也可尝试更换代码中 headers 浏览器User-Agent值。在谷歌浏览器或Edge浏览器地址栏中输入 about:version,或在火狐浏览器地址栏中输入 about:support,在显示的页面中找到用户代理的值就是,进行替换尝试,若再不行应该就是检测机制较严格被忽略或限制了,可尝试改用爬虫等其他程序方式,详请百度,就不再赘述。另:IE 浏览器目前对大部分about协议项都不支持,提示已取消网页导航,仅支持blank等几项,没查询到IE的用户代理值。欧朋浏览器我没看,欢迎知道的小伙伴评论补充下。

          这里 headers 中 User-Agent值 的作用是 伪装 浏览器,假装我们也是浏览器访问的,原需求网站会识别访问对象是程序还是浏览器。

          上述 Python 代码参考原作者 yzy_1996 https://blog.csdn.net/yzy_1996/article/details/81951189

          node.js程序脚本可参考作者 拿我格子衫来 https://blog.csdn.net/github_35631540/article/details/88259325。(这个我没测试行不行哈~看代码还可优化~)

       刷数据 可能 带来的某些问题:

        1、资源和带宽占用升高。承载服务的配置略低,或网络带宽偏低,刷的时候可能会资源或带宽占用跑满,短期内导致请求加载缓慢或失败。

        2、防火墙拦截。某些服务运营商会配置防火墙防流量攻击策略,或硬件或系统自带的防火墙软件策略,单纯跑脚本同一IP地址短时间内多次大流量访问会容易被拦截,刷一会儿会发现脚本请求无响应或出错啥的,再次启动一会后也一样会停下来。

      另外:有些网友想刷新博客文章的浏览量,不同的博客系统对浏览量+1的条件是不同的,例如博客园、CSDN博客、wordpress自己搭建的博客等等,有的有访问IP限制(博客园)、访问时间限制(CSDN)、访问机器脚本识别等,不是随便就能刷上数量的。wordpress用插件WP-postview显示阅读量时,可后台设置增加阅读量的限制条件或不限制,且发现可以直接后台修改阅读量数字,详请可百度“WP-PostViews插件修改阅读量”查看,下面是我整理自网络的。

      WP-PostViews插件修改阅读量:

        该方式需单独修改每篇文章的浏览数,若想统一批量设置或随机增加,可百度谷歌具体方法学习使用哈,这里就简单说下手动修改的简单方式。

        进入文章编辑页面,在编辑器下方找到 自定义栏目,在自定义栏目里面找到 views字段,修改后面的数字,即阅读量,再点击更新,如图:

         若没有找到自定义栏目,可点击页面右上角的显示选项,勾选自定义栏目,如图:

        WP-PostViews插件其他设置:可进 后台 -设置 -> PostViews,推荐设置一下,有几个选项会影响到统计数量:
          Count Views From:推荐选 Everyone,之后所有进入文章的访问都可以被统计;
          Exclude Bot Views:推荐选 No,该选项可设置是否排除爬虫的访问,若想多增加些阅读数的话还是建议关闭排除功能(即爬虫访问次数也算)。

         WP-PostViews插件数据修改参考文章  https://www.wpcom.cn/tutorial/145.html

       最后,朋友的公益性网站:上海美术馆、博物馆活动信息(日语)  http://www.exhibitionshanghai.com/  由上海同济大学日语专业的学生们开发,主要适配了移动端,为促进中日学生历史文化艺术交流。

    小伙伴们如有更好解决方式或发现错误,欢迎来评论补充或纠正~~~谢谢 (^ - ^ )

  • 相关阅读:
    字符串的不可变性--转载
    this的作用--转载
    构造函数
    根基决定一个程序员会不会被淘汰 --转载
    BAT-使用BAT方法清理Delphi临时文件
    键盘,鼠标,文件
    画布.画笔.画刷
    Delphi外挂开发网站
    教程-经典Delphi教程网
    教程-Delphi各版本与工具下载地址
  • 原文地址:https://www.cnblogs.com/dengfenglai/p/14519170.html
Copyright © 2011-2022 走看看