zoukankan      html  css  js  c++  java
  • IIS W3C日志记录字段和HTTP状态代码的说明

    一般情况下很多朋友都不在意IIS日志,有的是因为购买的虚拟主机不给提供,有的是提供了,但是还必须与服务器管理员联系才能得到。像新网的部分服务器ftp目录有这个文件,但是就是提示没权限查看也没有权限下载,还得必须给他们打电话才能要到。

      做为网站拥有者,我们应该关注IIS日志,从里面我们不仅仅可以看到网站的访问记录和搜索引擎的抓取记录,还可以看到哪些网站盗链本站的哪些资源、部分死链接以及其他出错信息。其实对于我们来说,蜘蛛抓取记录和相关出错信息是我们最想关注的。哪些蜘蛛什么时间抓取了什么页面,返回的什么结果,是否正常,都可以从日志里清楚的看到。

      下面说说IIS W3C格式日志中记录的字段及说明(一般都是选择的W3C格式日志)。

      date:发出请求时候的日期。
      time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。
      c-ip:客户端IP地址。
      cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。
      s-sitename:服务名,记录当记录事件运行于客户端上的Internet服务的名称和实例的编号。
      s-computername:服务器的名称。
      s-ip:服务器的IP地址。
      s-port:为服务配置的服务器端口号。
      cs-method:请求中使用的HTTP方法,GET/POST。
      cs-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。
      cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接符-表示。即访问网址的附带参数。
      sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。
      sc-substatus:协议子状态,记录HTTP子状态代码。
      sc-win32-status:Win32状态,记录Windows状态代码,参照chxwei博客上前几天发的日志“IIS中的sc-win32-status——Win32状态详细说明”的说明。
      sc-bytes:服务器发送的字节数。
      cs-bytes:服务器接受的字节数。
      time-taken:记录操作所花费的时间,单位是毫秒。
      cs-version:记录客户端使用的协议版本,HTTP或者FTP。
      cs-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,原因是HTTP.sys使用Punycode编码格式来记录主机名。
      cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。
      cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。
      cs(Referer):引用站点,即访问来源。

      附一:IIS日志的时间问题

      GMT时间就是英国格林威治时间,也就是世界标准时间,是本初子午线上的地方时,是0时区的区时,与我国的标准时间北京时间(东八区)相差8小时,即晚8小时。

      附二:HTTP状态代码:

      概括:

      1**:表示请求收到,继续处理
      2**:表示操作成功收到,分析、接受
      3**:表示完成此请求必须进一步处理
      4**:表示请求包含一个错误语法或不能完成
      5**:表示服务器执行一个完全有效请求失败

      详细代码说明:

      100——客户必须继续发出请求
      101——客户要求服务器根据请求转换HTTP协议版本

      200——交易成功
      201——提示知道新文件的URL
      202——接受和处理、但处理未完成
      203——返回信息不确定或不完整
      204——请求收到,但返回信息为空
      205——服务器完成了请求,用户代理必须复位当前已经浏览过的文件
      206——服务器已经完成了部分用户的GET请求

      300——请求的资源可在多处得到
      301——删除请求数据
      302——在其他地址发现了请求数据
      303——建议客户访问其他URL或访问方式
      304——客户端已经执行了GET,但文件未变化
      305——请求的资源必须从服务器指定的地址得到
      306——前一版本HTTP中使用的代码,现行版本中不再使用
      307——申明请求的资源临时性删除

      400——错误请求,如语法错误
      401——请求授权失败
      402——保留有效ChargeTo头响应
      403——请求不允许
      404——没有发现文件、查询或URl
      405——用户在Request-Line字段定义的方法不允许
      406——根据用户发送的Accept拖,请求资源不可访问
      407——类似401,用户必须首先在代理服务器上得到授权
      408——客户端没有在用户指定的饿时间内完成请求
      409——对当前资源状态,请求不能完成
      410——服务器上不再有此资源且无进一步的参考地址
      411——服务器拒绝用户定义的Content-Length属性请求
      412——一个或多个请求头字段在当前请求中错误
      413——请求的资源大于服务器允许的大小
      414——请求的资源URL长于服务器允许的长度
      415——请求资源不支持请求项目格式
      416——请求中包含Range请求头字段,在当前请求资源范围内没有range指示值,请求也不包含If-Range请求头字段
      417——服务器不满足请求Expect头字段指定的期望值,如果是代理服务器,可能是下一级服务器不能满足请求

      500——服务器产生内部错误
      501——服务器不支持请求的函数
      502——服务器暂时不可用,有时是为了防止发生系统过载
      503——服务器过载或暂停维修
      504——关口过载,服务器使用另一个关口或服务来响应用户,等待时间设定值较长
      505——服务器不支持或拒绝支请求头中指定的HTTP版本

  • 相关阅读:
    NuGet文件下载与应用
    两款Mongodb可视化工具
    原创 | 入门数据分析--SQL常用操作(+提取数据实例)
    原创 | 入门数据分析--数据存储之常用数据库及区别
    原创 | 入门数据分析--如何获取外部数据(+python爬虫实例)?
    原创 | 入门数据分析--如何建立需求解决框架?
    原创 | 入门数据分析--如何进行需求判定?
    原创 | 入门数据分析--如何更好的理解业务?
    原创 | 如何入门数据分析?
    原创 | 数据分析师的前景如何?
  • 原文地址:https://www.cnblogs.com/henryhappier/p/1656146.html
Copyright © 2011-2022 走看看