谷云秒收录

首页 > 秒收录 > 文章资讯

什么是HTTP状态码?

我介绍了搜索引擎蜘蛛,顺便也介绍了HTTP状态码。我们说robots.txt可以限制蜘蛛抓取网站文件,那么你怎么知道蜘蛛什么时候抓取自己的网站呢:爬行的结果是什么:是抓的还是:这段HTTP状态码会告诉你,网站日记文件每天会以代码的形式统计搜索引擎的蜘蛛爬行记录,以便我们随时查看。

通常,网站日志中最常见的HTTP状态代码是200和404。

其他常见的HTTP状态代码及其含义如下:

2成功处理了请求的状态代码。

200服务器成功处理了请求,并提供了请求的网页。

204服务器成功处理了请求,但没有返回任何内容。

重定向3在每个请求中不要使用重定向超过5次。

31请求的网页已永久移动到新位置。当网址改变时,使用代码301。将新的网址保存在搜索引擎索引中。

302所请求的网页被临时移动到新位置。将原始网址保存在搜索引擎索引中。

304如果自请求者最后一次请求后网页没有更新,使用304代码告诉搜索引擎机器人,这样可以节省带宽和开销。

客户端错误4表示请求可能有误,妨碍了服务器的处理。

400服务器不理解请求的语法。

43服务器拒绝了请求。

404服务器找不到请求的网页。服务器上不存在的网页通常会返回此代码。

410在请求的资源被永久删除后,服务器返回这个响应。该代码类似于404(未找到)代码,但是当资源以前存在但现在不存在时,有时会使用它来代替404代码。如果资源已被永久删除,您应该使用301来指定资源的新位置。

服务器错误5表示服务器在处理请求时出现内部错误。这些错误可能是服务器本身的错误,而不是请求。

500服务器遇到错误,无法完成请求。

53服务器当前不可用(由于过载或维护停机)。通常,这只是一种暂时的状态。

如何阅读网站日志:

通过Ftp,你可以在根目录下看到一个包含日志的文件夹,这就是网站日志。下载,解压,里面的txt文件就是日志记录。但是,某些服务器或虚拟主机不提供日志文件。请联系主机供应商,或自行打开服务器的日志功能。

你如何看待网站日志中的搜索引擎蜘蛛:当我们介绍什么是搜索引擎蜘蛛时,我们介绍了搜索引擎蜘蛛的名称。