什么是日志文件?
日志文件是包含有关向服务器发出的每个请求的信息的文档。以及人们和搜索引擎如何与你的网站互动的细节。
下面是日志文件的样子:
如您所见,日志文件包含大量信息。所以,了解它们以及如何使用这些信息是很重要的。
在本指南中,我们将看看:
什么是日志文件分析
在SEO中使用什么日志文件分析
如何进行日志文件分析
如何确保可抓取性是一个优先事项
提示创建一个免费的Semrush账户(不需要信用卡)。
什么是日志文件分析?
日志文件分析是下载和审计站点日志文件的过程,以主动识别错误、爬行问题和其他技术SEO问题。
站点的日志文件存储在服务器上。它记录了从人、搜索引擎和其他机器人那里收到的每一个请求。
通过分析这些日志,您可以看到谷歌和其他搜索引擎如何与您的站点交互。并确定和解决任何问题,可能会影响您的网站的性能和可见性的搜索结果。
日志文件分析在SEO中有什么用?
日志文件分析是改善技术SEO的游戏规则改变者。
为什么?
因为它向您展示b谷歌如何抓取您的站点。当你知道谷歌如何抓取你的网站时,你可以优化它以获得更好的有机性能。
例如,日志文件分析可以帮助您:
查看谷歌抓取您的站点(以及最重要的页面)的频率
确定谷歌最常抓取的页面
监控爬行频率的峰值和下降
测量你的站点加载谷歌的速度
检查站点上每个页面的HTTP状态码
发现您是否有任何抓取问题或重定向
简而言之:日志文件分析为您提供了可以用于改进站点SEO的数据。
如何分析日志文件
既然我们已经了解了在SEO中进行日志文件分析的一些好处,那么让我们看看如何进行日志文件分析。
你需要:
您网站的服务器日志文件
访问日志文件分析器
请注意我们将向您展示如何使用Semrush的日志文件分析器进行日志文件分析。
访问日志文件
首先,您需要获得站点日志文件的副本。
日志文件存储在web服务器上。你需要访问它才能下载副本。访问服务器的最常见方式是通过文件传输协议(FTP)客户机,如FileZilla。
你可以在他们的网站上免费下载FileZilla。
您需要使用FTP客户端设置到服务器的新连接,并通过输入登录凭据对其进行授权。
连接之后,需要找到服务器日志文件。它的位置取决于服务器类型。
以下是您可以找到日志的三个最常见的服务器和位置:
Apache: /var/log/access_log
/ access.log Nginx:日志
IIS: % SystemDrive % \ inetpub \ logs \日志
但是检索站点的日志文件并不总是那么简单。
常见的挑战包括:
发现日志文件已被服务器管理员禁用并且不可用
巨大的文件大小
只存储最近数据的日志文件(基于天数或条目—也称为“命中数”)
如果使用多个服务器和内容交付网络(cdn),则是部分数据
也就是说,您可以通过与开发人员或服务器管理员合作轻松解决大多数问题。
如果您没有服务器访问权限,那么无论如何都需要与开发人员或IT团队进行沟通。让他们共享一份拷贝。
分析日志文件
既然您已经有了日志文件,那么就该分析它了。
您可以使用谷歌Sheets和其他工具手动分析日志文件。但这很烦人。它会变得很乱。很快。
我们建议使用日志文件分析器。
首先,确保日志文件未归档,并且采用access.log、W3C或Kinsta文件格式。
然后,将其拖放到工具中,然后单击“启动日志文件分析器”。
您将看到一个显示Googlebot活动的图表。
它显示每日点击量、不同状态码的细分以及请求的不同文件类型。
你可以利用这些见解来理解:
谷歌每天向您的站点发出多少请求
每天发现的不同HTTP状态码的分解
每天抓取的不同文件类型的细分
如果向下滚动,您将看到一个表,其中包含特定页面和文件夹的见解。
您可以根据“抓取频率”列进行排序,以查看谷歌如何花费其抓取预算。
或者,单击“状态码不一致”按钮查看状态码不一致的路径。
比如在404状态码(表示无法找到页面)和301状态码(表示永久重定向)之间切换。
使用该工具可以使服务器日志分析变得简单和直接。所以你可以花时间优化你的网站,而不是分析数据。
确保可抓取性是一个优先事项
现在您知道了如何访问和分析日志文件。但不要止步于此。
你需要采取积极的措施来确保你的网站是优化的可抓取性。
这意味着做一些高级的SEO和审核你的网站,以获得更多的数据。
例如,你可以通过网站审计来运行你的网站,看到一个包含重要建议的仪表板,如下所示:
转到“问题”选项卡,在“类别”下拉列表中选择“可抓取性”。
这些都是影响站点可抓取性的问题。
如果您不知道问题的含义或如何解决问题,请点击“为什么以及如何解决问题”以了解更多信息。
每月进行一次这样的审计。解决任何突然出现的问题。
你需要确保谷歌和其他搜索引擎可以抓取和索引你的网页,以便对它们进行排名。