幸运的是,创建XML站点地图并将其提交到谷歌既快速又容易。
下面,我们一步一步地介绍如何做到这一点。
但首先,让我们了解一些基础知识。
(已经知道基本知识了吗?单击可直接跳转到创建站点地图。)
SEO新手?查看我们的seo基础指南
什么是站点地图?
站点地图是一个XML文件,列出了网站上所有重要的内容。你想在搜索引擎中显示的任何页面或文件都应该在你的站点地图中。
有趣的事实
站点地图不能列出超过50,000个url,并且它们的大小不能超过50mb。如果您的站点地图超过了这些数字中的一个或多个,那么您需要创建多个数字。
XML站点地图是什么样的?
XML站点地图是为搜索引擎制作的,不是为人类制作的。如果你以前从未见过它们,它们可能看起来有点吓人。
< ?xml version=“1.0“ encoding=“UTF-8“?>
让我们来分析一下。
XML声明
< ?xml version=“1.0“ encoding=“UTF-8“?>
这告诉搜索引擎他们正在读取XML文件。它还说明了使用的XML版本和字符编码。对于站点地图,版本应该是1.0,编码必须是UTF-8。
URL设置
< urlset xmlns = “ http://www.sitemaps.org/schemas/sitemap/0.9 “ >
这是站点地图中所有url的容器。它还告诉爬虫使用哪种协议标准。大多数站点地图都指定了Sitemap 0.90标准,该标准由b谷歌、Yahoo!微软等。
URL
这是每个URL的父标记。您必须在嵌套的 标记中指定URL的位置。至关重要的是,这些url必须是绝对的,而不是相对的规范url。
虽然这是这里唯一必需的标签,但还有一些可选的属性:
< lastmod >:文件最后修改的日期。这必须是W3C Datetime格式。例如,如果您在2019年9月25日更新了一篇文章,则该属性将读取2019-09-25。您还可以包括时间,但这是可选的。
< >优先:指定URL相对于站点上所有其他URL的优先级。取值范围在0.0到1.0之间。越高越重要。
< changefreq >:指定该页可能更改的频率。它的工作是给搜索引擎一些想法,关于他们可能需要多久重新抓取URL。这里的有效值是总是,每小时,每天,每周,每月,每年,从来没有.
这些可选标签对SEO来说都不是那么重要。
对于 ,谷歌的Gary Ilyes表示,他们在大多数情况下忽略它,因为“网站管理员在保持其准确性方面做得很糟糕。”由于大多数站点地图生成器将此设置为所有页面的当前日期,而不是文件最后修改的日期,因此很容易理解原因。
对于 ,谷歌表示他们忽略这个标签,因为它只是一个“噪音包”。
对于 , John Mueller说:“优先级和更改频率在Sitemaps中已经不再起那么大的作用了。”
为什么我需要一个站点地图?
谷歌通过抓取网络发现新内容。当他们抓取页面时,他们会同时注意页面上的内部和外部链接。如果发现的URL不在他们的搜索索引中,他们可以解析其内容并在适当的地方对其进行索引。
但是谷歌不能用这种方式找到所有的内容。如果一个网页没有链接到其他已知的网页,他们就找不到它。
这就是站点地图的用武之地。
站点地图告诉b谷歌(和其他搜索引擎)在你的网站上哪里可以找到最重要的页面,这样他们就可以抓取和索引这些页面。
这很重要,因为搜索引擎无法在没有索引的情况下对你的内容进行排名。
如何创建站点地图
有些CMS会为您生成站点地图。当您从网站添加或删除页面和帖子时,这些信息会自动更新。如果你的CMS不能做到这一点,那么通常有一个插件可以做到。
在WordPress中创建站点地图
即使WordPress支持34.5%的网站,它也不会为你生成站点地图。要创建一个,你需要使用像Yoast SEO这样的插件。
要安装Yoast SEO,登录你的WordPress仪表板。
转到插件b>添加新。
搜索“Yoast SEO”。
在第一个结果中点击“立即安装”,然后点击“激活”。
去SEO >一般>功能。确保打开“XML站点地图”开关。
现在您应该在yourdomain.com/sitemap.xml或yourdomain.com/sitemap_index.xml上看到您的站点地图(或站点地图索引)。
旁注。如果您的WordPress安装在子文件夹或子域中,那么您的站点地图就位于该路径下。例如,我们博客的站点地图可以在ahrefs.com/blog/sitemap_index.xml.TIP上访问
如果你想从站点地图中包含或排除某些类型的内容(标签页面、分类页面等),请转到“搜索外观”设置。
您还可以从编辑器的“高级”元框中排除个别帖子或页面。
重要的。只从站点地图中排除那些你不想在搜索结果中显示的页面。
在我们的WordPress SEO指南中了解更多。
在Wix中创建站点地图
Wix自动为您创建站点地图。你可以在yourwixsite.com/sitemap.xml找到它。
不幸的是,您无法控制哪些页面包含在站点地图中,哪些页面不包含在站点地图中。如果你想要排除一个页面,前往页面的“SEO (b谷歌)”设置选项卡,并关闭“在搜索结果中显示此页面”开关。
请注意,这还会向页面添加一个noindex元标记,从而将其排除在搜索结果中。
旁注。如果在Wix中规范化一个URL,它不会从站点地图中删除它。虽然这可能不会影响大多数用户,但请注意,在站点地图中包含规范化页面并不是最佳实践,并且可能会向谷歌发送混合信号。
创建一个站点地图在Squarespace
Squarespace也会自动为你创建一个站点地图。你通常可以在yoursquarespacesite.com/sitemap.xml找到它。
没有办法在Squarespace手动编辑你的站点地图,尽管你可以在“SEO”选项卡中从搜索引擎中排除(无索引)页面。
这也会将该页面从站点地图中排除。
在Shopify中创建站点地图
Shopify会自动为你生成一个站点地图。请访问yourstore.com/sitemap.xml。
不幸的是,在Shopify中没有简单的方法来删除页面索引。您必须直接编辑.liquid文件中的代码。
创建一个没有CMS的站点地图
如果你觉得你网站上的页面少于300个,那就安装尖叫青蛙的免费版本吧。
安装完成后,转到Mode b> Spider。
将你的主页网址粘贴到“输入网址到蜘蛛”的框中。
点击“开始”。
旁注。确保使用主页的规范(主)版本。如果你不这样做,尖叫青蛙将只抓取一个URL。
爬行完成后,看看右下角。
它会这样说:
如果编号为499或以下,请转到Sitemaps > XML sitemap。
因为谷歌不太关注 、 和 ,所以我们建议将它们从站点地图文件中排除。
点击“下一步”并将站点地图保存到您的计算机。完成了。
如果数字显示“500的500”,那么导出站点地图就没有意义了。为什么?因为这意味着在它爬遍你网站上的所有页面之前,你已经达到了抓取限制。因此,导出的站点地图可能会丢失数百个页面——这使得它变得相当无用。
解决这个问题的一个方法是寻找一个免费的站点地图创建者。有很多。
不幸的是,大多数都不可靠。
我们测试了一些最流行的生成器,发现相当多的生成器包含非规范url、无索引页面和重定向。这是糟糕的SEO实践。
发电机 包括规范化的url ? 包括没有索引的url ? 包括重定向?
xml-sitemaps.com 是的? 没有? 没有?
web-site-map.com 是的? 没有? 没有?
xmlsitemapgenerator.org 是的? 没有? 没有?
smallseotools.com/xml-sitemap-generator 是的? 是的? 是的?
freesitemapgenerator.com 是的? 是的? 是的?
duplichecker.com/xml-sitemap-generator.php 是的? 是的? 是的?
xsitemap.com 是的? 是的? 是的?
那么解决方案是什么呢?
如果尖叫青蛙未能抓取您的整个网站,请使用SEO研究院网站审计抓取您的网站。
https://www.youtube.com/watch?v=LjinWqfGyVE
旁注。验证您的网站,以便更快地爬行。这是如何。
一旦抓取完成,转到页面资源管理器并添加这些过滤器。
点击Export >当前表视图。
打开CSV文件,然后将URL列中的所有URL复制并粘贴到此工具中。
点击“添加到队列”,然后点击“将队列导出为sitemap.xml”。
这个文件是您完整的站点地图。
如何提交站点地图到b谷歌
首先,你需要知道你的站点地图在哪里。
如果您使用插件,URL可能是domain.com/sitemap.xml。
如果你是手工做的,把你的站点地图命名为sitemap.xml,然后上传到你网站的根文件夹。然后,您应该能够在domain.com/sitemap.xml上访问站点地图。
旁注。您可以为站点地图选择任何名称,但坚持使用sitemap.xml是一种良好的做法。如果有多个站点地图,可以使用简单的命名方案,如sitemap_1.xml、sitemap_2.xml。
进入谷歌搜索控制台>站点地图>粘贴到站点地图位置>点击“提交”
就是这样。完成了。
提示
将站点地图URL添加到robots.txt文件中也是一种很好的做法。
您可以在web服务器的根目录中找到该文件。要添加站点地图,打开文件并粘贴这一行:
网站地图:https://www.yourdomain.com/sitemap.xml
您需要将示例URL替换为站点地图的位置。
如果您有多个站点地图,只需添加多行即可。
Sitemap: https://www.asos.com/sitemap_1.xml
Sitemap: https://www.asos.com/sitemap_2.xml
修复影响站点地图的常见网站错误
谷歌搜索控制台告诉您与站点地图相关的大多数技术错误。
例如,这里有一个警告,我们提交的一个url被robots.txt阻止了:
您可以在这里了解更多关于这些问题以及如何解决它们的信息。
也就是说,b谷歌并没有告诉你一些问题。
下面是几个比较常见的错误,以及如何找到和修复它们。
站点地图中无用的、低质量的页面
站点地图中的每个页面现在都应该是可索引和规范的。
不幸的是,这并不意味着所有这些页面都是高质量的。如果你有很多内容,一些低质量的页面可能会进入你的站点地图。
例如,看看电子商务网站上的这两个页面:
这两个页面对搜索者来说都没有价值,但它们仍然在该网站的站点地图中,谷歌将这两个页面都编入了索引。
要查找这些页面,请转到站点审计>重复内容
寻找没有规范的重复和近乎重复的页面集群。这些是橙色的方块。单击其中一个可查看该组中的所有页面。
检查这些页面,看看它们是否有价值。
在你的网站上有低质量的页面是不好的,原因有三:
他们浪费了爬行预算. 让谷歌浪费时间和资源来抓取无用的、低质量的页面是不理想的。他们可以把时间花在抓取更重要的内容上。(b谷歌声明爬行预算“不是大多数发行商需要担心的问题”。)
他们从更重要的页面“窃取”链接权限。网页的权威性与其排名之间存在明显的相关性。指向低质量页面的内部链接只会削弱可能流向更重要页面的权限。(有趣的是,当我们删除SEO研究院博客上近三分之一的帖子时,我们发现流量增加了,而不是减少了。)
它们会导致糟糕的用户体验。访问者登陆这些页面是没有价值的。访问者点击它们是很烦人的,如果他们觉得你的网站质量很低,被忽视了,他们可能会跳出来。
总而言之,最好的做法是从你的网站上删除低质量的内容,然后是你的站点地图。如果要这样做,还应该记得删除指向这些页面的所有内部链接。如果做不到这一点,你就会把一个问题(低质量的页面)换成另一个问题(断开的链接)。
除了重复和近似重复之外,您还可以查找内容较少的页面。
只需检查网站审计中的“On page”报告中有“低字数”警告的页面。
意外从站点地图中排除的页面
如果您使用上述任何推荐的方法来创建站点地图,那么没有索引或规范标记(非自引用)的页面将不会被包含在内。
这是一件好事。您不应该在站点地图中包含规范化的url或没有索引的页面。
也就是说,如果你的网站上有恶意的noindex标签,页面可能会意外地被排除在外。
要检查错误,请前往站点审计中的“可索引性”报告,然后单击“无索引页”警告。这将显示所有未索引的页面。
其中大多数可能会故意没有索引,但值得浏览列表以再次检查。通常,恶意的noindex标签很容易被发现,因为它们会出现在网站的整个子部分。
如果你看到任何不应该被noindex索引的页面,从页面中删除noindex标签,并将其添加到站点地图中。如果您使用CMS或插件,那么这应该自动发生。
专业技巧
它也值得检查流氓规范和重定向。要做到这一点,请转到数据资源管理器并添加这些过滤器:
检查流氓正典。
检查恶意重定向。
删除任何违规规范和重定向,然后将受影响的页面添加到您的站点地图。
常见问题
以下是一些关于站点地图的常见问题的答案。如果您有问题没有在本节中回答,请告诉我们,我们将添加它。
您需要AMP页面的站点地图吗?
不。
如何为电子商务网站创建站点地图?
为电子商务网站创建站点地图的方法与为任何站点创建站点地图的方法相同。也就是说,检查电子商务网站上的重复和近乎重复的页面是值得的,因为这些页面经常在网上大规模地滑过,这要归功于分面导航的乐趣。
最终的想法
创建一个站点地图并不是什么火箭科学,特别是如果你使用的是一个插件,它可以帮你完成繁重的工作。从零开始创建一个也不难——只需要抓取您的站点并格式化生成的url列表。
也就是说,重要的是要记住谷歌不一定要索引站点地图中的页面。站点地图与排名无关。
如果你想在谷歌排名更高,请阅读这篇文章。
有问题吗?在评论或推特上喊我吧。