SEO指南独立站URL参数处理
眼中脚下路,心中要有宏图。大家好,我是Riven@跨境男孩。这里主要分享独立站和SEO的相关知识。相互交流,共同成长。
本文共4000多字,预计阅读3分钟。
URL 参数会创建重复内容,浪费预算,稀释排名信号等。与大家分享一些避免避免的内容 URL 参数影响 SEO 的方法。
虽然参数受到开发人员和分析爱好者的喜爱,但他们对SEO并不友好。URL的参数组合可以从相同的内容中创建数百个 URL 变体。
最重要的是,我们不能简单地不使用URL参数。因为参数在网站的用户体验中起着重要的作用。因此,我们需要知道如何处理它 SEO 以友好的方式处理它们。
本文主要分享内容如下:
1:URL参数的基本知识
什么是 URL 参数?
URL参数也称为查询字符串或查询字符串 URL 变量,参数是 URL 问号后面的中跟部分。它们由一个键组成(Key)和一个值(Value)组成,用等号(=)分隔。可以使用 & 将多个参数添加到单个URL页面中的符号。
最常见的参数场景用例:
1)跟踪:如 ?utm_medium=social、?sessionid=123 或 ?affiliateid=abc
2)重新排序:如 ?sort=lowest-price、?order=highest-rated 或 ?so=newest
3)过滤:如 ?type=widget、color=blue 或 ?price-range=20-50
4)识别:如 ?product=small-blue-widget、categoryid=124 或 itemid=24AU
5)分页:如 ?page=@ ?p=2 或 viewItems=10-30
6)搜索:如 ?query=users-query、?q=users-query 或 ?search=drop-down-option
7)翻译:如 ?lang=fr、?language=de
二:URL 参数的 SEO 问题
1.参数创建重复内容
通常情况下,URL 参数不会重大改变页面内容。重新排序的页面版本通常与原始版本没有太大区别。有跟踪标志或对话 ID 网页网站与原始网页网站相同。
例如,以下Shopify网站URL 将返回热销产品列表。
静态网址:https://www.jcojewellery.com/collections/best-seller
重新排序参数:https://www.jcojewellery.com/collections/best-seller?sort=price-ascending
识别参数:https://www.jcojewellery.com/collections/best-seller?pf_t_material=925 Silverhttps://www.jcojewellery.com/collections/best-seller?pf_t_colour=metal:gold
组合参数:https://www.jcojewellery.com/collections/best-seller?sort=created-descending&pf_p_price=25.01047628:62.66253870
跟踪参数:https://www.jcojewellery.com/collections/best-seller?sessionID=32764
搜索参数:https://www.jcojewellery.com/search?q=925 Silver
这其实是相当多的相同内容 URL。现在想象一下你网站上的每个类别、颜色、材料、价格范围等。
搜索引擎将每个基于参数的搜索引擎 动态URL 它被视为一个新页面。因此,他们会看到同一页面的多个变体。所有内容都提供重复的内容,并针对相同的关键短语或语义主题。
这种重复页面不太可能被完全过滤,会导致关键字被侵蚀,可能会减少 Google 对你整体网站质量的看法,因为这些额外的 URL 实际价值不会增加。
2.参数消耗抓取预算
爬行冗余参数页面会消耗爬行预算,减少你的网站索引 SEO 增加服务器负载的相关页面能力。
Google搜索中心文档中提到了这一点:
过于复杂的 URL,特别是那些包含多个参数的人 URL,可能会创造大量不必要的东西 URL,这些 URL 在你的网站上指出相同或相似的内容,从而给爬虫带来问题。因此,Googlebot 它可能比必要的带宽消耗更多,或者它可能无法完全索引你网站上的所有内容。
3.参数拆分页面排名信号
如果你有多个排列组合相同的页面内容,社交共享链接可能会有不同的版本。
这将稀释你的URL排名信号。当URL参数混淆爬虫时,它不确定搜索索引中哪些页面具有良好的竞争力和高质量。
4.参数使 URL 可点击性降低
URL带参数不好看,很难阅读,看起来不那么值得用户信赖。因此,它们不太可能被点击。点击率会影响排名和FeedBack页面的质量。它可以在社交媒体、电子邮件、复制和粘贴到论坛或其他任何可能显示完整性 URL 点击率低的地方。
虽然这可能只会对单个页面产生一些影响,但每条推特、拇指、共享、电子邮件、链接和提到对整个域名都非常重要。此外,URL 可读性差可能导致品牌参与度下降。
三:评估参数问题的程度
了解你网站上使用的每一个参数都很重要(也可以问开发人员)。
那么如何在网站上找到所有需要处理的参数呢?介绍几种方法:
@ 运行爬虫:使用 Screaming Frog 你可以搜索像这样的工具“?” 在网址中
@ 查看您的日志文件:查看您的日志文件 Googlebot 基于参数的网站是否在捕获?
@ 使用站点搜索:inurl:高级运算符:通过将键放入 site:example.com inurl:key 组合查询,理解 Google 如何为您找到的参数编制索引?
@ 查看 Google Analytics(分析)所有页面报告:搜索“?” 查看用户如何使用您找到的每个参数。请务必检查是否没有排除在视图设置中 URL 查询参数
@ 查看 Google Search Console URL 参数工具(现已废弃):Google 它找到的查询字符串会自动添加
有了这些数据,你现在可以决定如何最好地处理你网站的每个参数了。
四:处理URL参数 SEO 解决方案
1.基于参数优化 URL
思考源头,找到减少参数 URL 从而最大限度地减少负面数量的方法 SEO 影响。有四个常见的想法:
1) 去除不必要的参数
向您的开发人员索取每个网站参数及其功能列表。您可能会发现一些没有价值功能的参数。(例如,cookie可以比较 sessionID 然而,更好地识别用户, sessionID 参数可能仍然存在于您的网站上,以前已经使用过。)
或者你可能会发现你的用户很少在分页导航中使用过滤器。应尽快优化技术问题引起的任何参数。
2) 防止空值(Value)
只有当 URL 只有当参数具有功能时,才应使用参数 URL 参数添加到 URL。如果值为空,则不允许添加参数键。在上述示例中,key2 和 key3 没有添加任何值。
3) 只使用一次密钥(Key)
避免使用具有相同参数名称和不同值的多个参数。对于多选项,最好在单键后将值组合在一起。
4) 一致的网站参数顺序
若重新排列相同的 URL 搜索引擎将页面解释为相同的参数。
因此,从重复内容的角度来看,参数顺序并不重要。但这些组合中的每一个都会消耗预算和分割排名信号。
无论用户如何选择,都要求您的开发人员编写脚本,并始终按一致的顺序放置参数以避免这些问题。
在我看来,你应该从任何翻译参数开始,然后识别,然后分页,然后过滤和重新排序或搜索参数分层,最后跟踪。
优点:
- -允许更有效地使用爬网预算
-减少重复内容的问题
-将排名信号合并到页面较少
-适用于所有参数类型
缺点:
- -技术处理时间
2.Rel="Canonical" 链接属性
rel="canonical" 链接属性表明一个页面与另一个页面具有相同或相似的内容。这鼓励搜索引擎将排名信号集成到指定的标准中 URL。
基于参数的你可以 URL rel="canonical" 到你的 SEO 友好 URL,例如,跟踪、识别或重新排序参数。然而,该策略不适用于参数页面内容不接近规范的情况,如分页、搜索、翻译或一些过滤参数。
优点:
- -技术实现相对容易
- -很有可能防止重复内容问题
- -将排名信号整合到规范中 URL
缺点:
- -浪费在参数页面上爬行预算
- -不适用于所有参数类型
- -被搜索引擎解释为强烈的提示,而不是指令
3.Meta Robots Noindex 标签
不添加任何东西 SEO 基于参数的页面设置的价值 noindex 指令。这个标签将阻止搜索引擎将页面编入索引。
带有"noindex"标签的 URL 如果它存在很长一段时间,它也可能被抓得不那么频繁,最终会导致 Google 不要注意页面的链接。
优点:
- -技术实现相对容易
- -很有可能防止重复内容问题
- -适用于所有你不想被索引的参数类型
- -从索引中删除现有基于参数的参数 URL
缺点:
- -不会阻止搜索引擎抓取 URL,但它会鼓励他们减少这样做的频率
- -排名信号不整合
- -被搜索引擎解释为强烈的提示,而不是指令
4.Robots.txt 不允许
User-agent: *Disallow: /collections/*sort_by*Disallow: /*/collections/*sort_by*Disallow: /collections/* *Disallow: /collections/*+*Disallow: /collections/*+*Disallow: /*/collections/* *Disallow: /*/collections/*+*Disallow: /*/collections/*+*Disallow: /blogs/* *Disallow: /blogs/*+*Disallow: /blogs/*+*Disallow: /*/blogs/* *Disallow: /*/blogs/*+*Disallow: /*/blogs/*+*Disallow: /*?*oseid=*Disallow: /*preview_theme_id*Disallow: /*preview_script_id*Disallow: /*/*?*oseid=*Disallow: /*preview_theme_id*Disallow: /*preview_script_id*Disallow: /*/*?*ls=*&ls=*Disallow: /*/*?*ls=*?ls=*Disallow: /*/*?*ls=*?ls=*Disallow: /search# Google adsbot ignores robots.txt unless specifically named!User-agent: adsbot-googleDisallow: /*?*oseid=*Disallow: /*preview_theme_id*Disallow: /*preview_script_id*
robots.txt 文件是搜索引擎在抓取你的网站之前查看的第一个文件。如果他们不允许看到任何东西,他们就不会收集它们。
您可以使用此文件来防止爬虫访问每个基于参数的参数 URL(使用 Disallow: /**)或者只是阻止你不想被索引的特定查询字符串。
假如你选择用Shopify或Shopline建站,那么这些都已经处理好了,商家不需要处理。
优点:
- -实现简单的技术
- -允许更有效地使用爬网预算
- -避免重复内容问题
- -适用于所有你不想被捕获的参数类型
缺点:
- -排名信号不整合
- -不要从索引中删除现有 URL
5.Google Search Console URL 参数工具
在2022年3月之前,支持配置 Google 的 URL 参数工具,告诉抓取你的参数的目的,以及你想如何处理它们。
但在Google2022年3月发布的更新中,指出:
多年来,谷歌一直在猜测哪些参数在网站上有用,哪些参数在无用方面变得更好。事实上,现在在 URL Parameters 只有工具中指定的参数配置 1% 对爬行有用。因为这个工具是对的 Google 和 Search Console 我们将在用户价值低的时候 1 个月内弃用 URL 参数工具。未来,你不需要在网站上指定 URL 参数的功能,Google 爬虫将学习如何自动处理 URL 参数。
6.从动态 URL 转移到静态 URL
很多人认为处理 URL 最好的参数方法是首先避免使用它们。毕竟,子文件夹的形式比参数更好,以帮助谷歌理解网站结构。基于关键字的静态 URL 一直是页面 SEO 基本标准。
为此,您可以使用服务器端 URL 重写将参数转换为子文件夹 URL。
例如,网站:
www.example.com/view-product?id=482794
会处理为:
www.example.com/widgets/blue
该方法适用于基于关键字的描述性参数,如识别类别、产品或过滤搜索引擎相关属性的参数,也可用于翻译版本内容。
但是对于非关键词相关元素(如价格)的分面导航,就会出现问题。有静态和可索引的 URL 这样的过滤器没有提供 SEO 价值。
这也是搜索参数的一个问题,因为每个用户生成的查询都会创建一个静态页面,并与标准页面竞争排名。更糟糕的是,每当用户搜索你不提供的页面时,他们都会向爬虫展示低质量的内容页面。(事实上,Shopify和Shopline将Search disallow处理url)
虽然WordPressss应用于分页有点奇怪 并不少见),它会给出一个 URL,例如:
www.example.com/widgets/blue/page2
URL静态化后会很奇怪,会给出一个 URL,例如:
www.example.com/widgets/blue/lowest-price
因此,对于您不希望在搜索结果中被索引的参数(分页、重新排序、跟踪等),将其作为查询字符串实现。静态可用于您确实需要编写索引的参数 URL 路径。
优点:
- -爬虫的重点是基于参数的 URL 转移到更有可能排名的静态 URL
缺点:
- -URL 重写和 301 投入大量的重定向开发时间
- -不能防止重复的内容问题
- -排名信号不整合
- -不适用于所有参数类型
- -可能会导致内容稀缺的问题
- -并不总是提供可链接或可收集的链接 URL
五:SEO 的最佳实践 URL 参数处理
那么应该实施哪一种呢? SEO 哪一种策略?不可能采取所有的策略。所有的使用都会变得更加复杂或相互冲突。例如,如果你这样做了 robots.txt 禁止,Google 我将看不到任何metata noindex 标记;也不应该 meta noindex 标记与 rel=结合使用canonical链接属性。)
事实上,没有完美的解决方案。在某些情况下,爬行效率比巩固权威信号更重要。
最后,你的网站选择什么样的方式取决于你的优先级。
总结,对于 SEO 友好参数处理建议 :
1)研究关键词,了解搜索引擎应该友好的静态参数是什么 URL
2)使用rel="next" & rel="prev“实现正确的分页处理
3)通过去除不必要的参数来缩短 URL,同时,所有剩余的基于参数 URL,实施一致的排序规则,该规则只使用一次键(Key)并防止空值(Value)以限制 URL 的数量
4)将 rel="canonical" 将链接属性添加到适当的参数页面中,将排名信号集成到标准页面中
5)仔细检查 XML 基于参数的网站地图是否提交了? URL
6)考虑使用 robots.txt 文件来阻止 Googlebot 访问有问题的网站。通常,考虑阻止动态 URL,例如,生成搜索结果 URL,或者可以创造无限的空间 URL,例如日历。在 robots.txt 在文件中使用正则表达式可以让你很容易地阻止很多 URL
7)尽量避免在场 URL 中使用会话 ID,考虑改用 cookie
8)如果您的网站有无限日历,则添加链接“nofollow"属性
Meta Robots Noindex 标签 优化基于参数的 URL 优点 参数使 URL 的可点击性降低 参数创建重复内容 参数拆分页面排名信号 参数消耗抓取预算 最常见的参数场景用例 缺点