本章的主要内容是关于网站结构的优化。我先在河南的飞机上看了一遍,今天又看了一遍。总的来说,对于小白来说(虽然我也是小白TAT),因为涉及到很多专业术语和代码,比较复杂枯燥。
其实我们大多数人都是用shopify和wordpress建站的。书中列出的问题很多,我们不会遇到,所以我会尽量把重点写下来,省略一些复杂繁琐的东西。
废话不多说,开始吧~
很多人可能不知道什么是网站结构。我自己的理解是这样的:
事实上,我们的网站是由许多页面组成的。在实际上网的过程中,我们在不同的页面之间跳转——就像我们在读一本书一样。想象一下,当我们打开一本书时,首先有一个非常详细的介绍,告诉我们第一章的内容是什么,第一章的内容是从几页到几页。由于清晰的目录和页面排版,你可以根据自己的喜好随意翻到你想看的页面。所以如果我撕下这本书的每一页,最后随意粘贴在一起,那么这本书就会看起来很乱,因为你找不到你想读的东西,即使你找到了,也许你读了一页,但发现第二页不是上一页的连接。
所以从上面的例子中我们可以看到,我们的网站也应该像一本整洁和逻辑的书,第一页是什么,第二页是什么,第一章应该说什么,应该有一个清晰的结构,客户进入我们的网站可以找到他想要的内容或产品。
@ 优化网站结构的目的
1.用户体验
网站结构优化的主要目的是让用户在访问网站时清楚地知道他们在哪个页面,页面上有什么内容,以及如何点击他们想要访问的其他页面。同时,用户在网站上的行为也将包含在排名算法中。
2.收录
一个好的网站结构有利于搜索引擎的收录。我们搜索引擎优化的整个目的是尽可能促进搜索引擎收录网站页面。
3.权重分配
除了外部链接可以给一个页面带来权重外,网站本身的结构和链接关系也是内部页面权重分配的一个重要因素。我们应该有趣地规划网站所有页面的重要性,然后通过链接结构将权重引向更重要的页面。
4.锚文字
锚文本是排名算法的重要组成部分。我们可以控制网站内的锚文本,所有这些都是增加关键字相关性的方法之一。在这方面,我们可以从维基百科全书中学到更多。
@ 对搜索引擎友好的网站设计
如果我们从搜索引擎的角度看一个网站,当搜索引擎抓取、索引、排名时会遇到什么问题?解决这些问题表明,我们的网站对搜索引擎很友好。
1.搜索引擎能找到网页吗?
如果你想让搜索引擎蜘蛛找到一个网页,你首先需要一个外部链接。当搜索蜘蛛沿着外部链接进入我们的网站时,我们必须有一个良好的结构才能让蜘蛛爬到我们更多的网页。网站中的所有页面最终点击主页不超过4-5次。
2.找到网页后能否抓取页面内容?
URL包含太多的参数,整个页面是Flash,框架结构,可疑的转向,大量复制的内容,都可能使蜘蛛不愿意抓取。
3.抓取页面后如何提取有用的信息?
关键词在页面重要位置的合理分布、重要标签的编写、HTML代码的简化和至少的兼容性都有助于搜索引擎理解和提炼重要信息。这部分内容将在以后的“页面优化”中重新启动。
@ 避免蜘蛛陷阱
一些网站的设计对搜索引擎非常不友好,这些技术被称为蜘蛛陷阱,主要包括以下几点:
1.Flash
绝大多数网页都是Flash,这对搜索引擎抓取和理解页面内容非常不利。
2.Session ID
有些网站会使用sessionn 跟踪用户访问id会导致URL变化,不利于蜘蛛抓取。应该用cookie代替。
3.各种跳转
搜索引擎不喜欢任何其他形式的跳转,除了301跳转。
4.框架结构
我不明白这个解释。但作者说,如果我不知道框架结构是什么,恭喜我,我避免了这个陷阱。。。嗯,我第一次因为无知而得到祝福。
5.动态URL
该网站的网站由问号、等号、参数等数据库驱动。这种动态URL对客户和蜘蛛都不友好。
6.JavaScript链接链接
使用javascript可以产生有吸引力的视觉效果,但不利于搜索引擎分析。
7.要求登录
网页的内容设置为必须登录才能查看。但是蜘蛛不能填写信息登录,所以只会导致整个页面无法爬行。
8.强制使用cookiee
一些网站强迫用户使用cookie。如果用户不使用cookie,页面显示将异常。显然,这也是必须避免的。
@ 物理结构与链接结构
1.物理结构
物理结构是由网站的真实目录和文件的位置决定的结构。
我们可以想象我们电脑上的文件夹。
我们经常在硬盘下的文件夹中存储一些文件。当然,如果这个文件是你的小秘密,你可以把它存储得更深
同样,我们的网站是由网页组成的,每个网页都像一个文件,我们存储在服务器上。因此,一般的物理结构如下:
http://www.domain.com/catA/product-a.html
http://www.domain.com/catA/product-b.html
http://www.domain.com/catB/product-a.html
http://www.domain.com/catB/product-b.html
……
2.链接结构
链接结构又称逻辑结构,是网站内部链接形成的网络图。
简单的理解是我们为网站的不同页面设置的跳转逻辑。例如,网站的主页是H。我们已经指定H页面可以跳转到C1和C2页面,C1页面可以跳转到P1页面。
事实上,对于大多数人来说(比如像我这样的小网站……),我们只关心链接结构。典型的链接结构是树形结构,如下:
图片来源:谷歌
每个代码代表一个网站页面。
网页的收录是否容易,与页面在链接结构中的位置有关,与目录层次(物理结构)无关。
@ 清晰导航
清晰导航主要解决这两个问题:
1.让用户知道我现在在哪里
2.让用户知道我下一步要去哪里
从SEO的角度来看,网站的导航系统应做到以下几点:
1.文字导航
导航使用最常见的HTML文字,有利于抓取。
2.点击距离和扁平化
导航是链接所有页面的一只手,使所有页面从主页点击不超过4.5次。
3.锚文字包含关键词
在导航过程中要考虑使用关键词,但不能堆积,2-4字为宜。
4.面包屑导航
红框的位置可以称为面包屑导航。建议使用。
图片来源:谷歌
5.避免页脚堆积
建议避免在页脚上堆积关键词,这可能会导致搜索引擎的惩罚。
@ 子域名和目录
子域名和主域名是两个完全不同的网站。主域名获得外链增加权重,子域名不会增加。所以对于大多数人来说(比如像我这样的小网站……),不需要使用子域名。
举例如下:
http://www.domain.com
http://news.domain.com
这是两个不同的网站。
而http://www.domain.com/news纯粹是httpp://www.domain.com部分/。
@ 禁止抓取和收录机制
这个内容不需要大多数人(比如像我这样的小网站..),所以我只列出来,不详细展开。
有时,我们不希望包含一些页面(或索引),如付费内容、仍在测试的网站或一些毫无意义的重复内容。然后我们可以通过以下方式确保页面不被捕获:
1.robots文件
写robots文件是为了提醒搜索引擎禁止捕获哪些页面。robots文件的不存在或空缺意味着搜索引擎可以捕获所有内容。
但需要注意的是,robots文件禁止捕获内容,但页面的URL仍然可能被索引并出现在结果中。如果URL根本不出现在搜索结果中,请使用以下标签。
2.noindex meta robots标签
使用noindex meta robots标签页面将被捕获(只要robots文件不被禁止),但不会被索引(包括)。
注:抓取和索引(收录)是两个不同的概念。robots文件的作用是禁止抓取,但不禁止索引,meta noindes的作用是禁止索引(收录)。
3.使用nofollow
nofollow可以防止蜘蛛爬行和传递重量。
外链就像一个信任投票,是权重的传递。但当我们只是想做一个链接,不想传递权重或投票时,我们就会使用nofollow。
一般用途是减少垃圾链。用于博客评论、论坛帖子、社交网站、留言板等场所。另一个重要用途是广告链接。
@ URL静态化
有许多网站是由数据库驱动的,页面是由程序生成的。不像我们通常的小网站,每个页面都是由站长手动创建的。然后URL是动态的,如:
https://image.baidu.com/search/detail?ct=503316480&z=0&ipn=d&word=%
它包含许多参数,不利于搜索引擎的抓取。
对于大多数人来说(比如像我这样的小网站……),我们网站的所有页面基本上都是手动创建的,所以基本上没有URL动态问题,所以它不会启动。
@ URL设计
URL设计应遵循以下几点:
1.URL越短越好
2.避免参数过多
这主要是针对动态URL。尽量使用静态URL,如果必须使用动态URL,参数最好在2-3个以内。
3.目录层次尽可能少
这里指的是物理目录结构。
4.文件和目录的描述
URL有一定的描述性,不要都是无意义的单词。
比如:http://www.domain.com/news/finance比httpp好://www.domain.com/cd01-z/sub-a好得多。
5.URL包含关键字
英文网站关键词出现在URL中,可以稍微增加权重,有利于用户体验。中文网站不必勉强。中文字符出现在URL中,容易显示为乱码。
6.所有子母都是小写
7.使用连字符
搜索引擎将URL中的短横线,即连字符(-)作为空间处理,因此单词通常被(-)分开,而不是其他奇怪的符号。
@ 网址规范化
网站标准化是指搜索引擎选择最合适的URL作为真实网站的过程。
举例来说:
http://www.domain.com
http://domain.com
http://www.domain.com/index.html
这三个URL通常指的是同一个URL文件。虽然这些网站返回相同的文件(网页),但从技术上讲,这些网站可以返回不同的内容。
如果网站上同时出现不同版本的网站,搜索引擎可以包括两个或两个以上版本的URL,这将导致复制内容,导致搜索引擎认为内容质量低,影响包含。
解决方案如下;
1.所有内部链接保持统一。网站链接统一使用一个版本,通常选择带www的版本作为标准化网站。
2.在Google站长工具中设置首选域。
3.使用301转向将所有不规范的URL转向标准化的URL。
4.使用canonical标签,以后会深入讨论。
5.所有提交给搜索引擎的XML网站地图都使用标准化网站。
十@ 301转向
301转向(或301重定向,301跳转)是用户或蜘蛛在向网站服务器发出访问请求时返回的HTTP数据流中的信息(header)一个部分状态码表示该网站将永久转移到另一个网站。
其他常见状态代码如下;
202:一切正常。
404:网页不存在。
302:临时转向。
500:错误的内部程序。
网站转向还有很多其他方法,但除了301转向,搜索引擎对其他转向方法非常敏感。
网页A以301重定向转移到网页B。搜索引擎可以肯定网页A会永久改变地址,或者它实际上不存在。搜索引擎将网页B作为唯一有效的目标。网页A的权重将转移到网页B。
除解决网站不规范外,301转向还有一些其他用途:
1.为保护版权,公司拥有不同TLD的多个域名:
http://company.com
http://company.net
http://company.org
http://company.com.cn
http://company.cn
选择一个主域名作为301转向主域名,以避免大量复制内容。
2.公司注册了全名域名,如http://longcompany.com,但是太长,不方便客户记忆,所以买了http://lcn.com作为主域名,另一个301转向主域名。
3.网站修改,如页面删除、地址变更、URL命名系统变更、域名变更等。
4.动态URL也可能需要301,将旧的、动态的URL转换为新的、静态的URL。
十@ Canonical标签
Canonical标签相当于一个页面中的301转向。区别在于用户不转向或停留在原始网站上,搜索引擎将其视为301转向处理,并将页面权重集中在标签中指定的标准化网站上。用于解决网站标准化问题。
十@ 复制内容
复制内容也称为重复内容。指两个或两个以上的URL内容相同或非常相似。复制内容可以发生在同一个网站或不同的网站上。
复制内容的原因:
1.前面讨论的网站标准化问题导致复制内容。
2.代理商或零售商从产品制造商那里转载产品信息。
3.打印版本。许多网站不仅提供正常浏览的页面,还提供适合打印的页面版本。
4.网站结构造成的各种版本。如产品列表按价格、评论、上架时间等排序页面。
5.使用Session ID,搜索引擎蜘蛛在不同时间访问网页时,会给出不同的Session ID,网页的实际内容是一样的。
6.网页的实质性内容太少。每个网页都有一般内容,如导航条和版权声明。如果文本内容不如一般内容少,则被视为复制内容页面。
7.转载和抄袭。别人抄袭或转载你的文章。
8.镜像网站。
9.产品或服务之间的差异很小。
10.URL添加任何代码或返回200状态码。
检查页面是否有复制版本的方法:
拿出页面文本中的一个句子,加上双引号,在搜索引擎中搜索,从结果中可以看到是否有多个页面包含这个句子。一般来说,随机选择的句子不太可能完全出现在另一篇无关的文章中。
复制内容的危害:
在同一个网站上出现大量的复制内容,会导致权重分散,并可能导致搜索引擎对网站质量的怀疑和惩罚。
搜索引擎不会因为网站上有少量的复制内容而受到惩罚或减少。搜索引擎所做的就是从多个页面中选择真正的原始版本,或者用户体验最好的版本,并给出应有的排名。其他复制版本不在搜索结果或排名较低。
消除网站内复制内容的方法:
1.确保一篇文章只有一个相应的URL。
2.不是因为网站标准化产生的同站复制内容,可以选择允许收录的版本,禁止使用robots文件捕获其他版本,noindex meta 禁止索引robots标签等。
3.使用canonical标签复制内容。
复制不同网站之间的内容很麻烦,大致有以下三点:
1.在页面中添加版权声明,要求转载的网站保留版权声明和指向原始来源的链接。
2.联系对方要求添加版权、链接或删除内容,或直接向对方主机、域名提供商和搜索引擎投诉。
3.坚持原创,以时间增加网站权重,增加网站内容被判定为原创的机会。
十@ 绝对路径和相对路径
绝对路径是指包含域名的完整网站。相对路径是指与当前页面相比,不包含域名和链接页面的相对网站。
在网站正确分析URL的前提下,绝对路径和相对路径本身对排名没有影响。建议大多数人使用绝对路径(比如像我这样的小网站……)。
十@ 网站地图
无论网站的大小,网站地图都是必要的。主要有两种形式;
1.HTML网站地图,英文是sitemap,s小写。
网站地图的HTML版本是用户可以在网站上看到并列出网站上所有主页链接的页面。
2.XML网站地图,英文是Sitemap,S大写。
XML版本的网站地图由XML标签组成。制作XML地图文件后,通知搜索引擎有两种方式。一是在站长工具后台提交网站地图文件。二是在robots。.通知搜索引擎网站地图文件在txt文件中的位置。
需要注意的是,通知搜索引擎不能保证必须包括在内。XML网站地图只是一种辅助方法,不能取代良好的网站结构。
十@ 内部链接和权重分配
上述网站结构优化中最重要的问题包括包含和页面权重分配。对大多数人来说(比如像我这样的小网站……)使用经典的树结构是一个更好的链接和权重分配模式。但不同的网站有不同的目标,所以这一节主要是一个扩展的想法。
1.重点内页
一般来说,网站主页获得的内部链接最多,权重最高。然后主页链接到一级分类页面,然后依次分类,权重依次下降。
但有时候,我们可能希望一个页面有更高的权重,比如一些热门、高利润的产品,或者一些促销主题页面。解决方案是在主页上添加这些关键内部页面的链接。
2.不必要的页面
网站上总有一些需要用户体验但不需要SEO的页面,比如隐私政策和用户注册页面。如果网站上的每个页面都有指向这些页面的链接,那就是权重的浪费。解决方案主要是:
首先,链接只显示在主页上,链接取消在其他页面上。
第二,使这些页面的链接无法传递权重,使用Nofollow标签等。
三、二级分类
当一些二级类别的产品数量远远大于其他二级类别时,我们通常的做法是列出三级分类。但这将导致这些产品页面离主页太远,重量稀释。解决方案是将这些三级分类的链接尽可能地放在导航或主页上,或者从用户体验开始,尽可能地将流行的二级分类放在前面。
4.翻页过多
对于一些大型商业网站或信息网站来说,页面过多会导致页面过多的问题。“上一页”和“下一页”将列在网站上,但当页面太多时,需要点击十几次甚至几十次才能到达,这些页面基本上不可能包括在内。解决方案是重新分类页面,减少翻页次数。或者更改页面链接的格式,如以下内容:
1、2、3、4、5、10、20、30
甚至可以做成两排:
1、2、3、4、5、6、7、8、9
20,30,40,50,60
5.单入口还是多入口?
多入口是指向产品页面的多条链接路径。
优点是为最终页面提供了多个爬行收录渠道,东方不亮西方亮,提供的入口越多,收录的机会就越大。
缺点是这些入口页面本身也占据了捕获时间和页面配额。一个网站的权重大致是固定的,搜索引擎爬行的时间有上限,可以包含的页面总数也有上限。为了提高整个网站的爬行捕获,包含份额,有必要找到一种方法来提高网站的权重。如果网站的权重足够高,可以驱动的页面数量远远大于实际页面数量,提供多个入口是最好的方式。
6.相关产品链接
单个入口或多个入口结构都有一个缺陷,即过于规则,有时会导致产品页面的某一部分不能包括在内。单个入口结构更为明显。如果由于导航设计不合理,分类页面离主页太远,则该分类下的所有产品页面都可能不包括在内。或者在博客系统中,发布较早的帖子总是会随着时间的推移而减轻重量。
解决方案是在产品页面上生成相关的产品链接。链接通过系统的某种机制自动生成,连接到其他产品页面。
该机制的随机性越强,与正常入口的分类差异就越大。通常的方法是:购买该产品的用户购买其他产品;统一品牌、制造商、标签产品等。
相关产品应尽可能随机,以便原始不相连的页面可以交叉链接。
7.锚文本的分布和变化
最灵活、最常见的锚文本分布是基于合理的网站结构,在页面文本中手动或自动添加其他页面的链接。维基百科全书是这方面需要学习的对象。
除了文本,导航中的锚文本也可以改变。顶导航栏和侧导航栏可以使用一些语义相似的单词作为锚文本,用户通常不太关心。
8.主页链接NoFollow
当多个链接出现在同一网站上(如主页)时,第一个链接是最重要的,第一个链接的锚文本也是最重要的。
一般来说,页面上的第一个主页链接是顶部logo,因此logo图片中的ALT文本相当于锚文本,需要在主页上放置目标关键字。
然而,有些人认为图片上的ALT文本比真正的文本链接锚文本要小,所以解决方案是第一次出现在页面上的导向主页链接和NoFolllow属性,禁止搜索引擎跟踪。然后将关键字作为锚文本链接放在页面上的其他合适的地方。
9.深层链接
搜索引擎蜘蛛随着外部链接进入网站后,捕获的路线从中心向外扩散,就像在水中投入一块石头形成的波纹一样。因此,给一些远离主页的页面建立几个外部链接,不容易被蜘蛛爬到页面上,可以有效地解决包含一个块的所有页面的问题。
十@ 404页面
当用户访问网站上不存在的页面时,服务器通常会返回404错误。这样;
图片来源:谷歌
一些网站管理员认为,由于页面不存在,301转向主页,这对搜索引擎不友好,这会让搜索引擎觉得网站上有很多与主页相同的页面。
正确的方法是设计404页面,与网站保持统一的模板风格和标志名称,然后添加网站地图,链接到主页,建议访问页面或网站搜索框。
事实上,对于404页面,有一个有效的外部链接技能。
搜索引擎优化可以在谷歌站长工具的背景下看到谷歌爬行了哪些不存在的页面。一般来说,必须有外部链接指向此页面。然后我们可以充分利用它,比如联系对方修改地址;将错误的地址做成301,转向正确的页面,或者在不存在的页面上创建一个页面来接收这些权重。
以上。
这篇文章有很多内容实际上是重复的,我们必须在阅读完整篇文章后,选择关键点来记住。例如,关键是一个合理的树形结构,所有页面都不能离主页太远,尽量保持4-5次点击,为深度页面构建外部链接等。
这一章的所有内容都写完了。根据我自己的情况,我删除了一些无用的知识点,并尽可能地保持完整和关键。敲五六个小时,如果对你有帮助,记得竖起大拇指哦,我们下次见~