本文主要介绍搜索引擎的工作原理和常用的高级搜索指令,深入了解搜索引擎优化,灵活使用搜索引擎。
虽然很多人喜欢的内容是——
“告诉我如何三下五除二,把网站优化到第一页,不要给我拉这些花里胡哨的。”。
但我认为这一章实际上是必要的。在对搜索引擎的工作原理有了深入的了解后,我们可以从宏观层面有一个一般的操作思路,教鱼比教鱼好。
不啰嗦,我开始了~
2.1搜索引擎和目录
对于现在的人来说,目录网站已经很少使用了,典型的类似hao123,http://265.com等,网站上有很多人工收集整理的网站。在早期,许多SEO数据也称目录为搜索引擎。事实上,这是不准确的。
搜索引擎通过蜘蛛程序沿着链接爬行,在线捕获大量页面并存储在数据库中。预处理后,用户在搜索框中输入查询词,搜索引擎排序程序从数据库中选择符合查询词的页面。蜘蛛爬行、页面包含和排名自动处理——这是搜索引擎和目录网站之间最大的区别。
2.2搜索引擎工作原理简介
搜索引擎的工作过程可分为三个阶段
爬行和抓取:搜索引擎蜘蛛通过跟踪链接找到和访问网页,读取页面html代码,并将其存储在数据库中。
预处理:索引程序处理文本提取、中文分词、索引、倒排索引等页面数据
排名:用户输入查询词后,排名程序调用索引库数据计算相关性,然后以一定的格式生成搜索结果页面。
从搜索引擎的原理来看,我们想做的是,首先,吸引蜘蛛,让蜘蛛爬行我们的页面,第二:注意网站或网页的结构优化,有利于蜘蛛爬行,将使我们的网站包含尽可能多的页面。
如果你想吸引蜘蛛爬行,你应该做以下几点:
网站和页面权重的提高
经常更新页面
每个页面都有导入链接
与主页的点击距离不能太远
url短,层次浅
2.3用户如何浏览和点击搜索结果?
当用户在搜索框中输入关键字时,搜索引擎会给出搜索结果,用户会点击哪一个?
从大量的研究中可以得出以下结果:
排名第一的结果点击率约为40%
排名第二的结果点击率约为11%
排名第三的结果点击率约为8%
排名靠后的结果点击率逐渐下降,而第二页的结果则悬崖式下降。
虽然不同的行业和关键词会使这个结论有所不同,但我们仍然可以得出一些对我们有用的结论:
第一和第二名的流量差异很大,第二页和第一页的流量差距也很大;
有时候我们可以找到网站中排名第二的关键词,想办法把它们提高到第一位,这样可以把流量提高好几倍。第二页优化到第一页也是如此。
2.4常用的高级搜索指令
双引号:完全匹配搜索
解释:搜索结果返回的页面包含双引号中的所有单词,甚至必须完全匹配顺序。
例如:“飞机微博图片”
指令支持:谷歌和百度都支持
减号
解释:搜索不包含减号后面单词的页面。使用时,减号前面必须有空格,减号后面没有空格,然后是需要排除的单词。
如:新加 -坡
指令支持:谷歌和百度都支持
星号
解释:常用的通配符。
例如:郭*纲,其中*代表任何文字。
指令支持:谷歌支持,百度不支持
inurl:
解释:用于出现在url中的单词搜索查询页面。因为关键词出现在url中,对排名有一定的影响,所以使用inurl:搜索可以更准确地找到竞争对手
如:inurl:搜索引擎优化
指令支持:谷歌支持,百度不支持
inanchor:
解释:指令返回的结果是导入链接锚文本中包含搜索词的页面。
如:inanchor:点击这里
返回的结果页面本身并不一定包含“点击这里”四个字,而是指向这些页面的锚文本中出现“点击这里”四个字。
链接锚文本是关键字排名因素之一。经验丰富的搜索引擎优化将尝试在外部链接锚文本中出现一定数量的目标关键字。使用inanchor:指令可以找到关键字的竞争对手,这些竞争对手经常做SEO。
指令支持:谷歌支持,百度不支持
intitle:
解释:指令返回页面title中包含关键字的页面
如:intitle:搜索引擎优化
title是页面优化的一个重要因素,使用intitle指令找到的文件是更准确的竞争页面。如果关键字只出现在页面上,而不是在标题中,它就不是一个强大的竞争对手。
指令支持:谷歌和百度都支持
filetype:
解释:用于搜索特定的文件格式
如:filetype:pdf SEO
所有PDF文件都包含SEO这个关键词。
用于搜索pdf电子书、word文件等特定资源非常有效
指令支持:谷歌和百度都支持
site:
解释:用于搜索域名下的所有文件
如:site:http://seozac.com
回到seozac域名下的所有页面,这是查询网站包含页面最有效的方法。但是这个指令不是很准确,只能作为参考。
指令支持:谷歌和百度都支持
link:
解释:用于搜索url的反向链接,包括内部链接和外部链接
如:link:http://seozac.com
指令支持:谷歌支持,百度不支持
高级搜索指令也可以搭配使用
比如inurl:http://edu.cnintitle:交换链接
来自httpp的返回://edu.cn域名,标题中包含“交换链接”四个字的页面,大部分应该是愿意交换链接的学校网站。