搜索引擎的工作原理和常用的高级搜索指令-《seo实战密码》读书笔记-第二篇
· 2023-02-21

搜索引擎的工作原理和常用的高级搜索指令


这一篇主要介绍搜索引擎的工作原理和常用的高级搜索指令,对于我们深入了解seo和灵活使用搜索引擎。


虽然很多人喜欢的内容是——


“你就告诉我,怎么三下五除二,能把网站优化到第一页就行了,不要给我扯这些花里胡哨的”。


但我觉得这一章其实是很有必要的。在深入了解搜索引擎的工作原理之后,我们才能从宏观层面有个大概的操作思路,授之于鱼不如授之以渔。


不啰嗦了,我开始啦~



2.1搜索引擎与目录


对于现在的人来说,已经很少用到目录网站,典型的类似hao123,http://265.com等,网站上面有许许多多的人工搜集并整理的网站。在早期,许多seo资料把目录也称为搜索引擎的一种,其实这是不准确的。


搜索引擎是由蜘蛛程序沿着链接爬行,抓取网上的大量页面,存进数据库,经过预处理,用户在搜索框内输入查询词后,搜索引擎排序程序从数据库中挑选出符合查询词的页面。蜘蛛的爬行,页面的收录以及排序都是自动处理的——这就是搜索引擎和目录网站最大的区别。





2.2搜索引擎工作原理简介


搜索引擎的工作过程可分为三个阶段


爬行和抓取:搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面html代码,存入数据库。


预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理


排名:用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。



搜索引擎的原理上来分析,我们想做的事情就是,第一,吸引蜘蛛,尽可能地让蜘蛛爬行我们的页面,第二:要注意网站或网页的结构优化,有利于蜘蛛爬行,才会尽可能让我们网站更多的页面被收录。


想要吸引蜘蛛来爬取,要做好以下几点:


网站和页面权重的提升


页面经常更新


每个页面都有导入链接


与首页的点击距离不能太远


url短,层次浅



2.3用户怎样浏览和点击搜索结果


当用户在搜索框输入一个关键词,搜索引擎给出了搜索结果,那么用户会点击哪一个呢?


从大量的研究可以得出以下的结果:


排名第一的结果获得了大概40%的点击率


排名第二的结果获得了大概11%的点击率


排名第三的结果获得了大概8%的点击率


排名靠后的结果点击率逐渐下降,第二页的结果则断崖式下降。



虽然不同的行业,不同的关键词会使得这个结论有一定的差异,但是我们依然能得出一些对我们有用的结论:


第一和第二名流量差异巨大,第二页和第一页的流量差距也很大;


有时候我们可以找到网站有哪些关键词排名在第二位,想办法提高到第一位,,能使流量提升好几倍。第二页优化到第一页也是同理。





2.4常用的高级搜索指令


双引号:完全匹配搜索


释义:搜索结果返回的页面包含双引号中出现的所有词,连顺序也必须完全匹配。


如:“飞机微博图片”


指令支持:谷歌和百度都支持



减号


释义:搜索不包含减号后面词的页面。使用时,减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。


如:新加 -坡


指令支持:谷歌和百度都支持



星号


释义:常用的通配符。


如:郭*纲,其中*代表任何文字。


指令支持:谷歌支持,百度不支持



inurl:


释义:用于词搜索查询词出现在url中的页面。由于关键词出现在url中对排名有一定影响,因此使用inurl:搜索可以更准确地找到竞争对手


如:inurl:搜索引擎优化


指令支持:谷歌支持,百度不支持



inanchor:


释义:指令返回的结果是导入链接锚文字中包含搜索词的页面。


如:inanchor:点击这里


返回的结果页面本身不一定包含“点击这里”四个字,而是指向这些页面的锚文字中出现了“点击这里”这四个字。


链接锚文字是关键词排名因素之一,有经验的seo会尽量使外部链接锚文字中出现一定次数的目标关键词。使用inanchor:指令可以找到某个关键词的竞争对手,而这些对手往往都是做过seo的。


指令支持:谷歌支持,百度不支持



intitle:


释义:指令返回的是页面title中包含关键词的页面


如:intitle:搜索引擎优化


title是页面优化的重要因素,使用intitle指令找到的文件都是更准确的竞争页面。如果关键词只出现在页面却没有在title中,说明也不是有力的竞争对手。


指令支持:谷歌和百度都支持



filetype:


释义:用于搜索特定的文件格式


如:filetype:pdf SEO


返回的就是包含SEO这个关键词的所有PDF文件


用于搜索特定的资源,如pdf电子书,word文件等非常有效


指令支持:谷歌和百度都支持



site:


释义:用于搜索某个域名下的所有文件


如:site:http://seozac.com


返回的就是seozac这个域名下的所有页面,这个指令是查询网站收录页面最有效的方法。不过这个指令不是很准确,只能作为参考。


指令支持:谷歌和百度都支持



link:


释义:用于搜索某个url的反向链接,既包含内部链接,也包含外部链接


如:link:http://seozac.com


指令支持:谷歌支持,百度不支持



高级搜索指令也是可以搭配起来使用的


如inurl:http://edu.cnintitle:交换链接


返回的则是来自http://edu.cn域名,标题中包含“交换链接”这四个字的页面,大部分应该是愿意交换链接的学校网站。


熱門文章
British gambling levy rates confirmed for each vertical
Regulation
Gaming & Technology Expo Makes a Powerful Entrance in CDMX
Marketing
Across 6 Cities: HUIDU Invites You to 8 World Cup Parties Redefining High-Value Social Networking
HUIDU Focus
1spin4win releases unique slot Don Catleone Hold and Win featuring gangster cats
Online Game
1spin4win grows its Latin American presence by partnering with Fortuna Juegos
Online Game
B2B Tech Infrastructure Gains Momentum in Philippine Gaming Sector
Southeast Asia
Super PAC Raises $48 Million: Sports Betting Forces Ramp Up Political Push
Regulation
SBC Summit Canada to Make Player Safety a Key Pillar of 2026 Agenda
Marketing
UK MPs reopen 2025 gambling inquiry as reform stalls
Regulation
JILI Partners with Cricket Legend AB de Villiers (ABD) to Launch Exclusive Branded Game Series 100% 11
Sports Game
Brazil Proposes Raising Gambling Tax Rate to 24%, With Revenue Allocated to Social Security and Healthcare
Regulation
Kazakhstan plans to penalise online casino promotions
Regulation
GAT CDMX 2025 Institutional Academy: Leaders and Experts Analyze the Present and Future of the Gaming Industry in Mexico and Lat
Sports Game
GGC Awards 2026 Shines in Colombo: Honoring Leaders and Innovators in the iGaming Industry
HUIDU Focus
Institutional Academy that exceeded expectations marked the opening of GAT CDMX
Online Game
首頁
遊戲
合作
發現
我的