目前国内的搜索引擎商主要是百度、360、搜狗、神马为主。然后还有一些“二线”搜索引擎,比如说飘洋过海的微软必应,有着政府背景的中国搜索。还有一些主打私域流量的搜索引擎,比如说今日头条、微信公众号等。有没有想过这样的问题,为什么我们能搜到这个结果,一个结果几百万甚至几千万的结果,又为什么我们先看到某些答案?显然,SEO就是解释这个现象的轻技术,那么今天我们就讲一下搜索引擎的工作原理。
SEM教程
 数据库
 之前我们在讲域名的时候介绍到,所有的电脑都可以是网络服务器,我们也可以远程访问这台服务器,就像局域网共享一样。我们通过搜索,就可以查找到相应的文件,但是跟局域网不同,局域网的文件需要我们手动添加,而搜索引擎的文件,是由搜索引擎蜘蛛爬取的。每当有新的内容,搜索引擎蜘蛛就会出动,去爬取新鲜的内容到数据库中。
 
 搜索引擎蜘蛛
 搜索引擎蜘蛛,又称为爬虫,它能模拟真实用户,“有意识”的去爬取,阅读,快照,质量评估这个页面的内容。
 
 内容处理
 爬取到了内容后,搜索引擎会对这些内容进行处理,查重之类的操作,把文本内容提取为若干个词库,词库中包含了能代表页面核心内容的关键词。
 
 建立索引
 把关键词和内容和搜索词建立索引,把关键词对应到相应的文章。根据关键词与搜索词的匹配方式弱碱,最终会得到几百万个甚至几千万个答案,如果实现排名呢?
 
 搜索词与页面质量评估算法
 搜索引擎蜘蛛爬取后会对页面做一个详细的分析和评估,对页面的整体用户体验,原创度、seo三大标签、搜索词与页面相关性分析,最终得出分数进行排名。
 
 用户搜索与查询分析
 这时回到前端,用户向搜索引擎提交了搜索词,搜索引擎根据用户地理位置和历史检索特征来做用户需求分析,以便展示用户最需要的内容。
 
 应用缓存
 搜索引擎并不是每次都向服务器要求回传内容,而是会建立一些缓存机制,有一些比较热门的词,出结果会更快一些,一些生僻的词,查找时间就稍微会更长一些。
 
 结果排名
 回到搜索词与页面质量评估算法中,得出评分,得出排名。