搜索引擎每天解决数亿个查询请求。每个查询请求都意味着用户对特定类型资源的特定需求。大多数情况下,这个需求是根据返回的网页的结果来考虑的,人们会觉得结果中的一些页面给特定用户的特定需求带来了价值。那么对于搜索引擎来说,页面的价值意味着什么呢?为什么人们应该研究页面的价值,以及如何从技术上区分页面的价值?因此,如何在搜索引擎优化中获得所谓的高质量的文章将一一得到解答。站在  一、什么是页面价值前面的人说,如果考虑到某个用户的具体需求,某个页面最能反映这个页面对用户的价值。搜索引擎的价值是什么?一个简单的推理,所有能给用户带来价值的页面对搜索引擎都是有价值的。将这些页面构建到搜索引擎的索引中可以满足最终检索它们的用户的需求。人们称这种价值为检索价值。只要它能解决某个用户的信息需求,并能按照正常的检索要求到达,那么它就是有检索价值的。张三,一个小学生,喜欢在qzone上写一个周笔记,描述他昨天早上吃了什么和今天玩了什么。这种内容很有价值。它们对张三的父母、同学、老师、其他小学生以及那些对小学生日记感兴趣的人都很有价值。对于此信息体,“张三”名称的含义是“检索关键”。有些信息模块只能“预览”信息的价值,达不到信息的检索方法,那么资源将是有价值的,但检索价值很低。例如,从预览的角度来看,百度大厦周围的地形图很有价值。但是,如果附近没有文本描述(或链接的锚文本),只有一张裸露的地形图没有检索价值。也许,如果照片的内容图像识别技术有一天能自动检索到这张“百度大厦附近的地图”,或者能完全自动地分析各种商业建筑、街道社区、餐馆等的名称。在地形图中,这张地图将有越来越多的检索价值。因此,一个页面是否有检索价值应该在于两点:1)它是否能解决一个特定的需求(价值);2)是否可以根据基本搜索方法获得信息(检索);那么,没有检索价值的页面是否对搜索引擎没有价值呢?经过仔细考虑,参考答案是否定的。索引只是搜索引擎的一个阶段。对于其他阶段,没有检索价值的页面将有助于人们更强大的百度收录这些具有高检索价值的页面。例如,对于负责抓取互联网技术资源的spider,有些页面没有检索价值。然而,通过对这些页面的抓取和分析,人们可以快速掌握这些页面没有检索价值的关键信息,从而节省大量的总流量,进行更合理的抓取。充分考虑这种价值可以看作是一种“简单”的检索价值,最后集中在索引价值上,这在文章中还没有阐述。人们只关心“检索价值”这一本质问题。下面提到的“页面值”具体是指页面的“检索值”。  二、为什么要研究页面价值是第一个在互联网技术上拥有无限数量页面的国家,而搜索引擎的硬件平台是不够的。为了用不足的资源掩盖无穷无尽的互联网技术,人们必须区分页面的价值。百度不包括这些没有检索价值的页面,百度也不包括这些检索价值低的页面。它是页面价值在百度收藏和操作层面的应用。  资源分布规律人认为网站内部资源的分布反映了受众规模的问题。例如,新浪新闻首页上的这些推荐内容。新浪需要推广这种内容吗?因为他们认为这是顾客最感兴趣的。

从数据库索引值的角度来看,有一个庞大的编辑精英团队,他们已经在这个内容中添加了“符合每个人口味”的标志。百度搜索引擎只能享受它的成就。在这种情况下,资源的相关性可以成为一个索引值,用来衡量资源受众群相对于某些功能性重要页面(主页、频道栏页面等)的深层链接的大小。)。  浏览热门度人从受欢迎程度的角度考虑观众规模问题。这是最直接的,也许,它一定是第三方获取重要信息的特殊工具。根据这种方法,我们不仅可以获得必须存储的页面,还可以获得用户浏览网站的浏览方式。从某种意义上说,http://www . sogo.com的超级连锁店是受众规模的体现。资源的质量越高,接触的受众越多,它接收的正常链接的总数就越多。内容特写甲:我写了一篇博客:“有传言说郭德纲将参加央视春晚。”我写了一篇博客:“我今天吃了早饭。”这同样来自于这样一个事实,即前者的受众必须高于后者。也就是说,如果出版物的来源相同,则具有质量属性的内容在该分支中所占的比例较高。搜狗网稀有的关键在于互联网上叙事页面的独特性。说到稀有,通常会想到重复。稀有等同于没有重复吗?人们应该如何解释这个定义?让我们看一个例子:有人发布了一个关于新闻热点的原创博客,然后被Sina.com截取并在网上直播。从叙述的内容来看,这是一种重复。然而,这种重复只是演员内容的重复。一方面,它的分流带来了网站开放速度和可靠性的提高。此外,在未来,一些客户还会使用“新浪网,一个热点新闻”来寻找这一新闻报道。这可以称为网站增益。另一方面,它会在整个转移过程中改变页面的标题,在受众的帮助下,转移页面上也会有大量有价值的评论和回应,还会有指向其他相关事件的新闻报道的链接。这可以称为内容增益。因此,即使主题风格和内容没有改变,新浪网的转移是有价值的,它的稀缺性也很高。同样,故事中也有一些东西。如果被转移的网站不是非常有名,它不能在网站名称/可靠性/速度方面产生增益。页面上甚至有很多广告阻碍了文章的阅读,或者只是删掉了没有详细说明的部分。这种切断,换句话说,收集,即纯粹的重复,是与收集源相比较的,即没有搜索价值。一般来说,人们应该评论是否有网站增益和内容增益的网页与演员的重复内容。只有对许多重复的页面完全没有收获,人们才应该认为它们的稀有程度很低。http://www . sogo.com网页的质量反映了其对需求的满意度。区分页面质量应该基于最基本的要求。首先,它不能是一个死链,网站必须有一定的可靠性,网站的开放速度必须令人满意。其次,行为主体的内容是否详细,风格和字体是否最易读,是否会有太多的广告。最后,信息内容是否丰富多彩,扩大的二次需求是否得到满足。  超链1。无效/未满足的主要需求(过期的分类广告/软件下载页面、下载地址无效等)。)2、死链接连接3、虚假信息内容/欺诈等。4、不稳定点5、影响主要需求的管理权限问题(下载/预览必须由会员/点注册等。)6、不完整的信息内容(不完整的转发等。)7、差的预览感觉(广告/字体风格/合理的页面布局等。)  稀有1、网站开放速度快(页面加载速度快/资源网络速度快)2、页面整洁,且行为的主要内容在明显的地方。3.页面信息的详细信息。

4.页面的原始元素丰富多彩(文本、照片、评价、相关信息等)。)。http://www . sogo.com的“时效性”是页面价值的一个属性,这通常体现在两个层面:第一,页面上描述的事物具有很强的大众话题讨论性,非常容易传播。这实际上是观众的反映。第二,页面中描述的事物只在第一时间有较高的注意水平,并且随着时间的推移,注意水平明显下降。这是一种“新闻报道”。对于具有上述两个属性的页面,如果百度搜索引擎蜘蛛发现该页面的时间是在“爆发”或“爆发”之前的事情,人们会认为该页面具有时效性。必须指出的是,百度搜索引擎的“时效性”理论意味着所有有价值的新资源都被百度立即收集和搜索。然而,由于百度收录速度的提高,大部分有价值的新资源对于改善用户的检索体验几乎没有实际意义。例如,张三指出,教育类文章详细介绍了如何减肥。页面值中的“时效性”是指突然的时效性,即所有有价值的页面必须立即被百度收录。页面时效性的解决方案是专门引导人们将百度搜索引擎的不足资源和资金投入到最重要的领域,从而产生最佳的性价比。要区分一个页面的时效性价值,关键是基于以下几个方面:页面本身的受众是否在短时间内显著增加,如超级连锁爆发。贾的帖子就是一个典型的例子。一段时间以来,描述同一事物的网页是否显著增加。贾事件在短时间内引发了许多讨论和报道。所有与此事件相关的内容都具有时效性。根据组合中的页面是否具有这两个特征,推断组合的时效性值。例如,魔兽世界酒吧经常公开一些流行的帖子,人们讨论这个话题。人们推断源自魔兽世界酒吧的帖子具有更高的时效性“潜在价值”。  品质已经详细介绍了页面价值的含义、研究的现实意义和区分价值的方法。最终,人们会再次看到它。从技术的角度来看,这是该职位研究中的关键职位。对页面价值的研究主要集中在三个层面:1 .了解页面价值管理系统。在这个阶段,人们对页面价值的理解来自于上述四个层面。这种理解是否全面,以及如何针对不断变化的互联网自然环境和客户需求扩展和转换这一层次,从而提升更强服务项目的整体检索体验是一个关键问题。2.提取反映页面价值的页面特征。俗话说,巧妇难为无米之炊。发现大量页面特征,提取更准确有效的特征是提高页面价值判断成功率的基础。3、各种页面特征的构成对策(深入学习)。对于不必要的应用位置,必须根据有效和高效的对策,使用相对特征来拟合页面值的最终评估结果。第二,搜索引擎蜘蛛的爬行能力不足,由于考虑到浏览的友好性,对于一个网站或一个IP爬行速度必须有一个爬行速度限制。在这种限制下,爬行或页面升级必须有一个顺序,并且这种安排的关键参考基础是页面值,换句话说,页面值的预测分析(当不爬行时)。它是页面值在蜘蛛生产调度中的应用。第三,对于某些页面,页面的内容会发生变化,导致其检索值从零开始,这通常意味着“死链接”或“网站被黑客攻击”对于这样的页面,好的搜索引擎会在第一时间将它们从索引中清除,或者在检索过程中屏蔽它们,以确保返回给用户的结果是大量具有高检索价值的“好页面”。对于其他页面,它不仅具有很高的检索价值,而且具有很强的“时效性”,允许用户第一次检索此类页面,极大地改善了他们的搜索体验。

就搜索引擎而言,更快更快的百度列表和索引页面代表了更大的额外资源成本。百度列表和索引的速度有多快,升级索引的周期有多短,都必须以页面价值分析为指导。这两个层次是页面价值在改进两个主要搜索引擎指标中的应用:死链接率和及时性。最后,页面的一般价值也对搜索引擎返回给用户的结果的排名起着指导作用。在理想情况下,搜索引擎的结果是根据与查询请求的相关性来排列的。在相关性大致相等的情况下,一般来说,用户倾向于预览具有高页面价值的网页。它是页面值在排名级别的应用。可以说,网页搜索价值的研究是搜索引擎中一项比较基础的工作。理解和区分页面价值的准确性直接危及搜索引擎的覆盖率、死链接率和及时性等几个关键指标。  典型性的低品质页面存有下列一些特点:在前文中提到了一个叫张的小学生的例子。人们认为这一页对张三的同学、盆友和亲戚很有价值。就像这个类别一样,百度搜索首席执行官李彦宏在百度贴吧上发布了一个10个字符的帖子,这对李彦宏的10,000名顶级粉丝来说很有价值。虽然李的《我的帖子》的篇幅要比张三的短得多,但人们对这两页的价值有一个共同的认识,即总的来说,李的《我的帖子》的价值要比张三的高得多。(也许,对张三的母亲来说,这个值的相关性会被逆转。)另一个例子,当搜索一个人的移动电话号码时,搜索引擎返回一个结果,这是该人对社区论坛的响应。虽然关注该手机号码的人很少,但对于关注该手机号码的查询需求,该页面绝对不可替代,因此具有很高的价值。此外,页面检索的价值也受到页面质量的影响。对于相似的页面,在满足用户需求方面通常会有很大的差异,如资源网络速度、页面的合理布局、广告词的数量等。这种差异暂时称为页面质量。最后,一些网页具有明显的大众话题讨论的特征,这种资源在不久的将来被创建时通常具有很高的知名度。随着时间的推移,注意力明显减少,具有“新闻报道”的特点。典型灾害包括各种“门”恶性事件、地震灾害、火灾事故和其他大中型洪水。人们认为这种资源具有“时间性”的特征。因此,页面的检索值可能会受到以下四个因素的影响:1 .感兴趣的受众群体的规模2。稀有性(可替代性)3。第4页的质量。第4页的及时性。这四个因素通常被称为受众群体、稀有性、质量和及时性。  典型性的高品质页面存有下列一些特点:的受众规模意味着用户检索需求的规模。评论受众群体的大小取决于信息发布源的受众群体和信息内容本身的受众群体。实际要素包括但不限于:总体而言,  时效性拥有自己的大型网站忠实用户群,它们的成功取决于它们的内容和服务项目,并且比其他网站更能吸引和满足客户需求。从这个角度来看,人们可以推断,拥有大量忠实用户的网站上的内容会比拥有较少忠实用户的网站上的内容少,并且会有大量拥有潜在受众的群体。在这种情况下,忠诚用户组的规模可以成为网站资源检索价值的指标。忠诚用户的好处取决于,这种情况正在改变。如果一个网站更糟糕,用户会用脚投票。超级链中存在过期问题和欺骗问题,但是没有办法通过错误地报告用户来欺骗。一般来说,网站的声誉与忠实用户的总数密切相关。