当前位置:网站首页 > 广州SEO > 正文

如何理解信息的时效性(全文搜索引擎的原理)

三石哥三石哥 2022-11-11 13:00:11 772

什么是搜索信息时效性?百度进行搜索时效性全面发展解读

什么是时效性、时效性在百度进行搜索中的重要性分析以及企业如何通过判断时效性,下面我们详细为大家解读了时效性的相关研究内容,你想学习了解的朋友快来看看吧~

一、什么是时效性?

1、时效性是指用户对搜索分析结果进行新旧文化程度的感知。

2、时效性的重要性:

用户:在需求满足的前提下,用户天然希望获得相对较新的资源。

对于开发者来说: 继续生产高质量、时间敏感的内容是获得更多发行机会的好方法。

3、时效性内容的分类:

(1)、受时间可以影响具有较大的内容:即对时效性要求较高的内容,比如通过新闻信息事件、周期性进行更新的资源和持续发展更新的资源。

(2)、相对稳定的内容:对时效性要求相对较低的内容,如固定答案、长期不变的资源、已更新或明确指向的资源。

注意:上述两类研究内容我们可能会影响相互之间转换,如北京市政府2019年搬迁到通州新址后,需要进行及时更新最新的地址或相关的新闻信息资讯。显示旧地址会误导用户,破坏用户体验。

二、时间因子

1、定义:页面主体内容的产生时间,能够辅助用户判断内容时效性的时间。

2、时间因子的重要性:

规范的时间因子可以让用户获得更好的浏览体验,也可以辅助搜索策略进行更精准的判断。

在问答详细信息页面有一个最新的响应时间,在内容详细信息页面有一个发布时间

在问答详细信息页面有一个最新的响应时间,在内容详细信息页面有一个发布时间

3、时间因子包含以下三种类型:

内容发布时间(PubDate)、内容更新时间(UpDate)、最新回复时间(IrDate)

4、 根据不同的页面类型,用户需要在不同的时间查阅。以下根据不同的页面类型,建议优先提交不同的时间。

5、提交方式:

使用 JSON-LD格式在页面中嵌入代码即可,详细标准及提交格式可以参考《百度搜索落地页时间因子规范》。

三、站点收录

1、百度如何发现网站内容?

百度搜索Spider会主动定期抓取网站内容,同时开发者们也可以在百度搜索资源平台主动提交资源。

开发者们可以同时通过一个普通收录工具和快速收录工具主动提交人力资源。对于优质的高时效性资源,合理利用这些工具可以缩短爬虫发现网站链接的时间,让百度能及时收录最新的内容。

2、普通收录

普通收录工具可以帮助广大开发者主动向百度搜索推送资源,可以有效缩短爬虫发现链接的时间,主要包括API提交、手动提交、sitemap、自动推送四种方式。

3、快速收录

快速列表工具只适用于移动页面和移动自适应页面,可以帮助开发者主动将资源推送至百度搜索。对于高效的内容,建议使用快速列表工具将资源实时推送至百度搜索。

4、不同收录方式的对比

5、建议:

(1)对于受时间影响较大的资源,建议开发者在保证质量的前提下,尽量制作时效性高的内容,以满足用户的需求;

(2)根据“百度登陆页时间因素规范”,在不同的页面类型中提交不同的时间因素,有利于提高网站的展示机会。

一篇文章让你看懂百度搜索引擎原理——检索排序

搜索引擎原理很多人都只知其一,不知其二,随着互联网时代的发展,越来越多的算法被公开,也有越来越多的人对搜索引擎算法感到好奇,今天迅步总结的这篇文章用最简单直白的语言来解释搜索引擎的原理。本章内容分为抓取建库、检索排序、外部投票以及结果展现。

如何理解信息的时效性(全文搜索引擎的原理)

检索排序

检索

我们都知道站在用户的角度,我们使用搜索引擎是一个query的过程,用户在搜索不同的词汇的时候,搜索引擎会给我们不同的展现结果,比如我们搜索“运营是什么”,百度会把一些跟主题最相关的答部分展现给用户,而搜索“运营是什么行业”的时候,百度会变更搜索结果,把另外一些相关的答案展示给用户,而这个检索的流程是如何实现的呢?这就不得不提到检索。

用户在输入词汇的时候,算法会进行分词处理,然后查出每个term文档集合,然后求交集,然后通过协同过滤以及其他过滤手法最终形成了排序,我们拿上面的运营是什么来举例,分词后会变成:

运营——0x123sdsd

是——0x1237887

什么——0x565768

而算法查出每个文档集合(页面集合),有可能是这样

0x123sdsd 1 3 4 5

0x1237887 3 5 12

0x565768 9 7 6

上述求交集后,发现文档3、5是我们可能需要找的。如果用一个更简单的例子,我们可以这样描述:比如用户搜索运营是什么行业的query后,百度分词结果是:

运营 A,B,C,

是 D,E

什么 G,H

行业 H, C

我们可以看出,用户搜索“运营是什么行业”,页面C是我们想要找的结果,在实际应用过程中,百度算法会丢弃比如啊、什么、哦等这类的词语,也就是说,我们的页面越多的包含分词后的词,那么被检索出来的几率就越大,这也就是行业所称的“关键词密度”。

如何理解信息的时效性(全文搜索引擎的原理)

排序

既然检索有了结果,那哪些因素会影响到排序呢?

1、相关性

相关性是影响排序的重要因素,占据了70%以上,网页内容和用户检索需求的匹配程度,相关性主要体现在需求匹配、关键词个数以及关键词出现的位置和外部链接指向该页面所用的锚文本。

翻译过来就是,比如我们的内容中,出现跟运营、行业高度相关的词库,并且多次出现在H1等位置,外部一个链接使用锚文本指向该页面,那么该页面大概率是跟该主题高度相关的。

2、权威性

用户都喜欢权威性的站点,算法也相信权威站点的内容,而权威性代表了 这个网站的资质,也就是我们经常提到的备案、百度保障、百度信誉、百度认证等。

3、时效性

时效性内容也就是代表出现了新的页面,而新页面承载新鲜的内容,按时间排序我们的内容就可以排到前面。

4、重要性

网页内容与用户需求匹配重要程度或受欢迎程度,这句话理解过来就是,用户在进行query的时候,我们的内容不仅跟主题相关,内容还是要能吸引用户和被用户所重视的。

5、丰富度

丰富度看似简单,确实范围很广,简单的理解是你可以生产一篇内容满足用户单一需求,但还可以满足用户的延展需求,什么意思呢?我们可以拿上面的“运营是什么行业”举个例子,用户搜索运营是什么行业的时候,用户的一般需求是想了解运营具体什么行业,是否可以入行,更深层的需求是想了解一下运营这个行业的薪资待遇,是否有发展前景,如果我们把用户的多种需求都在一篇文章中完善了,文章的丰富度就出来了。

总结一下检索排序的流程:用户在进行query的时候,算法会对问题进行切词处理,让包含此主题的所有页面进行结果展现,但由于一些页面内容跟主题高度相关、内容且很丰富,观点新颖让用户喜欢,这样的文章就会被算法排在前面。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。

转载请注明来自专注SEO技术,教程,推广 - 8848SEO,本文标题:《如何理解信息的时效性(全文搜索引擎的原理)》

标签:

关于我

关注微信送SEO教程

搜索
最新文章
热门文章
热门tag
抖音优化提升网站排名网站优化百度SEO优化提高网站排名抖音小店SEO优化SEO优化技巧网站排名网站SEO优化seo优化关键词优化seo网站优化关键词排名小红书搜索引擎优化百度SEO排名SEO优化排名网站建设
友情链接