当前位置:网站首页 > 资讯百科 > SEO优化 > 正文

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

三石哥三石哥 2022-11-14 14:40:48 196

搜索引擎排名原理

SEO是指在了解搜索引擎自然排名机制的基础上,对网站进行内部及外部的调整优化,改进网站在搜索引擎中关键词的自然排名,获得更多的展现量,招引更多政策客户点击拜访网站,然后抵达网络营销及品牌制作的政策。

SEO的中心就是网民喜欢搜索什么内容,搜索引擎为之找到答案。

换作软文就是产品政策用户关心什么内容,我们用一篇篇文章帮他解决问题。

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

搜索引擎排名原理图

搜索引擎喜欢什么样的内容呢?我们从2方面来讲,一个是网站内部优化,一个是网站外部优化。

一、内部优化

1、内容质量方面


谨记!长、图文并茂、PPT/PDF这三点。

长的意思是:字数多的文章比字数短的文章更能获得搜索引擎的喜欢,更简单完结排名。

图文并茂:文章中有刺进多张图片的比文章是以纯文字内容写作的要更能获取搜索引擎的喜欢;

PPT/PDF:这两种格局的文章要比WORD格局的文章要好。这个在各类文库中的文章排名尤为显着。


2、关键词布局


假定你懂SEO技术,那么一听就懂。

标题里要出现关键词,多出现几回关键词、关键词要加粗、图片要加描绘。

关键词就是你地址职业/产品针对的政策人群所关心的问题。比方夏天瘦身、瘦身的人会在网络上搜索:“怎样快速瘦身?”“怎样健康瘦身?”等等这样的短的关键词、长尾关键词。

关键词要加粗:在我们发布文章的时分,各个途径都会有编辑器。里面有一个“B”字样的加粗按钮,你可以把关键词进行加粗。或是在文章排版的时分,可以用加粗按钮加粗你的小标题。

图片要加描绘:这个要用到SEO里面的alt标签了。假定你不明白,也可以在每张图片的下面写上这张图片的文字解释。


3、总结:


只需你把这两个方面做好了,你的软文内部布局作业就现已够了。


二、外部优化

外部优化途径许多许多,秋香姐曾整理过50个途径。我们就以3个途径为案例来阐明一下。



1、豆瓣


豆瓣的衡量标准是:谈论和喜欢。

在你的文章下面谈论越多、喜欢越多,那么这个页面获取排名的时机就会更大。


2、百度文库


百度文库的衡量标准是:浏览量和下载量。

在你的文章下面浏览量越多,下载量越多,那么这个页面获取排名的时机就会更大。


3、贴吧论坛


贴吧的衡量标准是:谈论和同享。

在你的文章下面谈论越多、同享越多,那么这个页面获取排名的时机就会更大。

SEO的中心就是网民喜欢搜索什么内容,搜索引擎为之找到答案。

软文就是产品的政策用户关心什么内容,我们用一篇篇文章帮他解决问题。

所以,我们在写一篇篇软文的时分,假定你通过学习,把握以及做好,SEO单页优化技巧里面的内部技巧和外部技巧里面的许多细节,那么你的软文被更多潜在用户看到的机率就会大许多。

这样也能阐明,为什么许多的软文,仅靠一篇也能在互联网上存留3-5年,还能连绵不断获取粉丝的一个很重要的原因。

搜索引擎原理系列教程:收录、索引、排名

《搜索引擎原理系列教程》这个虽然称不上书籍,但由于里面信息量以及内容比较实用,也弥补了百度白皮书的一些短板——话语浮于表面,另外值得鼓励的是,这个教程完全是由一个民间的SEO爱好者总结,这份精神值得称赞。我这里仍然想讲三个方面,也是我们SEOER比较关心的三个方面:收录、索引、排名。

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

一、收录

搜索引擎搜集网页过程,收录其实是个复杂的过程,他简单的分为这四个步骤:

1、 调度器是整个搜集过程的核心,它内部保存有一个已访问URL库和未访问URL库,统称URL库。一开始调度器会从未访问URL库中取出一条URL,分配给蜘蛛,让蜘蛛去抓取未抓取过的URL。

2、 当一个蜘蛛得到URL的时候,它会向返个URL发出请求抓取,流程是:对该URL对应的域名进行DNS解析->得到IP进行Socket连接->连接成功发出http请求->接收网页信息。

3、 蜘蛛得到网页信息后,会返回源代码给调度器,调度器会将源代码保存到网页数据库中。

4、 调度器会对抓取到网页迕行链接提取,将未抓取过的URL存放到未访问URL库中,并将刚刚抓取完的URL更新到已抓取URL库中。

这其中会涉及到去重

调度器的工作流程

1、从未访问URL表中依次取出URL,分配给各个蜘蛛。

2、蜘蛛得到URL,进行抓取,得到网页的源代码,对该源代码进行URL的提取,获得该网页包含的所有URL。

3、调度器依次查看得到的URL是否在已访问URL库中存在。如果存在,则说明已经被抓取过,那么将该URL丢弃;如果不存在,说明这个URL没有被抓取过,则顺序添加到未访问URL表中,等待之后抓取。

4、重复步骤1,直到未访问表为空。

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

二、索引

网页预处理

1、给原始网页建立索引。

2、针对搜索有网页库进行网页切分,将每一个页面转化为一组词的集合。(正向索引)

3、将网页到索引词的映射转换为索引词到网页的映射,形成倒排文件(包括倒排表和索引词表)

总的来说,搜索引擎从网页数据库获取网页然后进行代码过滤,然后提取正文信息后进行切词,之后的步骤就是对关键词集合进行筛选,得到网页关键词正向索引,最后才将搜索引擎将正向索引转换未关键词到网页的倒排索引,正是这个技术,搜索引擎才有可能在1S内给用户呈现搜索结果。

另外,这其中搜索引擎做的动作就是网页净化和消重,除了去除网页内噪音内容(如广告、版权等),提取网页主题和相关内容外,去除网页集合中内容重复内容。

有同学可能会问,搜索引擎如何识别主体内容的呢?事实上,算法是靠建立HTML标签树和投票方法识别正文文本。

比如,我们定一下规则,

1、如果文本块文本长度少于10个字,0分。介于10~50个字得5分。介于50~250个字,得8分。超过250个字,得10分。

2、文本块文本位置在右侧,得0分。在顶部,得3分。在左侧,得5分。在中部,得10分。

那我们就得出,页面TITLE得分9,正文加粗H1标签得分8等等,DIV部分的AD部分得分0,丢弃。

(以上举例只为了参考,跟实际算法没有关联)

搜索引擎进行网页消重都要经过3个步骤,首先是特征抽取(这其中涉及到I-Match算法、Shingle算法),然后相似度计算、评价是否相似,最后才是消重。

事实上,搜索引擎算法和用户交互的过程就是一个查询的流程,比如用户搜索“搜索引擎原理”,算法分词后得到“搜索引擎”,“原理”,在倒排索引表中找到包含这两个文档列表,求交,然后将用户查询以及上一步找到文档列表中被一条记录进行向量化后,求查询向量和文档向量的相似度,然后从高到底排序,最后就是我们看到的最终搜索结果。

三、排名

最后就举个例子作为结尾:

搜索引擎网页权重=网页中词项基本权重+链接权重+用户评价权重

网页中词项基本权重

1、例如某个关键词”搜索引擎”在<h1><b>搜索引擎</b></h1>的环境下,权重应该为:WBT=W+W, (h1)+W,(b)=10+12+4=26

2、关键词“搜索引擎”可能还在文档中其他地方出现n次,每次出现都可以计算一个WBT1、WBT2、WBT3…WBTn,那么可以计算出整个文档“搜索引擎”这个关键词的权重为︰

wBT(关键词,网页)=WBT,+ WBT,+…+WBTT=>wBT

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

相关排序–链接权值的计算

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

相关排序–用户评价权值的计算

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

….

最终权值的计算

搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)

搜索引擎可以通过配置KWB、KWL、KWU来设置侧重哪些因素影响权重,比如如果搜索引擎设置了KWL为0.8,KWB、KWU均为0.1,那么说明该搜索引擎更侧重链接对权重的影响,通过这样的算法,可以很轻松的算法上的调整。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。

转载请注明来自专注SEO技术,教程,推广 - 8848SEO,本文标题:《搜索引擎排名原理和算法(搜索引擎的高级搜索技巧)》

标签:

关于我

关注微信送SEO教程

搜索
最新文章
热门文章
热门tag
抖音优化提升网站排名百度SEO优化网站优化提高网站排名抖音小店SEO优化SEO优化技巧网站SEO优化网站排名seo优化seo网站优化关键词优化百度SEO排名小红书关键词排名seoSEO优化排名搜索引擎优化
友情链接