了解搜索引擎工作原理,更加有利于我们做数据布局,整站优化!
不发外链的网站可以获得首页排名吗?
搜索引擎如何对网页进行判定?
我们带着这些问题来看!
原理1:网站内部判定(搜索引擎对于网站的青睐度)
1、索引
2、收录过滤
3、排序
搜集器:搜索引擎蜘蛛爬取,下载数据交给控制器(不一定收录、索引);
控制器:预处理调度(特征、数据的预处理),清除噪音,控制抓取间隔,进行简单的URL分析,分区Url队列。
第一次大概判定:
特征预处理:行业特征,eg:1688(批发)bbs,blog的判定。
特征判定对于页面的影响力,词性判定(开放性的词(。。。怎么样):bbs、ask;企业词);
第二次判定:
URL特征,title判定,摘取一部分,去除一部分;
举例:
标题对于收录的作用,体现方式,最短时间给用户提供最有价值的信息;(首页收录快不仅仅是首页的链接因素。有时内页也会比首页收录还要快(标题占30%的因素)。需求度以及数据库的关系,搜索引擎进行了再次判定。)
根据数据库以及需求度数据比重来进行快慢收录。(特殊行业除外)
为什么特殊的标题写法收录快、利于排名、(和及的)
分析结果:分词处理,根据用户搜索需求度。面向对象比较广,需求度比较大。
举例:
三面翻 _三面翻价格 _三面翻定制-某某公司
内页收录22个,首页没收录,内页主要围绕效果价格去做的,内页收录很快;
数据调取分析后发现效果、价格为最大的需求度。
就是对需求度和搜索引擎资源库的一个判定!!!!!!
第三次判定:
包含与被包含的判定,页面特征!搜索引擎第三次判断的时候回抓取核心词,利用核心词来进行数据拓展,找到需求度,这些需求以综合需求为主要导向。(汽车之家)
原理2:投票判定
外链对于排名以及收录要好的多(焦大、创雨)
互联网是由链接建立的,一定有用。
二个维度:质量、数量,最终依据,对用户是否有推荐意义。
其他相关阅读:搜索引擎排名7个维度
1.相关性:query与结果说的是不是一回事?
2.需求强度:抓住主要需求?
3.丰富程度:详细全面?
4.有效性:能否真正满足?
5.时效性:新?
6.便捷性:找到目标信息要花多少时间和成本?
7.权威度:英雄也要问出处?
说明:这7个维度在不同特征的query下,关注的重点有不一样,不同维度适用的query范围有所不同。
1、对搜索结果中的前N条URL分别进行Query-URL相关性评估,并根据排名赋子权重,计算出一个值,名日DCG,通过这个绝对数值反映单次搜索前N结果的质量
2、将同一query下的百度搜索结果和竞品结果进行横向对比,判断好坏及程度,得出谁家搜索质量更好的结论,名日Side-by-side。在评估中如果隐去两侧所有品牌标识,并左右环境顺序随机互换,即为盲测,盲测的结论一般都会非常客观反应搜索引擎质量差距。