您现在的位置:主页 > 美丽人生高手坛 >

百度搜索优化的原理是什么

来源:本站原创 发布时间:2019-09-09 点击数:

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  知道合伙人互联网行家采纳数:761获赞数:4966毕业于西安交通大学思源学院,专业为广告设计制作,后又从事网站建设制作,负责产品线上运营策划,五年经验向TA提问展开全部

  2、搜集器:俗称蜘蛛,爬虫,工作任务就是访问页面,抓取页面,并下载页面;

  3、控制器:蜘蛛下载下来的传给控制器,功能是调度,主要来控制蜘蛛的抓取间隔,以及派最近的蜘蛛去抓取;

  4、原始数据库:存取网页的数据库,就是原始数据库。存进去就是为了下一步的工作,以及提供百度快照。

  原始数据库主要功能是存入和读取的速度,以及存取的空间,会通过压缩,以及为后面提供服务。网页数据库调度程序将蜘蛛抓取回来的网页,进行简单的分析过后,也就是提取了URL,简单的过滤镜像后存入数据当中。

  5、网页分析模板:垃圾网页、镜像网页的过滤,网页的权重计算全部都集中在这一块。

  6、索引器:把有价值的网页存入到索引数据库,中国男篮和美国男篮热身赛有直播吗,目的是查询的速度更加的快。把有价值的网页转换另外一个表现形式,8723大红鹰原创资料,把网页转换为关键词。建立索引的原因:为了便利,提高效率。一个词在多少个网页中出现,把词变成网页这么一个对列过程叫做倒排索引。搜索结果就是在倒排数据库简直的获取数据,把很多的排名因素作为一个项,存储在这个里面);

  7、索引数据库:将来用于排名的数据。关键词数量,关键词位置,网页大小,关键词特征标签,指向这个网页(内链,外链,锚文本),用户体验这些数据全部都存取在这个里面,提供给检索器。

  8、检索器:将用户查询的词,进行分词,再进行排序,通过用业内接口把结果返回给用户。负责切词,分词,查询,根据排名因素进行数据排序;

  9、用户接口:将查询记录,IP,时间,点击的URL,以及URL位置,上一次跟下一次点击的间隔时间存入到用户行为日志数据库当中。

  10、用户行为日志数据库:搜索引擎的重点,用户使用搜索引擎的过程,和动作;

  11、日志分析器:通过用户行为日志数据库进行不断的分析,把这些行为记录存储到索引器当中,

  12、词库:网页分析模块中日志分析器会发现最新的词汇存入到词库当中,通过词库进行分词,网页分析模块基于词库的。