搜索引擎的运行主要通过三个功能:爬虫、索引和排名。上次,我们已经了解了爬虫,今天我们来看一看搜索引擎需要的第二个主要功能——索引。什么是搜索引擎索引?将搜索引擎在第一阶段爬取和发现的内容进行分类重组,存进索引库的过程叫做索引。页面被索引之后,如果搜索者查询的问题答案被收录索引库中,搜索引擎会将这些相关的答案网页展示在搜索结果页面。搜索引擎是如何索引网站页面的?如果我们的网站内容已经被搜索引擎抓取,那么,接下来的工作就是确保这些被抓取的页面能够编入索引。因为,网站被搜索引擎发现和抓取,并不意味着页面有机会存储在索引中。在前面搜索引擎爬虫的介绍中,我们了解了搜索引擎如何发现我们的网页。搜索引擎爬虫
2022-03-19