搜索引擎的基本结构按照功能划分的话可以分为以下4个系统:
1)下载系统
2)分析系统
3)索引系统
4)检索系统
下载系统:就是从互联网上将各种各样的网页下载下来,并且保持对互联网众多网页变化的同步。
分析系统:就是负责分析下载系统中下载到的网页数据,然后进行相应的处理和分词计算等等。
索引系统:主要负责将分析处理好的网页对象索引入库,建立合理的索引机制。
检索系统:就是查询系统,主要负责分析用户提交的查询请求,然后从索引库中检索出相应的网页,并通过一系列的算法将网页排序后,以查询结果的形式返回给用户。