搜索引擎(search engine),万维网环境中的信息检索系统(包括目录服务和关键字检索两种服务方式),按照工作原理的不同,可以分为全文搜索引擎(Full Text Search Engine)和分类目录(Directory),通常所说的搜索引擎主要是指全文搜索引擎。
1、搜索引擎的起源
1990年由Montreal的McGill University 三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明的Archie(Archie FAQ),被公认为现代搜索引擎的鼻祖,Archie是第一个自动索引互联网上匿名FTP网站的程序。
2、搜索引擎工作原理
- 抓取网页:每个独立的搜索引擎都有自己的网页抓取程序(spider),Spider顺着网页中的超链接,连续的抓取网页,被抓取的网页被称为网页快照。
- 处理网页:由分析索引系统程序对收集回来的网页进行分析,根据一定的算法提取相关信息并建立网页索引数据库。
- 检索服务:当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页,根据相关度数值排序,并由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
3、搜索引擎商务模式
在搜索引擎发展早期,多是作为技术提供商为其他网站提供搜索服务,网站付钱给搜索引擎。后来,随着2001年互联网泡沫的破灭,大多转向竞价排名方式,这种模式最早是Bill Gross提出的。竞价排名模式有两个特点,一是点击付费,二是竞价排序。