
【搜索引擎的发展史】
1990年,加拿大麦吉尔大学(UniversityofMcGill)计算机学院的师生开发出Archie。
当时,万维网(WorldWideWeb)还没有出现,人们通过FTP来共享交流资源。Archie能
定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用
户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然
Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:
自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。
搜索引擎的起源:
所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity三名学生(AlanEmtage、
PeterDeutsch、BillWheelan)发明的Archie(ArchieFAQ)。AlanEmtage等想到了开发一个
可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名
FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列
表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该
文件。由于Archie深受欢迎,受其启发,NevadaSystemComputingServices大学于1993
年开发了一个Gopher(GopherFAQ)搜索工具Veronica(VeronicaFAQ)。Jughead是后来另
一个Gopher搜索工具。
发展(1):
世界上第一个Spider程序,是MITMatthewGray的WorldwideWebWande食品安全管理员 rer,用于
追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕
获网址(URL)。
搜索引擎一般由以下三部分组成:
爬行器(机器人、蜘蛛)
索引生成器
查询检索器
发展(2):
Excite的历史可以上溯到1993年2月,6个StanfordUniversity(斯坦福大学)大学
生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已
是一个完全投资项目,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,
后来被叫做ExciteforWebServers。
注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己
的搜索引擎,改用元搜索引擎Dogpile
发展(3):
1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和DavidFilo共同创办了
Yahoo!。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为
Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。
Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。
注:Yahoo以后陆续有Altavista、Inktomi、Google提供搜索引擎服务
Yahoo!--几乎成为20世纪90年代的因特网的代名词。
发展(4):
1995年,一种新的搜索引擎形式出现了——元搜索引擎(MetaSearchEngine)。用户
只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引
擎,并将从各独立搜索引擎返回的所有查询结果好看的照片头像 ,集中起来处理后再返回给用户。
第一个元搜索引擎,是Washington大学硕士生EricSelberg和OrenEtzioni的
Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有
过强势地位。
发展(5):
智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在
知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典检索处理
形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。
例:
(1)查询“计算机”,与“电脑”相关的信息也能检索出来;
(2)可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相
关的“电子技术”、“软件”、“计算机应用”等范畴;
(3)还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中
华人民共和国”的区分,将通过歧义知pppoe是什么 识描述库、全文索引、用户检索上下文分析以及用户
相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。
发展(6):
个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索
引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础
信息库的检索中引入个人因素进行分析,获得针对个人不同的搜索结果。自20exo12人 04年10月
yahoo推出myweb测试版,到11月a9推出个性化功能,到2005年Googlearchhistory基
本上都沿着一条路子走,分析特定用户的搜索需求限定的范围,然后按照用户需求范围扩展
到互联网上其他的同类网站给出最相关的结果。另外一种是针对大众化的,Google个性化
搜索引擎,或者yahooMindSet,或者我们都知道的前台聚类的vivisimo。但是无论其中的哪
一种实现方式,即Google的主动选择搜索范围,还是yahoo(),vivisimo
的在结果中重新组织自己需要的信息,都是一种实验或者创想,短期内无法成为主流的搜索
引擎应用产品。
1995年9月26日,加州伯克利分校助教EricBrewer、博士生PaulGauthier创立了
Inktomi,1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天
能抓取索引1千万页以上,除法口算 所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie
储存用户的个人搜索喜好设置。
1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,
它没有StopWords,它有出色的CurrentNews、7100多出版物组成的SpecialCollection、良
好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。
1998年10月之前,Google只是斯坦福大学(StanfordUnivers复仇者联盟海报 ity)的一个小项目BackRub。
1995年博士生LarryPage开始学习搜索引擎设计,于1997年9月15日注册了
的域名,1997年底,在SergeyBrin和ScottHassan、AlanSteremberg的共同参与下,BachRub
开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司
则把1998年9月27日认作自己的生日。Google以网页级别(Pagerank)为基础,判断网页
的重要性,使得搜索结果的相关性大大增强。Google公司的奇客(Geek)文化氛围、不作
恶(Don’tbeevil)的理念,为Google赢得了极高的口碑和品牌美誉。2006年4月,Google
宣布其中文名称“谷歌”,这是Google第一个在非英语国家起的名字。zoopig
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999
年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索
引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash
和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,
拥有极其强大的高级搜索功能。(2003年2月25日,Fast的互联网搜索部门被Overture收
购)。
1996年8月,sohu公司成立,制作中文网站分类目录,曾有“出门找地图,上网找搜狐”
的美誉。随着互联网网站的急剧增加211年 ,这种人工编辑的分类目录已经不适应。sohu于2004
年8月独立域名的搜索网站“搜狗”,自称“第三代搜索引擎”。
Openfind创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验
室。Openfind起先只做中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供
中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重
新发布基于GAIS30Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),
宣布累计抓取网页35亿,开始进入英文搜索领域。
2000年1月,两位北大校友,超链分析专利发明人、前Infoek资深工程师李彦宏与
好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月
发布搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索
引擎),2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。Baidu搜索引擎的
其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3
搜索、Flash搜索。2002年3月闪电计划(BlitzenProject)开始后地球的简笔画 ,技术升级明显加快。后
推出贴吧、知道、地图、国学、百科、文档、视频、博客等一系列产品,深受网民欢迎。2005
年8月5日在纳斯达克上市,发行价为USD27.00,代号为BIDU。开盘价USD66.00,以
USD122.54收盘,涨幅353.85%,创下了5年以来美国股市上市新股当日涨幅最高纪录。
2003年12月23日,原慧聪搜索正式独立运做,成立了中国搜索。2004年2月,中国
搜索发布桌面搜索引擎网络猪1.0,2006年3月中搜将网络猪更名为IG(InternetGateway)。
2005年6月,新浪正式推出自主研发的搜索引擎“爱问”。2007年起,新浪爱问使用google
搜索引擎。
2007年7月1日全面采用网易自主研发的有道搜索技术,并且合并了原来的综合搜索
和网页搜索。有道网家长评语怎么写 页搜索、图片搜索和博客搜索为网易搜索提供服务。其中网页搜索使用
了其自主研发的自然语言处理、分布式存储及计算技术;图片搜索首创根据拍摄相机品牌、
型号,甚至季节等高级搜索功能;博客搜索相比同类产品具有抓取全面、更新及时的优势,
提供“文章预览”,“博客档案”等创新功能。
本文发布于:2023-03-16 13:33:21,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/167894480231399.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:网络猪.doc
本文 PDF 下载地址:网络猪.pdf
| 留言与评论(共有 0 条评论) |