雅虎奇摩股市 雅虎奇摩股市当日行情( 三 )


随着互联网的迅速发展 , 使得检索所有新出现的网页变得越来越困难 , 因此 , 在Wanderer基础上 , 一些编程者将传统的Spider程序工作原理作了些改进 。其设想是 , 既然所有网页都可能有连向其他网站的链接 , 那么从一个网站开始 , 跟踪所有网页上的所有链接 , 就有可能检索整个互联网 。到1993年底 , 一些基于此原理的搜索引擎开始纷纷涌现 , 其中较负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider 。JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果 , 因此毫无信息关联度可言 。而RBSE是排名个索引Html文件正文的搜索引擎 , 也是排名个在搜索结果排列中引入关键字串匹配程度概念的引擎 。
Excite 的历史可以上溯到1993年2月 , 6个Stanford(斯坦福)大学生的想法是分析字词关系 , 以对互联网上的大量信息作更有效的检索 。到1993年中 , 这已是一个完全投资项目Architext , 他们还发布了一个供webmasters在自己网站上使用的搜索软件版本 , 后来被叫做Excite for Web Servers 。(注:Excite后来曾以概念搜索闻名 , 2002年5月 , 被Infospace收购的Excite停止自己的搜索引擎 , 改用元搜索引擎Dogpile)
1994年1月 , 排名个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线 。除了网站搜索 , 它还支持Gopher和Telnet搜索 。
1994年4月 , Stanford University的两名博士生 , 美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo(Jerry Yang Alerts a Usenet group to the Yahoo Database  , 1996年的Yahoo) 。随着访问量和收录链接数的增长 , Yahoo目录开始支持简单的数据库搜索 。因为Yahoo!的数据是手工输入的 , 所以不能真正被归为搜索引擎 , 事实上只是一个可搜索的目录 。Wanderer只抓取URL , 但URL信息含量太小 , 很多信息难以单靠URL说清楚 , 搜索效率很低 。Yahoo!中收录的网站 , 因为都附有简介信息 , 所以搜索效率明显提高 。(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)
1994年初 , Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler) 。1994年4月20日 , WebCrawler正式亮相时仅包含来自6000个服务器的内容 。WebCrawler是互联网上排名个支持搜索文件全部文字的全文搜索引擎 , 在它之前 , 用户只能通过URL和摘要搜索 , 摘要一般来自人工评论或程序自动取正文的前100个字 。(后来webcrawler陆续被AOL和Excite收购 , 现在和excite一样改用元搜索引擎Dogpile)
Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步 。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中 , 创建了Lycos 。1994年7月20日 , 数据量为54,000的Lycos正式发布 。除了相关性排序外 , Lycos还提供了前缀匹配和字符相近限制 , Lycos排名个在搜索结果中使用了网页自动摘要 , 而较大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents 。(注:1999年4月 , Lycos停止自己的Spider , 改由Fast提供搜索引擎服务)