怎么写网络爬虫( 二 )


4. 爬虫都可以干什么 简单来讲,爬虫就是一个探测机器,它的基本操作就是模拟人的行为去各个网站溜达,点点按钮,查查数据,抄或者把看到的信息背回来 。
就像2113一只虫子在一幢楼里不知疲倦地爬来爬去 。网络爬虫是一种程序,主要用于搜索引擎,它将一个网站的所有内容与链接进5261行阅读,并建立相关的全文索引到数据库中,然后跳到另一个网站.样子好像一只大蜘蛛.当人们在网络上(如google)搜索关键字时,其实就是比对数据库中的内容,找出与用户相符合的.网络爬虫4102程序的质量决定了搜索引1653擎的能力,如google的搜索引擎明显要比百度好,就是因为它的网络爬虫程序高效,编程结构好 。

怎么写网络爬虫

文章插图