4.火车头采集怎么设置采集网址规则啊“我采集一个网页的地址,起始找的是一个层,终止也找了一个层 这样不行啊 。如果没有数字的网址怎么采集呢!如某个网址是list_50.html。上图 才 。”
----------------------------
有些网站的列表页翻页参数中,第一个参数是无效的,利用数值变化就无法访问列表页的第一页 。
我不知道在火车头里面怎样解决这个问题的 。在熊猫采集里面是可以忽略这个问题的,只需要鼠标选择列表页中指向下一页的链接,就能翻页访问 。因为熊猫使用的是机器训练的采集设置方式 。不需要用户手工设置这些 。
少数没有下一页的列表页中,遇到这种情况,可以使用参数列表方式解决 。你可以在火车采集器里面找找是否有“参数列表”的翻页方式 。
有些采集软件中,可以直接同时输入多个列表页地址 。这样也就不必去设置翻页参数,也很简单 。熊猫中不支持这种方式,不知道火车采集器是否支持 。如果支持,你可以直接输入多个列表页地址,换行区分即可 。
【火车头采集器多页规则怎么写】

文章插图
- 传感器实验指导书前言怎么写
- 干粉灭火器怎么看过期 灭火器干粉多久过期
- 量血压的仪器哪种好 什么牌子量血压仪器好
- 适配器是啥 适配器是什么用途
- android选择器怎么写
- 助理病史采集怎么样写
- 器字用颜体怎么写
- 手指日语怎么写
- 宽带路由器怎么设置 华为宽带路由器怎么设置
- 机器|给心脏充电的脱口秀演员王十七:等了17年的机器心脏,花了80万!
