必威体育Betway必威体育官网
当前位置:首页 > IT技术

火车头采集多张图片

时间:2019-10-16 12:15:31来源:IT技术作者:seo实验室小编阅读:59次「手机版」
 

火车头采集图片

相信很多刚开始学习火车头的菜鸟们,也和烂泥一样使用的是火车头免费版,然后为我们的zencart网站进行一些产品数据的采集。但是在写采集规则的时候,会经常碰到的一个问题就是如何采集一个产品的多张图片。

采集一张图片的规则,相信大家都会写了。那么多张图片呢?如何写呢?其实,这个和我们写采集一张图的是一样的,只是在一些细节上面设置正确就ok了。下面我就自己采集的一个站点给各位做一下讲解。

我们知道要采集一个网站的图片,那么我们肯定是在火车头使用img标签来进行的。

clip_image004

在上图中是标记出来的1和2是两张不同的图片,但是我们仔细的观察可以发现img标签中,如果把图片的源地址和alt去掉的话,那么其他的都是一样的。而火车头有一个标签循环使用的功能,这就为我们采集多张图片提供了一个方便。我现在把源码粘贴出来:

<img src="http://www.simplydresses.com/_img/PRODUCTS/320/PromGirl-767611310.jpg" width="68" border="0" alt="Long One Shoulder Formal Dress P641 TI-P641" />

然后在火车头中进行采集规则的编写:

在数据提取方式中,我们选择了“正则提取”,而“正则匹配内容”中填写如下:

<img src="http://www.simplydresses.com/_img/PRODUCTS/[参数]/[参数]"(*)width="(*)"(*)border="(*)"(*)alt="(*)"(*)/>

组合结果中填写如下:

<img src="http://www.simplydresses.com/_img/PRODUCTS/[参数1]/[参数2]"/>

其中正则匹配内容第一个“参数”对应的是组合结果中的“参数1”,正则匹配内容第二个“参数”对应的是组合结果中的“参数2”,而其中的“*”是任意匹配的意思。

clip_image008

上图是设置好后,采集测试的结果

clip_image010

这个是导出的结果。

Ok,以上我们可以看到要采集多张图片,只要我们设置好了采集标签,然后此标签可以循环使用,就可以达到我们要的结果了……

相关阅读

FME如何采集肯德基中国的所有门店地址(一)

原文发表时间:2016-08-19 10:57:01 作者:雷中华 FME是个优秀的平台,并保持快速且持续的增长——更多的函数模块、更多的输入输出格式

STM32学习之搭建光敏二极管电路并采集判断光强

硬件部分:先来看硬件连接图,此次实验选择ADC3的通道7,硬件原理图如图1所示,光敏电阻的原理在图1中已经说明,这里就不再多说。图2是stm3

php数据采集 之 关于file_get_contents的使用

 file_get_contents  函数的应用注意: 开启 php.ini 配置 中 allow_url_fopen =On;\file_get_contents 中的一些参数: 遇到

NTC——热敏电阻的采集方法

前言: 最近在调试STM32ADC采集NTC热敏电阻的温度值,总结下NTC热敏电阻温度值的采集方法。 硬件平台:STM32F205 软件平台:keil V5 函

《火车头采集器采集网页数据》火车头配置规则采集信息

此为火车头采集器的页面 *左边建立分组,建议结构都和所需要采集的数据结构一致,不然数据多了起来,很容易混乱。 1, 创建任务 起始

分享到:

栏目导航

推荐阅读

热门阅读