电话号码资源采集
云菠萝智能采集软件作为通用性的大型电话号码资源采集软件,不仅操作非常简单,全程智能化辅助,而且功能丰富全面。现在介绍如何使用软件自带的“电话资源采集模板”,实现对主流网站的企业名录、联系人电话号码资源的采集。
选择软件界面的“电话号码资源采集模板”标签
图示1:选择软件界面的“电话资源采集模板”标签
首先,打开软件,点击“电话号码资源资料采集模板”标签。可以看到主流的电话源网站,都已经内置在软件中了,包括“从网页搜索电话”(输入关键词,即可全网搜索相关电话)。官方会不停的追加新的电话源采集网站进去。如果你有合适的网站,也可以推荐给云菠萝。
电话采集模板
图示2:客户资料采集模板
点击你需要采集对象网站的图标,即可打开新项目复制对话框。
新项目复制对话框
图示3:新项目复制对话框
在打开的复制项目对话框中,首先选择你需要采集的城市编码,从下拉列表中直接选择即可(如果下拉列表太长,难以找到。可以直接在下拉列表框中,输入你需要的城市名称,即可快速定位该城市。)。
然后输入你需要搜索的关键词,多个关键词之间可以用逗号分开即可。
再将当前项目取个名字(在上述截图左侧的“项目名称”输入框中)。
然后点击“确认创建”按钮,即可完成一个新的电话采集项目的配置。
是不是足够简单?——已经简单到无法再简单了!
然后返回软件主界面,点击主界面右侧中间位置中,项目属性中的“立即运行”按钮,即可开始采集数据。如下图:
立即运行该项目
图示4:立即运行该项目
最新获取的结果数据,会在软件主界面下方的列表中滚动展示:
最新获取的结果数据
图示5:最新获取的结果数据
当当前项目的运行进度条全部完成,并且“项目当前状态:”出现运行已完成字样的时候,说明本次采集完成。
当项目运行结束后,即可选择导出数据:软件菜单:项目数据-导出数据 。
导出数据
默认的导出数据设置,是只导出单一的电话号码,并排除重复。如果需要完整数据,请在弹出的对话框中,选择“指定列输出”。
导出数据的设置
图示7:导出数据的设置
默认的导出数据文件,会在项目专属文件夹下,和当前项目同名的文件。
至此即可完成一个电话采集项目的设置、运行、数据导出的全部流程。
注意同一个网站下,不宜同时运行多个采集项目,因为这会给对方网站造成很大的访问压力,进而可能会被封IP。软件的内置模板已经对访问压力做了均衡设置,单一项目运行的时候,一般不会被封IP的。但是同时运行多个项目,则会超出均衡设置的范围。
当被封IP的时候,请打开“项目高级设置”-云计算-选择“仅请求协助网页的访问”,进行云采集,即可绕开对方网站的采集屏蔽。