上次我教你如何安装八达通收集器。这次我将向您展示如何使用八达通收集器并开始您的第一次数据收集。一旦你变得熟练,你就可以随心所欲地爬行。数据,比如天气数据、购物网站数据等,利用这些数据来分析社会,了解人们的需求,让数据不再遥不可及!
步骤1
我们找到Octopus Collector的安装位置,双击或右键-打开并运行【Octopus.exe】,如果无法运行,右键-以管理员身份运行;您也可以通过桌面Octopus Collector 快捷方式打开它。
步骤2
开始运行后,会弹出登录界面。没有账号的朋友可以点击免费注册进行注册并使用。
步骤3
登录后,进入主界面。对于刚刚开始使用它的人,可能会弹出一份调查问卷。如实填写即可。
当我们将光标移动到新建按钮时,会出现一个下拉菜单,分别是【自定义任务】、【模板任务】、【导入任务】、【新建任务组】;这里我们选择【模板任务】。
步骤4
Octopus Collector在这里为我们预设了很多模板。这里我以京东作为演示内容。
步骤5
点击选择京东后,会出现几个不同功能的模板。这里我们点击第一个【京东-商品搜索】。
点击【立即使用】
步骤6
该接口用于设置爬取的内容参数。我们将一一解释。
任务名称:顾名思义,设置此任务的名称
任务组:该任务应归入哪个组?因为我们还没有设置,所以只有一个【我的任务组】。好友可以自行创建群组,并在新建按钮中选择【新建任务群组】。
搜索关键字:您想要在网页中搜索已爬网的内容。
页数:抓取多少页数据,不指定抓取全部。
这里小编设置抓取3页手机数据,点击【保存并开始】开始抓取
步骤7
点击后会弹出这个界面。有条件的朋友可以购买【云收藏服务】。这里我使用【启动本地采集】
等待一段时间后,软件就会开始自行抓取数据到指定页面。
这里小编没有等所有爬取完成,就点击停止采集。这里我们可以选择直接导出或者稍后导出。
步骤8
如果我们点击【导出数据】,我们可以指定导出格式。这里我将其导出到Excel。
选择导出位置
导出完成
查看内容
八达通收藏家新手收藏教程到此结束。爬取数据是不是很有趣?当你熟悉了八达通采集器的各种操作后,就可以爬取你想要的数据了。希望这篇文章能够对第一次使用它的人有所帮助。