后羿采集器是一款常用于数据采集和网页爬取的工具。它得名于中国古代神话中的英雄人物后羿,寓意着极强的命中率和精准度。后羿采集器可以根据用户的需求,自动从互联网上抓取数据,并将获取的数据保存为结构化的格式,例如CSV、Excel等。
软件功能
智能采集模式
该模式操作极其简单,只需要输入网址就能智能识别网页中的内容,无需配置任何采集规则就能够完成数据的采集。
支持可视化的网页点选操作
完全符合人工浏览网页的思维方式,用户只需要打开被采集的网站,根据软件给出的提示,用鼠标点击几下就能自动生成复杂的数据采集规则;
支持积木式采集组件拼接操作
通过将复杂的采集编码流程进行可视化封装,让开发采集规则就像搭积木一样简单,零基础也能很快上手。
支持单网址和多网址采集,支持从本地TXT文件中导入网址,也支持参数网址批量生成。
在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。
智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。
定时采集功能属于采集任务的高级设置,该功能可实现在用户设置的时间周期内,在固定的时间点开启和停止数据采集任务。如果您设置了定时采集,请保证软件一直处于工作状态(不能关机)。
防屏蔽功能有较多的设置,用户可以通过多种方式来实现防屏蔽或者防反爬的目的。
自动导出
自动导出功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。
下载图片功能可以实现在采集数据的同时,将网页上的图片下载到本地。
软件特色
操作简单,为广大无编程基础的用户提供了一个数据采集平台
安全无毒,此软件不会携带第三方恶意插件,木马病毒等危害电脑安全的信息
可选择抽取文本、属性、链接等
可自动采集数据
支持运行批量采集数据
可将采集到的的数据导出到电脑上保存
可一键发布信息到数据库、微信公众号等媒体平台
支持自定义采集流程
提供软件的使用教程
软件的使用完全免费,不会以任何理由收取用户费用
支持U盾偶任务同时进行、无数量限制
支持语段存储,切换终端同步更新
支持的导出格式有Excel、Txt、Csv、Html
支持的数据库类型有MySQL、PgSQl、SqlServer、MongDB