火车采集器(LocoySpider) V9.30.20210315 绿色版
火车采集器(LocoySpider)是一个功能强大的数据采集软件,利用该软件就可以轻易在网页上抓取文字、图片、文件等等需要的资源。软件还支持远程下载图片文件、探测文件真实地址、防盗链的采集、采集数据直接入库和模仿人手工发布等等。 软件特色 1、通用性强 无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。 2、稳定、高效 五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。 3、扩展性强、适用范围广 自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。 基本功能 1、规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。 2、多任务,多线程 - 可以同时进行多个信息获取任务,每个任务可以使用多个线程。 3、所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。 4、数据保存 - 数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。 5、断点续采 - 信息收集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。 6、网站登录 - 支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。 7、计划任务 - 通过这个功能可以让你的采集任务定时、定量或者一直循环执行。 8、采集范围限制 - 可以根据采集的深度和网址的标识来限制采集的范围。 9、文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。 10、结果替换 - 可以将采集的结果根据规则替换成你定义的内容。 更新日志 2021-03-15 火车采集器V9.30版 1、优化标签数据处理中字符替换。 2、对文件探测无效导致文件下载失败问题优化。 3、处理用户名包含特殊符号不能登录问题。 4、修复数据管理批量操作数据有异常弹窗提示。 5、修复二级代理卡死问题。 6、完善自动获取cookie失败问题。 7、发布到word,自动转义“<”、“>”为“《”、“》”。 8、修复:勾选发布选项,采集最大数无效。 9、修复oracle链接问题。 10、支持oss存储。 11、修复:下载地址后面有斜杠,下载文件时无后缀名。 |