JolaSia 发表于 2017-6-6 10:42:11

WebHarvy在线可视化对网页进行编辑

在线可视化对网页进行编辑

功能特色

视觉点和点击界面
WebHarvy是一个可视化的页面获取东西。本来彻底没有必要编写任何脚本或代码用来获取数据。运用webharvy的内置阅读器阅读页面。您能够选择用鼠标点击来获取数据。它是那么简单!

智能识别形式
WebHarvy主动识别页面中呈现的数据形式。所以,假如你需要从一个页面刮项目(名字,地址,电子邮件,报价等)的列表,你不需要做任何额定的装备。假如数据重复,WebHarvy会主动刮。

导出捕获的数据
能够保留从各种格局的页面中获取的数据。 WebHarvy网站刮板的当时版本答应你导出的刮数据作为XML,CSV,JSON或TSV文件。您还能够刮下数据导出到一个SQL数据库。

从多个页面获取
一般页面显现数据,如在多个页面中的产品目录。 WebHarvy能够主动抓取并从多个页面中获取数据。只是指出了“连接到下一页'和WebHarvy网站刮板将主动刮从一切页面的数据。

根据关键词的获取
根据关键词的获取可让您捕捉从查找成果页面输入关键词的列表数据。您创立的装备将被主动重复一切给定输入关键词,而发掘的数据。能够指定恣意数量的输入关键词

经过代{过}{滤}理服务器获取
获取匿名和避免获取网络软件被封闭的Web服务器,您必须经过代{过}{滤}理服务器拜访方针网站的选项。能够运用一个单一的代{过}{滤}理服务器地址或代{过}{滤}理服务器的地址列表。

获取分类
WebHarvy网站刮板答应您从一个连接列表,然后导致一个网站内的相似页面抽取数据。这使您能够运用一个单一的装备刮网站内的种类或末节。

运用正则表达式获取
WebHarvy能够使用正则表达式(正则表达式)在文本或页面的HTML源代码,并获取去匹配的有些。这种强壮的技能为您供给了更多的灵活性,一起拼抢的数据。


下载
rt70

使用教程


页: [1]
查看完整版本: WebHarvy在线可视化对网页进行编辑