Интуитивно понятный мощный визуальный веб-парсер. WebHarvy может легко извлекать текст, HTML, изображения, URL-адреса и электронные письма с веб-сайтов, а также сохранять извлеченный контент в различных форматах. Поддерживает все типы сайтов. Управляет логином, отправкой формы и т. д. Извлечение данных из нескольких страниц, категорий и ключевых слов. Встроенный планировщик, поддержка Proxy / VPN, Smart Help и многое другое ..
WebHarvy автоматически определяет шаблоны данных, встречающиеся на веб-страницах. Поэтому, если вам нужно очистить список элементов (имя, адрес, адрес электронной почты, цена и т. Д.) С веб-страницы, вам не нужно выполнять дополнительную настройку. Если данные повторяются, WebHarvy очистит их автоматически.
С помощью интерфейса WebHarvy «наведи и щелкни» легко выполнять парсинг веб- страниц. Абсолютно не нужно писать какой-либо код или скрипты для очистки данных. Вы будете использовать встроенный браузер WebHarvy для загрузки веб-сайтов и сможете выбирать данные для извлечения щелчком мыши. Это так просто!
Вы можете сохранять данные, извлеченные с веб-сайтов, в различных форматах. Текущая версия программного обеспечения веб- парсинга WebHarvy позволяет сохранять извлеченные данные в виде файлов Excel, XML, CSV, JSON или TSV . Вы также можете экспортировать очищенные данные в базу данных SQL .
Часто веб-сайты отображают данные, такие как списки продуктов или результаты поиска, на нескольких страницах. WebHarvy может автоматически сканировать и извлекать данные с нескольких страниц. Просто укажите ссылку для загрузки следующей страницы, и WebHarvy Web Scraper автоматически очистит данные со всех страниц.
Очистите данные, автоматически отправив список вводимых ключевых слов в формы поиска. Любое количество вводимых ключевых слов может быть отправлено в несколько текстовых полей ввода для выполнения поиска. Данные из результатов поиска для всех комбинаций вводимых ключевых слов могут быть извлечены.
Для анонимного парсинга и предотвращения блокировки программного обеспечения для парсинга веб-серверами у вас есть возможность получить доступ к целевым веб-сайтам через прокси-серверы или VPN. Можно использовать либо один адрес прокси-сервера, либо список адресов прокси-серверов.
WebHarvy Web Scraper позволяет извлекать данные из списка ссылок, которые ведут на похожие страницы / списки на веб-сайте. Это позволяет очищать категории и подкатегории на веб-сайтах с помощью единой конфигурации.
WebHarvy позволяет применять регулярные выражения (RegEx) к тексту или HTML-источнику веб-страниц и очищать соответствующую часть. Этот мощный метод предлагает большую гибкость при парсинге данных.
Перед извлечением данных запустите свой собственный код JavaScript в браузере. Это можно использовать для взаимодействия с элементами страницы, изменения модели DOM или вызова функций JavaScript, уже реализованных на целевой странице.
Можно загружать изображения или извлекать URL-адреса изображений. WebHarvy может автоматически извлекать несколько изображений, отображаемых на страницах сведений о продуктах веб-сайтов электронной коммерции.
WebHarvy можно легко настроить для выполнения таких задач, как нажатие на ссылки , выбор параметров списка / раскрывающегося списка , ввод текста в поле , прокрутка страницы , открытие всплывающих окон и т. д.
DOWNLOAD https://t.me/sunfile/116
Пароль к архиву вы найдете на нашем Telegram канале Pinta IT по ссылке https://t.me/webpinta/606