Предположим, вам нужно собрать данные с какой-то веб-страницы и превратить их в структурированную таблицу формата CSV или просто в текстовый документ. В этом вам поможет бесплатный инструмент для парсинга данных Octoparse.

После установки программы, на её главной странице введите ссылку на сайт, с которого будут собираться данные. Далее понадобится некоторое время, чтобы обнаружить ссылки, заголовки и другие данные со страницы и собрать их в одну таблицу.
Функционал программы позволяет парсить данные со страниц с длинными прокрутками и раскрывающимися списками, а также автоматическая меняет IP адреса для защиты от блокировок. С помощью этого инструмента можно, например, собрать и упорядочить информацию о товарах из интернет-магазина по конкретному поисковому запросу.
