Что такое парсинг и как он работает

1 мин
Автор PINTA IT
Что такое парсинг и как он работает

Упрощенно, парсинг это сбор информации. Есть более сложные определения, но так как мы говорим о парсинге «для чайников», то нет никакого смысла усложнять терминологию. Парсинг это сбор, как правило, структурированной информации. Чаще всего в виде таблицы с конкретным набором данных. Например, данных по характеристикам товаров.

Парсер программа, которая осуществляет этот самый сбор. Она ходит по ссылкам на страницы, которые вы указали, и собирает нужную информацию в Excel-файл либо куда-то еще.

Парсинг работает на основе XPath-запросов. XPath язык запросов, который обращается к определенному участку кода страницы и собирает из него заданную информацию.

Похожие публикации