Что такое парсинг и как он работает

Что такое парсинг и как он работает

Упрощенно, парсинг это сбор информации. Есть более сложные определения, но так как мы говорим о парсинге «для чайников», то нет никакого смысла усложнять терминологию. Парсинг это сбор, как правило, структурированной информации. Чаще всего в виде таблицы с конкретным набором данных. Например, данных по характеристикам товаров.

Парсер программа, которая осуществляет этот самый сбор. Она ходит по ссылкам на страницы, которые вы указали, и собирает нужную информацию в Excel-файл либо куда-то еще.

Парсинг работает на основе XPath-запросов. XPath язык запросов, который обращается к определенному участку кода страницы и собирает из него заданную информацию.


Share Tweet Send
0 Коментарии
Загрузка...
You've successfully subscribed to Pinta IT 🍺
Great! Next, complete checkout for full access to Pinta IT 🍺
Welcome back! You've successfully signed in
Success! Your account is fully activated, you now have access to all content.