Парсинг сайтов для B2B: как собрать контакты компаний
Парсинг сайтов помогает добрать то, чего часто нет в картах: email, телефоны из футера, мессенджеры, соцсети, реквизиты, страницы контактов и ссылки на источник найденного поля.
Коротко
- Парсинг сайтов лучше запускать после первичного списка компаний: из карт, веб-поиска или CSV.
- Проверять нужно не только главную страницу, но и футер, contacts, about, support, реквизиты, оферту и документы.
- Главный критерий качества — источник контакта и статус проверки, а не максимальное количество email любой ценой.
Содержание
Когда нужен парсинг сайтов
Карты хорошо находят локальные организации, но часто дают только телефон, адрес и сайт. Если нужны email, реквизиты, соцсети или мессенджеры, приходится открывать сайт компании и искать контактные страницы.
Парсер сайтов автоматизирует этот этап: проходит по публичным страницам и сохраняет найденные контакты вместе с URL, где они были обнаружены. Это особенно полезно для B2B-продаж, где важно понимать, можно ли связаться по email, телефону или через форму.
Сценарий подходит для агентств, отделов продаж, маркетологов, ресерчеров и команд, которые регулярно собирают базы компаний под разные офферы.
Какие страницы сайта проверять
Один email на главной странице — не гарантия, что все контакты найдены. У компаний часто разные данные лежат в разных частях сайта.
- Главная и футер. Часто содержат телефон, email, мессенджеры, ссылки на соцсети и юридическую информацию.
- Контакты. Самая важная страница для телефонов, email, адресов, карт и форм связи.
- О компании. Может содержать юридическое лицо, описание услуг, филиалы и дополнительные каналы связи.
- Реквизиты, оферта, политика. Нужны для ИНН, ОГРН, КПП, юридического адреса и официальных email.
- Документы и PDF. Иногда контакты и реквизиты лежат в договоре, презентации или коммерческом предложении.
Какие поля собирать с сайтов компаний
Для B2B-базы полезнее сохранять не только сам контакт, но и контекст: на какой странице он найден, к какой компании относится и насколько надёжен источник.
- Email и тип страницы, где он найден.
- Телефон в нормализованном формате.
- Telegram, WhatsApp, VK и другие публичные каналы.
- ИНН, ОГРН, КПП, юридическое название, если они опубликованы.
- Ссылки на контакты, реквизиты, оферту и политику.
- Статус проверки: найдено, не найдено, требуется ручная проверка.
Если поле не найдено, его лучше оставить пустым. Подстановка случайного email или неясного телефона делает базу хуже, а не лучше.
Рабочий процесс парсинга сайтов
- Соберите стартовый список.Используйте парсер карт, веб-поиск или свой CSV-файл.
- Найдите сайты компаний.Сайт может быть в карточке компании, поисковой выдаче или вашей базе.
- Проверьте контактные страницы.Главная, футер, contacts, about, реквизиты, оферта, документы.
- Сохраните источник каждого поля.Это помогает менеджеру понять, откуда пришёл контакт.
- Очистите и экспортируйте.Уберите дубли и выгрузите результат в CSV, Excel или JSON.
Если хотите проверить сценарий без большого сбора, начните с бесплатного теста на небольшой выборке.
Ошибки при сборе контактов
- Останавливать проверку после главной страницы и пропускать контакты в футере или реквизитах.
- Смешивать официальный email компании и личный email сотрудника без правовой оценки.
- Не сохранять URL страницы, где найден контакт.
- Принимать заголовки “Контакты” и “О нас” за название компании.
- Собирать огромный список без проверки дублей и статуса качества.
Частые вопросы
Парсинг сайтов найдёт email у всех компаний?
Нет. Многие компании не публикуют email или используют формы связи. В таком случае поле лучше оставить пустым и пометить строку для ручной проверки.
Что лучше: парсинг сайтов или карты?
Карты помогают найти компании и телефоны, сайты помогают добрать email, реквизиты и соцсети. Обычно эти источники дополняют друг друга.
Можно ли выгрузить результат в Excel?
Да. В Просто Парсере результат можно подготовить к экспорту в CSV, Excel или JSON в зависимости от доступа.